Помощь в написании студенческих работ
Антистрессовый сервис

Проверка различных гипотез о коэффициентах

РефератПомощь в написанииУзнать стоимостьмоей работы

В некоторых случаях целесообразнее использовать одностороннюю альтернативу, например, для нулевой гипотезы Щ:$т = ss* можно рассмотреть альтернативы Н{: ssw > ss* или Я1: ssw ta (n — k… Читать ещё >

Проверка различных гипотез о коэффициентах (реферат, курсовая, диплом, контрольная)

Важную роль в экономической интерпретации регрессионных уравнений играет проверка различных гипотез о коэффициентах. Обычно начинают с проверки гипотезы о незначимости регрессии в целом:

Проверка различных гипотез о коэффициентах. (все коэффициенты кроме константы равны нулю);

Нх хотя бы один из этих коэффициентов отличен от 0.

Идея теста Фишера состоит в следующем: если мы правильно выбрали регрессоры, то RSS будет существенно больше, чем ESS, т. е. при достаточно большом значении RSS/ESS стоит отвергнуть нулевую гипотезу. Более формально, если верна гипотеза #0, то статистика.

Проверка различных гипотез о коэффициентах.

имеет распределение Фишера с (k — 1) и (п — k) степенями свободы. На a-процентном уровне значимости эта гипотеза отвергается, если F > Fa(k-ltn-k), где Fa(k-l, n-k) — a-процентная точка распределения Фишера F (k-yn-k).

Чтобы узнать, какие факторы оказывают влияние на зависимую переменную, проверяют гипотезу о незначимости отдельного коэффициента:

Проверка различных гипотез о коэффициентах.

Если верна гипотеза #0, то статистика t = (З/sp имеет распределение Стыодента с (п — к) степенями свободы. На а-процентном уровне значимости эта гипотеза отвергается, если >ta/2{n-k)y где ta/2(n-k) — a/2-процентная точка распределения Стыодента t (n-k). Если в уравнении есть ровно один незначимый коэффициент, то соответствующий ему регрессор можно удалить из уравнения. Этот тест можно обобщить для проверки гипотезы о значении отдельного коэффициента:

Проверка различных гипотез о коэффициентах.

Тогда ?-статистика принимает вид t = ((3 — |3*)/$р, а процедура проверки сохраняется.

В некоторых случаях целесообразнее использовать одностороннюю альтернативу, например, для нулевой гипотезы Щ:$т = ss* можно рассмотреть альтернативы Н{: ssw > ss* или Я1: ssw < ss*. В такой ситуации мы оказываемся, если априори известно, что величина ss/;/ принимает значения, лежащие по одну сторону от ss*. На а-ироцентном уровне значимости нулевая гипотеза отвергается, если t > ta(n — k) (соответственно, t < -ta(n — k)). Желая подчеркнуть, что речь идет о i-статистике для проверки гипотезы о коэффициенте ssw, при переменной Хт используют обозначение tXm-

Нередко возникает вопрос, нельзя ли без потери качества исключить целую группу регрессоров? Для проверки используют гипотезу о незначимое™ группы коэффициентов (не умаляя общности, далее можно считать, что рассматриваются последние q регрессоров):

(q последних коэффициентов равны нулю);

Н: хотя бы один из этих коэффициентов отличен от нуля.

В этой ситуации регрессия Проверка различных гипотез о коэффициентах. называется регрессией без ограничений, а регрессия с исключенными последними q регрессорами.

Проверка различных гипотез о коэффициентах. — регрессией с ограничениями. Обозначим соответствующие им суммы квадратов через ESSUR и ESSr (от слов unrestricted — неограниченный и restricted — ограниченный). При удалении регрессоров ESS не может уменьшиться. Интуитивно понятно, что если ESS увеличилась ненамного, то этим можно пренебречь. Вопрос в том, сколь сильно она увеличивается. Если верпа гипотеза #0, то статистика.

Проверка различных гипотез о коэффициентах.

имеет распределение Фишера с q и (п — k) степенями свободы. На a-процентном уровне значимости эта гипотеза отвергается, если F > Fa(q, n-k), где Fa(q, n-k) — a-процентная точка распределения Фишера F (q, n-k).

Другой способ проверки гипотез (не требующий заранее фиксировать уровень значимости) основан на вычислении вероятности получения данного значения статистики в предположении, что нулевая гипотеза верна. Эконометрические пакеты (EconometricViewSy Gretl, Statistica и др.) приводят значения р-значения[1] (или p-value или Prob), позволяющие проверять стандартные гипотезы без использования таблиц. Р-значение — это вероятность ошибиться, отвергнув нулевую гипотезу. Если p-значение меньше зафиксированного уровня значимости, то нулевая гипотеза отвергается.

Зачастую эконометрические задачи приводят к вычислениям большого объема. Поэтому эффективное использование эконометрики невозможно без компьютера и современного программного обеспечения. Желая помочь читателю познакомиться с одним из популярных эконометрических пакетов, мы приведем результаты расчетов, сделанных с помощью пакета Gretl, в той форме, в которой он их предлагает пользователю (см. приложение 2). Мы будем использовать общедоступные данные из интернета.

Пример 14.1.

Пусть у нас есть следующие данные для 94 стран1: GROWTH — средний годовой экономический рост за 1965—1990 гг., LOGGDP65 — логарифм душевого ВНП в 1965 г., LND100 km — доля площади, находящейся не далее 100 км от побережья, POP 100 km — доля населения, живущих не далее 100 км от побережья, TROPICAR — доля площади, находящейся в тропиках, TROPPOP — доля населения, живущая в тропиках, OPEN — доля лет, в течение которых страна была открыта для торговли, POLINST — индекс качества политических институтов (0 — плохо, 10 — хорошо). Как географическое положение влияет на экономический рост?

Для ответа на этот вопрос построим регрессионное уравнение.

Проверка различных гипотез о коэффициентах.

Оцененное по МНК уравнение в пакете Gretl имеет следующий вид2: Модель 1: МНК, использованы наблюдения 1—94 Зависимая переменная: GROWTH

Коэффициент.

Ст. ошибка.

?-статистика.

Р-значсние.

const.

14,3292.

2,59 633.

5,5190.

<0,1.

***.

LND 100 КМ.

— 0,682 959.

1,35 263.

— 0,5049.

0,61 491.

LOGGDP65.

— 1,85 491.

0,365 881.

— 5,0697.

<0,1.

***.

OPEN.

3,14 094.

0,711 277.

4,4159.

0,3.

***.

POLINST.

0,365 219.

0,158 955.

2,2976.

0,2 401.

**.

  • 1 и ЛЬ: http://fmwww.bc.edu/ec-p/data/inst/geodata.dta
  • 2 Здесь и далее мы приводим распечатки пакета СгеМ в той форме, в которой он их предлагает пользователю. Расшифровка сокращений: среднее зав. перемен — среднее зависимой переменной; ст. откл. зав. перемен — стандартное отклонение зависимой переменной; сумма кв. остатков — сумма квадратов остатков; ст. ошибка модели — стандартная ошибка модели; испр. Р-квадрат — исправленный (скорректированный) Л-квадрат; лог. правдоподобие — логарифм функции максимального правдоподобия; крит. Акаике — критерий Акаике. Запись 8,17е-10 означает 8,17 • 10 10.

РОРНЮКМ.

1,63 806.

1,48 815.

1,1007.

0,27 408.

TROPICAR.

— 0,819 108.

0,789 786.

— 1,0371.

0,30 258.

TROPPOP.

— 1,16 981.

1,26 062.

— 0,9280.

0,35 602.

Среднее зав. перемен.

3,400 756.

Ст. откл. зав. перемен.

2,525 365.

Сумма кв. остатков.

313,5343.

Ст. ошибка модели.

1,909 384.

А'-квадрат.

0,471 368.

Испр. А-квадрат.

0,428 339.

Р (7, 86).

10,95 485.

Р-значение (F)

8,17е—10.

Лог. правдоподобие.

— 189,9971.

Крит. Акаике.

395,9942.

Крит. Шварца.

416,3405.

Крит. Хепнана — Куинна.

404,2126.

Зафиксируем уровень значимости 0,05. Оценим значимость уравнения в целом. Нулевая гипотеза — все коэффициенты, кроме константы, равны нулю. Первый вариант проверки: так как расчетное значение статистики F= 10,95 больше пятипроцентной точки Р005(7,86) = 2,1, то нулевая гипотеза отвергается. Второй вариант проверки: р-значение 8 -10-10 означает, что отвергая нулевую гипотезу, мы ошибемся в 8−10м0 процентах случаев, т.с. практически никогда. Следовательно, нулевую гипотезу стоит отвергнуть. Коэффициент детерминации 0,41 означает, что 41% вариации экономического роста объясняется регрессией. Проверим значимость отдельных коэффициентов. Первый вариант проверки: сравниваем модули i-статистик с ?0,05(86) = 1,9. Получаем, что коэффициенты при логарифме душевого ВНП, открытости торговли и индексе качества политических институтов значимы (для них |/| > 1,9). Второй вариант проверки: проверяем, для каких переменных p-значения меньше, чем 0,05. Приходим к такому же выводу. На самом деле, в пакете Gretl тест Стыодента на незначимость коэффициентов проводится автоматически — знаком «*» помечены коэффициенты, значимые на 10%-ном уровне, «**» на 5%-ном уровне, «***» на 1%-ном уровне.

Так как четыре коэффициента оказались незначимыми, то естественно проверить гипотезу о совместной незначимости коэффициентов.

Проверка различных гипотез о коэффициентах. Для этого строим регрессию с ограничением, исключив соответствующие факторы:

Модель 2: МИК, использованы наблюдения 1—94 Зависимая переменная: GROWTH

Коэффициент.

Ст. ошибка.

/-статистика.

Р-значение.

const 9,38 879.

2,889.

4,6736.

0,1.

***.

LOGGDP65 -1,21 939.

0,324 401.

— 3,7589.

0,30.

***.

OPEN 3,63 372.

0,718 595.

5,0567.

<0,1.

***

POLINST 0,318 687.

0,160 029.

1,9914.

0,4 947.

Среднее зав. перемен.

3,400 756.

Ст. откл. зав. перемен.

2,525 365.

Сумма кв. остатков.

356,4708.

Ст. ошибка модели.

1,990 172.

Я-квадрат.

0,398 975.

Испр. /?-квадрат.

0,378 941.

Р (3, 90).

19,91 472.

Р-значение (7).

5,50е—10.

Лог. правдоподобие.

— 196,0292.

Крит. Акаике.

400,0584.

Крит. Шварца.

410,2316.

Крит. Хеннана — Куинна.

404,1677.

Используя суммы квадратов остатков в обеих моделях, вычисляем.

Проверка различных гипотез о коэффициентах.

что больше, чем Р (4,8б) = 2,47. Следовательно, исключить все четыре переменные нельзя (несмотря на то, что по тесту Стьюдента они по отдельности незначимы). Попытки исключить только три фактора приводят к итоговому уравнению.

Модель 3: МНК, использованы наблюдения 1—94 Зависимая переменная: GROWTH

Коэффициент.

Ст. ошибка.

/-статистика.

Р-значение.

const.

14,1935.

2,443.

5,8099.

<0,1.

***.

LOGGDP65.

— 1,79 216.

0,358 234.

— 5,0028.

<0,1.

* * *.

OPEN.

3,20 814.

0,698 087.

4,5956.

0,1.

***.

POLINST.

0,380 688.

0,153 806.

2,4751.

0,1 521.

**.

TROPPOP.

— 2,33 973.

0,738 637.

— 3,1676.

0,211.

***.

Среднее зав. перемен.

3,400 756.

Ст. откл. зав. перемен.

2,525 365.

Сумма кв. остатков.

320,3539.

Ст. ошибка модели.

1,897 230.

Я- квадрат.

0,459 869.

Испр. Р-квадрат.

0,435 594.

Е (4, 89).

18,94 375.

Р-значение (Р).

2,68е-11.

Лог. правдоподобие.

— 191,0084.

Крит. Акаике.

392,0168.

Крит. Шварца.

404,7333.

Крит. Хеннана — Куинна.

397,1533.

или.

Проверка различных гипотез о коэффициентах.

Значимый и отрицательный коэффициент при переменной ТЯОРРОР указывает, что чем больше доля населения, живущая в тропиках, тем меньше экономический рост.

Гипотеза о независимых линейных ограничениях общего вида, число которых строго меньше числа регрессоров, проверяется с использованием регрессий с ограничением и без, аналогично тому, как была проверена незначимость группы коэффициентов. Например, для проверки гипотезы о том, что для модели.

Проверка различных гипотез о коэффициентах.

выполняются два ограничения.

Проверка различных гипотез о коэффициентах.

нам пришлось бы построить регрессию с ограничением Проверка различных гипотез о коэффициентах. Пример 14.2.

Пусть HOUSING: количество новых домов (в 1000), POP: население (млн человек), GNP: ВНП (млрд долл. 1982), UNEMP. уровень безработицы (%), INTRATE: ставка процента по закладной (%)'. Оцените модель.

Проверка различных гипотез о коэффициентах.aside class="viderzhka__img" itemscope itemtype="http://schema.org/ImageObject">Проверка различных гипотез о коэффициентах.

и проверьте гипотезу Решение

Оценим исходную модель Модель 4: МНК, использованы наблюдения 1—23 Зависимая переменная: _110USING

Коэффициент.

Ст. ошибка.

/-статистика.

P-значение.

const -12,5673.

12,9355.

— 0,9715.

0,34 349.

1РОР 2,69 517.

4,31 359.

0,6248.

0,53 953.

1_GNP 1,7 517.

1,37 195.

0,7837.

0,44 289.

I INTRATE -1,38 855.

0,406 027.

— 3,4199.

0,287 ***.

Среднее зав. перемен.

7,356 288.

Ст. откл. зав. перемен.

0,215 598.

Сумма кв. остатков.

0,559 555.

Ст. ошибка модели.

0,171 611.

Р-квадрат.

0,452 817.

Испр. Р-квадрат.

0,366 420.

Р (3, 19).

5,241 105.

Р-значение (/•').

0,8 343.

Лог. правдоподобие.

10,9 966.

Крит. Акаикс.

— 12,19 931.

Крит. Шварца.

— 7,657 335.

Крит. Хеннана — Куинна.

— 11,5 702.

Отсюда ESSur = 0,56. Подставим ограничение (3? = 1- P:? в уравнение Проверка различных гипотез о коэффициентах.[2]

и преобразуем его так, чтобы можно было оценить по МНК:

Проверка различных гипотез о коэффициентах.

В правой части у второго слагаемого отсутствует коэффициент, поэтому его следует перенести в левую часть, а из третьего и четвертого слагаемых следует вынести общий множитель, чтобы коэффициент получился одинаковым по модулю:

Проверка различных гипотез о коэффициентах.

Мы получили уравнение с ограничением. Оценим его.

Модель 5: МНК, использованы наблюдения 1—23 Зависимая переменная: Ь_Н01/5'ШС_Р0Р

Коэффициент Ст. ошибка ?-статистика Р-значение.

сопэГ.

— 0,980 999.

1,273.

— 0,7706.

0,44 994.

ММТКАТЕ.

— 1,11 899.

0,27 287.

— 4,1008.

0,56.

1._СКР_РОР.

2,13 563.

0,699 675.

3,0523.

0,629.

Среднее зав. перемен.

1,991 961.

Ст. откл. зав. перемен.

0,226 095.

Сумма кв. остатков.

0,583 415.

Ст. ошибка модели.

0,170 795.

Р-квадрат.

0,481 231.

Испр. Р-квадрат.

0,429 354.

Р (2, 20).

9,276 402.

Р-значение (Р)

0,1 412.

Лог. правдоподобие.

9,619 438.

Крит. Акаике.

— 13,23 888.

Крит. Шварца.

— 9,832 393.

Крит. Хеннапа — Куинна.

— 12,38 216.

Используя суммы квадратов остатков в обеих моделях, вычисляем.

Проверка различных гипотез о коэффициентах.

что меньше, чем Р (1,19) = 4,38. Следовательно, нулевая гипотеза принимается.

  • [1] Сокращение от probability — вероятность.
  • [2] URL: dss.ucsd.edu/-rramanat/XLDATA/DATA4−3.XLS
Показать весь текст
Заполнить форму текущей работой