Проверка различных гипотез о коэффициентах

РефератПомощь в написанииУзнать стоимостьмоей работы

В некоторых случаях целесообразнее использовать одностороннюю альтернативу, например, для нулевой гипотезы Щ:$т = ss* можно рассмотреть альтернативы Н{: ssw > ss* или Я1: ssw ta (n — k… Читать ещё >

Проверка различных гипотез о коэффициентах (реферат, курсовая, диплом, контрольная)

Важную роль в экономической интерпретации регрессионных уравнений играет проверка различных гипотез о коэффициентах. Обычно начинают с проверки гипотезы о незначимости регрессии в целом:

Проверка различных гипотез о коэффициентах. (все коэффициенты кроме константы равны нулю);

Н_х хотя бы один из этих коэффициентов отличен от 0.

Идея теста Фишера состоит в следующем: если мы правильно выбрали регрессоры, то RSS будет существенно больше, чем ESS, т. е. при достаточно большом значении RSS/ESS стоит отвергнуть нулевую гипотезу. Более формально, если верна гипотеза #₀, то статистика.

Проверка различных гипотез о коэффициентах.

имеет распределение Фишера с (k — 1) и (п — k) степенями свободы. На a-процентном уровне значимости эта гипотеза отвергается, если F > F_a(k-l_tn-k), где F_a(k-l, n-k) — a-процентная точка распределения Фишера F (k-_yn-k).

Чтобы узнать, какие факторы оказывают влияние на зависимую переменную, проверяют гипотезу о незначимости отдельного коэффициента:

Если верна гипотеза #₀, то статистика t = (З/sp имеет распределение Стыодента с (п — к) степенями свободы. На а-процентном уровне значимости эта гипотеза отвергается, если >t_a/2{n-k)_y где t_a/2(n-k) — a/2-процентная точка распределения Стыодента t (n-k). Если в уравнении есть ровно один незначимый коэффициент, то соответствующий ему регрессор можно удалить из уравнения. Этот тест можно обобщить для проверки гипотезы о значении отдельного коэффициента:

Тогда ?-статистика принимает вид t = ((3 — |3*)/$р, а процедура проверки сохраняется.

В некоторых случаях целесообразнее использовать одностороннюю альтернативу, например, для нулевой гипотезы Щ:$_т = ss* можно рассмотреть альтернативы Н_{: ss_w > ss* или Я₁: ss_w < ss*. В такой ситуации мы оказываемся, если априори известно, что величина ss_/;/ принимает значения, лежащие по одну сторону от ss*. На а-ироцентном уровне значимости нулевая гипотеза отвергается, если t > t_a(n — k) (соответственно, t < -t_a(n — k)). Желая подчеркнуть, что речь идет о i-статистике для проверки гипотезы о коэффициенте ss_w, при переменной Х_т используют обозначение t_Xm-

Нередко возникает вопрос, нельзя ли без потери качества исключить целую группу регрессоров? Для проверки используют гипотезу о незначимое™ группы коэффициентов (не умаляя общности, далее можно считать, что рассматриваются последние q регрессоров):

(q последних коэффициентов равны нулю);

Н: хотя бы один из этих коэффициентов отличен от нуля.

В этой ситуации регрессия Проверка различных гипотез о коэффициентах. называется регрессией без ограничений, а регрессия с исключенными последними q регрессорами.

Проверка различных гипотез о коэффициентах. — регрессией с ограничениями. Обозначим соответствующие им суммы квадратов через ESS_UR и ESS_r (от слов unrestricted — неограниченный и restricted — ограниченный). При удалении регрессоров ESS не может уменьшиться. Интуитивно понятно, что если ESS увеличилась ненамного, то этим можно пренебречь. Вопрос в том, сколь сильно она увеличивается. Если верпа гипотеза #₀, то статистика.

имеет распределение Фишера с q и (п — k) степенями свободы. На a-процентном уровне значимости эта гипотеза отвергается, если F > F_a(q, n-k), где F_a(q, n-k) — a-процентная точка распределения Фишера F (q, n-k).

Другой способ проверки гипотез (не требующий заранее фиксировать уровень значимости) основан на вычислении вероятности получения данного значения статистики в предположении, что нулевая гипотеза верна. Эконометрические пакеты (EconometricViewSy Gretl, Statistica и др.) приводят значения р-значения^[1] (или p-value или Prob), позволяющие проверять стандартные гипотезы без использования таблиц. Р-значение — это вероятность ошибиться, отвергнув нулевую гипотезу. Если p-значение меньше зафиксированного уровня значимости, то нулевая гипотеза отвергается.

Зачастую эконометрические задачи приводят к вычислениям большого объема. Поэтому эффективное использование эконометрики невозможно без компьютера и современного программного обеспечения. Желая помочь читателю познакомиться с одним из популярных эконометрических пакетов, мы приведем результаты расчетов, сделанных с помощью пакета Gretl, в той форме, в которой он их предлагает пользователю (см. приложение 2). Мы будем использовать общедоступные данные из интернета.

Пример 14.1.

Пусть у нас есть следующие данные для 94 стран¹: GROWTH — средний годовой экономический рост за 1965—1990 гг., LOGGDP65 — логарифм душевого ВНП в 1965 г., LND100 km — доля площади, находящейся не далее 100 км от побережья, POP 100 km — доля населения, живущих не далее 100 км от побережья, TROPICAR — доля площади, находящейся в тропиках, TROPPOP — доля населения, живущая в тропиках, OPEN — доля лет, в течение которых страна была открыта для торговли, POLINST — индекс качества политических институтов (0 — плохо, 10 — хорошо). Как географическое положение влияет на экономический рост?

Для ответа на этот вопрос построим регрессионное уравнение.

Оцененное по МНК уравнение в пакете Gretl имеет следующий вид²: Модель 1: МНК, использованы наблюдения 1—94 Зависимая переменная: GROWTH

	Коэффициент.	Ст. ошибка.	?-статистика.	Р-значсние.
const.	14,3292.	2,59 633.	5,5190.	<0,1.	***.
LND 100 КМ.	— 0,682 959.	1,35 263.	— 0,5049.	0,61 491.
LOGGDP65.	— 1,85 491.	0,365 881.	— 5,0697.	<0,1.	***.
OPEN.	3,14 094.	0,711 277.	4,4159.	0,3.	***.
POLINST.	0,365 219.	0,158 955.	2,2976.	0,2 401.	**.

1 и ЛЬ: http://fmwww.bc.edu/ec-p/data/inst/geodata.dta
2 Здесь и далее мы приводим распечатки пакета СгеМ в той форме, в которой он их предлагает пользователю. Расшифровка сокращений: среднее зав. перемен — среднее зависимой переменной; ст. откл. зав. перемен — стандартное отклонение зависимой переменной; сумма кв. остатков — сумма квадратов остатков; ст. ошибка модели — стандартная ошибка модели; испр. Р-квадрат — исправленный (скорректированный) Л-квадрат; лог. правдоподобие — логарифм функции максимального правдоподобия; крит. Акаике — критерий Акаике. Запись 8,17е-10 означает 8,17 • 10 ¹⁰.

РОРНЮКМ.	1,63 806.	1,48 815.	1,1007.	0,27 408.
TROPICAR.	— 0,819 108.	0,789 786.	— 1,0371.	0,30 258.
TROPPOP.	— 1,16 981.	1,26 062.	— 0,9280.	0,35 602.

Среднее зав. перемен.	3,400 756.	Ст. откл. зав. перемен.	2,525 365.
Сумма кв. остатков.	313,5343.	Ст. ошибка модели.	1,909 384.
А'-квадрат.	0,471 368.	Испр. А-квадрат.	0,428 339.
Р (7, 86).	10,95 485.	Р-значение (F)	8,17е—10.
Лог. правдоподобие.	— 189,9971.	Крит. Акаике.	395,9942.
Крит. Шварца.	416,3405.	Крит. Хепнана — Куинна.	404,2126.

Зафиксируем уровень значимости 0,05. Оценим значимость уравнения в целом. Нулевая гипотеза — все коэффициенты, кроме константы, равны нулю. Первый вариант проверки: так как расчетное значение статистики F= 10,95 больше пятипроцентной точки Р₀₀₅(7,86) = 2,1, то нулевая гипотеза отвергается. Второй вариант проверки: р-значение 8 -10^-10 означает, что отвергая нулевую гипотезу, мы ошибемся в 8−10^м0 процентах случаев, т.с. практически никогда. Следовательно, нулевую гипотезу стоит отвергнуть. Коэффициент детерминации 0,41 означает, что 41% вариации экономического роста объясняется регрессией. Проверим значимость отдельных коэффициентов. Первый вариант проверки: сравниваем модули i-статистик с ?0,05(86) = 1,9. Получаем, что коэффициенты при логарифме душевого ВНП, открытости торговли и индексе качества политических институтов значимы (для них |/| > 1,9). Второй вариант проверки: проверяем, для каких переменных p-значения меньше, чем 0,05. Приходим к такому же выводу. На самом деле, в пакете Gretl тест Стыодента на незначимость коэффициентов проводится автоматически — знаком «*» помечены коэффициенты, значимые на 10%-ном уровне, «**» на 5%-ном уровне, «***» на 1%-ном уровне.

Так как четыре коэффициента оказались незначимыми, то естественно проверить гипотезу о совместной незначимости коэффициентов.

Проверка различных гипотез о коэффициентах. Для этого строим регрессию с ограничением, исключив соответствующие факторы:

Модель 2: МИК, использованы наблюдения 1—94 Зависимая переменная: GROWTH

Коэффициент.	Ст. ошибка.	/-статистика.	Р-значение.
const 9,38 879.	2,889.	4,6736.	0,1.	***.
LOGGDP65 -1,21 939.	0,324 401.	— 3,7589.	0,30.	***.
OPEN 3,63 372.	0,718 595.	5,0567.	<0,1.	***
POLINST 0,318 687.	0,160 029.	1,9914.	0,4 947.

Среднее зав. перемен.	3,400 756.	Ст. откл. зав. перемен.	2,525 365.
Сумма кв. остатков.	356,4708.	Ст. ошибка модели.	1,990 172.
Я-квадрат.	0,398 975.	Испр. /?-квадрат.	0,378 941.
Р (3, 90).	19,91 472.	Р-значение (7).	5,50е—10.
Лог. правдоподобие.	— 196,0292.	Крит. Акаике.	400,0584.
Крит. Шварца.	410,2316.	Крит. Хеннана — Куинна.	404,1677.

Используя суммы квадратов остатков в обеих моделях, вычисляем.

что больше, чем Р (4,8б) = 2,47. Следовательно, исключить все четыре переменные нельзя (несмотря на то, что по тесту Стьюдента они по отдельности незначимы). Попытки исключить только три фактора приводят к итоговому уравнению.

Модель 3: МНК, использованы наблюдения 1—94 Зависимая переменная: GROWTH

	Коэффициент.	Ст. ошибка.	/-статистика.	Р-значение.
const.	14,1935.	2,443.	5,8099.	<0,1.	***.
LOGGDP65.	— 1,79 216.	0,358 234.	— 5,0028.	<0,1.	* * *.
OPEN.	3,20 814.	0,698 087.	4,5956.	0,1.	***.
POLINST.	0,380 688.	0,153 806.	2,4751.	0,1 521.	**.
TROPPOP.	— 2,33 973.	0,738 637.	— 3,1676.	0,211.	***.

Среднее зав. перемен.	3,400 756.	Ст. откл. зав. перемен.	2,525 365.
Сумма кв. остатков.	320,3539.	Ст. ошибка модели.	1,897 230.
Я- квадрат.	0,459 869.	Испр. Р-квадрат.	0,435 594.
Е (4, 89).	18,94 375.	Р-значение (Р).	2,68е-11.
Лог. правдоподобие.	— 191,0084.	Крит. Акаике.	392,0168.
Крит. Шварца.	404,7333.	Крит. Хеннана — Куинна.	397,1533.

или.

Значимый и отрицательный коэффициент при переменной ТЯОРРОР указывает, что чем больше доля населения, живущая в тропиках, тем меньше экономический рост.

Гипотеза о независимых линейных ограничениях общего вида, число которых строго меньше числа регрессоров, проверяется с использованием регрессий с ограничением и без, аналогично тому, как была проверена незначимость группы коэффициентов. Например, для проверки гипотезы о том, что для модели.

выполняются два ограничения.

нам пришлось бы построить регрессию с ограничением Проверка различных гипотез о коэффициентах. Пример 14.2.

Пусть HOUSING: количество новых домов (в 1000), POP: население (млн человек), GNP: ВНП (млрд долл. 1982), UNEMP. уровень безработицы (%), INTRATE: ставка процента по закладной (%)'. Оцените модель.

aside class="viderzhka__img" itemscope itemtype="http://schema.org/ImageObject"> Проверка различных гипотез о коэффициентах.

и проверьте гипотезу Решение

Оценим исходную модель Модель 4: МНК, использованы наблюдения 1—23 Зависимая переменная: _110USING

Коэффициент.	Ст. ошибка.	/-статистика.	P-значение.
const -12,5673.	12,9355.	— 0,9715.	0,34 349.
1РОР 2,69 517.	4,31 359.	0,6248.	0,53 953.
1_GNP 1,7 517.	1,37 195.	0,7837.	0,44 289.
I INTRATE -1,38 855.	0,406 027.	— 3,4199.	0,287 ***.

Среднее зав. перемен.	7,356 288.	Ст. откл. зав. перемен.	0,215 598.
Сумма кв. остатков.	0,559 555.	Ст. ошибка модели.	0,171 611.
Р-квадрат.	0,452 817.	Испр. Р-квадрат.	0,366 420.
Р (3, 19).	5,241 105.	Р-значение (/•').	0,8 343.
Лог. правдоподобие.	10,9 966.	Крит. Акаикс.	— 12,19 931.
Крит. Шварца.	— 7,657 335.	Крит. Хеннана — Куинна.	— 11,5 702.

Отсюда ESS_ur = 0,56. Подставим ограничение (3? = 1- P:? в уравнение Проверка различных гипотез о коэффициентах. ^[2]

и преобразуем его так, чтобы можно было оценить по МНК:

В правой части у второго слагаемого отсутствует коэффициент, поэтому его следует перенести в левую часть, а из третьего и четвертого слагаемых следует вынести общий множитель, чтобы коэффициент получился одинаковым по модулю:

Мы получили уравнение с ограничением. Оценим его.

Модель 5: МНК, использованы наблюдения 1—23 Зависимая переменная: Ь_Н01/5'ШС_Р0Р

Коэффициент Ст. ошибка ?-статистика Р-значение.

сопэГ.	— 0,980 999.	1,273.	— 0,7706.	0,44 994.
ММТКАТЕ.	— 1,11 899.	0,27 287.	— 4,1008.	0,56.
1._СКР_РОР.	2,13 563.	0,699 675.	3,0523.	0,629.

Среднее зав. перемен.	1,991 961.	Ст. откл. зав. перемен.	0,226 095.
Сумма кв. остатков.	0,583 415.	Ст. ошибка модели.	0,170 795.
Р-квадрат.	0,481 231.	Испр. Р-квадрат.	0,429 354.
Р (2, 20).	9,276 402.	Р-значение (Р)	0,1 412.
Лог. правдоподобие.	9,619 438.	Крит. Акаике.	— 13,23 888.
Крит. Шварца.	— 9,832 393.	Крит. Хеннапа — Куинна.	— 12,38 216.

Используя суммы квадратов остатков в обеих моделях, вычисляем.

что меньше, чем Р (1,19) = 4,38. Следовательно, нулевая гипотеза принимается.

[1] Сокращение от probability — вероятность.
[2] URL: dss.ucsd.edu/-rramanat/XLDATA/DATA4−3.XLS

Показать весь текст

Заполнить форму текущей работой