Проверка различных гипотез о коэффициентах
В некоторых случаях целесообразнее использовать одностороннюю альтернативу, например, для нулевой гипотезы Щ:$т = ss* можно рассмотреть альтернативы Н{: ssw > ss* или Я1: ssw
Проверка различных гипотез о коэффициентах (реферат, курсовая, диплом, контрольная)
Важную роль в экономической интерпретации регрессионных уравнений играет проверка различных гипотез о коэффициентах. Обычно начинают с проверки гипотезы о незначимости регрессии в целом:
(все коэффициенты кроме константы равны нулю);
Нх хотя бы один из этих коэффициентов отличен от 0.
Идея теста Фишера состоит в следующем: если мы правильно выбрали регрессоры, то RSS будет существенно больше, чем ESS, т. е. при достаточно большом значении RSS/ESS стоит отвергнуть нулевую гипотезу. Более формально, если верна гипотеза #0, то статистика.
имеет распределение Фишера с (k — 1) и (п — k) степенями свободы. На a-процентном уровне значимости эта гипотеза отвергается, если F > Fa(k-ltn-k), где Fa(k-l, n-k) — a-процентная точка распределения Фишера F (k-yn-k).
Чтобы узнать, какие факторы оказывают влияние на зависимую переменную, проверяют гипотезу о незначимости отдельного коэффициента:
Если верна гипотеза #0, то статистика t = (З/sp имеет распределение Стыодента с (п — к) степенями свободы. На а-процентном уровне значимости эта гипотеза отвергается, если >ta/2{n-k)y где ta/2(n-k) — a/2-процентная точка распределения Стыодента t (n-k). Если в уравнении есть ровно один незначимый коэффициент, то соответствующий ему регрессор можно удалить из уравнения. Этот тест можно обобщить для проверки гипотезы о значении отдельного коэффициента:
Тогда ?-статистика принимает вид t = ((3 — |3*)/$р, а процедура проверки сохраняется.
В некоторых случаях целесообразнее использовать одностороннюю альтернативу, например, для нулевой гипотезы Щ:$т = ss* можно рассмотреть альтернативы Н{: ssw > ss* или Я1: ssw < ss*. В такой ситуации мы оказываемся, если априори известно, что величина ss/;/ принимает значения, лежащие по одну сторону от ss*. На а-ироцентном уровне значимости нулевая гипотеза отвергается, если t > ta(n — k) (соответственно, t < -ta(n — k)). Желая подчеркнуть, что речь идет о i-статистике для проверки гипотезы о коэффициенте ssw, при переменной Хт используют обозначение tXm-
Нередко возникает вопрос, нельзя ли без потери качества исключить целую группу регрессоров? Для проверки используют гипотезу о незначимое™ группы коэффициентов (не умаляя общности, далее можно считать, что рассматриваются последние q регрессоров):
(q последних коэффициентов равны нулю);
Н: хотя бы один из этих коэффициентов отличен от нуля.
В этой ситуации регрессия называется регрессией без ограничений, а регрессия с исключенными последними q регрессорами.
— регрессией с ограничениями. Обозначим соответствующие им суммы квадратов через ESSUR и ESSr (от слов unrestricted — неограниченный и restricted — ограниченный). При удалении регрессоров ESS не может уменьшиться. Интуитивно понятно, что если ESS увеличилась ненамного, то этим можно пренебречь. Вопрос в том, сколь сильно она увеличивается. Если верпа гипотеза #0, то статистика.
имеет распределение Фишера с q и (п — k) степенями свободы. На a-процентном уровне значимости эта гипотеза отвергается, если F > Fa(q, n-k), где Fa(q, n-k) — a-процентная точка распределения Фишера F (q, n-k).
Другой способ проверки гипотез (не требующий заранее фиксировать уровень значимости) основан на вычислении вероятности получения данного значения статистики в предположении, что нулевая гипотеза верна. Эконометрические пакеты (EconometricViewSy Gretl, Statistica и др.) приводят значения р-значения[1] (или p-value или Prob), позволяющие проверять стандартные гипотезы без использования таблиц. Р-значение — это вероятность ошибиться, отвергнув нулевую гипотезу. Если p-значение меньше зафиксированного уровня значимости, то нулевая гипотеза отвергается.
Зачастую эконометрические задачи приводят к вычислениям большого объема. Поэтому эффективное использование эконометрики невозможно без компьютера и современного программного обеспечения. Желая помочь читателю познакомиться с одним из популярных эконометрических пакетов, мы приведем результаты расчетов, сделанных с помощью пакета Gretl, в той форме, в которой он их предлагает пользователю (см. приложение 2). Мы будем использовать общедоступные данные из интернета.
Пример 14.1.
Пусть у нас есть следующие данные для 94 стран1: GROWTH — средний годовой экономический рост за 1965—1990 гг., LOGGDP65 — логарифм душевого ВНП в 1965 г., LND100 km — доля площади, находящейся не далее 100 км от побережья, POP 100 km — доля населения, живущих не далее 100 км от побережья, TROPICAR — доля площади, находящейся в тропиках, TROPPOP — доля населения, живущая в тропиках, OPEN — доля лет, в течение которых страна была открыта для торговли, POLINST — индекс качества политических институтов (0 — плохо, 10 — хорошо). Как географическое положение влияет на экономический рост?
Для ответа на этот вопрос построим регрессионное уравнение.
Оцененное по МНК уравнение в пакете Gretl имеет следующий вид2: Модель 1: МНК, использованы наблюдения 1—94 Зависимая переменная: GROWTH
Коэффициент. | Ст. ошибка. | ?-статистика. | Р-значсние. | ||
const. | 14,3292. | 2,59 633. | 5,5190. | <0,1. | ***. |
LND 100 КМ. | — 0,682 959. | 1,35 263. | — 0,5049. | 0,61 491. | |
LOGGDP65. | — 1,85 491. | 0,365 881. | — 5,0697. | <0,1. | ***. |
OPEN. | 3,14 094. | 0,711 277. | 4,4159. | 0,3. | ***. |
POLINST. | 0,365 219. | 0,158 955. | 2,2976. | 0,2 401. | **. |
- 1 и ЛЬ: http://fmwww.bc.edu/ec-p/data/inst/geodata.dta
- 2 Здесь и далее мы приводим распечатки пакета СгеМ в той форме, в которой он их предлагает пользователю. Расшифровка сокращений: среднее зав. перемен — среднее зависимой переменной; ст. откл. зав. перемен — стандартное отклонение зависимой переменной; сумма кв. остатков — сумма квадратов остатков; ст. ошибка модели — стандартная ошибка модели; испр. Р-квадрат — исправленный (скорректированный) Л-квадрат; лог. правдоподобие — логарифм функции максимального правдоподобия; крит. Акаике — критерий Акаике. Запись 8,17е-10 означает 8,17 • 10 10.
РОРНЮКМ. | 1,63 806. | 1,48 815. | 1,1007. | 0,27 408. |
TROPICAR. | — 0,819 108. | 0,789 786. | — 1,0371. | 0,30 258. |
TROPPOP. | — 1,16 981. | 1,26 062. | — 0,9280. | 0,35 602. |
Среднее зав. перемен. | 3,400 756. | Ст. откл. зав. перемен. | 2,525 365. |
Сумма кв. остатков. | 313,5343. | Ст. ошибка модели. | 1,909 384. |
А'-квадрат. | 0,471 368. | Испр. А-квадрат. | 0,428 339. |
Р (7, 86). | 10,95 485. | Р-значение (F) | 8,17е—10. |
Лог. правдоподобие. | — 189,9971. | Крит. Акаике. | 395,9942. |
Крит. Шварца. | 416,3405. | Крит. Хепнана — Куинна. | 404,2126. |
Зафиксируем уровень значимости 0,05. Оценим значимость уравнения в целом. Нулевая гипотеза — все коэффициенты, кроме константы, равны нулю. Первый вариант проверки: так как расчетное значение статистики F= 10,95 больше пятипроцентной точки Р005(7,86) = 2,1, то нулевая гипотеза отвергается. Второй вариант проверки: р-значение 8 -10-10 означает, что отвергая нулевую гипотезу, мы ошибемся в 8−10м0 процентах случаев, т.с. практически никогда. Следовательно, нулевую гипотезу стоит отвергнуть. Коэффициент детерминации 0,41 означает, что 41% вариации экономического роста объясняется регрессией. Проверим значимость отдельных коэффициентов. Первый вариант проверки: сравниваем модули i-статистик с ?0,05(86) = 1,9. Получаем, что коэффициенты при логарифме душевого ВНП, открытости торговли и индексе качества политических институтов значимы (для них |/| > 1,9). Второй вариант проверки: проверяем, для каких переменных p-значения меньше, чем 0,05. Приходим к такому же выводу. На самом деле, в пакете Gretl тест Стыодента на незначимость коэффициентов проводится автоматически — знаком «*» помечены коэффициенты, значимые на 10%-ном уровне, «**» на 5%-ном уровне, «***» на 1%-ном уровне.
Так как четыре коэффициента оказались незначимыми, то естественно проверить гипотезу о совместной незначимости коэффициентов.
Для этого строим регрессию с ограничением, исключив соответствующие факторы:
Модель 2: МИК, использованы наблюдения 1—94 Зависимая переменная: GROWTH
Коэффициент. | Ст. ошибка. | /-статистика. | Р-значение. | |
const 9,38 879. | 2,889. | 4,6736. | 0,1. | ***. |
LOGGDP65 -1,21 939. | 0,324 401. | — 3,7589. | 0,30. | ***. |
OPEN 3,63 372. | 0,718 595. | 5,0567. | <0,1. | *** |
POLINST 0,318 687. | 0,160 029. | 1,9914. | 0,4 947. |
Среднее зав. перемен. | 3,400 756. | Ст. откл. зав. перемен. | 2,525 365. |
Сумма кв. остатков. | 356,4708. | Ст. ошибка модели. | 1,990 172. |
Я-квадрат. | 0,398 975. | Испр. /?-квадрат. | 0,378 941. |
Р (3, 90). | 19,91 472. | Р-значение (7). | 5,50е—10. |
Лог. правдоподобие. | — 196,0292. | Крит. Акаике. | 400,0584. |
Крит. Шварца. | 410,2316. | Крит. Хеннана — Куинна. | 404,1677. |
Используя суммы квадратов остатков в обеих моделях, вычисляем.
что больше, чем Р (4,8б) = 2,47. Следовательно, исключить все четыре переменные нельзя (несмотря на то, что по тесту Стьюдента они по отдельности незначимы). Попытки исключить только три фактора приводят к итоговому уравнению.
Модель 3: МНК, использованы наблюдения 1—94 Зависимая переменная: GROWTH
Коэффициент. | Ст. ошибка. | /-статистика. | Р-значение. | ||
const. | 14,1935. | 2,443. | 5,8099. | <0,1. | ***. |
LOGGDP65. | — 1,79 216. | 0,358 234. | — 5,0028. | <0,1. | * * *. |
OPEN. | 3,20 814. | 0,698 087. | 4,5956. | 0,1. | ***. |
POLINST. | 0,380 688. | 0,153 806. | 2,4751. | 0,1 521. | **. |
TROPPOP. | — 2,33 973. | 0,738 637. | — 3,1676. | 0,211. | ***. |
Среднее зав. перемен. | 3,400 756. | Ст. откл. зав. перемен. | 2,525 365. |
Сумма кв. остатков. | 320,3539. | Ст. ошибка модели. | 1,897 230. |
Я- квадрат. | 0,459 869. | Испр. Р-квадрат. | 0,435 594. |
Е (4, 89). | 18,94 375. | Р-значение (Р). | 2,68е-11. |
Лог. правдоподобие. | — 191,0084. | Крит. Акаике. | 392,0168. |
Крит. Шварца. | 404,7333. | Крит. Хеннана — Куинна. | 397,1533. |
или.
Значимый и отрицательный коэффициент при переменной ТЯОРРОР указывает, что чем больше доля населения, живущая в тропиках, тем меньше экономический рост.
Гипотеза о независимых линейных ограничениях общего вида, число которых строго меньше числа регрессоров, проверяется с использованием регрессий с ограничением и без, аналогично тому, как была проверена незначимость группы коэффициентов. Например, для проверки гипотезы о том, что для модели.
выполняются два ограничения.
нам пришлось бы построить регрессию с ограничением Пример 14.2.
Пусть HOUSING: количество новых домов (в 1000), POP: население (млн человек), GNP: ВНП (млрд долл. 1982), UNEMP. уровень безработицы (%), INTRATE: ставка процента по закладной (%)'. Оцените модель.
и проверьте гипотезу Решение
Оценим исходную модель Модель 4: МНК, использованы наблюдения 1—23 Зависимая переменная: _110USING
Коэффициент. | Ст. ошибка. | /-статистика. | P-значение. |
const -12,5673. | 12,9355. | — 0,9715. | 0,34 349. |
1РОР 2,69 517. | 4,31 359. | 0,6248. | 0,53 953. |
1_GNP 1,7 517. | 1,37 195. | 0,7837. | 0,44 289. |
I INTRATE -1,38 855. | 0,406 027. | — 3,4199. | 0,287 ***. |
Среднее зав. перемен. | 7,356 288. | Ст. откл. зав. перемен. | 0,215 598. |
Сумма кв. остатков. | 0,559 555. | Ст. ошибка модели. | 0,171 611. |
Р-квадрат. | 0,452 817. | Испр. Р-квадрат. | 0,366 420. |
Р (3, 19). | 5,241 105. | Р-значение (/•'). | 0,8 343. |
Лог. правдоподобие. | 10,9 966. | Крит. Акаикс. | — 12,19 931. |
Крит. Шварца. | — 7,657 335. | Крит. Хеннана — Куинна. | — 11,5 702. |
Отсюда ESSur = 0,56. Подставим ограничение (3? = 1- P:? в уравнение [2]
и преобразуем его так, чтобы можно было оценить по МНК:
В правой части у второго слагаемого отсутствует коэффициент, поэтому его следует перенести в левую часть, а из третьего и четвертого слагаемых следует вынести общий множитель, чтобы коэффициент получился одинаковым по модулю:
Мы получили уравнение с ограничением. Оценим его.
Модель 5: МНК, использованы наблюдения 1—23 Зависимая переменная: Ь_Н01/5'ШС_Р0Р
Коэффициент Ст. ошибка ?-статистика Р-значение.
сопэГ. | — 0,980 999. | 1,273. | — 0,7706. | 0,44 994. |
ММТКАТЕ. | — 1,11 899. | 0,27 287. | — 4,1008. | 0,56. |
1._СКР_РОР. | 2,13 563. | 0,699 675. | 3,0523. | 0,629. |
Среднее зав. перемен. | 1,991 961. | Ст. откл. зав. перемен. | 0,226 095. |
Сумма кв. остатков. | 0,583 415. | Ст. ошибка модели. | 0,170 795. |
Р-квадрат. | 0,481 231. | Испр. Р-квадрат. | 0,429 354. |
Р (2, 20). | 9,276 402. | Р-значение (Р) | 0,1 412. |
Лог. правдоподобие. | 9,619 438. | Крит. Акаике. | — 13,23 888. |
Крит. Шварца. | — 9,832 393. | Крит. Хеннапа — Куинна. | — 12,38 216. |
Используя суммы квадратов остатков в обеих моделях, вычисляем.
что меньше, чем Р (1,19) = 4,38. Следовательно, нулевая гипотеза принимается.