Обнаружение гетероскедастичности.
Эконометрика
Отметим, что этот тест предназначен для анализа больших массивов данных и не всегда его результаты совпадают с результатами других тестов при недостаточном числе наблюдений. В случае множественной линейной регрессии проверка гетероскедастичности производится по каждой из объясняющих переменных. Оцениваются отдельно регрессии для первой подвыборки {k первых наблюдений) и для третьей подвыборки (k… Читать ещё >
Обнаружение гетероскедастичности. Эконометрика (реферат, курсовая, диплом, контрольная)
Обнаружение гетероскедастичности в каждом конкретном случае является сложной задачей. Для знания дисперсий отклонений необходимо знать распределение случайной величины У, соответствующее выбранному значению х-{ (для одного значения xt иметь набор значений У). На практике для каждого конкретного значения xi определяется единственное значение yv что не позволяет оценить дисперсию случайной величины У.
1 Бородич С. А. Эконометрика: учеб, пособие. Минск: Новое знание, 2001. С. 236.
Поэтому не существует какого-либо однозначного метода определения гетероскедастичности.
Для определения наличия в выборке гетероскедастичности рассмотрим следующие тесты: графический анализ остатков, тест ранговой корреляции Спирмена, тест Глейзера и тест Голдфельда — Квандта. Выбор обусловлен относительной простотой тестов и наиболее частым их употреблением.
Графический анализ остатков. Использование графического представления отклонений позволяет определиться с наличием или отсутствием в модели гетероскедастичности. В этом случае по оси абсцисс откладываются значения хх объясняющей переменной X, а в случае множественной регрессии — линейной комбинации объясняющих переменных.
а по оси ординат — отклонения е, — или их квадраты ef, i- 1,2,…, п. Если все отклонения в, находятся внутри полосы постоянной ширины, а отклонения вf находятся внутри полуполосы постоянной ширины, параллельной оси абсцисс, это говорит о независимости дисперсий случайных отклонений ef от значений переменной X и их постоянстве, т. е. в этом случае выполняются условия гомоскедастичности. Отметим, что графический анализ отклонений является удобным и достаточно надежным в случае парной линейной регрессии. На рис. 5.2 приведен пример графика отклонений ef от соответствующего значения объясняющей переменной хх. Очевидно, что отклонения не укладываются в полуполосу постоянной ширины. В данной модели дисперсии случайных отклонений непостоянны. В модели присутствует гетероскедастичность.
Рис. 5.2. График отклонений случайной составляющей е? от величины объясняющей переменной х{
Тест ранговой корреляции Спирмена. Тест выполняется в предположении о том, что дисперсия случайного члена а, = а (еу) меняется с изменением значения хг Следовательно, абсолютные величины остатков ех и хг будут коррелированы. Для проверки того, что дисперсия случайного члена коррелирует с изменением .г, ранжируются величины .г, и |е,| и определяется коэффициент ранговой корреляции Спирмена
где Д — разность между рангами х, и |"г,-| {ранг — порядковый номер значения переменной в ранжированном ряду).
Проверка основной гипотезы #0 (значимость г) проводится по Г-тесту:
Если Унабл > ?кр = ta. v, то гипотеза Я0 отклоняется, следовательно, имеет место гетероскедастичность. Критическое значение ?кр = ta. v берется по таблицам распределения Стыодента; здесь а — уровень значимости; v = п — 2 — число степеней свободы.
Тест Глейзера. В тесте Глейзера ошибка случайного члена базируется на более общих представлениях о значении объясняющей переменной. Например, ошибка случайного члена может аппроксимироваться выражением Gj = а + $х] + |е, |. Далее данная регрессионная зависимость оценивается при различных значениях параметра у, и выбирается наилучшая. Для оценок гетероскедастичность случайного отклонения аппроксимируется таким уравнением:
где Sj = е- — оценка стг С помощью статистики Стьюдента проверяется основная гипотеза Я0 — отсутствие гетероскедастичности. Гипотеза Я0 отклоняется, если коэффициент b в уравнении (5.1) значимо отличается от нуля. Отметим, что для большинства экономических расчетов параметр у = 1.
Тест Голдфелда — Квандта. Тест выполняется в предположении о том, что стандартное отклонение а, = а (е;) пропорционально значению переменной X в этом наблюдении, т. е. of — o2xf, i =1,2,…, п. Второе предположение — е, имеет нормальное распределение и отсутствует автокорреляция остатков.
Последовательность выполнения теста Голдфелда — Квандта следующая.
- 1. Все п наблюдений упорядочиваются по величине X.
- 2. Вся упорядоченная выборка после этого разбивается на три группы
(подвыборки) размерностей k, (п — 2k), k соответственно ().
3. Оцениваются отдельно регрессии для первой подвыборки {k первых наблюдений) и для третьей подвыборки (k последних наблюдений). Если предположение о пропорциональности дисперсий отклонений значениям X верно, то дисперсия регрессии по первой подвыборке (сумма квадратов отклонений)
будет существенно меньше дисперсии регрессии по третьей подвыборке (суммы квадратов отклонений).
4. Для сравнения дисперсий 5, и 53 строится следующая /—статистика:
где р — число объясняющих переменных в каждом уравнении регрессии. Если 5, > 53, то При сделанных предположениях относительно случайных отклонений построенная /'-статистика имеет распределение Фишера с числами степеней свободы v, = v3 = k — р — 1.
5. Если.
то гипотеза об отсутствии гетероскедастичности отклоняется. Здесь а — выбранный уровень значимости.
Отметим, что этот тест предназначен для анализа больших массивов данных и не всегда его результаты совпадают с результатами других тестов при недостаточном числе наблюдений. В случае множественной линейной регрессии проверка гетероскедастичности производится по каждой из объясняющих переменных.
Пример 5.1.
Имеются условные данные по выпуску продукции у на одного работника х (табл. 5.1).
Таблица 5.1
Исходные данные к примеру 5.1.
i | |||||||||
У | |||||||||
X | G. | ||||||||
i | |||||||||
У | |||||||||
X |
Построим модель парной линейной регрессии и проверим наличие гетероскедастичности.
Решение. Пусть модель регрессии выражается линейным уравнением Используя обычный МИК, получим
Проверим модель на наличие гетероскедастичности, применяя рассмотренные выше методы.
1. Графический анализ остатков.
В табл. 5.2 приведены значения остатков, полученные по уравнению регрессии.
Таблица 5.2
Значения остатков.
i | |||||||||
X | |||||||||
е,. | 10,37. | — 3,71. | — 15,57. | 5,71. | 44,20. | 11,54. | — 14,05. | 4,26. | 8,51. |
i | |||||||||
X | |||||||||
— 4,12. | — 22,08. | 42,06. | 40,55. | — 33,66. | — 43,69. | — 39,42. | 17,78. | — 8,69. |
График остатков е, = г/; -yt позволяет предполагать наличие гетероскедастичности (рис. 5.3).
Рис. 53. График остатков.
2. Проверка гетероскедастичности по тесту Спирмена.
Для этого расположим все наблюдения в порядке возрастания объясняющей переменной .г, рассчитав yt. найдем остатки е, модуль остатков |е, |, в порядке возрастания ранги Xj и е:| и квадрат разности между этими рангами Df. Результаты представлены в табл. 5.3.
Таблица 53
Расчеты для теста Спирмена.
i | X | kl. | Ранг Xj | Ранг | С; |. | А. | А2 |
i. | ||||||
i. | 4,12. | — 1. | ||||
3,71. | ||||||
15,57. | — 7. | |||||
5,71. | ||||||
4,26. |
i | X | kl. | Ранг Xj | Ранг е{ | А. | D? |
11,54. | — 2. | |||||
14,05. | — 2. | |||||
10,37. | ||||||
8,51. | ||||||
17,78. | — 1. | |||||
22,08. | И. | — 1. | ||||
42,06. | — 4. | |||||
44,20. | — 5. | |||||
33,66. | ||||||
43,69. | — 2. | |||||
8,69. | ||||||
39,42. | ||||||
40,55. |
Находим коэффициент ранговой корреляции Спирмена:
Проверяем значимость полученного коэффициента по ?-тесту:
Т ак как ?кр = v = ?(0,05; 16) = 2,12, гипотеза Я0 отклоняется, следовательно, имеет место гетероскедасти ч ность.
3. Проверка гетерос кедасти чности по тесту Глейзера.
Гетероскедастичность случайного отклонения аппроксимируется уравнением (5.1) для у = 1: S; = а + bxj.
Остатки для уравнения регрессии = 13,53 + 2,86х, представлены в табл. 5.2. Применяя обычный МНК к. г, и et| (столбцы 2 и 3 табл. 5.3), находим коэффициенты а и b:
здесь Sj = е
Значимость коэффициента b:
Гипотеза Я0 отклоняется, b значимо отличается от нуля. В модели имеет место гетероскедастичность (определение Sb рассмотрено в параграфе 3.5).
4. Проверка гетероскедастичности по тесту Голдфелда — Квандта. Упорядоченная по х выборка (см. табл. 5.1) разбивается на три группы 6 — 6 —.
б наблюдений. Для первой и третьей групп по МНК строятся уравнения регрессии:
и находится отношение квадратов остатков.
Критическое значение FKp = F005.4.4 = 6,39. Так как наблюдаемое значение больше критического, нулевая гипотеза #0 отклоняется. Гетероскедастичность в выборке, представленной в табл. 5.1, есть.
Вывод. Все тесты показали наличие гетероскедастичности остатков, т. е. невыполнение одной из предпосылок МНК.
Замечание 5.1. Если хотя бы один из примененных тестов показал наличие гетероскедастичности, а остальные — нет, то гипотеза об отсутствии гетероскедастичности отклоняется.