Помощь в написании студенческих работ
Антистрессовый сервис

Упражнения с пояснениями

РефератПомощь в написанииУзнать стоимостьмоей работы

Рис. 13.34. Коррелограмма ряда значений ИПЦ Исходя из анализа коррелограммы мы можем заключить, что единичные корни отсутствуют, есть месячная сезонность. Построим сезонную модель. Команда arima, как следует из ее названия, позволяет оценить ARIMA (p, d, г/)-модель, в опциях этой команды можно задавать параметры модели. Для получения сезонной части необходимо воспользоваться опцией sarima (P, D… Читать ещё >

Упражнения с пояснениями (реферат, курсовая, диплом, контрольная)

Упражнение 13.1. Проанализируем ряд квартальных значений безработицы, используя приведенную методологию исследования ряда. Данные содержатся в базе unem. Будем использовать статистический пакет EViews.

Решение. Согласно методологии проанализируем сезонность ряда уровней безработицы. Для этого построим коррелограмму. Чтобы создать коррелограмму, откройте окно со значениями ряда и нажмите View, затем выберите Correlogram…, и у вас появится следующее окно (рис. 13.11).

В этом окне можно выбрать, для уровней или для разностей вы будете строить коррелограмму и сколько лагов можно отобразить на рисунке. В результате отобразится коррелограмма, как на рис. 13.12.

Как можно заметить, есть значимые пики, указывающие на сезонность, поэтому необходимо оценить AR (A)-, МЛ (4) — и ARM/1(4,4)-модели, чтобы корректно учесть сезонность. Для того чтобы оценить модель, нужно нажать вверху окна кнопку Quick, а затем выбрать Estimate Equation… В появившемся окне необходимо ввести формулу для оцениваемой модели и ограничить выборку (рис. 13.13).

Окно задания коррелограммы в EViews.

Рис. 13.11. Окно задания коррелограммы в EViews

Коррелограмма ряда уровня безработицы.

Рис. 13.12. Коррелограмма ряда уровня безработицы.

Задание параметров для оценки модели в EViews.

Рис. 13.13. Задание параметров для оценки модели в EViews

В подразделе Equation specification вводится формула для модели. Сначала пишется название зависимой переменной, потом перечисляются названия регрессоров: р-й лаг зависимой переменной задается как ипет (-р), q-й лаг МД-части — как та (<7), константа прописывается как с. Все переменные записываются в формуле через пробел, т. е. формула, например, для ARMA (2, 2) с константой будет задаваться как.

|| unem с unem (-l) unem (-2) ma (l) гаа (2).

В подразделе Estimation settings можно менять метод оценки модели (Method), а также размер выборки (Sample), по которой будет оцениваться модель. Для нашей модели изменим размер выборки на 2000ql—2014q3, так как прогнозирование должно быть корректным: обучающая выборка нс должна пересекаться с тестовой выборкой. Для учета сезонности включим лаги AR (4) и МА (4) и попробуем оценить AR (A), МА (А) и ARMA (A, 4) (для подбора сезонной части модели удобно пользоваться информационными критериями, в данном случае мы опираемся на AIC). Получилось, что наилучшей моделью является модель ARMA (4, 4)[1]:

Sample (adjusted): 2001Q2 2014Q3, Included observations: 54 after adjustments Convergence achieved after 24 iterations, MA Backcast: 2000Q2 2001Q1.

Variable.

Coefficient.

Std. Error.

t-Statistic.

Prob.

D_UNEM (-4).

0,957 654.

0,2 041.

46,92 104.

МА (4).

— 0,962 612.

0,51 897.

— 18,54 843.

R-squared.

0,640 609.

Mean dependent var.

— 0,94 444.

Adjusted R-squared.

0,633 697.

S.D. dependent var.

0,642 935.

S.E. of regression.

0,389 123.

Akaike info criterion.

0,98 649.

Sum squared resid.

7,873 662.

Schwarz criterion.

1,60 156.

Log likelihood.

— 24,63 524.

Hannan-Quinn criter.

1,14 901.

Durbin-Watson stat.

1,382 087.

Inverted MA Roots 0,99.

— 0,00+0,99i.

— 0,00−0,99i.

— 0,99.

Однако эта модель содержит сезонный единичный корень и необратимую сезонную МЛ-часть (поскольку коэффициенты перед соответствующими переменными значимы и равны 0,96 и -0,96 соответственно), поэтому нужно перейти к сезонным разностям. Создадим новую переменную unem sa по формуле ипет — ипет (-А). Сначала нужно нажать на кнопку Genr, а в появившемся окне (рис. 13.14) введем команду вида.

|| ИмяНовойПеременной = формула: unem_sa = unem — unem (-4).

Построим график и коррелограмму первых разностей переменной unem_sa (рис. 13.15).

Создание новой переменной в EViews.

Рис. 13.14. Создание новой переменной в EViews.

Исходя из визуального анализа можно заключить, что этот ряд нс является стационарным. Этот же результат был показан и в упражнении 12.1. Для перепроверки еще раз проведем тест Дики — Фуллера (тест ряда ипет на единичный корень без константы). Получим.

График и коррелограмма сезонных разностей уровня безработицы.
Рис. 13.15. График и коррелограмма сезонных разностей уровня безработицы.

Рис. 13.15. График и коррелограмма сезонных разностей уровня безработицы.

Теперь перейдем к первым разностям переменной unemsa, создав переменную d_unem_sa = d (unem_sa) (рис. 13.16).

Выберем наилучшую модель для ряда на основе качества прогноза. Длину прогнозного окна примем равную двум периодам, а в качестве критерия качества выберем МАРЕ.

Сначала построим для новой переменной график и коррелограмму (рис. 13.17).

Из анализа коррелограммы получаем, что в данных осталась сезонность, образованная МЛ (4)-частыо, а скорей всего одна из трех моделей: AR ( 1), МА ( 1),.

ARMA ( 1, 1) — будет обладать наилучшей объясняющей силой. Выберем наилучшую модель из вышеперечисленных, проанализировав их качество прогноза (читатель может убедиться, что другие модели будут обладать гораздо более плохим качеством прогноза). В случае если наша цель — прогнозирование, то можно поменять этапы 3 и 4 процедуры Бокса — Дженкинса местами. Для построения прогноза нам сначала необходимо переоценить модель, ограничив выборку, в нашем случае исключим последние два наблюдения (напомним, это делается в разделе Sample). Нажмите (Ж, а затем в появившемся окне нажмите кнопку Forecast вверху. В подразделе Forecast sample напишите 2014q4 2015ql и нажмите OK (рис. 13.18).

Puc. 13.18. Задание параметров для построения прогноза.

Puc. 13.18. Задание параметров для построения прогноза.

Создание еще одной переменной.

Рис. 13.16. Создание еще одной переменной.

Sample 2000Q1 2015Q1 included observations 56.

График и коррелограмма разностей сезонно скорректированного.

Рис. 13.17. График и коррелограмма разностей сезонно скорректированного уровня безработицы.

_I ———;

(=) fcqwtiore UNIITIED WcrtMe UNByfcUnen — П X.

|Ww| Pto< | Otyct | Цн—|.

Затем у вас появится окно с графиком прогноза, его доверительным интервалом и мерами качества прогноза (рис. 13.19, интерпретация последних четырех строчек таблицы выходит за границы данного учебника).

Прогноз разности сезонно скорректированного уровня безработицы.

Рис. 13.19. Прогноз разности сезонно скорректированного уровня безработицы

Наилучшей моделью по критерию МАРЕ оказалась модель Упражнения с пояснениями.

на ней и остановим наш анализ. Стоит отмстить, что качество прогноза достаточно высоко (значения критериев качества прогноза RMSE, МАЕ, МАРЕ сигнализируют о малых ошибках прогноза).

Хотя эта модель используется исключительно для прогнозирования, протестируем ее на возможные недостатки. Сначала проверим нормальность остатков. Выберем View — Residual Diagnostics — Histogram — Normality Test (рис. 13.20).

Результаты проверки представлены на рис. 13.21.

Выбор проверки нормальности остатков.

Рис. 13.20. Выбор проверки нормальности остатков

Тест нормальности остатков модели ипет.

Рис. 13.21. Тест нормальности остатков модели ипет

Исходя из результатов теста Харке — Бера можно заключить, что остатки распределены не по нормальному закону (p-value примерно равно 0). В нашем случае это не столь критично, так как модель используется для прогнозирования, в моделях временных рядов остатки часто будут распределены не, но нормальному закону.

Теперь протестируем остатки на автокорреляцию. Нажмите View — Residual Diagnostics — Serial Correlation LM Test… Далее у вас возникнет окно, где нужно будет выбрать количество лагов для теста Бройша — Годфри. В данном случае можно оставить количество лагов по умолчанию — 2 (рис. 13.22).

Выбор параметров для проверки на автокорреляцию.

Рис. 13.22. Выбор параметров для проверки на автокорреляцию.

Получим.

Упражнения с пояснениями.

Учитывая, что p-value достаточно близко к 0,05 и что модель выбирается для прогноза, можно заключить, что учитывать автокорреляцию в данном случае не столь существенно (добавление Д#(1)-части, которая может поправить проблему автокорреляции остатков в модели, приведет к резкому ухудшению качества прогноза в силу увеличения числа параметров при не очень большой выборке).

Проверим остатки на гетероскедастичность с помощью теста Уайта: необходимо выбрать View — Residual Diagnostics — Heteroskedasticity Tests… — White.

Упражнения с пояснениями.

Очевидно, что гетероскедастичность есть, так как нулевая гипотеза отвергается на 5%-ном уровне значимости, поэтому перестроим прогноз для нашей модели. Для этого используем оценки дисперсий оценок коэффициентов в форме Уайта. Для этого нажмем в окне с результатами оценки модели еще раз кнопку Estimate, после выберем вкладку Options, а в подразделе Coefficient covariance matrix выберем опцию White (рис. 13.23).

Выбор ковариационной матрицы в форме Уайта.

Рис. 13.23. Выбор ковариационной матрицы в форме Уайта.

Упражнения с пояснениями.

Однако теперь А7?(1)-часть в модели незначима. Уберем этот регрессор и перестроим прогноз (рис. 13.24).

Новый прогноз разности сезонно скорректированного.

Рис. 13.24. Новый прогноз разности сезонно скорректированного.

уровня безработицы Из-за учета гетероскедастичности поменялись стандартные ошибки коэффициентов и поэтому немного изменились доверительные интервалы для прогноза. Более того, из-за исключения AR ( 1)-части немного улучшилось качество прогноза.

Поскольку был построен прогноз для преобразованных разностей, то необходимо перейти к уровням, чтобы его можно было удобно интерпретировать. Для этого создадим сначала переменную, которая содержит прогнозы для первых разностей: d_unem _Jor = d_unem_saf + d_unem (-4).

Затем необходимо переходить к созданию переменной, которая будет соответствовать прогнозу для значений оригинального ряда. Однако использование формулы шгет_for = d unem_for + ипет (-) в данном случае не совсем корректно для второй точки прогноза, так как при прогнозировании на первый квартал 2015 г. мы не знаем истинного значения четвертого квартала 2014 г., поэтому мы должны использовать прогноз. В итоге для расчета прогноза на четвертый квартал 2014 г. необходимо сложить прогноз первой разности на этот период и реальное значение ряда период назад, а для расчета второй точки необходимо сложить прогноз разности на текущей период и прогноз уровня ряда, который мы рассчитали до этого.

В итоге полученные значения можно представить в следующей таблице:

Реальное значение.

Прогноз разности.

Прогноз.

2014Q3.

4,9.

(-0,200 000).

(5,1).

2014Q4.

5,1.

0,181 172.

5,281 172.

2015Q1.

5,6.

0,520 656.

5,801 828.

Качество прогноза высоко, модель достаточно точно предугадала динамику ряда. Читатель может сам рассчитать критерии качества прогноза для данной модели.

Упражнение 13.2. Используя базу SP500, в которой представлены ежедневные значения цены закрытия индекса SP500 начиная с января 2012 г. и заканчивая 29 мая 2015 г., построим наиболее оптимальную модель для прогнозирования. Расчеты будем выполнять в EViews.

Решение. Загрузите файл SP500. csv в EViews аналогично тому, как осуществлялись загрузки файлов в предыдущих упражнениях, за одним исключением — на последнем, 4-м шаге импортирования данных выберите структуру данных Dated — regularfrequancy. В подразделе Frequency/date specification в качестве Frequency выберите Integer Date, а в Start Date поставьте значение «1», чтобы задать начальный момент времени (рис. 13.25). Э го необходимо сделать из-за дневной структуры данных.

Построим график и коррелограмму ряда (рис. 13.26).

Выбор параметров загрузки.

Рис. 13.25. Выбор параметров загрузки

График и коррелограмма индекса SP500.

Рис. 13.26. График и коррелограмма индекса SP500

Ряд скорее всего является нестационарным из-за наличия единичного корня. Проведем тест Дики — Фуллера (в двух версиях, с трендом и константой и только с константой) для проверки этой гипотезы.

Результаты теста ряда SP500 на единичный корень с константой:

Null Hypothesis: SP500 has a unit root, Exogenous: Constant, Linear Trend Lag Length: 0 (Automatic — based on SIC, maxlag=20).

Augmented Dickey-Fuller test statistic.

t-Statistic.

— 4,257 556.

Prob*.

0,0038.

Test critical values:

1 % level.

— 3,968 820.

5% level.

— 3,415 080.

10% level.

— 3,129 732.

‘ MacKinnon (1996) one-sided p-values.

Результаты тестов с константой и трендом и только с константой расходятся. Наиболее вероятным кажется случай, когда в модель включена константа, так как судя по графику модель не содержит одновременно линейный тренд и единичный корень (иначе был бы заметен квадратичный тренд).

Исследование оригинального ряда достаточно просто и не представляет особого практического и научного интереса, поэтому создадим ряд доходностей на основе ори;

7−1.

SP500. — SP500,.

SP500.

Упражнения с пояснениями.

Результаты теста ряда SP500 на единичный корень с константой и трендом:

Упражнения с пояснениями.

гипалыюго ряда, сделав соответствующие преобразования: rt = -

t-

Построим для полученного ряда график и коррелограмму (рис. 13.27).

Очевидно, что данные являются практически белым шумом. Это достаточно фундаментальный результат, вытекающий из гипотезы эффективного рынка. При эффективном рынке не существует стратегии, позволяющей зарабатывать сверхприбыль, а поскольку линейная эконометрическая модель представляет собой простейший пример такой стратегии, то вполне ожидаемо, что спрогнозировать динамику индекса практически невозможно. Тем не менее на коррелограмме про;

График и коррелограмма доходности SP500.

Рис. 13.27. График и коррелограмма доходности SP500

слеживается некоторый аналог недельной сезонности, значимы четвертые лаги — учтем это в модели. Результат оценивания модели ARMA (4, 4) для доходности SP500 следующий:

Упражнения с пояснениями.

Из полученных результатов можно заключить, что, во-первых, средняя доходность больше нуля, во-вторых, необходимо учитывать сезонность. Проведем тестирование модели.

Результаты теста на нормальность остатков представлены на рис. 13.28.

Гипотеза о нормальности остатков отвергается на любом адекватном уровне значимости.

Тест нормальности остатков модели SP500.

Рис. 13.28. Тест нормальности остатков модели SP500

Результаты теста ряда доходностей SP500 на серийную корреляцию следующие:

Упражнения с пояснениями.

Согласно тесту Бройша — Годфри гипотеза об отсутствии автокорреляции в остатках модели не отвергается на любом адекватном уровне значимости.

Результаты теста Уайта на гетероскедастичность для модели доходности SP500 следующие:

Упражнения с пояснениями.

Согласно тесту Уайта гипотеза о гомосксдастичности нс отвергается на любом адекватном уровне значимости.

Для построения прогноза исключим последнее наблюдение из выборки при оценке модели:

Упражнения с пояснениями.

Сделаем прогноз (рис. 13.29). На рисунке слева среднее значение — это точечный прогноз, а верхнее и нижнее значения — доверительные интервалы.

Прогноз доходности SP500.

Рис. 13.29. Прогноз доходности SP500

Можно легко заметить, что качество прогноза низко, поэтому торговую стратегию на этой модели построить сложно. Для более высокого качества подгонки требуется применение гораздо более продвинутых моделей и методов оценивания.

Упражнение 13.3. Используя статистический пакет Ry проведем исследование ряда квартального ВВП России (период: I квартал 1995 г. — I квартал 2015 г.) (база gdp).

Решение. В предыдущей главе в упражнении 12.3 мы установили, что при анализе этого ряда в целях повышения репрезентативности следует рассматривать период начиная с 1 квартала 2000 г., при этом ряд ВВП является стационарным в первых разностях.

Создадим и рассмотрим коррелограмму для уровней (рис. 13.30, пунктир обозначает доверительный интервал для гипотезы о значимости конкретного коэффициента корреляции, т. е. если значение лежит внутри этого интервала, то оно статистически равно нулю):

gdp <- data$GDP[21:81].

acf (gdp).

Коррелограмма временного ряда ВВП.

Рис. 1330. Коррелограмма временного ряда ВВП

Исходя из анализа коррелограммы можно заключить, что процесс содержит квартальную сезонность. Оценим соответствующую модель:

|| arima (gdp, seasonal = list (order = c (lL, OL, 1L), period = 4)).

Получим.

Call :

arima (x = gdp, seasonal = list (order = c (lL, OL, 1L), period = 4)).

Coefficients:

sari smal intercept 0.9604 0.3040 8611.075.

s.e. 0.0260 0.1043 989.873.

sigma~2 estimated as 231 084: log likelihood = -469.58, aic = 947.16.

Как легко заметить, процесс содержит сезонный единичный корень — уберем его, взяв сезонную разность. Затем проведем тестирование стационарности преобразованного ряда:

gdp_diff4 <- diffCgdp, lag = 4, differences = 1) adfTest (gdp_diff4, lags = 3, type = «ct»).

Получим.

Title :

Augmented Dickey-Fuller Test.

Test Results:

PARAMETER:

Lag Order: 3 STATISTIC:

Dickey-Fuller: -2.9113 P VALUE:

0.2069.

Очевидно, что процесс является нестационарным. Теперь необходимо взять первую разность, чтобы перейти к полностью стационарному процессу:

|| gdp_diff4_diff <- diff (gdp_diff4, lag = 1, differences = 1).

Теперь перейдем к подбору модели. Построим графики автокорреляционной и частной автокорреляционной функций для нашего ряда (рис. 13.31).

Если использовать коррелограмму в качестве основного критерия выбора модели, то для преобразованных данных наилучшей моделью будет ARMA (1, 1). Но ARMA (2, 1) имеет наименьшее значение информационных критериев. Поскольку.

Коррелограмма временного ряда разности ВВП.

Рис. 13.31. Коррелограмма временного ряда разности ВВП.

нам необходима модель для объяснения развития ряда, то мы остановимся на последней модели:

fit <- arima (gdp_diff_diff4, order=c (2,0,1), include. mean = FALSE) summary (fit).

Получим.

Call:

arima (x = gdp_diff_diff4, order = c (2, 0, 1), include. mean = FALSE).

Coefficients:

arl ar2 mal.

1.3562 -0.5997 -0.9410.

s.e. 0.1088 0.1044 0.0762.

sigma~2 estimated as 29 209: log likelihood = -368.16, aic = 744.32 Training set error measures:

ME RMSE MAE MPE MAPE MASE ACF1.

Training set -13.23 537 170.9054 124.0528 36.28 165 165.6614 0.7 469 837 0.1 923 468.

Дадим краткую интерпретацию полученным результатам. Мы получили, что в данных наблюдается сильная зависимость текущих значений от предыдущих. Для экономических переменных инерция достаточно естественна; действительно, совокупное производство некоторой страны зависит от производственных мощностей в прошлых годах: полностью уничтожить или обновить все производственные мощности за год невозможно.

Теперь проведем тестирование данной модели. Сначала рассчитаем остатки модели, а затем протестируем их на нормальность:

resid <- fit$residuals shapiro. test (resid) j arque.bera.test (resid).

Получим.

Shapiro-Wilk normality test data: resid.

W = 0.90 861, p-value = 0.4 453.

Jarque Bera Test data: resid.

X-squared = 53.434, df = 2, p-value = 2.494e-12.

Очевидно, что по результатам тестов остатки не распределены, но нормальному закону (на любом адекватном уровне значимости нулевая гипотеза о нормальности отвергается), однако наша выборка достаточно мала, поэтому распределения остатков по нормальному закону и не стоит ожидать.

Перейдем к тестам на гетероскедастичность и автокорреляцию. Проведем тест на гетероскедастичность Глейзера, а затем — тест для линейной модели для квадратов остатков (в данном случае мы решили взять в качестве объясняющих переменных куб зависимой переменной):

|| summary (lm (resicT2 ~ 1 + dgp_diff_diff4~3)).

Получим.

Call:

lm (formula = resid~2 — 1 + dgp_diff_diff4"3).

Residuals:

Min IQ Median 3Q Max.

— 61 756 -28 606 -19 379 7209 359 761.

Coefficients:

(Intercept) dgp_diff_diff4.

**.

***.

Estimate Std. Error t value Pr (>11 I) 27 647.0 8353.8 3.310 0.167.

— 181.6 38.1 -4.767 1.45e-05.

Signif. codes:

***' 0.001 '**' 0.01.

  • 0.05
  • 0.1
  • 1

Residual standard error: 62 470 on 54 degrees of freedom Multiple R-squared: 0.2962, Adjusted R-squared: 0.2831 F-statistic: 22.72 on 1 and 54 DF, p-value: 1.454e-05.

Можно легко заметить, что на 5%-ном уровне значимости модель имеет гетероскедастичность, однако 54 наблюдения в случае временных рядов — это мало для корректного применения робастных ошибок в форме Уайта, поэтому в данном случае можно оставить модель без изменений.

Протестируем остатки модели на автокорреляцию. Построим коррелограмму остатков (рис. 13.32).

Коррелограмма остатков модели динамики ВВП.

Рис. 1332. Коррелограмма остатков модели динамики ВВП Исходя из анализа коррелограммы можно заключить, что остатки похожи на белый шум. Проведем тест Бройша — Пагана — Годфри на выявление автокорреляции второго порядка:

|| bgtest (resid ~ 1, order = 2, type = «F»).

Получим.

Breusch-Godfrey test for serial correlation of order up to 2 data: resid — 1.

LM test = 0.34 575, dfl = 2, df2 = 53, p-value = 0.966.

Можно заключить, что автокорреляции нет (ситуация будет аналогична и для автокорреляции первого порядка).

Чтобы построить прогноз, можно воспользоваться командой forecast из одноименного пакета.

Упражнение 13.4. Используя статистический пакет Stata, проведем исследование ряда месячного уровня индекса потребительских цен (ИПЦ) в Российской Федерации (январь 2000 г. — июль 2015 г.). Данные находятся в базе inf.

Решение. Сначала преобразуем данные, чтобы Stata воспринимала их как временной ряд:

format date 70tm.

tsset date.

Построим график ряда для анализа (рис. 13.33):

|| twoway (tsline inf).

График ряда ИПЦ.

Рис. 1333. График ряда ИПЦ В целом ряд очень похож на стационарный процесс с сезонностью.

Построим коррелограмму ряда (рис. 13.34, серым фоном выделен доверительный интервал для проверки гипотезы о том, что конкретный лаг равен нулю (если значение коэффициента корреляции при соответствующем лаге попадает в доверительный интервал, то он незначим)). Команда ас позволяет построить значения корреляционной функции для ряда. Команда рас позволяет построить график частных автокорреляционных функций:

ас inf.

рас inf.

Коррелограмма ряда значений ИПЦ.

Рис. 13.34. Коррелограмма ряда значений ИПЦ Исходя из анализа коррелограммы мы можем заключить, что единичные корни отсутствуют, есть месячная сезонность. Построим сезонную модель. Команда arima, как следует из ее названия, позволяет оценить ARIMA (p, d, г/)-модель, в опциях этой команды можно задавать параметры модели. Для получения сезонной части необходимо воспользоваться опцией sarima (P, D, Q, S). Такая опция позволяет строить сезонную часть для модели. S — параметр сезонности (в нашем случае 12), Р — количество сезонных лагов /1/?-части, D — параметр сезонной разности, Q — количество сезонных лагов МЛ-части. Если необходимо вручную взять первую разность от переменной, то можно воспользоваться оператором D., например, команда reg D. у х будет строить регрессию первой разности переменной у на переменную х. Для того чтобы сдвинуть переменную на один лаг назад, необходимо воспользоваться оператором L., например, команда reg у L.у построит регрессию переменной у на свой первый лаг. В результате выполнения команды.

|| arima inf, arima (0, 0, 0) sarimaCl, 0, 1, 12)

получим.

ARIMA regression.

Sample: 2000ml — 2015m6 Number of obs = 186.

Wald chi2(2) = 1430.95.

Log likelihood? -150.616 Prob > chi2 = 0.0000.

Упражнения с пояснениями.

Очевидно, что в данных присутствует единичный корень. Необходимо взять сезонную разность:

|| gen inf_sa = D12. inf

Проведем расширенный тест Дики — Фуллера для определения стационарности ряда. Поскольку ряд достаточно длинный, то возьмем модель с тремя лагами, оценим версии с константой и без нее:

dfuller inf_sa, regress lags (3)

dfuller inf_sa, regress lags (3) nocons

Соответственно получим.

Augmented Dickey-Fuller test for unit root Number of obs = 170.

————— Interpolated Dickey-Fuller ————;

Test 1'/, Critical 5У. Critical 10'/, Critical.

Statistic Value Value Value.

Z (t) -32.827 -3.487 -2.885 -2.575.

MacKinnon approximate p-value for Z (t) = 0.0000.

D.inf_sa I.

Coef .

Std. Err.

t.

P>lt I.

[95У. Conf.

Interval].

inf_sa I.

LI. |.

— 10.81 711.

.3 295 206.

— 32.83.

0.000.

— 11.46 773.

— 10.16 649.

LD. I.

6.949 408.

.2 822 716.

24.62.

0.000.

6.392 078.

7.506 738.

L2D. |.

3.287 108.

.1 677 276.

19.60.

0.000.

2.955 939.

3.618 277.

L3D. |.

I.

.7 626 179.

.50 877.

14.99.

0.000.

.662 164.

.8 630 718.

l.

_cons I.

.5 404 925.

3.559 022.

0.15.

0.879.

— 6.486 603.

7.567 588.

Augmented Dickey-Fuller test Test.

Statistic.

for unit root Number of obs =.

  • ————— Interpolated Dickey-Fuller
  • 1'/, Critical 5'/, Critical 10'/, Value Value

Critical.

Value.

Z (t).

— 32.923.

;

2.591.

— 1.950.

— 1.615.

D.inf_sa 1.

Coef .

Std. Err.

t.

P> 111.

[95У. Conf.

Interval].

inf_sa 1.

LI. |.

— 10.81 688.

.3 285 462.

— 32.92.

0.000.

— 11.46 555.

— 10.16 821.

LD. I.

6.949 233.

.2 814 375.

24.69.

0.000.

6.393 575.

7.504 892.

L2D. I.

3.287 027.

. 1 672 324.

19.66.

0.000.

2.95 685.

3.617 204.

L3D. I.

.7 626 012.

.50 727.

15.03.

0.000.

.662 448.

.8 627 545.

Нулевая гипотеза о нестационарности на любом адекватном уровне значимости отвергается, следовательно, можно оценивать модель для сезонных разностей. Перед подбором модели построим коррслограмму (рис. 13.35).

ас inf_sa рас inf_sa.

Коррелограмма ряда сезонной разности ИПЦ.

Рис. 1335. Коррелограмма ряда сезонной разности ИПЦ По коррслограмме это напоминает некоторый процесс AR (4) с сезонностью. Поэтому оставим МЛ (4) в модели и будем выбирать параметры р и q. На основе информационных критериев наилучшей будет оцененная ниже модель (для получения значения информационного критерия использовалась команда estat ic после оценки регрессии):

arima inf, arima (l, 0, 0) sarima (0, 1, 1, 12) estat ic.

Sample: 2001ml — 2015m6 Number of obs = 174.

Wald chi2(2) = 606.01.

Log likelihood = -81.37 104 Prob > chi2 = 0.0000.

I.

0PG.

S12.inf.

I.

Coef .

Std. Err.

z.

P> 1 z I.

[957. Conf.

Interval].

inf.

I.

_cons.

I.

-.465 195.

.201 775.

— 2.31.

0.021.

-.860 666.

-.69 724.

ARM A.

I.

ar.

I.

LI .

I.

.6 770 183.

.536 267.

12.62.

0.000.

.5 719 119.

.7 821 248.

ARMA12.

I.

ma.

I.

LI.

I.

-.8 853 909.

.633 167.

— 13.98.

0.000.

— 1.9 489.

-.7 612 924.

/sigma.

I.

.3 660 328.

.154 871.

23.63.

0.000.

.3 356 785.

.396 387.

Model | Obs 11 (null).

11(model).

df.

AIC.

BIC.

. I 174.

— 81.37 104.

170.7421.

183.3783.

Note :

N=0bs used in calculating.

BIC; see [R].

BIC note.

Напомним, что наилучшей является та модель, которая обладает наименьшим значением информационного критерия.

Теперь необходимо провести тесты. Рассчитаем остатки модели и проведем тесты на нормальность остатков (Харкс — Бсра, Шапиро — Уилка):

predict res, res sktest res.

Упражнения с пояснениями.

Получилось, что на любом адекватном уровне значимости нулевая гипотеза отвергается, а значит, остатки не нормальны. Однако это не столь критично для данных моделей, так как в силу наличия выборки средних размеров применима ЦПТ, а значит, можно корректно пользоваться тестами. В случае временных рядов тяжело провести адекватный тест на гетероскедастичность, гак как все объясняющие переменные есть лаги зависимой, обычно предполагается, что в длинных рядах тесты на гетероскедастичность склонны показывать ее наличие (в силу большей гетерогенности наблюдений), поэтому мы можем пользоваться опцией robust:

arima inf, arima (l, 0, 0) sarima (0, 1, 1, 12) r.

Получим.

Iteration.

Iteration.

Iteration.

Iteration.

Iteration.

(switching.

Iteration.

Iteration.

Iteration.

Iteration.

Iteration.

ARIMA regr.

log log log log log optimiz log log log log log.

  • 0 1 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8 9

ession.

pseudolikelihood pseudolikelihood pseudolikelihood pseudolikelihood pseudolikelihood ation to BFGS) pseudolikelihood pseudolikelihood pseudolikelihood pseudolikelihood pseudolikelihood.

  • -118.41 839
  • -87.57 895
  • -83.203 646
  • -81.708 543
  • -81.406 204
  • -81.382 324
  • -81.37 194
  • -81.371 219
  • -81.371 042
  • -81.371 036

Sample: 2001ml — 2015m6 Log pseudolikelihood = -81,.

.37 104.

Number of obs = Wald chi2(2).

Prob > chi2 =.

  • 174
  • 108.31
  • 0.0000

S12.inf.

  • 1
  • 1

Coef .

Semirobust Std. Err.

z.

P > 1 z 1.

[95*/, Conf.

Interval].

inf.

_cons.

  • 1
  • 1

-.465 195.

.208 948.

— 2.23.

0.026.

-.874 726.

-.55 664.

ARMA.

ar.

LI.

  • 1
  • 1

.6 770 183.

.708 321.

9.56.

0.000.

.5 381 899.

.8 158 468.

ARMA12.

ma.

LI.

  • 1
  • 1

-.8 853 909.

.1 278 403.

— 6.93.

0.000.

— 1.135 953.

-.6 348 285.

/sigma.

.3 660 328.

.30 376.

12.05.

0.000.

.3 064 969.

.4 255 686.

Поскольку оценки стандартных ошибок изменились, то гетероскедастичность есть. К сожалению, в версии 12 статистического пакета Stata нет надежных тестов на гетероскедастичность во временных рядах, поэтому мы предполагаем, что она есть, и используем стандартные ошибки оценок коэффициентов в форме Уайта (так как они состоятельны при гетероскедастичности).

Теперь проведем тест Бройша — Годфри на автокорреляцию:

reg res.

estat bgodfrey, lag (3).

Получим.

Source.

SS.

df MS.

Number of obs F (0, 173) Prob > F R-squared Adj R-squared Root MSE.

= 174 = 0.00.

= 0.0000 = 0.0000 = .39 329.

Model.

Residual.

  • 1
  • 1
  • 0
  • 26.7 586 477
  • 0
  • 173 .154 674 264

Total.

26.7 586 477.

173 .154 674 264.

res.

Coef .

Std. Err. t.

P> 111.

[95*/. Conf.

Interval].

_cons.

-.17 128.

.29 815 -0.57.

0.566.

-.75 976.

.417 199.

Breusch-Godfr.

ey.

LM test for.

autocorrelation.

lags (p).

chi2.

df.

Prob >

chi2.

4.415 3.

0.2200.

HO:

no serial correlation.

Как можно заметить, автокорреляции в данных нет, так как нулевая гипотеза не отвергается, поэтому можно переходить к построению прогноза для модели. Построим прогноз па последнюю точку. Сначала ограничим выборку, по которой оцениваем модель, чтобы в обучающую выборку не попали те наблюдения, по которым мы будем строить прогноз, а затем сделаем прогноз:

arima inf if date= 665

Получим.

ARIMA regression.

Sample: 2001ml — 2015m5 Log pseudolikelihood = -81.

.37 242.

Number of obs = Wald chi2(2).

Prob > chi2 *.

  • 173
  • 108.35
  • 0.0000

S12.inf.

  • 1
  • 1

Coef .

Semirobust Std. Err.

z.

P>lz|.

[957. Conf .

Interval].

inf.

_cons.

  • 1
  • 1

-.456 076.

.211 478.

— 2.16.

0.031.

-.870 565.

-.41 587.

ARM A.

ar LI.

  • 1
  • 1

.6 765 514.

.707 464.

9.56.

0.000.

.537 891.

.8 152 117.

ARMA12.

ma LI .

  • 1
  • 1

-.8 849 151.

.1 281 905.

— 6.90.

0.000.

— 1.136 164.

-.6 336 663.

/sigma.

.3 669 661.

.304 808.

12.04.

0.000.

.3 072 248.

.4 267 075.

Сравним предсказанное и реальное значения. Реальное значение инфляции составляет 2%, предсказанное — 4,2%. Таким образом, качество прогноза низко, так как МАРЕ составляет 110%. Поэтому для прогнозирования ряда инфляции нужны более продвинутые методы.

  • [1] Читатель может самостоятельно убедиться, что добавление дополнительных переменных не сильно отразиться на выводе о нестационариости модели.
Показать весь текст
Заполнить форму текущей работой