Методы выявления тенденции
Если на графике видна монотонная тенденция (уровни ряда устойчиво возрастают или убывают), то для такого ряда можно найти математическую функцию и использовать ее в прогнозировании. Например, на рис. 5.1 четко прослеживается линейная функция. Если временные ряды содержат значительные колебания уровней, то для выявления тенденции ряды динамики подвергаются определенной обработке разными методами… Читать ещё >
Методы выявления тенденции (реферат, курсовая, диплом, контрольная)
Если на графике видна монотонная тенденция (уровни ряда устойчиво возрастают или убывают), то для такого ряда можно найти математическую функцию и использовать ее в прогнозировании. Например, на рис. 5.1 четко прослеживается линейная функция. Если временные ряды содержат значительные колебания уровней, то для выявления тенденции ряды динамики подвергаются определенной обработке разными методами. Самым простым из них является метод укрупнения интервалов. Суть его состоит в том, что от первоначального динамического ряда переходят к ряду динамики с большими промежутками времени. Так, суточные данные заменяются пятидневными, декадными, месячными; месячные — квартальными, годовыми. Рассмотрим пример (табл. 5.11).
Таблица 5.11
Условные данные об объеме продаж валюты на торгах ММВБ в 2017 г., тыс. долларов.
Дата. | 1.10. | 2.10. | 5.10. | 6.10. | 7.10. | 11.10. | 12.10. | 13.10. | 14.10. | 15.10. |
Объем продаж. |
В этих данных тенденция объема продаж представлена нечетко. Она затушевана колебаниями уровней в отдельные дни. Иная картина предстает при укрупнении интервала ряда по пятидневкам (табл. 5.12).
Таблица 5.12
Метод укрупнения интервалов.
Период. | Общий объем продаж, тыс. долл. | Среднедневной объем продаж, тыс. долл. |
1—5.10. | ||
6—10.10. | ||
11—15.10. | 10 500. |
Поскольку число дней торгов по пятидневкам было неодинаково, то сравнивать по группам можно только среднедневной объем продаж. Тенденция роста объема продаж при укрупнении интервалов выступает уже отчетливо.
Метод укрупнения интервала как метод выявления тенденции имеет существенный недостаток: длина временного ряда укорачивается, что затрудняет выявление тенденции. Этот недостаток можно устранить, если по укрупненным интервалам исчислять скользящие (подвижные) средние.
Метод скользящих средних представляет собой нахождение средних уровней за определенные периоды времени путем последовательного передвижения начала периода на единицу времени. Простая скользящая средняя определяется по средней арифметической простой и условно относится к середине периода, для которого она исчислена. Сглаживание методом скользящих средних — это замена фактических уровней ряда расчетными, которые в меньшей степени подвержены колебаниям, что позволяет более четко выявить тенденцию развития (табл. 5.13).
Таблица 5.13
Условные данные об инвестициях в основной капитал (млн руб.).
Год. | ||||||||||||
Уг. |
Уровни ряда то возрастают, то понижаются. Для более четкого представления тенденции применим простую трехчленную и пятичленную скользящие средние. Трехчленные скользящие средние найдем по формуле средней арифметической поостой:
и т.д. Относим их к середине интервала, т. е. первую среднюю, Уа — ко второму году, у2 — к третьему году и т. д. В результате ряд укорачивается на два уровня, т. е. нельзя рассчитать скользящую среднюю для первого и последнего года. Аналогично найдем пятичленные скользящие.
5 6 7.
средние, т. е. yi =?у/5; У2=Ху/5', Уз =ZУ/5 и отнесем их к сере;
12 3.
дине интервала, т. е. у — к третьему году, у2 — к четвертому году и т. д. В результате ряд укоротится на четыре уровня: отсутствуют скользящие средние для первых двух и последних двух лет (табл. 5.14).
Таблица 5.14
Применение простых скользящих средних.
Год. | У, | Трехчленная скользящая средняя. | Пятичленная скользящая средняя. |
—. | —. | ||
18,0. | —. | ||
18,3. | 19,0. | ||
20,3. | 19,6. | ||
20,7. | 21,4. | ||
22,7. | 22,6. | ||
23,6. | |||
24,8. | |||
25,8. | |||
26,8. | |||
—. | |||
—. | —. |
Как видим, при использовании скользящих средних тенденция к росту инвестиций проявляется достаточно отчетливо. Пятичленная скользящая средняя дает лучший результат: нет ни одного случая нарушения тенденции.
Чаше всего период скольжения (К) берется нечетным, так как скользящая средняя относится к середине интервала и динамический ряд сокращается на К — 1 уровень. Начинают всегда с трехчленной скользящей средней. Если сглаженные уровни не показывают тенденцию четко, то период скольжения увеличивают до пяти. Возможно и дальнейшее увеличение интервала сглаживания, если тенденция не выявлена. Чем больше интервал сглаживания К, тем в большей мере выровненный ряд осредняет исходный ряд. Чем меньше интервал скольжения, тем больше сглаженный ряд приближается к эмпирическому. Рассмотренная скользящая средняя предполагает линейную тенденцию. Если тренд ряда имеет явно нелинейный характер, используются взвешенные скользящие средние или методы экспоненциального сглаживания.
Взвешенные скользящие средние определяются по средней арифметической взвешенной:
где у — уровень ряда по интервалу сглаживания; w — вес каждого уровня внутри интервала сглаживания.
Для трехчленной скользящей средней веса w берутся как коэффициенты бинома: 1; 2; 1. Для пятичленной (или семи-; девятии т.д.) скользящей средней — обычно w-коэффициенты полинома второй или третьей степени, рассчитанных МНК. В настоящее время пользуются готовыми весовыми коэффициентами (табл. 5.15).
Таблица 5.15
Весовые коэффициенты для взвешенных скользящих средних.
Длина интервала сглаживания. | Весовые коэффициенты. |
(-3; +12; +17; +12; -3) / 35. | |
(-2; +3; +6; +7; +6; +3; -2) / 21. | |
(-21; +14; +39; +54; +59; +54; +39; +14; -21) / 231. | |
(-36; +9; +44; +69; +84; +89; +84; +69; +44; +9; -36) / 429. | |
(-11; 0; +9; +16; +21; +24; +25; +24; +21; +16; +9; 0; -11) / 143. |
Производство продукции А на предприятии (тыс. ед.) и расчет взвешенных пятичленных скользящих средних (У) представлен в табл. 5.16.
Таблица 5.16
Расчет взвешенных пятичленных скользящих средних.
Год. | |||||||||||
Тыс. ед. | |||||||||||
Y | —. | —. | 37,2. | 31,2. | 24,3. | 26,1. | 36,5. | —. | —. |
По скользящим средним может быть построена линия тренда, которая используется при прогнозировании.
Продолжением метода взвешенных скользящих средних, веса которых подчиняются экспоненциальному закону, является метод экспоненциальных средних.
В экспоненциальных средних учитывается степень «устаревания» данных с помощью системы весов (а) для уровней ряда.
Экспоненциальная средняя (St) определяется по формуле.
где, а — параметр сглаживания; а = const, 0 < а < 1; St и — экспоненциальные средние текущего и предыдущего периодов; Yt — уровень ряда для текущего периода.
Экспоненциальная средняя формируется под влиянием всех предшествующих уровней ряда с весами, убывающими по экспоненте. Результаты сглаживания зависят от величины параметра, а и принятых начальных условий, т. е. от значения S0 при расчете первой экспоненциальной средней (Sj). Для устранения случайных колебаний значение, а берется в интервале (0,1—0,3), а для краткосрочных прогнозов а — (0,7—0,9). В качестве S0 принимается либо начальный уровень ряда (в пакете анализа Excel), либо среднее значение по всему ряду или средняя из нескольких прошлых уровней ряда.
При использовании экспоненциальных средних в прогнозировании каждый новый прогноз основывается на предыдущем прогнозе:
где St — прогноз для периода t; St_j — прогноз для периода t — 1; Ум — фактический уровень ряда для периода t — 1.
Прогноз на следующий период (St) представляет собой линейную комбинацию предыдущего прогноза (Sr_a) и ошибки прогноза (Уг_г — St_a). Иными словами, каждый новый прогноз получается в результате корректировки предыдущего прогноза с учетом его ошибки.
Пример 5.4.
Таблица 5.17
Инвестиции в прирост материальных запасов (У) на предприятии за девять месяцев года.
Период. | |||||||||
У, тыс. руб. |
Требуется:
провести экспоненциальное сглаживание, используя параметры сглаживания: 0,1; 0,5; 0,9;
дать прогноз на октябрь;
дать прогноз на ноябрь, учитывая, что в октябре фактическое значение инвестиций составило 34,8 тыс. руб.
Для расчета экспоненциальных средних в качестве начальной экспоненциальной средней (S0) выбрано среднее значение ряда S0 = 33. Тогда при a = 0,1:
= 0,1 • 35 + 0,9 • 33 = 33,2; S2 = 0,1 • 31 + 09 • 33,2 = 33 и т. д. Расчеты представлены в табл. 5.18.
Таблица 5.18
Расчет экспоненциальных средних S, при параметрах сглаживания:
0,1; 0,5; 0,9.
t | У, | to /— Р II. О. 'м. >—* | S, (а = 0,5). | St (ос = 0,9). |
33,2. | 34,0. | 34,8. | ||
33,0. | 32,5. | 31,4. | ||
33,7. | 36,3. | 39,1. | ||
33,7. | 35,1. | 34,5. | ||
32,2. | 27,1. | 20,6. | ||
32,0. | 28,5. | 29,1. | ||
32,2. | 31,3. | 33,5. | ||
33,0. | 35,6. | 39,4. | ||
33,1. | 34,8. | 34,5. |
Как видим, при а = 0,9 экспоненциальные средние практически воспроизводят исходный динамический ряд. В пакете анализа Excel обычно S0 = У] = 35 (выбирается компьютером автоматически). Для получения экспоненциальных средних (S,) задается фактор затухания как (1 — ос). Так, при а = 0,9 результаты составят: 35; 31,4; 39,14; …; 34,53.
Прогноз на октябрь, исходя из данных таблицы:
где St_j = 34,5 (при, а = 0,9), т. е. Yp = 34,5 + 0,9 • (34 — 34,5) = 34,05, так как Yp = St = 9 + 0,9 х (ошибка прогноза при t = 9).
Чтобы дать прогноз на ноябрь, нужно учесть, что в октябре фактическое значение инвестиций составило 34,8 тыс. руб. Экспоненциальные средние (St) — самокорректирующиеся модели, которые учитывают результаты прогноза, сделанного на предыдущем шаге. Поэтому в примере ошибка прогноза в октябре составила 34,8 — 34,05 = 0,75. Тогда, прогноз на ноябрь = предыдущий прогноз + а • ошибка прогноза в октябре 34,05 + 0,9 • 0,75 = 34,725 тыс. руб.
Тенденция развития может быть представлена математической формулой, что и представляет собой метод аналитического выравнивания.
При аналитическом выравнивании модель уровня динамического ряда можно представить как
где у, — фактическое значение уровня; у? — теоретическое значение уровня, найденное по математической функции в соответствии с действием основной тенденции развития; ег — случайное колебание, т. е. отклонение от тенденции,.
Суть аналитического выравнивания состоит в построении модели тенденции (уравнения тренда) и нахождении теоретических значений уровня ряда (у,).
Центральным вопросом при построении уравнения тренда является выбор математической функции, описывающей тенденцию. Наиболее часто используются следующие функции: линейная.
Линейный тренд означает, что уровни ряда изменяются с одинаковым абсолютным приростом (параметр Ь). Так, если получено уравнение тренда для индекса потребительских цен за 12 месяцев года: yt= 99,9 + l, 9t, где t = = 1,2,…, 12, то ежемесячно цены возрастали в среднем на 1,9 п.п. По данным рис. 5.1 динамика среднегодовой численности занятых в гостиницах и ресторанах РФ за 2005—2014 гг. характеризуется уравнением тренда: у = 990,33 + + 30,78t, т. е. ежегодно в России за 2005—2014 гг. в этом виде деятельности среднегодовая численность занятых возрастала в среднем на 30,78 тыс. чел.
Показательная функция или равносильная ей экспонента характеризуются стабильным коэффициентом роста (в показательной кривой — это параметр Ь, а в экспоненте — eh). Так, если тренд динамики производства продукции характеризуется уравнением yt= 14 • 1,15', где t = 1, 2, …, п, то ежегодно производство продукции увеличивается в среднем на 15% (коэффициент роста 1,15). Данный тренд в виде экспоненты составит: у, =14е0'14' ие0'14 =0,15.
Парабола второй степени рекомендуется для моделирования тенденции, если в ряду динамики постоянны абсолютные ускорения (приросты абсолютных приростов). При этом в модели у, =a + bt + сг2параметр с характеризует половину абсолютного ускорения. Поэтому, если, например, динамика численности детей в возрасте семи лет в районе характеризуется уравнением тренда: у( = 323,7 + 10,8t — l, 6t2, где t = 1, 2,…, 15 лет, а у — число детей, тыс. чел., то ежегодно численность детей сокращалась в среднем с ускорением в 3,2 тыс. чел.
Полиномы более высоких степеней требуют довольно длинных динамических рядов. Чтобы параметры тренда были статистически надежными, на каждый параметр при t должно приходиться не менее шести-семи временных единиц. Так, парабола уже третьей степени должна быть рассчитана по не менее чем 20 интервалов времени.
Л b
Равносторонняя гипербола (yf = а + —) при b > 0 означает, что уровни ряда снижаются во времени и асимптотически приближаются к параметру а. Так, если в регионе численность безработных за 12 месяцев года (у) характеризу- Л 3.
ется трендом: у = 6 + —, где t = 1, 2,…, 12, у — тыс. чел., то имеет место падающая тенденция, при которой численность безработных не может быть меньше 6 тыс. чел. Если Ь < 0, то уравнение yt = а — характеризует тенденцию к росту с асимптотой, равной параметру а. Так, если перевозка грузов, а 20.
за ряд лет (У) характеризуется уравнением уг =140-—, где t = 1, 2, 10,.
у — млн т, то ежегодно объем перевозок возрастает, но при этом он не может превысить 140 млн т.
Отметим, что при наличии понижающейся тенденции для прогноза предпочтительнее гипербола, чем линейный тренду = а — Ы, так как при прогнозе на отдаленную перспективу при линейном тренде можно получить у < 0, а для гиперболы величина у не может быть меньше параметра а.
Ряд Фурье используется при наличии периодических колебаний и отсутствии тенденции (рис. 5.6).
Рис. 5.6. Численность безработных, зарегистрированных в службах занятости региона (на конец месяца).
На рис. 5.6 видна волна вниз и волна вверх вокруг среднего уровня. Поэтому можно предложить модель ряда Фурье с одной гармоникой:
где t принимает значения от нуля с последующим увеличением на 2тт/п,
Если в ряду динамики наблюдается тенденция и периодические колебания, то ряд Фурье может быть применен к отклонениям от тренда. Для этой цели можно найти линейный тренд yt=a + bt и применить ряд Фурье к остаткам е, =ус — Ус Возможен и иной путь: ряд Фурье строится по первым разностям, что равносильно учету линейного тренда.
Степенная функция yt=a-tb при b > 0 характеризует непрерывный рост уровней с падающими темпами роста, а при b < 0 — их ускоренное снижение. При этом tb характеризует базисный коэффициент роста. Так, если за девять месяцев года объем продукции характеризуется трендом yt = 16t°>2, где t = 1, 2, …, 9, то за девять месяцев объем продукции вырос в 1,552 раза (90-2).
Логарифмический тренд используется при замедленном росте уровней ряда в конце периода.
Параметры уравнения тренда чаще всего оцениваются методом наименьших квадратов (МНК). В качестве зависимой переменной рассматриваются уровни динамического ряда, а в качестве независимой — фактор времени t, который представляет собой ряд натуральных чисел 1, 2,…, п.
Применение МНК к линейному тренду yt=a+bt предполагает решение системы нормальных уравнений.
Найдем линейный тренд для ряда, представленного в табл. 5.10 и на рис. 5.1.
Необходимые суммы составят: п =10 (временной ряд включает 10 лет); t = 1, 2, 3, …, 10 и = 55; Ну = П596; Xt2 =385; ?yt = 66 317. Используем эти суммы:
Решая эту систему уравнений, получаем: а = 990,33 и b = 30,78. Таким образом, уравнение тренда составит: у = 990,33+30,781, что и было показано ранее. Параметр а означает значение у при t = 0, т. е. в 2004 г. среднегодовая численность занятых в данном бизнесе согласно тенденции составляла 990,33 тыс. чел.
Оценка параметров нелинейных функций проводится МНК после их линеаризации, т. е. приведения к линейному виду. Так, для оценки параметров показательной кривой у = ab' путем логарифмирования приводим функцию к линейному виду In у = In а +1 In b. Далее строим систему нормальных уравнений:
Пример 5.5.
Уровень безработицы в регионе в 2010—2015 гг. характеризуется следующими данными (табл. 5.19).
Таблица 5.19
Исходные данные.
Год. | ||||||
Уровень безработицы, %. | 15,9. | 13,3. | 12,5. | 10,3. | 8,2. | 8,1. |
Для характеристики тенденции выбрана показательная кривая. Для построения системы нормальных уравнений рассчитаны:
Система нормальных уравнений составила:
Отсюда In а = 2,903 001; In Ъ = -0,14 334.
Получим уравнение: In у = 2,903 001 — 0,143 341.
Поскольку а = е2-903 = 18,229, Ъ = е-0'143 = 0,866, соответственно, показательная функция составит у, =18,229 0,866', т. е. за рассматриваемый период времени ежегодно уровень безработицы снижался со средним темпом 86,6%, или на 13,4% в год. Данное уравнение тренда в виде экспоненты будет записано каку,=18,229е о.143'.
Для параболы второго порядка применение МНК аналогично оценке параметров двухфакторного уравнения регрессии, т. е. нахождением параметров для уравнения yt = a+ bt + ct2 решается система нормальных уравнений.
" - Л и
Для равносторонней гиперболы у = а + — МНК применяется к линеаризованному виду т 1
гдеГ = -.
При 1=1,2, 3, 4, 5 значения Т составят 1; 0,5; 0,333; 0,25; 0,2.
Далее решается система нормальных уравнений, такая же как для линейного тренда.
Для оценки параметров степенной функции у = atb также используется МНК после линеаризации исходного уравнения путем логарифмирования:
где 1=1, 2, 3,.
Некоторую специфику имеет применение МНК к ряду Фурье.
Рассмотрим МНК для ряда Фурье с одной гармоникой: у, = а0 + ajcos 1 + b:sin 1, где 1 принимает значения от нуля с постоянным увеличением на 2—/п. При п = 12.
^Л к к л 2п 5п 11л месяцам значения! будут равны: 0;—;—; —; —; —-.
6 3 2 3 6 6.
Система нормальных уравнений составит.
В этой системе Xcost = Xsinl = 0. Тогда из первого уравнения системы получим
Поскольку Xsin с cos 1 = 0, из второго уравнения системы получим оценку У. у t cost
параметра а: :а} = —-—.
? cos2! л U ly.sint.
Аналогично из третьего уравнения системы следует, что о, =. .
Ввиду того, что Icos2t = Xsin2f = п/2, оценка параметров может быть дана по формулам.
При ряде Фурье с двумя гармониками.
yt = Oq + a, cos t + bjsin f + a2cos 2f + b2sin 2f (5.57).
параметры a^a^bj определяются так же, как показано выше, а параметры а2 и Ь2 соответственно составят
При К гармониках (как правило, не больше четырех) параметры ряда Фурье определяются как
Пример 5.6.
Производство товара А по годам характеризуется данными (тыс. ед). Построим уравнение тренда с одной гармоникой (табл. 5.20):
у, = а0 + ajcos f + bjsin f.
Расчет параметров по ряду Фурье.
Таблица 5.20
Год. | yt | t | cos t | sin t | У, cost. | yt sin t. |
л/4. | 0,707. | 0,707. | 7,777. | 7,777. | ||
л/2. | ||||||
Зл/4. | — 0,707. | 0,707. | — 6,363. | 6,363. | ||
я. | — 1. | — 8. | ||||
5л/4. | — 0,707. | — 0,707. | — 4,949. | — 4,949. | ||
Зл/2. | — 1. | — 7. | ||||
7 л/4. | 0,707. | — 0,707. | 7,07. | — 7,07. | ||
Итого. | —. | 4,535. | 6,121. |
Соответственно, получим
Уравнение тренда составит у, = 9,0 +1,134cos t + l, 530sin t.
Для оценки точности модели используется коэффициент детерминации (R2), определяемый так же, как и для уравнения регрессии. При значениях R2, близких к единице, уравнение тренда хорошо описывает тенденцию, что имеет место в рассмотренном примере: R2 =0,806.
В настоящее время трендовые модели достаточно легко могут быть получены с помощью Excel. Для этого временной ряд следует представить в виде точечной диаграммы и щелкнуть на диаграмме правой кнопкой мыши по одной из точек данных. В результате на диаграмме будет выделен сам временной ряд, а на экране раскроется меню. В этом меню следует выбрать команду «Добавить линию тренда». На экран будет выведено диалоговое окно, и выбирается требуемый тип тренда: линейный, логарифмический, полиномиальный (от 2-й до 6-й степени включительно), степенной, экспоненциальный. При установке флажка опции «Показать уравнение» на диаграмме будет выведено уравнение, описывающее сглаживающую линию тренда. Можно также при установке флажка опции на диаграмме показать значение коэффициента детерминации.
После выбора наиболее адекватной модели можно сделать прогноз — точечный и интервальный. Точечный прогноз по трендовым моделям осуществляется путем подстановки в уравнение тренда следующего по порядку значения фактора времени t.
Таблица 5.21
Объем продаж товара, А за 12 месяцев года.
Месяц, t | ||||||||||||
Продажа, у |
Тенденция временного ряда объема продаж описывается линейным трендом
Точечный прогноз на январь следующего года составит yt = 14,333 + + 2,6923−13 = 49,33, или 49 ед.
Для интервального прогноза определяется ошибка прогноза (Sp). Ошибка прогноза зависит от вариации уровней ряда (yt) относительно тренда (yt), а также от длины временного ряда и периода упреждения. Колеблемость уровней ряда вокруг тренда измеряется как стандартное отклонение (Sy):
где yt — фактическое Значение уровня временног о ряда; yt — расчетное значение уровня временного ряда (по уравнению тренда); п — длина временного ряда; т — число параметров при факторе времени t (в пакете прикладных программ (ППП) Excel в режиме Анализа данных Sy выдается в регрессионной статистике как стандартная ошибка).
В рассматриваемом примере величина Sy при компьютерной обработке в режиме регрессии составила 1,707. Чем больше стандартное отклонение (Sy), тем шире должен быть интервал прогноза для тренда. Доверительный интервал прогноза для тренда составит: yt ±taSy, где to. — табличное значение f-критерия Стьюдента при ошибке, а (как правило, 5%) и числе степеней свободы df = (п — 2), в рассматриваемом примере df= 10. Соответственно, для рассматриваемого примера ta = = 2,228. Тогда интервал прогноза для тренда составит 49,33 ± 2,228 х х 1,706 699, т. е. объем продаж ожидается в интервале от 45 до 53 ед. Однако этот интервал не учитывает возможное отклонение уровней ряда от тенденции, а также период упреждения. Поэтому принято при окончательном расчете ошибки прогноза учитывать поправочный коэффициент Q. При прогнозе индивидуального значения уровня временного ряда ошибка прогноза (Sp) определяется как Sp = SyQ, где Q — поправочный коэффициент, величина которого зависит от длины временного ряда (п) и периода упреждения (L). Чем длиннее временной ряд, тем меньше ошибка прогноза (Sp). Чем больше период упреждения (период, на который дается прогноз), тем больше ошибка прогноза (Sp). Величина Q зависит также от вида уравнения тренда. Для линейного тренда у = a+ bt поправочный коэффициент Q определяется по формуле.
Для нашего примера п = 12, tp = 13 (прогнозное значение f), t =6,5, I 1 42,25.
коэффициент Q = 1 + — +——— =1,168 и средняя ошибка прогноза.
V 12 150,9167.
составит 1,992, а предельная — tccSp =2,228−1,992 = 4,44. Тогда и окончательный вариант прогноза 49,33 ±4,44, т. е. от 45 до 54 ед.
Аналогично определяется величина Q и для нелинейных функций, сводимых при преобразовании к линейному виду. Для полиномов второй и более высоких степеней ошибка прогноза (Sp) определяется матричным методом. Более детально о построении интервального прогноза см. в учебниках по эконометрике[1].
- [1] См., например: Эконометрика: учебник для магистров / под ред. И. И. Елисеевой., 2012; Носко В. П. Эконометрика. Кн. 1 и 2. М.: Издательский дом «Дело», 2011; Эконометрика: учебник для магистров / под ред. И. И. Елисеевой., 2014.