Методы и модели, используемые для выделения тренда временного ряда
Модификацией метода экспоненциального сглаживания для сезонных рядов являются методы Уинтерса и Тейла-Вейджа. В качестве модели ряда используется его представление в виде комбинации линейного тренда с сезонной составляющей, наложенной либо мультипликативно (модель Уинтерса), либо аддитивно (модель Тейла — Вейджа). Предполагается, что коэффициенты тренда и сезонная составляющая могут медленно… Читать ещё >
Методы и модели, используемые для выделения тренда временного ряда (реферат, курсовая, диплом, контрольная)
КУРСОВАЯ РАБОТА
«Методы и модели, используемые для выделения тренда временного ряда»
Все социально-экономические процессы имеют динамический характер, так как развиваются во времени, а их реальные модели учитывают фактор времени. Мифическая модель времени разделяет начальное или старое и новое эмпирическое время. Она имеет линейный характер, но постепенно перерастает в циклическую модель. Эти же подходы использует и современная наука при анализе динамики процессов.
Актуальность темы
заключается в том, что статистические методы обработки информации играют исключительно большую роль в энергетике, экологии, экономике, а также в других областях науки и практики, имеющих дело с обобщением, обработкой и анализом больших массивов информации о разнообразных явлениях и процессах. Однако, в настоящее время в научной и учебной литературе, адаптированной к энергетической области знаний, вопросам классификации видов графических изображений статистических и других данных, методики их построения уделяется недостаточно внимания.
Анализ социально-экономического развития — одно из важнейших заданий статистики. Информационной базой его служат динамические ряды.
Решение народно хозяйственных проблем связано с глубоким анализом и всесторонним учетом объективных закономерностей экономического и социального развития в течение определенного периода времени. Количественным выражением этих закономерностей могут служить временные ряды.
Повторяемость, последовательность и порядок явлений можно обнаружить в изменении явлений и процессов во времени, который происходит под воздействием разных социальных, экономических, технических и других показателей. Изучение динамики позволяет выявить и оценить особенности развития явлений в течение времени под воздействием разных факторов. Знание этих особенностей важно не только для понимания и оценки прошлого, но и для прогнозирования, позволяющего контролировать процессы и руководить ими.
Целью написания данной курсовой работы является изучение методов и моделей, используемых для выделения тренда временного ряда.
Задачами курсовой работы являются:
— изучить основную тенденцию ряда динамики;
— выделить основные методы анализа временных рядов;
— дать аналитическую оценку уравнению тренда;
— исследовать основную тенденцию методом механического выравнивания;
— выделить основную тенденцию методом аналитического выравнивания;
— сделать прогноз на следующий год с помощью основной тенденции.
Объектом исследования являются социально-экономические данные Ставропольского края.
1. Теория и методика анализа основной тенденции в рядах динамики
1.1 Понятие об основной тенденции ряда динамики, ее сущность и визуальное представление
временной тренд уравнение ряд Числовые данные, характеризующие процессы, находящиеся в постоянном изменении и движении, образуют ряды динамики. Чаще всего под динамическими рядами понимается хронологические (или временные) последовательности, хотя в принципе выражение «динамика» охватывает не только изменение во времени, но и любое другое изменение состояния под влиянием внешних условий (например, в пространстве).
Большие системы, к которым, как правило, относятся изучаемые экосистемы, функционируют и развиваются во времени и пространстве под действием внутреннего детерминизма и инерционности: сложившиеся объективные тенденции изменения параметров системы сохраняются в известной степени на перспективу определенного периода. Вместе с тем, элементы реальных больших систем находятся, во-первых, в условиях чрезвычайно сложного переплетения внутренних взаимосвязей и, во-вторых, под постоянным влиянием внешних, чаще всего случайных факторов, действующих нередко в непредсказуемом направлении. Поэтому прогнозирование поведения экосистем имеет смысл только в рамках вероятностных категорий. Иначе говоря, для ожидаемых событий могут быть указаны лишь вероятности их наступления, а относительно значений тех или иных величин приходится ограничиваться законами их распределения или другими вероятностными характеристиками.
Теоретической базой для анализа динамических рядов явилась теория случайных процессов. Случайные процессы представляют собой семейство случайных функций X(t), зависящих от одного параметра, которым в большинстве случаев является время. Cовременная методика статистического анализа случайных процессов построена на постулате непрерывности динамической траектории. Однако на практике для преодоления вычислительных трудностей непрерывный ряд представляется таблично в виде дискретных численных последовательностей (даже если проводилась непрерывная запись изменения явления с помощью механических или электронных приборов).
Важными характеристиками случайного процесса являются математическое ожидание и дисперсия. Математическим ожиданием процесса X(t) является неслучайная функция mx(t), значение которой в момент времени t равно математическому ожиданию множества реализаций в соответствующем сечении t. Дисперсией случайного процесса является неслучайная функция Dx(t), значение которой также равно дисперсии реализаций сечения в каждый момент времени t.
Временной ряд стационарен, если порождающий его механизм не меняется при сдвиге во времени, а соответствующий случайный процесс достиг статистического равновесия. Это определение не вполне точно, однако выражает существо дела. Формально стационарный временной ряд определяется как такой случайный процесс, для которого математическое ожиданиие, дисперсия и ковариации между отдельными членами ряда случайно варьируют вокруг постоянного, не зависящего от времени уровня (так называемая «стационарность» в широком смысле, которая только и рассматривается для временных рядов):
mx(t) = const; Dx(t) = const.
Простейшим примером стационарного временного ряда является «белый шум» — чисто случайный процесс, значения которого в различные моменты времени независимы и одинаково распределены. [1]
Динамические процессы, происходящие в экономических системах, обычно представляются в виде ряда значений некоторого экономического показателя, последовательно расположенных в хронологическом порядке. Изменение этого показателя отражает ход развития изучаемого экономического процесса. Последовательность наблюдений одного показателя (признака), упорядоченная в зависимости от последовательно возрастающих или убывающих значений другого показателя, называется динамическим рядом, или рядом динамики. Если в качестве признака, в зависимости от которого происходит упорядочивание, берется время, то такой динамический ряд называется временным рядом. Поскольку в экономических процессах упорядочивание обычно происходит во времени, то три приведенных термина можно рассматривать как равнозначные.
Элементами рядов динамики являются значения наблюдаемого показателя, называемые уровнями ряда, и моменты и интервалы времени, к которым относятся уровни. Временные ряды, в которых заданы значения экономического показателя, относящиеся к определенным моментам времени, называются моментными. Например, остатки на счетах на первое число каждого месяца. Если уровни временного ряда образуются суммированием, усреднением или каким-либо другим методом агрегирования за некоторый промежуток времени, то такие ряды называют интервальными временными рядами. Примерами могут служить ряд объема произведенной продукции по месяцам и ряд средней заработной платы работника по месяцам.
Под длиной временного ряда понимают время, прошедшее о начального момента наблюдений до конечного, или число уровней ряда.
Если во временном ряду проявляется длительная («вековая») закономерность изменения уровней, то говорят, что имеет место тренд. Таким образом тренд определяет общее направление развития экономического процесса. Экономико-математическая модель, в которой развитие изучаемой экономической системы отражается через тренд ее основных показателей, называется трендовой моделью. Для выявления тренда временных рядов, а также для построения и анализа трендовых моделей используется аппарат теории вероятностей и математической статистики. Однако следует иметь в виду, что этот аппарат предназначен для обработки простых статистических совокупностей, и поэтому применение методов теории вероятности и математической статистики требует определенных поправок. [2]
Для количественной оценки динамики явлений применяются статистические показатели: абсолютные приросты, темпы роста, темпы прироста, которые могут быть цепными, базисными или средними.
В основе расчета этих показателей динамики лежит сравнение уровней временного ряда.
Если сравнение осуществляется с одним и тем же уровнем, принятым за базу сравнения, то эти показатели называются базисными.
Если сравнение осуществляется при переменной базе, и каждый последующий уровень сравнивается с предыдущим, то вычисленные таким образом показатели называются цепными.
Абсолютный прирост равен разности двух сравниваемых уровней.
Темп роста есть отношение двух сравниваемых уровней ряда, выраженное в процентах. Темп прироста характеризует абсолютный прирост в относительных величинах. Определенный в процентах темп прироста показывает, на сколько процентов изменился сравниваемый уровень по отношению к уровню, принятому за базу сравнения. В таблице 1 приведены формулы для вычисления базисных, цепных и средних показателей динамики.
Средние показатели: средний абсолютный прирост, средний темп роста и прироста определяются для получения обобщающих показателей динамики развития.
В таблице 1 использованы следующие обозначения:
y1, y2,…, yt,…, yn — уровни временного ряда в моменты времени t = 1, 2,…, n;
n — длина временного ряда;
yб — уровень временного ряда, принятый за базу.
Таблица 1. Основные показатели динамики временных рядов
Показатель | Абсолютный прирост, Ду | Темп роста, Т, % | Темп прироста К, % | |
Цепной | ||||
Базисный | ||||
Средний | ||||
Отличие временных рядов от простых статистических совокупностей заключается в том, что уровни временного ряда зависят друг от друга, тогда как элементы статистической совокупности являются независимыми друг от друга. Кроме того, уровни временного ряда упорядочены во времени и их перемешивание недопустимо, а элементы статистической совокупности не являются упорядоченными. Перемешивание этих элементов не изменяет значений статистических показателей (дисперсию, среднее значение и т. д.) [3]
Важнейшее условие правильного построения и исследования рядов динамики показателей правовой статистики — сопоставимость уровней этих радов, относящихся к различным периодам.
Сопоставимость данных правовой статистики — это соответствие условий и методов расчёта её показателей, обеспечивающих правильность получаемых при их сравнении выводов о различиях между изучаемыми явлениями (например, преступностью). Данное условие решается либо в процессе сбора и обработки данных, либо путём их пересчёта.
Во-первых, необходимо соблюдать требование сопоставимости показателей ряда во времени и пространстве. Иногда, для того чтобы привести уровни ряда динамики к сопоставимому виду, приходится прибегать к приёму, который называется «смыкание рядов динамики». Под смыканием понимают объединение в один ряд двух или несколько рядов динамики, уровни которых исчислены по разной методологии или разным территориальным границам.
Во-вторых, показатели динамического ряда должны быть сопоставимы по кругу (полноте) охватываемых объектов.
В-третьих, формируя динамические ряды, необходимо следить за однокачественностью их уровней на протяжении всего временного периода.
Вследствие многих обстоятельств однородность величин, составляющих динамический ряд, может нарушиться, и таким образом нарушается сопоставимость уровней динамического ряда.
В-четвёртых, на сопоставимость уровней ряда динамики непосредственно влияет методология учёта или расчёта показателей. Несопоставимость по этому параметру порождает некоторые трудности всякий раз, когда возникает необходимость проверить данные одних учётов с помощью других.
Важным направлением в исследовании массовых явлений и процессов выступает изучение основной или общей тенденции их развития (тренда).
Многочисленные факторы, под действием которых формируются и изменяются уровни рядов динамики изучаемых явлений, неоднократны по силе, направлению и времени их действия.
Поставленные действующие факторы оказывают на изучаемые явления определяющее влияние и формируют в рядах динамики основную тенденцию развития (тренд). Воздействие других факторов проявляется периодически и вызывает повторяемые во времени колебания уровней рядов динамики (так называемые сезонные колебания). Действия разовых (спорадических) факторов отображаются случайными (кратковременными) изменениями уровней рядов динамики. Исходя из этого при анализе рядов динамики необходимо изучить основные компоненты рядов: тренд, периодически (сезонные) колебания, случайные отклонения.
Как показывает практика, в одних рядах основная тенденция развития проявляется достаточно четко на основе анализа статических показателей направления и интенсивности развития (тестов роста, прироста, изменения уровней, средних величин), в других ряда она может быть выявлена с использованием специальных методов анализа рядов динамики. Выбор конкретных методов статистики для этой цели зависит от характера исходной информации и предопределяется задачами анализа. [4]
1.2 Методы анализа основной тенденции
Выбор стратегии и методов предварительной обработки и анализа рядов динамики безусловно зависит от конечной цели исследователя. Однако, как правило, первым этапом является оценка тренда временного ряда.
Любой ряд динамики может быть разделен на три компоненты:
x(t) = f (t) + g (t) + h,
где f(t) — детерминированная компонента, представляющая собой некоторую аналитическую функцию, выражающую тенденцию в ряду динамики;
g(t) — стохастическая компонента, моделирующая характер периодической и квазипериодической вариации исследуемого явления;
h — случайная компонента типа «белый шум».
Таким образом, вычитание тренда из исследуемого ряда динамики является изменением масштаба данных и сохраняет полную информацию о вариации явления. [5]
Для длинных рядов выделение тренда носит обычно разведочный характер, так как часто невозможно указать подходящую параметрическую кривую для аппроксимации ряда на всей его длине. Для выделения тренда в этом случае используют различные непараметрические методы анализа временных рядов, такие как, сглаживание скользящими средними или скользящими медианами, частотную фильтрацию и т. п. В отличие от параметрических методов выделения тренда, эти методы пригодны лишь для осреднения значений ряда по точкам некоторой окрестности и не могут быть использованы для прогнозирования (экстраполяции) динамических рядов, поскольку не дают в явном виде расчетного уравнения детерминированной компоненты f(t). Однако получение достаточно гладкой траектории дает возможность визуально оценить наличие тенденции в условиях сильной зашумленности, а также выделить ряд остатков y(t) = x(t) — f(t), как случайную компоненту временной последовательности, если конечной целью исследования является построение моделей авторегрессии для прогнозирования. [7]
Метод укрупнения интервалов Одним из наиболее элементарных способов изучения общей тенденции в ряду динамики является укрупнение интервалов. Этот способ основан на укрупнении периодов, к которым относятся уровни ряда динамики. Например, преобразование месячных периодов в квартальные, квартальных в годовые и т. д. [8]
Метод скользящих средних Метод скользящих средних базируется на предположении, считающимся тривиальным: при определении средних значений случайные отклонения погашаются. При сглаживании этим методом фактические значения ряда динамики заменяются средними значениями, которые характеризуют срединную точку периода скольжения. [9]
Простое сглаживание основывается на составлении нового ряда из простых средних арифметических, исчисленных для промежутков времени длиной q:
где длина периода сглаживания q зависит от характера временного ряда, а также от цели сглаживания и выбирается исследователем; k — порядковый номер средней.
Взвешенное сглаживание состоит в определении средних, взвешенных для разных точек ряда динамики. В основе метода лежит идея локального приближения тренда полиномом не очень высокой степени. Значения оценки тренда в точке t аппроксимируются по уровням ряда из временного интервала [t — q, t + q] полиномом заданного порядка p:
параметры которого оцениваются по методу наименьших квадратов с помощью уравнений типа:
Решая полученные уравнения относительно ai, получим последовательность весов, зависящих только от ширины интервала (2q + 1) и порядка полинома p, а расчет значений оценок тренда в точке t эквивалентен построению взвешенной суммы значений ряда в интервале [t — q, t + q]. Для полинома порядка 1 веса ai равны между собой, что сводит этот метод к простому сглаживанию.
На практике часто используется сглаживающий фильтр Хэмминга — взвешенное скользящее среднее с весами 0.25, 0.5 и 0.25, соответствующее формуле:
= 0.25 x (t -1) + 0.5 x(t) + 0.25 x (t +1)
(концевые точки копируются: = x(0), = x(n)). [10]
Метод скользящих средних имеет ряд преимуществ перед другими методами:
скользящая средняя дает функцию тренда, в наибольшей мере приближенную к значениям исследуемого ряда, поскольку для отдельных частей ряда выбирается наилучшая тенденция;
к исследуемому ряду могут быть прибавлены новые значения;
нахождение тренда не связано с большими вычислительными трудностями.
Недостатком метода скользящей средней является то обстоятельство, что при увеличении периода скольжения теряется информация о крайних периодах ряда, что недопустимо при некоторых приемах анализа временных рядов (например, при спектральном анализе). Кроме того, этот метод (и другие, подобные ему) может вызывать автокорреляцию остатков, даже если она отсутствовала в исходном ряду — так называемый эффект Слуцкого — Юла [11]
Метод экспоненциального сглаживания Метод экспоненциального сглаживания применяется для прогнозирования нестационарных временных рядов, имеющих случайные изменения уровня и угла наклона, и известен под названием метода Брауна.
В качестве основной модели ряда рассматривается его локальная аппроксимация в виде полинома невысокой степени p:
x(t) = a0(t) + a1(t) t + a2(t) t 2 + … + ap(p) t p + h,
коэффициенты которого ai медленно меняются со временем.
Если, например, ограничиться линейной моделью, то коэффициенты a0(t) и a1(t) оцениваются
a0(t) = x(t) + 2[x*(t -1) — x(t)],
a1(t) = a1(t -1) + 2 [x*(t -1) — x(t)],
где — параметр сглаживания в диапазоне 0 < < 1; = 1 —; x*(t -1) — предыдущее сглаженное значение. В качестве начальных значений оценок коэффициентов модели берутся
a0(0) = 4x(1) + x(2) — 2x(3); a1(0) = x(3) — x(1).
Таким образом, вычислительный процесс устроен как адаптивная процедура, в которой коэффициенты полинома пересчитываются по старым коэффициентам и новым данным с экспоненциально убывающими весами, причем наибольший вес приписывается последнему наблюдению. Процесс вычислений управляется двумя параметрами: порядком аппроксимирующего полинома p и параметром сглаживания. В ходе вычислений строится сглаженный ряд, представляющий собой в каждый момент времени t прогноз по данным до момента (t — 1) включительно.
Выбор параметра сглаживания представляет собой достаточно сложную проблему. Чем ближе параметр сглаживания к единице, тем больше влияние последних наблюдений и тем больше скорость убывания весов. Однако, если высокочастотная компонента ряда имеет достаточно большую дисперсию, не следует использовать большие значения параметра сглаживания из-за плохого качества прогноза.
Модификацией метода экспоненциального сглаживания для сезонных рядов являются методы Уинтерса и Тейла-Вейджа. В качестве модели ряда используется его представление в виде комбинации линейного тренда с сезонной составляющей, наложенной либо мультипликативно (модель Уинтерса), либо аддитивно (модель Тейла — Вейджа). Предполагается, что коэффициенты тренда и сезонная составляющая могут медленно меняться во времени. В соответствии с этим вычислительный процесс устроен как адаптивная процедура, управляемая тремя параметрами адаптации (один параметр — адаптация уровня, второй — угла наклона, третий — коэффициентов сезонности). Каждый параметр должен находится в интервале от 0 до 1: чем ближе параметр к единице, тем больший вес приписывается последним наблюдениям. В ходе вычислений строится сглаженный ряд, представляющий собой в каждый момент времени t прогноз по данным до момента (t -1) включительно.
Метод аналитического выравнивания Основным содержанием метода аналитического выравнивания в рядах динамики является то, что основная тенденция развития явления рассчитывается как функция времени. Определение теоретических (расчетных) уровней изучаемого явления производится на основе так называемой адекватной математической функции, которая наилучшим образом отображает основную тенденцию ряда динамики при применении метода аналитического выравнивания.
Подбор адекватной функции при аналитическом выравнивании ряда осуществляется методом наименьших квадратов — минимальностью отклонений суммы квадратов между теоретическими и эмпирическими уровнями: При изучении тренда уравнение принимается в качестве критерия оценки соответствия расчетных (теоретических) уровней с фактическими (эмпирическими) уровнями ряда динамики.
Важнейшей проблемой, требующей своего решения при применении метода аналитического выравнивания ряда, является подбор математической функции, по которой рассчитываются теоретические уровни тренда. От правильности решения этой проблемы зависят выводы о закономерностях тренда изучаемых явлений. Если выбранный тип математической функции адекватен основной тенденции развития изучаемого явления во времени, то синтезированная на этой основе трендовая модель может иметь полезное применение при изучении сезонных колебаний, прогнозировании и других практических целях. Одним из условий обоснованного применения метода аналитического выравнивания в анализе рядов динамики является знание типов развития социально-экономических явлений во времени, их основных отличительных признаков. В практике статистического изучения ряда динамики в основном используют эталонные типы развития социально-экономических явлений во времени: 1) равномерное развитие; 2) равноускоренное (равнозамедленное) развитие; 3) развитие с переменным ускорением (замедлением); 4) развитие по экспоненте; 5) развитие с замедлением роста в конце периода. [13]
1.3 Аналитическая оценка уравнения тренда. Методика прогнозирования уравнения ряда динамики
Наличие либо отсутствие тренда часто хорошо видно на графике. Проверку этой гипотезы в сомнительных случаях можно осуществить с использованием некоторых простых критериев, широко описанных в литературе по статистике.
Тест числа поворотных точек основан на вычислении числа локальных максимумов. Отклонение этого числа от идеального значения в большую сторону свидетельствует о значительной дисперсии и заметной отрицательной автокорреляции случайной компоненты. Отклонение в меньшую сторону может возникнуть как при наличии тренда, так и в случае положительной автокорреляции (первого порядка) случайной компоненты. Последняя ситуация возникает и для стационарных рядов.
Критерий знаков разности чувствителен как к наличию тренда, так и к присутствию квазипериодической компоненты. Случайная компонента мало сказывается на результаты тестирования с использованием этого критерия.
Критерий ранговой корреляции Кендала является хорошим тестом на наличие монотонного или кусочно-монотонного тренда для не очень длинных рядов. Положительный коэффициент соответствует возрастающему тренду, отрицательный — убывающему.
Критерий ранговой корреляции Спирмена по своему смыслу и свойствам близок к коэффициенту Кендала.
Параметрические модели тренда Для коротких временных рядов наиболее употребительны параметрические методы выделения тренда. В этом случае делается попытка представить временной ряд в виде суммы детерминированной функции времени f (t, a), зависящей от небольшого числа неизвестных параметров, и случайной компоненты. Для оценки вектора неизвестных параметров a обычно применяется метод наименьших квадратов (МНК), состоящий в минимизации суммы квадратов отклонений
[x (t) — f (t, a)] min.
Нет необходимости приводить здесь описание методологии МНК и расчетных формул применительно к линейному и нелинейному регрессионному анализу, поскольку все это доступно практически в любом руководстве по математической статистике. Остается лишь предостеречь от от популярных, к сожалению, приемов необоснованной «линеаризации», т. е. использования линейного формализма МНК для расчета коэффициентов уравнения в той или иной нелинейной форме. Например, для расчета коэффициентов экспоненциального уравнения регрессии часто логарифмируют исходные данные, после чего используют формулы МНК для коэффициентов линейного уравнения, получая при этом заведомо искаженные результаты. Минимизация суммы квадратов отклонений между уровнями ряда и прогнозируемыми значениями, вычисленными по нелинейным уравнениям связи, в настоящей работе проводилась по методу Нелдера-Мида, реализующему прямой поиск по деформируемому многограннику. [14]
Традиционной проблемой является выбор наилучшего вида модели тренда. В качестве такого критерия отбора может быть использована доля объясненной дисперсии, называемая коэффициентом детерминации:
где — дисперсия остатков; - дисперсия исходного ряда.
Непосредственная оценка коэффициента детерминации по приведенной формуле через выборочные дисперсии приводит к смещенной оценке, поэтому для построения несмещенной оценки вводится поправочный коэффициент, учитывающий число оцениваемых параметров. Получающийся при этом коэффициент называют скорректированным коэффициентом детерминации:
где n — число наблюдений; k — число оцениваемых параметров (или число независимых переменных). В отличие от коэффициента, значение которого при включении в регрессионную модель дополнительной независимой переменной может лишь возрасти, коэффициент может и уменьшиться, если снижение дисперсии остатков оказалось менее существенным по сравнению с ростом числа оцениваемых параметров.
Удобным средством описания одномерных временных рядов является их выравнивание с помощью тех или иных функций времени (кривых роста). Кривая роста позволяет получить теоретические значения уровней динамического ряда. Это те уровни, которые наблюдались бы в случае полного совпадения динамики явления с кривой.
Аппроксимация, или приближение — научный метод, состоящий в замене одних объектов другими, в том или ином смысле близкими к исходным, но более простыми.
Алгоритм прогнозирования с использованием кривых роста приведен на рис. 1.
В настоящее время известно несколько десятков кривых роста, многие из которых широко применяются для выравнивания экономических временных рядов.
Кривые роста условно могут быть разделены на три класса в зависимости от того, какой тип динамики развития они хорошо описывают.
1. Функции, используемые для описания процессов с монотонным характером развития и отсутствием пределов роста. Эти условия справедливы для многих экономических показателей, например, для большинства натуральных показателей промышленного производства.
2. Кривые, описывающие процесс, который имеет предел роста в исследуемом периоде. С такими процессами часто сталкиваются в демографии, при изучении потребностей в товарах и услугах (в расчете на душу населения), при исследовании эффективности использования ресурсов и т. д.
Примерами показателей, для которых могут быть указаны пределы роста, являются среднедушевое потребление определенных продуктов питания, расход удобрений на единицу площади и т. п.
Функции, относящиеся ко II классу, называются кривыми насыщения.
3. Если кривые насыщения имеют точки перегиба, то они относятся к III типу кривых роста — к S-образным кривым. Эти кривые описывают как бы два последовательных лавинообразных процесса (когда прирост зависит от уже достигнутого уровня): один с ускорением развития, другой — с замедлением.
S-образные кривые находят применение в демографических исследованиях, в страховых расчетах, при решении задач прогнозирования научно-технического прогресса, при определении спроса на новый вид продукции.
Вопрос о выборе кривой является основным при выравнивании ряда. Существует несколько подходов к решению этой задачи, однако, все они предполагают анализ основных свойств используемых кривых роста.
Рассмотрим порядок аппроксимации временных рядов с помощью полиномов, которые относятся к кривым I типа:
(1)
где aк (к = 0,1,…, p) — параметры многочлена,
t — независимая переменная (время).
Коэффициенты полиномов невысоких степеней могут иметь конкретную интерпретацию в зависимости от содержания динамического ряда. Например, их можно трактовать как скорость роста (a1), ускорение роста (a2), изменение ускорения (a3), начальный уровень ряда при t = 0 (a0).
Обычно в экономических исследованиях применяются полиномы не выше третьего порядка. Использовать для определения тренда полиномы высоких степеней нецелесообразно, поскольку полученные таким образом аппроксимирующие функции будут отражать случайные отклонения (что противоречит смыслу тенденции).
Полином первой степени на графике изображается прямой и используется для описания процессов, развивающихся во времени равномерно.
Полином первого порядка (прямая) Полином второй степени применим в тех случаях, когда процесс развивается равноускоренно (т.е. имеется равноускоренный рост или равноускоренное снижение уровней). Как известно, если параметр a2 > 0, то ветви параболы направлены вверх, если же a2 < 0, то вниз. Параметры a0 и a1 не влияют на форму параболы, а лишь определяют ее положение.
Полином второго порядка (парабола) Полином третьей степени имеет вид. У этого полинома знак прироста ординат может изменяться один или два раза, то есть такая кривая имеет точку перегиба.
Отличительная черта полиномов — отсутствие в явном виде зависимости приростов от значений ординат.
Оценки параметров моделей определяются методом наименьших квадратов. Суть этого метода состоит в том, что выбирается такая модель и такие ее параметры, при которых сумма квадратов отклонений расчетных значений уровней от фактических значений будет минимальной. Таким образом, оценки параметров кривой роста находятся в результате минимизации функции:
(2)
где — фактическое значение временного ряда в момент времени t;
— расчетное (теоретическое) значение временного ряда в момент времени t;
n — длина временного ряда.
Существует ряд модификаций метода наименьших квадратов, подробно описанного в литературе по математической статистике.
В результате минимизации выражения (2) строится система нормальных уравнений. Система состоит из (p+1) уравнений, содержащих в качестве неизвестных величин (p+1) коэффициентов. Решение этой системы позволяет вычислить оценки искомых коэффициентов (параметров) моделей. [15]
Оценивание параметров моделей Система нормальных уравнений для оценивания параметров прямой состоит из двух уравнений:
(3)
Для параболы второго порядка система содержит три уравнения, позволяющих найти оценки трех неизвестных коэффициентов :
(4)
Существует подход к упрощению расчетов, который заключается в переносе начала координат в середину ряда динамики. Это позволяет упростить сами нормальные уравнения, а также уменьшить абсолютные значения величин, участвующих в расчете.
Если до переноса начала координат t было равно1,2,3,…,
то после переноса:
— для четного числа членов ряда t =…, — 5; -3; -1; 1; 3; 5;…;
— для нечетного числа членов ряда t =…, — 3; -2; -1; 0; 1; 2; 3;…
После переноса начала координат сумма нечетных степеней ,
что существенно упрощает систему нормальных уравнений.
В этом случае оценки параметров соответствующих полиномов имеют находятся из соотношений:
Прямая:
; (5)
Парабола:
. (6)
Для прогнозирования на базе полученной модели на k шагов вперед необходимо в уравнение кривой роста подставить соответствующее значение временного параметра t, т. е. tпр = tn + k, учитывая номер временной точки при переносе шкалы времени в середину координат. Если оценки коэффициентов модели были получены без переноса начала координат в середину ряда, то следует подставить в модель значение временного параметра t, равного реальному прогнозному значению. [16]
Прогнозирование по методу экспоненциальных средних В настоящее время одним из наиболее перспективных направлений исследования и прогнозирования одномерных временных рядов являются адаптивные методы.
При обработке временных рядов, как правило, наиболее ценной является информация последнего периода, т.к. необходимо знать, как будет развиваться тенденция, существующая в данный момент, а не тенденция, сложившаяся в среднем на всем рассматриваемом периоде. Адаптивные методы позволяют учесть различную информационную ценность уровней временного ряда, степень «устаревания» данных.
Прогнозирование методом экстраполяции на основе кривых роста в какой-то мере тоже содержит элемент адаптации, поскольку с получением «свежих» фактических данных параметры кривых пересчитываются заново.
Поступление новых данных может привести и к замене выбранной ранее кривой на другую модель. Однако степень адаптации в данном случае весьма незначительна, кроме того, она падает с ростом длины временного ряда, т.к. при этом уменьшается «весомость» каждой новой точки. В адаптивных методах различную ценность уровней в зависимости от их «возраста» можно учесть с помощью системы весов, придаваемых этим уровням.
Оценивание коэффициентов адаптивной модели обычно осуществляется на основе рекуррентного метода, который формально отличается от метода наименьших квадратов, метода максимального правдоподобия и других методов тем, что не требует повторения всего объема вычислений при появлении новых данных. [17]
Примером простейшей адаптивной модели является экспоненциальная средняя. Экспоненциальное сглаживание временного ряда производится итеративно (пошагово), причем массив прошлой информации представлен единственным значением сглаженного уровня ряда в предыдущий момент времени.
Для экспоненциального сглаживания ряда используется рекуррентная формула:
(7)
где St — значение экспоненциальной средней в момент t;
б — параметр сглаживания, б =сonst, 0< б <1;
в = 1 — б.
Если последовательно использовать соотношение (7), то экспоненциальную среднюю St можно выразить через предшествующие значения уровней временного ряда. При
. (8)
Таким образом, величина St является взвешенной суммой всех членов ряда. При этом, веса отдельных уровней ряда убывают по мере их удаления в прошлое соответственно экспоненциальной функции (в зависимости от «возраста» наблюдений). Поэтому величина St названа экспоненциальной средней.
Английский математик Р. Браун показал, что дисперсия экспоненциальной средней D[St] меньше дисперсии временного ряда :
. (9)
Следует, что при высоком значении б дисперсия экспоненциальной средней незначительно отличается от дисперсии ряда. С уменьшением б дисперсия экспоненциальной средней уменьшается, возрастает ее отличие от дисперсии ряда. Тем самым, экспоненциальная средняя начинает играть роль «фильтра», поглощающего колебания временного ряда.
Таким образом, с одной стороны, необходимо увеличивать вес более свежих наблюдений, что может быть достигнуто повышением б, с другой стороны, для сглаживания случайных отклонений величину б нужно уменьшить.
Эти два требования находятся в противоречии. Поиск компромиссного значения параметра сглаживания б составляет задачу оптимизации модели.
Часто поиск оптимального значения б осуществляется путем перебора и в качестве оптимального выбирается такое значение, при котором получена наименьшая дисперсия ошибки. Обычно параметр сглаживания принимается равным в интервале от 0,1 до 0,3.
При использовании экспоненциальной средней для краткосрочного прогнозирования предполагается, что модель ряда имеет вид: yt = a1,t + et, где a1,t — варьирующий во времени средний уровень ряда, et — случайные не автокоррелированные отклонения с нулевым математическим ожиданием и дисперсией .
Прогнозная модель определяется равенством
где — прогноз, сделанный в момент t на ф единиц времени (шагов) вперед; - оценка параметра в момент времени t.
Единственный параметр модели в1,t определяется экспоненциальной средней: в 1,1 = St; в 1,0 = S0.
Выражение (7) можно представить иначе:
. (10)
Величину можно рассматривать как погрешность прогноза. Тогда новый прогноз St получается в результате корректировки предыдущего прогноза с учетом его ошибки. В этом и состоит адаптация модели.
Экспоненциальное сглаживание является примером простейшей самообучающейся модели. Массив прошлой информации уменьшен до единственного значения St-1. [18]
2. Использование различных методов для выделения тренда временных рядов
2.1 Характеристика объекта исследования и графическое представление рядов динамики
Ставропольский край или Ставрополье находится на Юге России, является субъектом РФ, входит в состав Северо-Кавказского Федерального округа.
Край образован 13 февраля 1924 как Юго-Восточная область (край). 16 октября 1924 — 13 марта 1937 — Северо-Кавказский край. 13 марта 1937 — 12 января 1943 — Орджоникидзевский край.
Граничит на юге с Республикой Северная Осетия, Кабардино-Балкарской Республикой. На юго-западе, западе и северо-западе — с Краснодарским краем. На севере — с Ростовской областью, на севере и северо-востоке — c Республикой Хальмг Тангч (Калмыкией). На востоке — с Республикой Дагестан, на юго-востоке — с Чеченской и Ингушской Республиками.
Рельеф территории меняется от равнинного на севере и северо-востоке до предгорного и горного на юге и юго-западе. Склоны Большого Кавказа занимают юго-запад края. Большая часть территории Ставропольского края занята Ставропольской возвышенностью, переходящей на востоке в Терско-Кумскую низменность. На севере возвышенность сливается с Кумо-Манычской впадиной. Реки края принадлежат к бассейнам Азовского и Каспийского морей. Наиболее крупные из них — Кубань, Егорлык, Кума и Калаус.
Краевой центр — город Ставрополь. Крупнейшие города — Ставрополь, Пятигорск, Невинномысск, Кисловодск, Ессентуки, Минеральные воды, Георгиевск, Буденновск, Михайловск.
Этнический состав населения разнообразен, но большинство составляют: русские — 85,5%, значительная часть которых относит себя к казакам, армяне — 4,1%, украинцы — 2%, греки. В Предкавказье живут черкесы, ногайцы, абазины, карачаевцы.
Численность населения Ставропольского края на 1 января 2011 года с учетом предварительных итогов Всероссийской переписи населения 2010 года составила 2 785,3 тысяч человек. Объем зарегистрированного миграционного прироста населения перекрыл естественную убыль в 2,4 раза. Коэффициент рождаемости по краю составил 11,9 на 1000 населения. В сельской местности он на 9,6% выше показателя по городской местности. За 2010 год коэффициент смертности снизился по сравнению с 2009 годом и составил 12,4 человека на 1000 населения края, в том числе младенческая смертность составила 8,3 человека на 1000 родившихся живыми. Однако число умерших в целом по краю превысило число родившихся на 1498 человек или на 4,4%. Коэффициент естественной убыли населения сократился с -1,1 до -0,5 человека на 1000 населения. [19]
Таблица 2
Показатели | На 01.01.2010 г. | На 01.01.2011 г. | |
Численность постоянного населения, тыс. человек | 2711,2 | 2785,3 | |
Число родившихся, чел. | |||
Коэффициент рождаемости, на 1000 населения | 12,1 | 11,9 | |
Число умерших, чел. В том числе дети в возрасте до 1 года | |||
Коэффициент смертности, на 1000 населения | 13,2 | 12,4 | |
Младенческая смертность, на 1000 детей, родившихся живыми | 9,7 | 8,3 | |
Естественная убыль населения, чел. | — 2929 | — 1498 | |
Коэффициент естественной убыли населения, на 1000 населения | — 1,1 | — 0,5 | |
Продолжительность жизни, лет | 70,3 | 70,4 | |
Объектом исследования являются данные численности постоянного населения Ставропольского края в среднем за год, число родившихся и умерших за год человек в течение 1990;2010 г.
Динамика числа родившихся и умерших за год человек По данным рис. можно сказать, что с 1992 г. по 2005 г. число умерших за год человек увеличивается, хотя в промежутке 1995;1998 гг. наблюдается небольшое снижение. С 2005 г. численность умерших начинает снижаться. С начала периода численность родившихся резко снижается с 36 374 человек до 15 509, и только с 2006 г. наблюдается рост.
Динамика численности населения в среднем за год
По рисунку можно сказать, что с начала периода наблюдается тенденция к увеличению численности населения, максимального значения достигла в 2000 году — 2 740 906 человек.
2.2 Исследование основной тенденции методом механического выравнивания
Проанализируем численность постоянного населения в среднем за год, взяв период 1990;2010 гг. (таблица 3), для того, чтобы выявить тенденцию и спрогнозировать численность населения на 2011 и 2012 годы. [20]
На основе данных за 21 год нужно произвести сглаживание ряда методом трехчленной скользящей средней.
Взяв данные за первые три года, исчисляем трехчленные суммы, а затем среднюю и т. д.
Таблица 3
t | Численность постоянного населения в среднем за год, | Сглаживание значений | |
годы | тыс. человек | ||
Абсолютное увеличение показывает на сколько каждый из уровней отличается от уровня, принятого за базу сравнения (базой сравнения является каждый предшествующий уровень ряда).
Рассчитаем данный показатель:
1. Среднегодовой абсолютный прирост:
2. Если эта тенденция сохранится, то прогнозное значение на 21 год будет равно средний абсолютный прирост
3. Рассчитаем темп роста, который показывает, во сколько раз каждый из уровней ряда выше (в том числе и в моем случае) уровня, принятого за базу сравнения:
4. Среднегодовой темп прироста:
Расчетные данные позволяют сделать вывод о том, что произошло небольшое увеличение численности населения в 0,5%. Данное явление можно пронаблюдать на рисунке.
Динамика численности постоянного населения в среднем за год На диаграмме выделен тренд линейный (тыс. человек), сделанный с помощью программы Microsoft Excel.
2.3 Выделение основной тенденции методом аналитического выравнивания
Вышеприведенная система показателей анализа рядов динамики позволяет охарактеризовать уровни ряда, но также при анализе важна основная тенденция ряда. Применим специальные методы обработки, которые позволяют проявить основную закономерность развития явления. Таковыми являются методы аналитического выравнивания по уравнению прямой и параболы. При аналитическом выравнивании исходные уровни ряда динамики заменяются теоретическими или расчетными, которые представляют собой некоторую достаточно простую математическую функцию времени, выражающую тенденцию развития ряда динамики. Т.к. применяем уравнение прямой и параболы, то расчет коэффициентов уравнения будем проводить на основе метода наименьших квадратов:
Выполним аналитическое выравнивание по уравнению прямой ряда динамики числа родившихся и умерших за год человек в период 1990;2010 гг. (Приложение 1)
Произведем расчеты:
1.
На основе решения двух уравнений получим параметры линейного регрессионного уравнения Результаты исследования можно пронаблюдать на рисунках.
Тенденция динамики числа родившихся за год человек На рисунке выделен тренд (полином 3-го порядка). Наблюдается тенденция увеличения числа родившихся. По коэффициенту детерминации можно сказать, что связь средняя.
Вычисления на рисунке сделаны с помощью программы Microsoft Excel.
На рис. выделен тренд (полиномиальный) По коэффициенту детерминации можно сказать, что связь — сильная.
2.4 Прогнозирование уровня показателей с помощью основной тенденции
В таблице 4 приведены данные о численности населения за 1990;2010 гг.
Таблица 4
t | |||||||||
Yt | |||||||||
t | |||||||||
Yt | |||||||||
t | |||||||||
Yt | |||||||||
Шаг 1. В предположении об изменении тенденции ряда по линейной модели:
— определить параметры линейного тренда ;
— дать экономическую интерпретацию полученных параметров модели;
— рассчитать прогнозный уровень за 22-й год.
Шаг 2. В предположении об изменении тенденции ряда по параболической модели:
— определить параметры параболического тренда ;
— дать экономическую интерпретацию полученных параметров модели;
— рассчитать прогнозный уровень за 22-й год.
Решение:
Расчет параметров модели производится по формулам, полученным из соответствующих систем нормальных уравнений (3), (4), (5), (6) после переноса начала координат в середину временного ряда.
Для определения параметров моделей необходимые промежуточные вычисления представлены в таблице 5 «Расчетные данные для оценки параметров трендов»
Таблица 5
№ п/п | Yt | t | Yt*t | t2 | Yt*t2 | t4 | |
— 10 | — 24 567 900 | ||||||
— 9 | — 22 501 980 | ||||||
— 8 | — 20 392 504 | ||||||
— 7 | — 18 182 703 | ||||||
— 6 | — 15 850 236 | ||||||
— 5 | — 13 386 570 | ||||||
— 4 | — 10 793 704 | ||||||
— 3 | — 8 141 817 | ||||||
— 2 | — 5 457 332 | ||||||
— 1 | — 2 738 198 | ||||||
Сумма | |||||||
1. Линейный тренд
Следовательно, уравнение линейного тренда имеет вид:
Согласно полученной модели, оценка среднего уровня ряда при t = 0 составляет 2 676 992,6 человек, а среднегодовой абсолютный прирост равен 9276,41 человек.
Для прогнозирования по линейной модели на одну точку вперед необходимо в полученное выражение подставить соответствующее значение временного параметра tпр = 11, соответствующее реальному значению t* = 22.
Прогнозное значение численности населения на 22-й год составит:
тыс. человек
2. Параболический тренд
Полученное уравнение параболы имеет вид:
Согласно полученной модели, оценка среднего уровня ряда при t = 0 составляет 1 483 350 956,6 человек, среднегодовой абсолютный прирост равен 9276,4116 человек, причем прирост является не постоянной величиной, а в среднем убывает на 91 569,2 человека ежегодно.
Для прогнозирования по параболе на одну точку вперед необходимо в полученное выражение подставить соответствующее значение временного параметра tпр = 11, соответствующее реальному значению t* = 22.
Прогнозное значение за 22-й год составит:
.
Анализ по линейному тренду свидетельствует о том, что прирост на 22-й год составляет 9276,4 человек. Прогнозное значение численности населения на 22-й год составит 2 779 033 человек, что на 67 835 человек больше, чем в 21 году.