Помощь в написании студенческих работ
Антистрессовый сервис

Построение краткосрочного прогноза в рамках адаптивной модели

ДипломнаяПомощь в написанииУзнать стоимостьмоей работы

Методы прогнозирования Среди большого разнообразия экономико-математических методов, используемых для решения задач управления предприятием, особое место занимают методы и модели прогнозирования. Следует различать два понятия, связанные с прогнозированием — собственно прогнозирование и предсказание. Под предсказанием понимают суждение о будущем процесса, основанное на субъективном взвешивании… Читать ещё >

Построение краткосрочного прогноза в рамках адаптивной модели (реферат, курсовая, диплом, контрольная)

СОДЕРЖАНИЕ ВВЕДЕНИЕ

1. ОСНОВЫ ТЕОРИИ ВЕРОЯТНОСТНОГО ПРОГНОЗИРОВАНИЯ

1.1 Методы прогнозирования

1.2 Адаптивные модели прогнозирования

1.3 Модель Брауна

1.3.1 Простое экспоненциальное сглаживание

1.3.2 Условия экспоненциального сглаживания

1.3.3 Постоянная сглаживания

1.4 Линейные модели временных рядов

1.4.1 Авторегрессия первого порядка AR (1)

1.4.2 Авторегрессия второго порядка AR (2)

1.4.3 Авторегрессия порядка p AR (p)

1.4.4 Процессы скользящего среднего MA (q)

1.4.5 Комбинированные процессы авторегрессии-скользящего среднего ARMA (p, q)

1.5 Критерий точности и надежности прогнозов

2. ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ МЕТОДОВ ПРОГНОЗИРОВАНИЯ НА ПРИМЕРЕ СПК КОЛХОЗА «НОВОАЛЕКСЕЕВСКИЙ»

2.1 Характеристика СПК колхоза «Новоалексеевский»

2.2 Постановка задачи прогнозирования

2.3 Идентификация модели ARIMA в системе STATISTICA

2.4 Идентификация стационарности модели, определение порядка разности d

2.4.1 Определение параметров p и q стационарной модели

2.5 Оценивание параметров модели ARIMA (p, d, q)

2.6 Исследование адекватности модели

2.6.1 Проверка случайности остатков

2.6.2 Проверка соответствия остатков нормальному закону распределения

2.6.3 Проверка равенства нулю математического ожидания остатков

2.6.4 Проверка независимости значений уровней остаточной компоненты

2.7 Проверка значимости и точности модели

2.8 Построение прогноза и оценка его точности

2.9 Анализ результатов ЗАКЛЮЧЕНИЕ СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ ПРИЛОЖЕНИЯ

ВВЕДЕНИЕ

Актуальность темы дипломной работы «Модель потребительского выбора продукции СПК колхоза «Новоалексеевский» заключается в том, что предложенное решение задачи о реализации продукции интересно в опыте применения этой теории для деятельности данного предприятия.

Целью дипломной работы является построение краткосрочного прогноза в рамках адаптивной модели.

Для достижения этой цели в дипломной работе последовательно решены следующие задачи:

1. Идентифицирована модель, т. е. определено количество параметров различного типа, которые присутствуют в модели.

2. Оценены параметры модели.

3. Исследована адекватность построенной модели.

4. Построен прогноз на основе адекватной модели.

5. Проведен анализ полученных результатов.

Дипломная работа состоит из двух разделов основной части пояснительной записки, заключения, списка использованной литературы и приложений.

Во введении обоснованна актуальность темы исследования, цель и задачи дипломной работы.

В первой главе дан общий обзор адаптивных методов прогнозирования. Изложены теоретические основы построения одной из базовых СС-моделей — модели Брауна. Рассмотрены линейные модели временных рядов — это процессы авторегрессии, скользящего среднего и их комбинации.

Вторая глава посвящена практическому применению методов прогнозирования на примере СПК колхоза «Новоалексеевский», построен прогноз реализации продукции на основе наблюдений, фиксируемых ежедневно с 03.03.09 по 23.03.11 гг. Прогнозирование проводится в рамках модели авторегрессии и проинтегрированного скользящего среднего, предложенной Боксом и Дженкинсом[1]. Исследование временного ряда и прогнозирование осуществляется в системе STATISTICA — интегрированной системе комплексного статистического анализа обработки данных в среде Windows. Результаты работы представлены графически и проведен их анализ.

В заключении кратко перечисляются самостоятельно полученные результаты дипломной работы.

В список использованной литературы включены основные литературные источники в количестве 20 шт., используемые для написания пояснительной записки дипломной работы.

В приложениях приводятся таблицы, результаты вычислений для различных параметров поставленных задач.

1. ОСНОВЫ ТЕОРИИ вероятностного ПРОГНОЗИРОВАНИЯ

1.1 Методы прогнозирования Среди большого разнообразия экономико-математических методов, используемых для решения задач управления предприятием, особое место занимают методы и модели прогнозирования. Следует различать два понятия, связанные с прогнозированием — собственно прогнозирование и предсказание. Под предсказанием понимают суждение о будущем процесса, основанное на субъективном взвешивании большого числа факторов качественного и количественного характера. Предсказание подразумевает описание возможных или желательных перспектив, состояний, решений проблем будущего. Под прогнозированием понимают научное (т.е. основанное на системе фактов и доказательств, установленных причинно следственных связях) выявление вероятных путей и результатов предстоящего развития явлений и процессов, оценку показателей, характеризующих эти явления и процессы. Прогнозирование — это исследовательский процесс, в результате которого получают прогноз о состоянии объекта. Прогноз является вероятностным суждением о состоянии объекта или об альтернативных путях его достижения.

В основе прогнозирования лежат три взаимодополняющих источника информации о будущем:

— оценка перспектив развития будущего состояния прогнозируемого явления на основе опыта, чаще всего при помощи аналогии с достаточно хорошо известными сходными явлениями и процессами;

— условное продолжение в будущее (экстраполяция) тенденций, закономерности, развития которых в прошлом и настоящем достаточно хорошо известны;

— модель будущего состояния того или иного явления, процесса, построенная сообразно ожидаемым или желательным изменениям ряда условий, перспективы развития которых достаточно хорошо известны.

В соответствии с этим существует три дополняющих друг друга способа разработки прогнозов:

— анкетирование — опрос населения, проведение экспериментов с целью упорядочить, объективизировать субъективные оценки прогнозного характера, особенно большое значение, имеют экспертные оценки;

— экстраполирование и интерполирование (выявление промежуточного значения между двумя известными моментами процесса) — построение динамических рядов развития показателей прогнозируемого явления на протяжении периодов основания прогноза в прошлом и упреждения прогноза в будущем (ретроспекции и проспекции прогнозных обработок);

— моделирование — построение поисковых и нормативных моделей с учетом вероятного и желательного изменения прогнозируемого явления на период упреждения прогноза по имеющимся прямым и косвенным данным о масштабах и направлении изменений.

Наиболее эффективная прогнозная модель — система уравнений. Однако имеют значение все возможные виды моделей в широком смысле этого термина: сценарии, имитации, графы, матрицы, подборки показателей, графические изображения и т. д.

1.2 Адаптивные модели прогнозирования Самонастраивающаяся рекуррентная модель, способная отражать изменяющиеся во времени динамические свойства временного ряда и учитывать информационную ценность его членов.

Данное направление в прогнозировании особенно актуально в условиях возрастания динамики бизнес — систем, структурной перестройки экономики и неравномерности развития научно-технического прогресса в различных отраслях, высокой изменчивости фондовых и товарно-сырьевых рынков на текущую конъюнктуру.

Преимущество адаптивных моделей в том, что они отражают динамические свойства временного ряда и учитывают информационную ценность его ретроспективных членов и поэтому способны давать достаточно точные оценки будущих значений. Такие модели предназначаются, прежде всего, для краткосрочного прогнозирования. Они позволяют достичь компромисса между требованием статистических подходов к увеличению объемов выборки для получения более точных оценок и требованием гомогенности (однородности) данных, чем больше период наблюдений, тем выше вероятность того, что исследуемый процесс или объект претерпел коренные изменения.

Реальные бизнес-процессы протекают в постоянно изменяющихся условиях внешней среды. На временной ряд, описывающий некоторый исследуемый процесс, воздействуют в разное время различные факторы: одни из них по тем или иным причинам ослабляют свое влияние, другие — увеличивают. Поэтому модель должна адаптироваться к ряду. Поскольку большинство реальных рядов являются нестационарными, то их характеристики (уровень, скорость роста, дисперсия колебаний и т. д.) также не постоянны во времени, модель всегда будет находиться в движении. Образно говоря, процесс адаптации модели к ряду можно рассматривать как «гонку за лидером».

Адаптация в таких моделях обеспечивается небольшими дискретными сдвигами. Изначально модель находится в некотором исходном состоянии, то есть, определены текущие значения ее параметров, и по ним делается прогноз на один шаг вперед. Затем устанавливается отклонение прогнозного значения от фактического, и полученная ошибка используется для корректировки параметров модели с целью ее лучшего согласования с динамикой ряда. Затем делается прогноз на следующий момент времени, и процедура повторяется.

Таким образом, адаптация представляет собой рекуррентную процедуру с получением каждой новой точки ряда. Целью такого «обучения» модели является выбор наилучшего параметра на основе пробных прогнозов на ретроспективном статистическом материале.

Адаптивные модели обладают высокой гибкостью, но при этом достаточно низкой универсальностью, поскольку приспосабливаются к конкретному ряду. Поэтому при построении и обосновании моделей необходимо учитывать наиболее вероятные закономерности развития исследуемого процесса и соотносить динамические свойства ряда с их структурой и возможностями.

К числу наиболее популярных адаптивных прогностических моделей можно отнести модели Холта, Брауна, Бокса-Дженкинса и др.

В практике прогнозирования наиболее часто используют модель Брауна или как ее еще называют модель экспоненциального сглаживания.

1.3 Модель Брауна Экспоненциальное сглаживание — это очень популярный метод прогнозирования многих временных рядов. Исторически метод был независимо открыт Брауном и Холтом. Браун служил на флоте США во время второй мировой войны, где занимался обнаружением подводных лодок и системами наведения. Позже он применил открытый им метод для прогнозирования спроса на запасные части. Свои идеи он описал в книге, вышедшей в свет в 1959 году. Исследования Холта были поддержаны Департаментом военно-морского флота США. Независимо друг от друга, Браун и Холт открыли экспоненциальное сглаживание для процессов с постоянным трендом, с линейным трендом и для рядов с сезонной составляющей.

1.3.1 Простое экспоненциальное сглаживание Предположим, что исследуется временной ряд. Выявление и анализ тенденции динамического ряда часто производится с помощью его выравнивания или сглаживания. Экспоненциальное сглаживание — один из простейших и распространенных приемов выравнивания ряда. В его основе лежит расчет экспоненциальных средних. Экспоненциальное сглаживание ряда осуществляется по рекуррентной формуле [4]

(1)

где значение экспоненциальной средней в момент t;

— параметр сглаживания, б= const, 0 < < 1;

— коэффициент дисконтирования данных. Он характеризует обесценивание данных в единицу времени и отражает степень доверия более поздним наблюдениям.

Выражение (1) можно переписать следующим образом:

(2)

Экспоненциальная средняя на момент t здесь выражена как экспоненциальная средняя предшествующего момента плюс доля, а разницы текущего наблюдения и экспоненциальной средней прошлого момента. Если последовательно использовать рекуррентное соотношение (1), то экспоненциальную среднюю можно выразить через значения временного ряда :

(3)

где n — количество членов ряда;

— некоторая величина, характеризующая начальные условия для первого применения формулы (1) при t=l.

Так как, то при, а сумма коэффициентов. Тогда. Таким образом, величина оказывается взвешенной суммой всех членов ряда. Причем веса падают экспоненциально в зависимости от давности («возраста») наблюдения. Это и объясняет, почему величина названа экспоненциальной средней. Если, например,, то текущее наблюдение будет иметь вес, а веса предшествующих данных составят соответственно и т. д.

Простая и прагматически ясная модель временного ряда имеет следующий вид: где — случайные некоррелированные отклонения, или шум, со средним значением 0 и дисперсией. Константа относительно стабильна на каждом временном интервале, но может также медленно изменяться со временем. Один из интуитивно ясных способов выделения состоит в том, чтобы использовать сглаживание скользящим средним, в котором последним наблюдениям приписываются большие веса, чем предпоследним, предпоследним большие веса, чем пред-предпоследним и т. д. Простое экспоненциальное именно так и устроено. Здесь более старым наблюдениям приписываются экспоненциально убывающие веса, при этом, в отличие от скользящего среднего, учитываются все предшествующие наблюдения ряда, а не те, что попали в определенное окно.

Применим к нему процедуру экспоненциального сглаживания (1). Тогда Найдем математическое ожидание и дисперсию

(4)

Так как

Таким образом, экспоненциальная средняя имеет те же математическое ожидание, что и ряд, но меньшую дисперсию. Как видно из (4), при высоком значении дисперсия экспоненциальной средней незначительно отличается от дисперсии ряда. Чем меньше, тем в большей степени сокращается дисперсия экспоненциальной средней. Следовательно, экспоненциальное сглаживание можно представить как фильтр, на вход которого в виде потока последовательно поступают члены исходного ряда, а на выходе формируются текущие значения экспоненциальной средней. И чем меньше, тем в большей степени фильтруются, подавляются колебания исходного ряда.

После появления работ Брауна экспоненциальная средняя часто используется для краткосрочного прогнозирования. В этом случае предполагается, что ряд генерируется моделью где — варьирующий во времени средний уровень ряда;

— случайные неавтокоррелированные отклонения с нулевым математическим ожиданием и дисперсией .

Прогнозная модель имеет вид

(5)

где — прогноз, сделанный в момент на единиц времени (шагов)вперед;

— оценка, (знак над величиной здесь и далее будет означать оценку).

Средством оценки единственного параметра модели служит экспоненциальная средняя. Таким образом, все свойства экспоненциальной средней распространяются на прогнозную модель. В частности, если рассматривать как прогноз на 1 шаг вперед, то в выражении (2) величина есть погрешность этого прогноза, а новый прогноз St получается в результате корректировки предыдущего прогноза с учетом его ошибки. В этом и состоит существо адаптации.

При краткосрочном прогнозировании желательно как можно быстрее отразить изменения и в то же время как можно лучше «очистить» ряд от случайных колебаний. Таким образом, с одной стороны, следует увеличивать вес более свежих наблюдений, что может быть достигнуто повышением (см. (3)), с другой стороны, для сглаживания случайных отклонений величину нужно уменьшить. Как видим, эти два требования находятся в противоречии. Поиск компромиссного значения составляет задачу оптимизации модели.

Экспоненциальное сглаживание является простейшим вариантом самообучающейся модели. Вычисления просты и выполняются итеративно. Они требуют даже меньше арифметических операций, чем скользящая средняя, а массив прошлой информации уменьшен до одного значения. Такую модель будем называть адаптивной экспоненциального типа, а величину — параметром адаптации.

1.3.2 Условия экспоненциального сглаживания Экспоненциальное выравнивание всегда требует предыдущего значения экспоненциальной средней. Когда процесс только начинается, должна быть некоторая величина которая может быть использована в качестве значения, предшествующего. Если есть прошлые данные к моменту начала выравнивания, то в качестве первого, значения S0 можно использовать арифметическую среднюю всех имеющихся точек или какой-то их части. Когда для такого оценивания S0 нет данных, требуется предсказание начального уровня ряда.

Предсказание может быть сделано исходя из априорных знаний о процессе или на основе его аналогии с другими процессами. После k шагов вес, придаваемый первому значению, равен. Если есть уверенность в справедливости первого значения, то можно коэффициент взять малым. Если такой уверенности нет, то параметру следует дать большое значение, с таким расчетом, чтобы влияние первого значения быстро уменьшилось. Однако большое значение, как это следует из (4), может явиться причиной большой дисперсии колебаний St. Если требуется подавление этих колебаний, то после достаточного удаления от начального момента времени величину можно убавить.

Рассмотрим роль параметра в первый период сглаживания в случае, когда нет уверенности в справедливости выбора первой величины. В этом случае получение прогнозов по экспоненциальной средней, построенной на малом отрезке ряда (выборке) чревато большими ошибками. Для того чтобы элиминировать избыточный вес, приданный первой величине, один из ученых Р. Вейд предлагает модифицировать процедуру сглаживания следующим образом.

Для исходного момента времени запишем:

где S0 — как и раньше, начальная оценка уровня ряда.

Так как коэффициенты и в сумме теперь не дают единицу, то следует использовать множитель, равный единице, деленной на сумму коэффициентов. Таким образом, модифицированной экспоненциальной средней для t=l будет и вообще Сущность этого метода состоит в том, чтобы убрать избыточный вес от веса, даваемого первому значению, и распределить его пропорционально по всем членам ряда. Прогнозы, получаемые по соответствующей модифицированной модели, основываются в большей степени на фактических данных, чем на предварительной оценке S0 даже при малых выборках. Для того чтобы сократить время вычислений, целесообразно вернуться к обычному экспоненциальному сглаживанию, когда сумма коэффициентов приближается к единице. На основе эмпирического анализа Р. Вейд рекомендует осуществлять такой переход при сумме коэффициентов 0.995. При заданном значении можно заранее определить, на каком шаге следует вернуться к обычной модели.

1.3.3 Постоянная сглаживания Выбору величины постоянной сглаживания следует уделять особое внимание. Поиски должны быть направлены на отыскание оснований для выбора наилучшего значения. Нужно учитывать условия, при которых эта величина должна принимать значения, близкие то одному крайнему значению, то другому. Нетрудно заметить, что при представляет случай абсолютной фильтрации и полного отсутствия адаптации. При приходим к так называемой наивной модели в соответствии с которой прогноз на любой срок равен текущему фактическому значению ряда. На практике эта модель из-за простоты пользуется особой популярностью.

Постоянная сглаживания характеризует скорость реакции модели на изменения уровня процесса, но одновременно определяет и способность системы сглаживать случайные отклонения. Поэтому величине следует давать то или иное промежуточное значение между 0 и 1 в зависимости от конкретных свойств динамического ряда.

В качестве удовлетворительного компромисса Р. Браун рекомендует брать в пределах от 0.1 до 0.3. Опыт работы с экономическими рядами показывает, что наибольшая точность прогнозирования может быть достигнута при любых допустимых значениях. Однако, как правило, если в результате испытаний обнаружено, что наилучшее значение константы близко к 1, следует проверить законность выбора модели данного типа. Часто к большим значениям приводит наличие в исследуемом ряде ярко выраженных тенденций или сезонных колебаний. В этом случае для получения эффективных прогнозов требуется другая модель.

Ясно, что наилучшее значение в общем случае должно зависеть от срока прогнозирования. Для конъюнктурных прогнозов в большей мере должна учитываться свежая информация. При увеличении периода упреждения более поздняя информация, отражающая последнюю конъюнктуру, должна, по-видимому, иметь несколько меньший вес, чем в случае малых. Для того чтобы сгладить конъюнктурные колебания, следует в большей мере учитывать информацию за прошлые периоды времени. Для проведения подобного анализа вводят понятие среднего возраста данных. Возраст текущего наблюдения равен 0, возраст предыдущего наблюдения равен 1 и т. д. Средний возраст — это сумма взвешенных возрастов данных, использованных для подсчета сглаженной величины. Причем возраста имеют те же веса, что и соответствующая информация. При экспоненциальном выравнивании вес, даваемый точке с возрастом, равен, где и средний возраст информации равен:

(6)

Таким образом, чем меньше, тем больше средний возраст информации. Для конъюнктурных прогнозов значение, как правило, надо брать большим, а для более долгосрочных — малым.

На практике параметр сглаживания часто ищется с поиском на сетке. Возможные значения параметра разбивают сеткой с определенным шагом. Например, рассматривается сетка значений от =0.1 до =0.9, с шагом 0.1. Затем выбирается, для которого сумма квадратов (или средних квадратов) остатков (наблюдаемые значения минус прогнозы на шаг вперед) является минимальной.

1.4 Линейные модели временных рядов Рассмотрим некоторые математические модели временных рядов: процессы авторегрессии, скользящего среднего и их комбинации. Эти модели называют линейными, так как определяющие их соотношения для элементов временного ряда и случайных ошибок выражаются с помощью линейных операций над ними: сложения-вычитания и умножения-деления на действительные числа.

1.4.1 Авторегрессия первого порядка AR (1)

Рассмотрим процесс X (t), значения которого в момент времени t формируется как комбинация значений этого процесса в предшествующий момент t-1 и некоторой случайной составляющей, независимой от значения X (t-l).

Процессы такого типа могут описывать как экономические, так и технологические временные ряды. Мы предположим, что — это процесс белого шума, т. е. что в разные моменты t случайные величины независимы и одинаково распределены по нормальному закону с математическим ожиданием равным нулю и дисперсией D.

Определение. Случайный процесс X (t) называют процессом авторегрессии первого порядка (коротко AR (1)), если для него выполняется соотношение

(7)

где — параметр авторегрессии.

С помощью соотношения (7) можно задать значение процесса X (t) в любой момент времени через значения процесса X (t), если известна величина в момент .

Определим числовые характеристики стационарного процесса авторегрессии. Пусть

Взяв математическое ожидание от обеих частей (7), получим, что. Отсюда следует, что, если. Взяв дисперсию от обеих частей (7), получим, что. Отсюда следует (учитывая, что), что Таким образом, для стационарного процесса AR (1) получаем, что и для любых t и k

Похожим приемом можно вычислить при k= 1,2,… Чтобы вычислить умножим (7) на и возьмем математическое ожидание. Получаем, что. Так как и независимы, то Поэтому, т. е.

Для вычисления заметим, что, согласно (7) а потому. Последнее равенство умножим на и возьмем математическое ожидание. Вычисляя, как выше, найдем, что Аналогичным образом вычисляем (здесь соотношение (7) надо применить дважды). Получаем, что. Действуя, таким образом, и далее, найдем для любого k, что Из этих соотношений следует, что

(8)

Таким образом, автокорреляционная функция AR (1) процессов экспоненциально убывает с ростом поправки k. Обратим внимание, что чем ближе значение к единице, тем более гладко ведет себя траектория процесса AR (1) по сравнению с траекторией белого шума. И наоборот, чем ближе значение к минус единице, тем более изломанно (пилообразно) ведет себя траектория.

Стационарный процесс авторегрессии первого порядка с ненулевым средним. определяется соотношением:

(9)

Здесь

Учитывая стационарность процесса X (t), в качестве оценки можно взять среднее по траектории: где. Еще ранее для мы получили, что Заменяя его оценкой по траектории, получаем для оценку:

(10)

Наконец, уже известное соотношение DX (t) позволяет оценить и Для этого можно воспользоваться стандартной оценкой дисперсии DX (t) стационарного процесса:

Отсюда

(11)

1.4.2 Авторегрессия второго порядка AR (2)

Текущее значение процесса AR (2) в момент t формируется как линейная комбинация его значений в предыдущие моменты (t-1) и (t-2), и независимой от них случайной величины. Как и ранее, процесс будем считать белым шумом. Процессы AR (2) обладают большей «памятью», чем процессы AR (1).

Определение. Случайный процесс X (t) называют процессом авторегрессии второго порядка (коротко AR (2)), если для X (t) выполняется соотношение

(12)

где и — некоторые константы.

С помощью соотношения (12) значения X (t) можно определить в любой момент через посредство последовательности и значений X (t) в моменты t0 и

Условие стационарности. Так же, как это было для AR (1), из условия стационарности X (t) вытекает, что MX (t)=0. Условие стационарности накладывает также определенные ограничения на параметры, Ниже будет показано, что для стационарного процесса AR (2)

(13)

Ограничения (13) задают на плоскости треугольную область. Верно и обратное если точка с координатами попадает внутрь этого треугольника, то с помощью (12) можно задать стационарный процесс AR (2) с параметрами .

Определим числовые характеристики и их оценки. Пусть. Для стационарного процесса AR (2) с нулевым средним для любого t. С использованием (12) для выводим соотношения Вычисляя, таким же образом получим, что

Для автокорреляционной функции эти равенства дают

(14)

Соотношения (14) называют уравнениями Юла-Уолкера. Они связывают параметры процесса AR (2) со значениями его автокорреляционной функции:

(15)

Аналогичным путем для произвольного целого k получаем соотношение:

(16)

Рассмотрим это соотношение как уравнение, и найдем все последовательности, скажем, которые ему удовлетворяют. Решения уравнения (16) связаны с корнями квадратного уравнения (его называют характеристическим)

(17)

Пусть — корни (17), которые сейчас предположим различными. Случай рассмотрим позже. Легко проверить, что последовательности удовлетворяют (16). Более того, нетрудно доказать, что любое решение (16) является их линейной комбинацией, т. е. любое решение (16) имеет вид:

(18)

где — произвольные числа.

Теперь рассмотрим случай, когда уравнение (17) имеет кратный корень Легко проверить, что в этом случае линейно-независимыми решениями (16) служат последовательности. Поэтому общее решение (16) в случае кратного корня (17) имеет вид

(19)

Заметим, что последовательности (18) и (19) неограниченно возрастают с ростом k, если хотя бы одно из чисел превосходит 1. Посколькукоэффициент корреляции, и не может превосходить по модулю 1, необходимо, чтобы. Более аккуратный анализ показывает, что если X (t) — стационарная последовательность, не являющаяся постоянной, то

(20)

Последнее условие — не только необходимое следствие стационарности X (t), но и достаточное: если выполнено (20), то существует стационарная последовательность X (t), удовлетворяющая (16).

Формулы (18), (19) указывают общее решение уравнения (16). Чтобы полностью задать автокорреляционную функцию rk стационарного процесса AR (2), надо еще правильно подобрать значения неопределенных коэффициентов .

Начнем со случая, когда корни — действительные числа. В этом случае надо взять такие действительные числа чтобы выполнялись соотношения (см. (14)).

(21)

При таком выборе формулы (18), (19) дают явное выражение для rk при любом. Корни уравнения (17) могут быть и комплексными (комплексно-сопряженными) числами. В этом случае надо дополнительно позаботиться о том, чтобы формула (18) при всяком k определяла бы действительное значение для автокорреляции rk,. Для этого числа следует взять тоже комплексными и сопряженными. При таком выборе выражение (18) преобразуется так, что в нем участвуют только действительные числа и действительные функции переменного k:

(22)

Действительные числа b и f определяются значениями. Роль неопределенных параметров в (22), которые надо подбирать, играют и. Для того, чтобы получить окончательную формулу для rk, их надо выбрать с помощью условия (21). Видно, что формула (22) задает экспоненциально затухающую синусоиду. Условие стационарности (20) можно выписать в явном виде через значения коэффициентов и AR (2) процесса. Для этого надо записать значения. в виде корней квадратного уравнения (17) через и. Решение получаемых таким образом неравенств приводит к указанным в (13) условиям для и .

Определение. Процесс авторегрессии второго порядка с ненулевым средним определяют соотношением

Здесь .

Также как и ранее учитывая стационарность рассматриваемого процесса, в качестве оценки можно взять, где .

Оценки и можно получить из (15), заменяя истинные значения их выборочными оценками и :

(23)

Для оценки дисперсии белого шума может быть использована остаточная сумма квадратов S, а именно:

(24)

Откуда получаем:

(25)

где значение знаменателя в (25) получено уменьшением исходного числа слагаемых в (24) на 3, за счет оценки параметров и .

1.4.3 Авторегрессия порядка р — AR (p)

Выше для простейших моделей авторегрессии были довольно подробно выведены и разобраны их свойства. В этом пункте мы приведем без доказательства сводку основных результатов, касающихся AR (p) процессов.

Определение. Случайный процесс X (t) со средним значением называется процессом авторегрессии порядка р или кратко AR (p), если для него выполняется соотношение:

(26)

Поведение автокорреляционной функции АR (р) процесса. По аналогии с тем, как мы поступали с AR (2) процессом, рассмотрим корреляцию между X (t) и X (t-k). Получаем:

(27)

Укажем общее решение уравнения (27) относительно. Оно задается с помощью корней характеристического уравнения:

Пусть — корни этого уравнения, которые мы предполагаем различными. Так же, как и в случае AR (2) процесса общее решение системы разностных уравнений (27) относительно может быть записано в виде:

Из требования стационарности AR (p) процесса вытекает, что все. Рассмотрим возможное поведение автокорреляционной функции в случае несовпадающих корней. При этом возможны два случая.

1. Корень вещественный. При этом член экспоненциально затухает с ростом k.

2. Пара корней — комплексно-сопряженные числа. Как и в случае AR (2), они вносят в rk слагаемые типа которые являются экспоненциально затухающими синусоидами.

Таким образом, в общем случае автокорреляционная функция стационарного AR процесса является суммой затухающих экспонент и затухающих синусоидальных волн.

Оценим коэффициенты AR (p) процесса. Рассмотрим выражение (27) для значений. При этом мы получим систему уравнений Юла-Уолкера (аналогичную (14) для AR (2) процесса).

(28)

Решая эту систему относительно неизвестных значений параметров и подставляя вместо неизвестных значений их оценки по наблюденному временному ряду, получаем искомые оценки коэффициентов AR (p) модели.

Частная автокорреляционная функция (ЧАКФ) полезна, когда по наблюденному отрезку временного ряда мы пытаемся подобрать для его описания подходящую ARMA-модель. Подобно автокорреляционной функции, ЧАКФ определяется для каждого натурального k и представляет собой бесконечную последовательность. Ее элементы мы обозначим через, Определение ЧАКФ и ее значений тесно связано с AR (p) моделями. Дадим определение для произвольного р. Систему уравнений Юла-Уолкера (28) можно формально рассмотреть как систему уравнений, связывающих неизвестные со значениями автокорреляции. Эта система — линейная; при заданных она легко может быть решена численно. Пусть — решение системы (28). Из этого набора чисел нам нужно всего одно число, а именно. По определению, мы полагаем значением ЧАКФ при k=p.

С уравнениями Юла-Уолкера и их решениями для мы уже встречались в п. 1.4.1 и 1.4.2. По результатам этих подразделов мы можем найти при :

(29)

Формальное определение ЧАКФ дано. Посмотрим, каковы ее свойства. Рассмотрим для примера стационарный процесс авторегрессии первого порядка (1). Согласно (2), в этом случае, причем. По определению ЧАКФ, здесь. Чтобы найти, надо рассмотреть систему Юла-Уолкера (28) при р=2 и ее решение. С учетом (2), получаем, что удовлетворяют условиям Умножим первое уравнение на и вычтем из второго. Получим, что. Так как, то это равенство возможно лишь при. Подобным способом находим, что для AR (1)

(30)

Обратно, если выполняется (30), то процесс является процессом авторегрессии первого порядка.

Приведем без доказательства некоторые свойства частной автокорреляционной функции.

1. Для любого .

2. При имеет место .

3. Если рассматриваемый стационарный процесс является AR (p) процессом, то все при .

Для того, чтобы получить оценки по реализации, следует для каждого k решить соответствующую систему уравнений Юла-Уолкера (28), в которой значения автокорреляционной функции заменены их выборочными оценками. На практике в статистических пакетах для вычисления оценок используется специальные рекурсивные процедуры, позволяющие быстро осуществить вычисления оценок. Мы не будем подробнее останавливаться на этом вопросе. Последовательность оценок называют выборочной частной автокорреляционной функцией.

Укажем некоторые статистические свойства оценок при условии, что они построены по реализации AR (p) процесса. При

M

(31)

Указанные аппроксимации справедливы, если k много меньше длины реализации n. Это свойство оценок позволяет использовать выборочную частную автокорреляционную функцию для подбора порядка p модели процесса авторегрессии.

Подбор порядка р модели AR (p) процесса. Правило предварительного выбора порядка модели AR (p) процесса с использованием выборочной частной автокорреляционной функции звучит так. В качестве предварительного порядка модели AR (p) можно рассматривать такое число р, начиная с которого все последующие оценки выборочной частной автокорреляционной функции отклоняются от нуля не более чем на. То есть

для всех

Окончательный подбор порядка модели AR (p) процесса связан со статистической значимостью полученных коэффициентов модели и детальным изучением поведения остатков, получаемых вычитанием из исходного ряда значений подобранной AR (p) модели. Пусть — оценки коэффициентов подобранной модели. Для удобства записи формул обозначим первые р значений реализации через. Тогда подобранное значение AR (p) с номером можно записать в виде:

(32)

Подобранное значение с номером имеет вид:

(33)

где значение в (33) вычислено с помощью (32). Продолжая этот итеративный процесс, можно получить все значения при a также спрогнозировать дальнейшее поведение процесса, то есть вычислить значение и т. д. Если полученные остатки для ведут себя как белый шум, то процесс подбора модели можно считать завершенным. В противном случае, следует изменить порядок подбираемой модели или перейти к более сложным комбинированным моделям авторегрессии-скользящего среднего.

1.4.4 Процессы скользящего среднего MA (q)

Аббревиатура МА в заголовке образована от английского названия этих процессов: moving average. Данное сокращение стандартно используется для этих процессов в литературе и статистических пакетах. Начнем с примера.

Пусть, как и ранее, обозначает процесс белого шума,. Белый шум можно понимать как в широком, так и в узком смысле. Соответственно в широком либо узком смысле окажутся стационарными далее вводимые случайные процессы X (t). Рассмотрим временной ряд, заданный соотношением

(34)

Очевидно, что Х (t) — стационарный процесс, причем,. Ясно, что траектории X (t) будут более гладкими, чем траектории белого шума st, так как корреляция между соседними членами процесса X (t) положительна:

Корреляция между более удаленными членами при этом равна 0:

для

Процесс (34) — простой пример процессов скользящего среднего. Дадим общее определение этих процессов.

Определение. Случайный процесс X (t) называется процессом скользящего среднего порядка q (кратко MA (q)), если для него выполняется соотношение:

(35)

Свойства. Очевидно, что MA (q) (35) — случайный стационарный процесс Используя (35), нетрудно подсчитать, что для

(36)

и что для выполняется. Из этого последнего свойства следует, что автокорреляция rk обращается в нуль вне некоторого конечного участка:

для .

Это свойство автокорреляции хорошо различимо на ее графике. Оно позволяет уверенно различать процессы скользящего среднего, основываясь на графике выборочной автокорреляционной функции, если наблюдаемая траектория процесса достаточно велика.

Оценивание коэффициентов в (35) по наблюдаемому участку траектории может быть проведено, например, по обобщенному методу наименьших квадратов. Этот метод хорошо известен и реализован в любом статистическом пакете.

1.4.5 Комбинированные процессы авторегрессии-скользящего среднего ARMA (p, q)

Происхождение аббревиатуры ARMA очевидно: она соединяет сокращения AR и МА, нам уже известные. Числа р и q указывают порядок процесса.

Определение. Случайный процесс X (t) называется процессом авторегрессии-скользящего среднего порядков р и q соответственно (кратко ARMA (p, q)), если для него выполняется соотношение:

(37)

где — процесс белого шума:

В согласии с п. 1.4.3, процесс (37) может быть стационарным, только если все корни характеристического многочлена по абсолютному значению меньше единицы.

Формулы, выражающие автоковариацию и автокорреляцию стационарного случайного процесса (37) через коэффициенты и, выглядят сложно и мы их не приводим. Скажем только, что для k>q автокорреляция k>q процесса (37) удовлетворяет тем же уравнениям Юла-Уолкера, что уже были получены для процесса AR (p):

для всех

Поэтому при больших k автокорреляция rk процесса ARMA (p, q) приобретает такую же форму, как и у процесса AR (p). Прежде чем приступить к оцениванию параметров в (37) по наблюдаемому участку траектории X, надо прежде выбрать порядок (р, q) модели ARMA (p, q). Для такого выбора редко когда есть теоретические основания. Обычно решение принимают, руководствуясь формой выборочной автокорреляционной функции, выборочной частной автокорреляционной функцией, и естественным стремлением иметь модель наиболее простого вида. На практике выделяют пять основных классов моделей[6]:

1) модель AR (1) (один параметр авторегрессии): автокорреляционная функция экспоненциально затухает; частная автокорреляционная функция имеет выброс на поправке 1 (нет корреляций для других задержек);

2) модель AR (2) (два параметра авторегрессии): автокорреляционная функция имеет форму затухающей синусоидальной волны или экспоненциально затухает; частная автокорреляционная функция имеет выброс только для сдвигов 1 и 2 (значения для остальных задержек нулевые);

3) модель МА (1) (один параметр скользящего среднего): автокорреляционная функция имеет выброс на сдвиге 1 (остальные значения нулевые); частная автокорреляционная функция экспоненциально затухает — либо монотонно, либо осциллируя, т. е. меняя знак;

4) модель МА (2) (два параметра скользящего среднего): автокорреляционная функция имеет выбросы на сдвигах 1 и 2 (остальные значения нулевые); частная автокорреляционная функция имеет форму синусоидальной волны или экспоненциально затухает;

5) модель ARMA (1,1) (один параметр авторегрессии и один параметр скользящего среднего): автокорреляционная функция экспоненциально затухает, начиная с первой задержки (первое значение ненулевое), затухание может быть монотонное и колебательное; в частной автокорреляционной функции преобладает затухающий экспоненциальный член, либо монотонный, либо осциллирующий (первое значение ненулевое).

После того, как модель идентифицирована, переходят к оценке ее параметров. Оценивание коэффициентов и, представляет сложную задачу. Многие статистические пакеты прикладных программ содержат алгоритмы для ее решения. Мы не будем касаться подробностей. Заметим, что задача оценивания не всегда разрешима. Рассмотрим, например, процесс ARMA (1, 1), где Здесь, если, решением X (t) служит, и значения и не оказывают на процесс X (t) никакого влияния. Поэтому они и не могут быть определены по траектории.

1.5 Критерий точности и надежности прогнозов Точность и надежность прогнозов — широко распространенные в прогностической литературе термины, смысл которых, как это представляется на первый взгляд, вполне очевиден. Однако содержание этих терминов часто толкуется достаточно субъективно. Нередки случаи, когда одно понятие подменяется другим. О точности прогноза принято судить по величине погрешности (ошибки) прогноза — разности между прогнозируемым и фактическим значением (реализацией) исследуемой переменной. Однако такой подход к оценке точности возможен только в двух случаях. Во-первых, когда период упреждения уже окончился и исследователь имеет фактические значения переменной. При краткосрочном прогнозировании это вполне реально. Во-вторых, когда прогноз разрабатывается ретроспективно, т. е. прогнозирование осуществляется для некоторого момента времени в прошлом, для которого уже имеются фактические данные. При этом имеющаяся информация делится на две части. Одна из них, охватывающая более ранние данные, служит для оценивания параметров прогностической модели, а более поздние данные рассматриваются как реализации соответствующих прогностических оценок. Полученные ретроспективно ошибки прогноза в какой-то мере характеризуют точность примененной методики прогнозирования и могут оказаться полезными при сопоставлении нескольких методов. В то же время, величину ошибки ретроспективного прогноза нельзя рассматривать как окончательное доказательство пригодности или, наоборот, непригодности применяемого метода прогнозирования. К ней следует относиться с известной осторожностью и при ее применении в качестве меры точности необходимо учитывать, что она получена при использовании лишь части имеющихся данных. Однако эта мера точности обладает большей наглядностью и уж во всяком случае, теоретически более надежна, чем погрешность прогноза, исчисленная для периода, характеристики которого уже были использованы при оценивании параметров модели. В последнем случае погрешности, как правило, будут незначительны и мало зависимы от теоретической обоснованности, примененной для прогнозирования модели. Точность же прогнозов будет преувеличенной и в известном смысле иллюзорной. В связи с проверкой точности прогнозов необходимо сделать еще одно замечание. Так, если для ретроспективного прогнозирования применяется модель, содержащая одну или несколько экзогенных переменных, то точность прогноза будет в значительной мере зависеть от того, насколько точно определены значения этих переменных на период упреждения. При этом возможны два пути: воспользоваться фактическими значениями экзогенных переменных (так называемый прогноз ex post) и ожидаемыми их значениями (так называемый прогноз ex ante). Естественно, что точность прогноза ex post, который, как правило, и получают при проверке, будет выше, чем прогноза ex ante, так как в первом случае будет исключено искажающее влияние погрешности в значении экзогенных переменных.

Проверка точности одного прогноза мало что может сказать исследователю. В самом деле, на формирование исследуемого явления влияет множество разнообразных факторов, поэтому полное совпадение или значительное расхождение прогноза и его реализации может быть следствием просто особо благоприятных (или неблагоприятных) стечений обстоятельств. Единичный хороший прогноз может быть получен и по плохой модели, и наоборот. Отсюда следует, что о качестве прогнозов применяемых методик и моделей можно судить лишь по совокупности сопоставлений прогнозов и их реализации.

Известно, ширина доверительного интервала в значительной мере, зависит от принятой доверительной вероятности. Чем меньше эта вероятность, тем уже интервал. Таким образом, сопоставление коэффициентов для разных моделей может иметь смысл только при условии, что доверительные вероятности приняты одинаковыми. Если прогнозы получены в виде точечных оценок, то при проверке качества прогнозирования можно использовать целый ряд статистических характеристик, например среднюю абсолютную и среднеквадратическую ошибку прогноза[8]. Указанные две характеристики качества имеют ту же размерность, что и сами показатели прогноза. Легко заметить, что значения обеих характеристик существенно зависят от масштаба измерения уровней исследуемых явлений.

Применение такой меры качества прогноза, как коэффициента корреляции между прогнозами и их реализациями, вообще говоря, возможно, однако следует помнить, что коэффициент парной корреляции указывает на степень близости к линейному соотношению коррелируемых величин. Так, если коэффициент корреляции прогнозов и реализации равен единице, то это вовсе не означает, что соответствующие показатели полностью совпали, просто они могут находиться в строгом линейном соотношении.

Одним из исследователей проблем экономического прогнозирования, Г. Тейлом предложен в качестве меры качества прогнозов коэффициент расхождения (или коэффициент несоответствия), числителем которого является среднеквадратическая ошибка прогноза, а знаменатель равен квадратному корню из среднего квадрата реализации. Итак,

(38)

где и xt — соответственно предсказанное и фактическое (реализованное) изменения переменной. Коэффициент v=0, когда все =xt (случай совершенного прогнозирования); v=l, когда процесс прогнозирования приводит к той же среднеквадратической ошибке, что и «наивная» экстраполяция неизменности приростов; наконец, v>1, когда прогноз дает худшие результаты, чем предположение о неизменности исследуемого явления. Верхней границы коэффициент не имеет. Коэффициент расхождения может быть использован при сопоставлении качества прогнозов, получаемых на основе различных методов и моделей. В этом его несомненное достоинство. К тому же он имеет весьма прозрачный смысл. Величина v поддается разложению на составляющие (частные коэффициенты расхождения), характеризующие влияние ряда факторов.

Выше приведенные меры качества прогнозов (их точность) рассматривались при условии, что исследователь располагает информацией об истинных значениях величин, которые он оценивал в ходе разработки прогнозов. Такие меры качества, несомненно, представляют ценность при изучении различных методик прогнозирования. Однако в практической работе проблему точности прогноза надо решать, как правило, тогда, когда период упреждения еще не прошел и истинное значение прогнозируемой переменной неизвестно. В этом случае проблема точности может рассматриваться в плане сопоставления априорных качеств, свойств, присущих альтернативным прогностическим моделям. Так, если прогнозирование осуществляется статистическими методами, то, вероятно, понятие точности прогноза можно сделать более узким, а именно связав априорную точность прогноза с размером доверительного интервала.[9] Модель, дающая более узкий доверительный интервал при одной и той же доверительной вероятности, и является более точной. (Разумеется, при этом теоретическая обоснованность сравниваемых моделей является примерно равной). Очевидно, что надежность прогноза определяется вероятностью реализации соответствующей прогностической оценки. Чем она выше, тем выше и надежность. Вероятность реализации может быть оценена субъективно (экспертное прогнозирование) или может быть связана с доверительными интервалами прогноза, если последний основывается на статистической модели. В этом случае надежность является характеристикой, сопряженной мере точности, если под мерой точности понимается размер доверительного интервала. Отсюда чем выше надежность прогноза, тем ниже его точность, и наоборот. Рассмотренные здесь понятия априорной точности и надежности прогнозов, связанные с доверительными интервалами, являются в значительной мере условными показателями. Они могут использоваться в практической работе лишь при условии, что принятая для получения прогнозов модель имеет серьезное теоретическое обоснование и спецификация модели корректна. В противном случае полученные доверительные интервалы лишь создают иллюзию точности.

2. ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ МЕТОДОВ ПРОГНОЗИРОВАНИЯ НА ПРИМЕРЕ СПК КОЛХОЗА «НОВОАЛЕКСЕЕВСКИЙ»

2.1 Характеристика СПК колхоза «НОВОАЛЕКСЕЕВСКИЙ»

СПК колхоз «Новоалексеевский» является одним из самых крупных хозяйств в Курганинском районе Краснодарского края. Сельскохозяйственный производственный колхоз «Новоалексеевский» был зарегистрирован 23 января 2007 года. Основными видами деятельности являются: оптово-розничная торговля, производители живого скота (свиньи, крупный рогатый скот) и птицы.

2.2 Постановка задачи прогнозирования Представление о дневном торговом диапазоне дает возможность для принятия верного решения — покупать, продавать или подождать, в зависимости от сложившейся ситуации.

Задача прогнозирования состоит в том, чтобы по значениям наблюдений, собранных к данному моменту времени, определить значения в следующие моменты.

Рассмотрим временной ряд, описывающий максимальную цену продукции СПК колхоза «Новоалексеевский», фиксируемую ежедневно с 03.03.09 по 23.03.11 гг.

Цель состоит в том, чтобы построить прогноз значений ряда реализации продукции на основе наблюдаемых значений. Обычной мерой надежности модели является сравнение прогноза построенного по урезанному ряду с известными исходными данными. Таким образом, на основе 504 наблюдений построим прогноз на 3 шага вперед. Для достижения поставленной цели необходимо последовательно пройти следующие этапы:

идентифицировать модель, т. е. определить количество параметров различного типа, которые присутствуют в модели;

оценить параметры модели;

исследовать адекватность построенной модели;

на основе адекватной модели построить прогноз;

провести анализ полученных результатов.

Исследование временного ряда и прогнозирование проведем в системе STATISTICA.

2.3 Идентификация модели ARIMA в системе STATISTICA

В модели ARIMA имеются следующие типы параметров: d — порядок разности, р — порядок авторегрессии, qпорядок скользящего среднего. Идентифицировать модель ARIMA — значит определить эти параметры.

Различают идентификацию порядка разности модели ARIMA — d и идентификацию стационарного процесса или порядка смешанной моделипараметров р, q. Идентификация является достаточно грубой процедурой, в которой получают прикидочные значения порядка модели. Довольно типично получение на этапе идентификации нескольких приемлемых моделей, которые с достаточной степенью точности подходят к наблюдаемым данным и в дальнейшем подвергаются детальному рассмотрению. Основным критерием идентификации является поведение автокорреляционной и частной автокорреляционной функции ряда. Но в действительности эти функции не известны, и мы имеем дело с их более или, менее точными оценками — выборочными автокорреляционными и частными автокорреляционными функциями. Графики и численные значения автокорреляционной и частной автокорреляционной функции являются основным инструментом идентификации модели ARIMA. Анализируя графики и, если необходимо, рассматривая численные значения, проводим идентификацию модели. Вначале рассмотрим идентификацию порядка разности модели.

Показать весь текст
Заполнить форму текущей работой