Прогнозирование объема кредита

Прогнозирование объема кредита (реферат, курсовая, диплом, контрольная)

КурсоваяПомощь в написанииУзнать стоимостьмоей работы

Y=201 507+153,94*t

Y=10,954×2+152,76x+203 070

Экспон сглаж-е Альфа=
0,7

Модель Хольта шаг=1

[Введите текст]

Реферат

В данной работе проведен обзор методов социально-экономического прогнозирования, наиболее часто применяемых в экономической практике. Выбраны четыре модели для прогнозирования кредитов: Метод наименьших квадратов, модель Хольта, экспоненциальное сглаживание. Данные представлены в виде временного ряда. Выбранные модели дают различный результат прогноза. Лучшие результаты были получены при использовании Метода наименьших квадратов и модели Хольта. Результаты вычислений представлены в таблицах. По каждой модели была проведена оценка качества прогнозирования: рассчитана абсолютная ошибка прогноза, средняя относительная ошибка прогноза, проверена адекватность модели по критерию Дарбина-Уотсона. Именно эти показатели рассматривались в качестве критерия для выбора модели, дающей наилучшее прогнозное значение интересующей нас переменной, т. е. кредитов.

Все расчеты проводились с использованием программ Statistica и Excel, что дало возможность визуально представить результаты работы.

В экономике основой практически любой деятельности является прогноз. Уже на основе прогноза составляется план действий и мероприятий. Таким образом, можно сказать, что прогноз макроэкономических переменных является основополагающей составляющей планов всех субъектов экономической деятельности.

Прогнозирование — это способ научного предвидения, в котором используется как накопленный в прошлом опыт, так и текущие допущения насчет будущего с целью его определения. Основная функция прогноза — обоснование возможного состояния объекта в будущем или определение альтернативных путей.

В настоящее время ни одна сфера жизни общества не может обойтись без прогнозов как средства познания будущего. Особо важное значение имеют прогнозы социально-экономического развития общества, обоснование

основных направлений экономической политики, предвидение последствий

принимаемых решений.

Актуальность данной темы как в условиях развитой рыночной экономики, так и переходной экономики определяется тем, что уровень прогнозирования процессов общественного развития обуславливает эффективность планирования и управления экономикой и другими сферами.

Целью данной курсовой работы является рассмотрение наиболее эффективных методов социально экономических прогнозов и осуществление прогнозирования кредитов в РФ в 2007 году.

Организация финансово-кредитного обслуживания предприятий, организаций и населения, функционирование кредитной системы играют исключительно важную роль в развитии хозяйственных структур. От эффективности и бесперебойности функционирования кредитно-финансового механизма зависят не только своевременное получение средств отдельными хозяйственными единицами, но и темпы экономического развития страны в целом.

Кредитные операции — это отношения между кредитором и заемщиком (дебитором) по представлению первым последнему определенной суммы денежных средств на условиях платности, срочности, возвратности. Банковские кредитные операции подразделяются на две большие группы:

активные, когда банк выступает в лице кредитора, выдавая ссуды;

пассивные, когда банк выступает в роли заемщика (дебитора), привлекая деньги от клиентов и других банков в банк на условиях платности срочности, возвратности

1. Описание предметной области и постановка задачи исследования

Задачей данного исследования является осуществление точечного краткосрочного прогноза по выдачи кредита.

Прогнозирование — разработка прогноза, т. е. специальное научное исследование перспектив (прошлых тенденций) развития каких-либо явлений (технических, социально-экономических).

При прогнозировании используются три группы методов:

Экстраполяция (интерполяция);

Моделирование;

Опрос экспертов.

Экстраполяция изучает явление и переносит тенденции этого изученного явления на другую часть этого явления или переносит прошлые тенденции явления на будущие периоды. В научном плане примером экстраполяции является математическая статистика.

Интерполяция имеет сходную с экстраполяцией методологию — ищет промежуточные значения величины (параметра) по некоторым известным её значениям.

В данной работе будут использованы следующие аналитические методы прогнозной экстраполяции: метод наименьших квадратов, адаптивные методы.

Качество прогнозирования, прежде всего, характеризуется ошибкой прогноза, (математическое определение качества прогноза): предполагается, что чем меньше ошибка прогноза, тем выше его качество.

Все существующие методики оценки качества прогнозирования можно условно разделить на три группы показателей:

Абсолютные;

Сравнительные;

Качественные.

Абсолютные показатели оценки качества прогноза позволяют количественно определить величину ошибки прогноза в единицах измерения прогнозируемого объекта или в процентах. Это среднеквадратическая ошибка (), абсолютная ошибка (), средняя абсолютная ошибка (), относительная ошибка () и средняя относительная ошибка ().

Абсолютная ошибка прогноза может быть определена как разность между фактическим значением () и прогнозом (), значит,

;

среднее абсолютное значение ошибки

Среднее абсолютное значение всегда неотрицательно. Среднеквадратическая ошибка прогноза рассчитывается по формуле:

где n — период упреждения.

Недостатком рассматриваемых показателей является то, что значение этих характеристик существенно зависит от масштаба измерения уровней исследуемых явлений.

Поэтому абсолютная ошибка прогноза может быть выражена в процентах относительно фактических изменений показателя следующим образом:

а средняя относительная ошибка рассчитывается как

Данный показатель используется, как правило, при сравнении точности прогнозов разнородных объектов прогнозирования.

Сравнительные показатели оценки качества прогноза основаны на сравнении ошибки рассматриваемого прогноза с эталонными прогнозами определенного вида.

Один из типов таких показателей может быть представлен следующим образом:

где — прогнозируемое значение величины эталонного прогноза. В качестве эталонного прогноза может быть выбрана простая экстраполяция, постоянный темп прироста и т. д.

Качественные показатели позволяют повести некоторый анализ видов ошибок прогнозов, разложить их на какие-либо составляющие. Особенно такой анализ важен для циклически меняющихся переменных, когда необходимо прогнозировать не только общее направление развития, но и поворотные точки цикла, в которых меняются коэффициенты адаптации прогнозной модели.

Все рассмотренные выше показатели точности прогноза используются при проверке точности прогноза, полученного в виде точечных оценок.

Выбор показателей точности зависит от задач, которые ставит перед собой исследователь при анализе точности прогноза.

Важным критерием правильности применения прогнозной модели является проверка на адекватность. Адекватными моделями считаются такие, для которых остаточная компонента имеет свойства независимости, случайности и нормальности распределения.

В данной работе использовались абсолютные показатели оценки качества прогноза.

2. Описание используемого математического аппарата при проведении расчетов

Как уже отмечалось выше, в данной курсовой работе использовались аналитические методы прогнозной экстраполяции: метод наименьших квадратов, адаптивные методы. Расчеты проводились на их основе. Остановимся поподробнее на каждом из них.

Метод наименьших квадратов (МНК) Метод наименьших квадратов позволяет относительно просто определить аналитическую зависимость одного показателя от другого:

y=ц (x).

Имея такую функциональную зависимость, легко определить значение Y при любом значении x, т. е. получить прогнозное значение Y при заданном значении х. Вывод формул метода наименьших квадратов. Пусть имеем статистические данные о параметре y в зависимости от х. Эти данные представим в виде табл.1.


х	х1	х2	…	хi	…	хn
y*	y1*	y2*	…	yi*	…	yn*

Метод наименьших квадратов позволяет при заданном типе зависимости y=ц (x) так выбрать ее числовые параметры, чтобы кривая y=ц (x) наилучшим образом отображала экспериментальные данные по заданному критерию. Рассмотрим обоснование с точки зрения теории вероятностей для математического определения параметров, входящих в ц (x).

Предположим, что истинная зависимость y от х в точности выражается формулой y=ц (x). Экспериментальные точки, представленные в табл.2, отклоняются от этой зависимости следствие ошибок измерения. Ошибки измерения подчиняются по теореме Ляпунова нормальному закону. Рассмотрим какое-нибудь значение аргумента хi. Результат опыта есть случайная величина yi, распределенная по нормальному закону с математическим ожиданием ц (xi) и со средним квадратическим отклонением уi, характеризующим ошибку измерения. Пусть точность измерения во всех точках х=(х1, х2, …, хn) одинакова, т. е. у1=у2=…=уn=у. Тогда нормальный закон распределения Yi имеет вид:

(1)

В результате ряда измерений произошло следующее событие: случайные величины (y1*, y2*, …, yn*). Поставим следующую задачу.

Задача МНК. Подобрать математические ожидания ц (x1), ц (x2), …, ц (xn) так, чтобы вероятность этого события была максимальной. Так как величины Yi непрерывны, то говорят не о вероятностях событий Yi=yi*, а о вероятностях того, что Yi примут значения из интервала (yi*, yi*+dyi*), т. е.

Вероятность P того, что система случайных величин (y1, y2, …, yn) примет совокупность значений, лежащих в пределах (yi*, yi*+dyi*), i=1, 2, …, n, с учетом того, что измерения проводятся независимо друг от друга, равна произведению вероятностей Fi (yi)*dyi* для всех значений i:

(2)

Где k — коэффициент, не зависящий от ц (xi).

Требуется выбрать математические ожидания

ц (x1), ц (x2), …, ц (xn) так, чтобы выражение (2) достигало максимума. Это возможно, когда выполнено условие

. (3)

Отсюда получаем требование метода наименьших квадратов: для того чтобы данная совокупность наблюдаемых значений (y1*, y2*, …, yn*) была наивероятнейшей, нужно выбрать функцию ц (x) так, чтобы сумма квадратов отклонений наблюдаемых значений yi* от ц (xi) была наименьшей.

При решении практических задач зависимость y=ц (x) задается в виде y=ц (x, a1, a2, …, am), где a1, a2, …, am — числовые параметры, которые необходимо определить. Учитывая соотношение (3), получим

(4)

Продифференцируем выражение (4) по a1, a2, …, am и прировняем полученные производные нулю. Получим следующую систему уравнений:

… … … … … … … … … …; (5)

где — значения частной производной функции ц по аk в точке хi.

Отметим, что в общем случае систему (5) решить нельзя, так как неизвестен вид функции ц (x, a1, a2, …, am). При решении практических задач зависимость y от x ищут в виде линейной комбинации известных функций с коэффициентами a1, a2, …, am, а именно:. Подставив значение цk (х) в (5), решаем эту систему и находим a1, a2, …, am.

Рассмотрим один из частных случаев МНК: пусть зависимость y от х выражается линейной функцией y=a1+a2x. Тогда значения коэффициентов a1 и a2 находятся по следующим формулам:

; (6)

Адаптивные методы прогнозирования Временным рядом называется множество наблюдений, получаемых последовательно во времени.

Прогнозирование с помощью временных рядов относится к классу адаптивных методов прогнозирования, которые имеют следующие особенности:

1) в основе всех адаптивных моделей лежит идея экспоненциального сглаживания;

2) адаптивные модели отражают только текущие свойства исследуемого временного ряда;

3) на каждой итерации адаптивные модели непрерывно учитывают текущие изменения характеристик ряда;

4) некоторые адаптивные модели обладают свойством самонастраивания, т. е. свойством учитывать прошлые изменения характеристик ряда;

5) критерием качества использования адаптивной прогнозной модели, как правило, является средний квадрат ошибки прогнозирования. В редких случаях за качество модели принимается отсутствие автокорреляции между членами временного ряда.

Согласно классическому подходу, в общем случае временной ряд рассматривается как состоящий из четырёх компонент: тренда, сезонных колебаний, нерегулярных колебаний и случайной компоненты.

Для описания временных рядов используется следующая модель:

хt=оt + зt, (7)

где хt — текущий член временного ряда в момент времени t;

оt — случайная величина, которая генерируется детерминированной функцией или стохастическим процессом;

зt — случайная величина, которая генерируется случайным неавтокоррелированным процессом с математическим ожиданием М=0 и постоянной дисперсией.

Значение прогнозируемого показателя определяется по формуле (7) только случайной величиной оt, так как в силу концепции модели (7) только через нее может быть реализовано взаимодействие членов ряда. Величина оt называется уровнем ряда хt и может быть представлена различными законами, т. е. трендами.

Случайная величина зt влияет на один или несколько соответствующих членов временного ряда, причем долевое влияние зt на прогноз значительно меньше, чем влияние оt.

Простейшие адаптивные модели используют идею экспоненциального сглаживания, т. е. вычисление экспоненциальной средней. Рассмотрим экспоненциальное сглаживание.

Экспоненциальное сглаживание При исследовании временного ряда xt экспоненциальное сглаживание проводится по формуле:

(8)

Где хt — текущий член временного ряда в момент времени t;

St — значение экспоненциальной средней в момент времени t;

б — параметр адаптации (параметр сглаживания),

0< б<1, в=1-б.

В качестве начальных условий для применения экспоненциального сглаживания рекомендуется выбирать следующие значения:

среднее арифметическое всех имеющихся значений (или части значений) временного ряда;

среднее геометрическое всех имеющихся значений временного ряда;

значения, выбранные из статистики, полученной при наблюдении за аналогами изучаемого явления.

Модели линейного роста Если временной ряд имеет тенденцию линейного роста, то применение экспоненциальной средней ведет к смещенным прогнозам. Поэтому были сконструированы специальные адаптивные модели, учитывающие тенденции роста и опирающиеся на идею экспоненциального сглаживания.

Эти модели позволяют статистически данным, близким к периоду прогнозирования, придать в некотором смысле больший вес, а наблюдениям, относящимся к далекому прошлому, — меньший, тогда как при использовании критерия наименьших квадратов все наблюдения имеют равный вес.

При исследовании численности населения была использована двухпараметричная модель Хольта.

Простейшая модификация двухпараметрической модели Хольта выглядит следующим образом:

где:

— временной ряд;

— прогнозное значение временного ряда в точке t на шагов вперед;

— шаг прогноза;

— коэффициенты;

— параметры адаптации, и ;

— ошибка прогноза.

3. Описание выбранных программных продуктов

Для расчетов будет использоваться СПП STATISTICA и MS Excel.

Программа MS Excel, являясь лидером на рынке программ обработки электронных таблиц, определяет тенденции развития в этой области. Вплоть до версии 4.0 программа Excel представляла собой фактический стандарт с точки зрения функциональных возможностей и удобства работы. Теперь на рынке появилась версия 5.0, которая содержит много улучшений и приятных неожиданностей.

К значительным достижениям в новой версии программы Excel можно отнести появление трехмерных документов (блокнотов). Установление связей между файлами и таблицами значительно упростилось по сравнению с прежними версиями. Контекстные меню значительно расширены, а дополнительные программные инструменты облегчают решение сложных прикладных задач.

Следует также упомянуть о различных помощниках (Ассистентах), которые помогают пользователю задавать функции и выдают рекомендации, если существует более простой метод решения текущей задачи. В программу Excel встроена удобная подсистема помощи, которая в любой момент готова выдать необходимую справку.

Описанные до сих пор новшества касаются в основном комфорта в работе и быстрого освоения программы. Одним из важнейших функциональных расширений программы, предназначенным для профессионалов, является встроенная в Excel Среда программирования Visual Basic (VBA) для решения прикладных задач. Благодаря VBA фирме Microsoft удалось не только расширить возможности языка макрокоманд Excel 4.0, но и ввести новый уровень прикладного программирования, поскольку VBA позволяет создавать полноценные прикладные пакеты, которые по своим функциям выходят далеко за рамки обработки электронных таблиц. Кроме этого, следует назвать следующие важные новшества программы Excel 5.0:

— менеджер файлов, который выдает подробную информацию о всех файлах;

— диалоговые окна-регистры;

— отдельная пиктограмма для форматирования;

— появление механизма Drag & Plot, предназначенного для быстрой активизации диаграмм.

MS Excel — средство для работы с электронными таблицами, намного превышающее по своим возможностям существующие редакторы таблиц. MS Excel — это простое и удобное средство, позволяющее проанализировать данные и, при необходимости, проинформировать о результате заинтересованную аудиторию, используя Internet.

Ключевые преимущества:

эффективный анализ данных;

богатые средства форматирования и отображения данных;

совместное использование данных и работа над документами;

обмен данными и информацией через Internet и внутренние Intranet-сети.

Достоинства Microsoft Excel

Эффективность анализа данных

Быстрый и эффективный анализ, удобные средства для работы с данными (мастер сводных таблиц позволяет быстро обрабатывать большие массивы данных и получать итоговые результаты в удобном виде);

Механизм автокоррекции формул автоматически распознает и исправляет ошибки при введении формул;

Использование естественного языка при написании формул.

Богатство средств форматирования и отображения данных

Новые средства форматирования делают оформление таблиц более ярким и понятным (возможности слияния ячеек в электронной таблице, поворот текста в ячейке на любой угол);

Новый и дополненный Мастер создания диаграмм позволяет сделать представление данных в таблицах более наглядным (более удобный и мощный мастер создания диаграмм, новые типы диаграмм — диаграммы в виде круглых столбиков, тетраэдров, в виде «бубликов» и др.).

Совместное использование данных и работа над документами

Microsoft Excel обеспечивает возможность одновременной работы нескольких пользователей над одним документом.

Обмен данными и работа в Internet

Теперь возможно использовать самые свежие данные путем получения их в виде электронных таблиц прямо с Web-серверов в Internet;

Возможность использовать встроенный Internet Assistant для преобразования таблицы в формат HTML и публикации на Web-сервере.

Пакет STATISTICA был создан в начале 1990;х годов сразу для среды Windows. В пакете нашли отражение многие последние достижения теоретической и прикладной статистики.

У пакета есть специальная версия для обучения основам статистических методов — Studеnt Еditiоn оf STATISTICA. Эта версия позволяет анализировать файлы данных, включающих не более 400 наблюдений, и представляет собой урезанный вариант пакета.

Основная версия пакета может дополнительно комплектоваться специализированными модулями: Роwеr Analysis (планирование статистических исследовании), Nеural Nеtwоrks (нейросетевой анализ) и др.

С помощью реализованных в системе STATISTICA мощных языков программирования, снабженных специальными средствами поддержки, легко создаются законченные пользовательские решения и встраиваются в различные другие приложения или вычислительные среды. Очень трудно представить себе, что кому-то могут понадобиться абсолютно все статистические процедуры и методы визуализации, имеющиеся в системе STATISTICA, однако опыт многих людей, успешно работающих с пакетом, свидетельствует о том, что возможность доступа к новым, нетрадиционным методам анализа данных помогает находить новые способы проверки рабочих гипотез и исследования данных.

STATISTICA является наиболее динамично развивающимся статистическим пакетом и по многочисленным рейтингам является мировым лидером на рынке статистического программного обеспечения. СПП STATISTICA является универсальной системой, предназначенной для статистического анализа и визуализации данных, управления базами данных и разработки пользовательских приложений, содержащей широкий набор процедур анализа для применения в научных исследованиях, технике, бизнесе.

Она состоит из следующих основных компонент, объединенных в рамках одной системы:

электронных таблиц для ввода и задания исходных данных;

специальных таблиц для вывода численных результатов анализа;

графической системы для визуализации данных и результатов статистического анализа;

набора специализированных статистических модулей, в которых собраны группы логически связанных между собой статистических процедур;

специального инструментария для подготовки отчетов.

Статистический анализ данных в системе STATISTICA может быть разбит на следующие основные этапы:

ввод данных в электронную таблицу с исходными данными и их предварительное преобразование перед анализом;

визуализация данных при помощи того или иного типа графиков;

применение конкретной процедуры статистической обработки;

вывод результатов анализа в виде графиков и электронных таблиц с численной и текстовой информацией;

Пакет содержит следующие модули:

Basic Statistic/Tables — Основные статистики и таблицы: позволяет провести предварительную обработку данных, осуществить разведочный анализ, определить зависимости между переменными, разбить их различными способами на группы;

Nonparametrics/Distrib. — Модуль Непараметрическая статистика/Распределеня: дает возможность проверить гипотезы о характере распределения ваших данных;

ANOVA/MANOVA — Модуль дисперсионного анализа: представляет собой набор процедур общего одномерного и многомерного дисперсионного и ковариационного анализа;

Multiple Regression — Модуль Множественная регрессия: помогает построить зависимости между многомерными переменными, подобрать простую линейную модель и оценить ее адекватность;

Nonlinear Estimation — Модуль Нелинейное оценивание: предоставляет возможность определения нелинейной зависимости в данных и подгонки к ним функциональных кривых;

Time Series/Forecasting — Анализ временных рядов и прогнозирование: общее назначение модуля — построить простую модель, описывающую ряд, сгладить его, спрогнозировать будущие значения временного ряда на основе наблюдаемых до данного момента, построить регрессионные зависимости одного ряда от другого, провести спектральный или Фурье — анализ ряда;

Claster Analysis — Модуль Кластерный анализ: позволяет произвести сложную иерархическую классификацию данных или выделить в них кластеры;

Data Management/MFM — Управление данными: специализированный модуль, который содержит большое количество вспомогательных процедур по работе с данными (иерархическая сортировка, проверка, категоризация и ранжирование и др.);

Factor Analysis — Модуль Факторный анализ: дает возможность сжать данные или выделить основные общие факторы, влияющие на наблюдаемые характеристики сложного объекта и объясняющие связи между ними;

Canonical Analysis — Модуль Канонический анализ: включает в себя широкий набор процедур для выполнения канонического корреляционного анализа, исследования связи между двумя множествами переменных;

Multidimensional Scaling — Модуль Многомерное шкалирование: помогает представить данные о близости объектов какой-либо простой пространственной моделью, в которой объекты интерпретируются, например, как города на обычной карте, а различия между ними есть просто расстояния, в частности данные о странах, политических партиях и т. д., и всесторонне диагностировать модель;

SEPATH — Модуль Моделирование структурными уравнениями: позволяет строить и тестировать различные модели, объясняющие структуру связей между наблюдаемыми переменными;

Reliability/Item Analysis — Модуль Анализ надежности: включает широкий набор процедур для разработки и вычислений надежности сложных объектов на основе результатов обследований и диагностики отдельных узлов;

Discriminant Analysis — Модуль Дискриминантный анализ: позволяет построить на основе ряда предположений классификационное правило отнесения объекта к одному из нескольких классов, минимизируя некоторый разумный критерий;

Log-linear Analysis — Модуль Лог-линейный анализ: проводит анализ сложных многоуровневых таблиц;

Survival Analysis — Модуль Анализ длительностей жизни: предлагает обширный набор методов анализа данных из социологии, биологии, медицины, так же, как процедуры, используемые в инженерии и маркетинге;

Commmand Language (SCL) — Командный язык STATISTICA: позволяет автоматизировать рутинные процессы обработки данных в системе;

STATISTICA File Server — позволяет быстро открыть для просмотра/редактирования как графики и таблицы, так и отчеты.

Выбор системы STATISTICA в качестве инструмента для обработки данных может быть обусловлен возможностью проведения наиболее полного анализа, т.к. система содержит все необходимые нам статистические процедуры.

Основные преимущества системы STATISTICA:

содержит полный набор классических методов анализа данных: от основных классических методов статистики, до самых современных, что позволяет гибко организовывать анализ;

является средством построения приложений в конкретных областях;

отвечает всем стандартам Windows, что позволяет сделать анализ высокоинтерактивным;

система может быть интегрирована в Интернет;

поддерживает web-форматы:HTML, JPEG, PNG;

данные системы STATISTICA легко конвертировать в различные базы данных и электронные таблицы;

поддерживает высококачественную графику, позволяющую эффективно визуализировать данные и проводить графический анализ;

является открытой системой: содержит языки программирования, которые позволяют расширить систему, запускать ее из других Windows-приложений, например из Excel;

используются разнообразные методы, позволяющие провести всесторонне исследование ретроспективных данных (в виде временных рядов);

доступны различные возможности преобразования временных рядов;

позволяют построить объективный прогноз данных, который включает в себя вычисление верхних и нижних границ, в которых, можно утверждать, что с определенной вероятностью лежат значения прогнозируемых показателей.

4. Практическая часть

прогнозирование кредит объем Полное исследование проблем, связанных с прогнозированием конкретного показателя, сводится к выполнению следующих этапов:

1. постановка задачи исследования и сбор исходной информации;

2. предпрогнозный анализ данных;

3. выбор моделей прогнозирования;

4. численное оценивание параметров моделей;

5. проверка моделей на точность и адекватность;

6. выбор лучшей модели или построение обобщенной модели;

7. получение точечного интервального прогнозов;

8. анализ и интерпретация полученных прогнозных значений.

Задача исследования Задачей данного исследование является прогнозирование объема кредита. Исходная информация представляет из себя временной ряд размерностью 27 — с января 2005 г. по май 2007 г.

Таблица 1


t	y
	137,4
	142,8
	142,6
	142,9
	143,7
	145,2
	144,6
	144,0
	145,9
	146,3
	147,0
	147,7
	146,9
	146,6
	147,8
	147,2
	147,5
	147,3
	147,0
	147,8
	147,5
	146,9
	146,3
	145,6
	145,0
	144,2
	145,5

Исходные данные Примем январь 2005 года за единицу. Обозначим за X (независимую переменную) определенный момент времени, а за Y — выдачу кредита в каждый из рассматриваемых моментов. Рассмотрим диаграмму рассеяния зависимой переменной (рисунок 1.).

Рис. 1 — Диаграмма рассеивания выдачи кредита (Y)

Глядя на этот график можно предположить, что, близкими к такому виду зависимости являются линейная, степенная функции и полином второго порядка. Их параметры возможно определить, используя метод наименьших квадратов. Кроме того, исходные данные представляют из себя временной ряд с тенденцией линейного роста, значит, к нему возможно применить адаптивные модели, а именно экспоненциальное сглаживание и модели линейного роста.

Таким образом, конечный выбор моделей для построения следующий:

1) Линейная зависимость вида (МНК);

2) Полином второго порядка (МНК);

3) Степенная функция (МНК);

4) Экспоненциальное сглаживание;

5) Модель Хольта;

Оценка параметров моделей.

Параметры линейной зависимости определяются в пакете MSExcel. Получили следующую зависимость Y=201 507+153,94*t. Коэффициент детерминации () = 0,5199. Это значит, что предложенное уравнение на 51% объясняет дисперсию результативного признака.

Рис. 2 — Линейный тренд Рассчитаем абсолютные показатели качества прогноза по рассматриваемой модели. Это будут средняя абсолютная и среднеквадратическая ошибки.

а1=153,94;

а2=201 507.

Таблица 2 — Расчет средней абсолютной и среднеквадратической ошибок в линейной модели


	t	y	t2	t*y	МНК	?пр	?пр2
					201 741,1	744,9	554 950,1
						3759,0
					202 048,9	— 1149,9
					202 202,9	— 417,9	174 620,6
					202 356,8	— 35,8	1282,949
					202 510,8	187,2	35 058,71
					202 664,7	— 665,7	443 159,5
					202 818,6	37,4	1395,45
					202 972,6	— 1075,6
					203 126,5	— 471,5	222 338,9
					203 280,5	687,5	472 697,1
					203 434,4	— 645,4
					203 588,4	— 689,4	475 209,3
					203 742,3	— 620,3	384 767,5
					203 896,2	— 576,2	332 050,6
					204 050,2	1115,8
					204 204,1	— 1104,1
					204 358,1	— 1395,1
						— 823,0	677 339,4
					204 665,9	— 711,9	506 870,4
					204 819,9	1391,1
					204 973,8	— 404,8	163 889,2
					205 127,8	— 129,8	16 841,37
					205 281,7	— 713,7
					205 435,7	1687,3
					205 589,6	— 133,6	17 849,05
					205 743,5	2153,5
сумма		5 501 042,0		7,7E+07				средняя	1 327 617,56
а1=	201 587,1
а2=	153,942
прогноз					205 897,5

= 132 761 736; =1152,2;

Степенная функция

Рис. 3 — Степенная зависимость Y от X

Получили, что. Коэффициент детерминации невысок и равен 28%. Расчет оценок качества прогноза приведен ниже в Таблице 4.

Таблица 3 — Расчет средней абсолютной и среднеквадратической ошибок в линейной модели


	t	y	t2	t*y	МНК	?пр	?пр2
						1319,0
					203 297,7	2356,3	5 552 304,16
					204 554,5	— 3655,5	13 362 488,8
					205 450,9	— 3665,9	13 438 833,7
					206 148,9	— 3827,9	14 653 042,4
						— 4023,0	16 184 686,6
						— 5207,0	27 112 364,9
					207 626,9	— 4770,9	22 761 885,6
						— 6102,0	37 234 278,2
					208 332,4	— 5677,4	32 232 447,9
					208 634,4	— 4666,4	21 775 248,3
					208 910,5	— 6121,5	37 472 914,1
					209 164,8	— 6265,8	39 260 724,4
					209 400,6	— 6278,6	39 420 598,4
					209 620,3	— 6300,3	39 693 708,8
						— 4660,0	21 715 876,9
					210 019,5	— 6919,5
						— 7239,0	52 403 384,1
					210 374,8	— 6685,8	44 700 426,7
					210 538,9	— 6584,9	43 361 199,9
					210 695,1	— 4484,1	20 107 313,8
					210 844,2	— 6275,2	39 377 558,3
					210 986,7	— 5988,7	35 864 079,5
					211 123,2	— 6555,2	42 970 585,5
					211 254,2	— 4131,2	17 067 116,6
					211 380,2	— 5924,2	35 096 317,2
					211 501,5	— 3604,5	12 992 479,1
сумма		5 501 042,0						средняя

прогноз					211 618,5

а1= 201 167;

= 28 719 656; =5359,07;

Произошло снижение средней абсолютной ошибки с 132 761 736 до 28 719 656 единиц и среднеквадратической ошибки с 1152,2 до 5359,07.

Полином второго порядка

Воспользовавшись средствами MSExcel, получили уравнение Y=10,954×2+152,76x+203 070.

Рис. 4 — Зависимость Y от X в виде полинома второго прядка Коэффициент детерминации достаточно высокий 64,7%. Рассчитаем оценки качества прогноза (Таблица 5.).

Таблица 4 — Расчет средней абсолютной и среднеквадратической ошибок в модели полинома


	t	y	t2	t*y	МНК	?пр	?пр2
					202 928,2	— 442,2	195 535,5336
					202 808,3	2845,7	8 098 031,256
					202 710,3	— 1811,3	3 280 829,426
					202 634,2	— 849,2	721 181,4022
					202 580,1	— 259,0	67 106,9025
					202 547,8	150,2	22 564,84666
					202 537,4	— 538,4	289 902,5575
						307,0	94 263,73658
					202 582,4	— 685,4	469 819,7684
					202 637,8	17,2	295,84
					202 715,1	1252,9	1 569 823,561
					202 814,3	— 25,3	637,865 536
					202 935,3	— 36,3	1321,31 716
					203 078,3	43,7	1905,846 336
					203 243,3	76,8	5890,5625
					203 430,1	1735,9	3 013 473,796
					203 638,8	— 538,8	290 290,3538
					203 869,4	— 906,4	821 589,9651
						— 433,0	187 449,1661
					204 396,4	— 442,4	195 717,76
					204 692,8	1518,2	2 305 070,917
						— 442,0	195 378,1443
					205 351,2	— 353,2	124 740,3506
					205 713,3	— 1145,3	1 311 629,63
					206 097,3	1025,8	1 052 163,063
					206 503,1	— 1047,1	1 096 510,557
					206 930,9	966,1	933 260,3309
сумма		5 501 042,0					26 346 384,17	средняя	975 792,0062
а1=
а2=	— 152,76
а3=	10,954
прогноз					207 380,7

= 975 792,006; =987,8;

Средняя абсолютная ошибка равна 975 792,006, а среднеквадратическая = 987,8.

Экспоненциальное сглаживание Применим к рассматриваемому временному ряду экспоненциальное сглаживание, используя формулу:

Для этого сначала определим начальное значение S0 как первый член прогнозного ряда, полученного методом наименьших квадратов для полиномиальной модели третьего порядка. Т. е. S0=203 742,3 штук. Шаг прогноза в нашем случае равен 1. Следующее значение прогноза равно. Повторяем проделанные шаги несколько раз и формируем таким образом прогнозный ряд на основе экспоненциального сглаживания для адаптивной полиномиальной модели 0-го порядка. Большое влияние на точность прогноза влияет параметр адаптации.

Таблица 5


t	y	у сгл а=0,1	прогноз	?пр	\|?пр\|
	202 486,0	81 371,3	140,074	81 231,22	81 231,22
	205 654,0	20 565,4	141,006	20 424,42	20 424,42
	200 899,0		141,876	19 948,11	19 948,11
	201 785,0	20 178,5	142,685	20 035,81	20 035,81
	202 321,0	20 232,1	143,433	20 088,67	20 088,67
	202 698,0	20 269,8	144,118	20 125,68	20 125,68
	201 999,0	20 199,9	144,742	20 055,16	20 055,16
	202 856,0	20 285,6	145,305	20 140,30	20 140,30
	201 897,0	20 189,7	145,806	20 043,89	20 043,89
	202 655,0	20 265,5	146,245	20 119,26	20 119,26
	203 968,0	20 396,8	146,623	20 250,18	20 250,18
	202 789,0	20 278,9	146,939	20 131,96	20 131,96
	202 899,0	20 289,9	147,193	20 142,71	20 142,71
	203 122,0	20 312,2	147,386	20 164,81	20 164,81
	203 320,0		147,518	20 184,48	20 184,48
	205 166,0	20 516,6	147,587	20 369,01	20 369,01
	203 100,0		147,595	20 162,40	20 162,40
	202 963,0	20 296,3	147,542	20 148,76	20 148,76
	203 689,0	20 368,9	147,427	20 221,47	20 221,47
	203 954,0	20 395,4	147,25	20 248,15	20 248,15
	206 211,0	20 621,1	147,012	20 474,09	20 474,09
	204 569,0	20 456,9	146,712	20 310,19	20 310,19
	204 998,0	20 499,8	146,35	20 353,45	20 353,45
	204 568,0	20 456,8	145,927	20 310,87	20 310,87
	207 123,0	20 712,3	145,443	20 566,86	20 566,86
	205 456,0	20 545,6	144,896	20 400,70	20 400,70
	207 897,0	20 789,7	144,288	20 645,41	20 645,41
сумма					607 298,03

= 31 724,58; =33 319,08;

Таблица 6


t	y	у сгл а=0,5	прогноз	?пр	\|?пр\|
	202 486,0		140,074	162 225,62	162 225,62
	205 654,0		141,006	102 686,14	102 686,14
	200 899,0		141,876	100 307,71	100 307,71
	201 785,0		142,685	100 749,81	100 749,81
	202 321,0		143,433	101 017,07	101 017,07
	202 698,0		144,118	101 204,88	101 204,88
	201 999,0		144,742	100 854,76	100 854,76
	202 856,0		145,305	101 282,70	101 282,70
	201 897,0		145,806	100 802,69	100 802,69
	202 655,0		146,245	101 181,26	101 181,26
	203 968,0		146,623	101 837,38	101 837,38
	202 789,0		146,939	101 247,56	101 247,56
	202 899,0		147,193	101 302,31	101 302,31
	203 122,0		147,386	101 413,61	101 413,61
	203 320,0		147,518	101 512,48	101 512,48
	205 166,0		147,587	102 435,41	102 435,41
	203 100,0		147,595	101 402,40	101 402,40
	202 963,0		147,542	101 333,96	101 333,96
	203 689,0		147,427	101 697,07	101 697,07
	203 954,0		147,25	101 829,75	101 829,75
	206 211,0		147,012	102 958,49	102 958,49
	204 569,0		146,712	102 137,79	102 137,79
	204 998,0		146,35	102 352,65	102 352,65
	204 568,0		145,927	102 138,07	102 138,07
	207 123,0		145,443	103 416,06	103 416,06
	205 456,0		144,896	102 583,10	102 583,10
	207 897,0		144,288	103 804,21	103 804,21
сумма					2 807 714,95

= 146 268,9; =146 309,7;

Таблица 7


t	y	у сгл а=0,7	прогноз	?пр	\|?пр\|
	202 486,0		140,074	202 722,82	202 722,82
	205 654,0		141,006	204 675,66	204 675,66
	200 899,0		141,876	201 932,42	201 932,42
	201 785,0		142,685	201 729,10	201 729,10
	202 321,0		143,433	202 042,80	202 042,80
	202 698,0		144,118	202 400,35	202 400,35
	201 999,0		144,742	202 017,90	202 017,90
	202 856,0		145,305	202 502,69	202 502,69
	201 897,0		145,806	201 976,49	201 976,49
	202 655,0		146,245	202 348,94	202 348,94
	203 968,0		146,623	203 379,53	203 379,53
	202 789,0		146,939	202 863,21	202 863,21
	202 899,0		147,193	202 785,15	202 785,15
	203 122,0		147,386	202 917,72	202 917,72
	203 320,0		147,518	203 096,01	203 096,01
	205 166,0		147,587	204 441,67	204 441,67
	203 100,0		147,595	203 399,18	203 399,18
	202 963,0		147,542	202 990,59	202 990,59
	203 689,0		147,427	203 376,31	203 376,31
	203 954,0		147,25	203 677,67	203 677,67
	206 211,0		147,012	205 348,16	205 348,16
	204 569,0		146,712	204 700,14	204 700,14
	204 998,0		146,35	204 806,31	204 806,31
	204 568,0		145,927	204 537,47	204 537,47
	207 123,0		145,443	206 245,68	206 245,68
	205 456,0		144,896	205 591,64	205 591,64
	207 897,0		144,288	207 104,57	207 104,57
сумма					5 495 610,21

= 203 541,1; =2 003 545,9;

Очевидно, что с ростом параметра адаптации увеличиваются ошибки прогноза.

Двухпараметрическая модель Хольта Простейшая модификация двухпараметрической модели Хольта выглядит следующим образом:

где:

— временной ряд;

— прогнозное значение временного ряда в точке t на шагов вперед;

— шаг прогноза;

— коэффициенты;

— параметры адаптации, и ;

— ошибка прогноза.

В нашем случае воспользуемся моделями Хольта с шагом прогноза =1, начальные значения и определим с помощью линейной модели, полученной методом наименьших квадратов.

Модель Хольта с шагом прогноза = 1.


а1=	201 587,0
а2=	153,94
альфа1=	0,5
альфа2=	0,5

На их основе можно определить прогнозные значения независимой переменной по формуле. Рассмотрим случай, когда параметры адаптации равны 0,5. Были получены следующие значения коэффициентов (Таблица 8.):

Таблица 8


		мод хольт	а1	а2
t	y		201 587,0	153,9	?пр	\|?пр\|
	202 486,0	201 740,9	202 113,47	340,2065	745,06	745,06
	205 654,0	202 453,7	204 053,84	1140,287	3200,32	3200,32
	200 899,0	205 194,1	203 046,56	66,50 566	— 4295,13	4295,13
	201 785,0	203 113,1	202 449,03	— 265,511	— 1328,07	1328,07
	202 321,0	202 183,5	202 252,26	— 231,142	137,48	137,48
	202 698,0	202 021,1	202 359,56	— 61,922	676,88	676,88
	201 999,0	202 297,6	202 148,32	— 136,581	— 298,64	298,64
	202 856,0	202 011,7	202 433,87	74,48 425	844,26	844,26
	201 897,0	202 508,4	202 202,68	— 78,354	— 611,35	611,35
	202 655,0	202 124,3	202 389,66	54,31 539	530,68	530,68
	203 968,0	202 444,0	203 205,99	435,3212	1524,02	1524,02
	202 789,0	203 641,3	203 215,15	222,2438	— 852,31	852,31
	202 899,0	203 437,4	203 168,2	87,64 419	— 538,40	538,40
	203 122,0	203 255,8	203 188,92	54,18 331	— 133,84	133,84
	203 320,0	203 243,1	203 281,55	73,40 705	76,89	76,89
	205 166,0	203 355,0	204 260,48	526,1672	1811,04	1811,04
	203 100,0	204 786,6	203 943,32	104,5054	— 1686,65	1686,65
	202 963,0	204 047,8	203 505,41	— 166,702	— 1084,83	1084,83
	203 689,0	203 338,7	203 513,86	— 79,13	350,29	350,29
	203 954,0	203 434,7	203 694,36	50,68 845	519,27	519,27
	206 211,0	203 745,1	204 978,03	667,1755	2465,95	2465,95
	204 569,0	205 645,2	205 107,1	398,1252	— 1076,20	1076,20
	204 998,0	205 505,2	205 251,61	271,3187	— 507,23	507,23
	204 568,0	205 522,9	205 045,47	32,58 581	— 954,93	954,93
	207 123,0	205 078,1	206 100,53	543,8229	2044,95	2044,95
	205 456,0	206 644,3	206 050,17	246,7357	— 1188,35	1188,35
	207 897,0	206 296,9	207 096,96	646,7582	1600,09	1600,09
	прогноз28	207 743,7			сраб ош	1151,23
					сигма	1497,685

Просчитаем оценки качества модели Хольта для различных комбинаций значений коэффициентов адаптации.

Таблица 9


а1=	201 587,0
а2=	153,94
альфа1=	0,3
альфа2=	0,7

		мод хольт	а1	а2
t	y		201 587,0	153,9	?пр	\|?пр\|
	202 486,0	201 740,9	201 964,46	220,9972	745,06	745,06
	205 654,0	202 185,5	203 226,02	533,1661	3468,54	3468,54
	200 899,0	203 759,2	202 901,13	275,7494	— 2860,19	2860,19
	201 785,0	203 176,9	202 759,32	150,4803	— 1391,88	1391,88
	202 321,0	202 909,8	202 733,16	97,48 863	— 588,80	588,80
	202 698,0	202 830,6	202 790,85	85,55 051	— 132,65	132,65
	201 999,0	202 876,4	202 613,18	6,584 286	— 877,40	877,40
	202 856,0	202 619,8	202 690,64	27,84 534	236,23	236,23
	201 897,0	202 718,5	202 472,04	— 46,088	— 821,48	821,48
	202 655,0	202 425,9	202 494,66	— 25,4734	229,05	229,05
	203 968,0	202 469,2	202 918,83	109,4194	1498,81	1498,81
	202 789,0	203 028,3	202 956,48	87,88 662	— 239,25	239,25
	202 899,0	203 044,4	203 000,75	74,80 388	— 145,36	145,36
	203 122,0	203 075,6	203 089,49	78,98 361	46,44	46,44
	203 320,0	203 168,5	203 213,93	92,6209	151,53	151,53
	205 166,0	203 306,6	203 864,39	259,9711	1859,45	1859,45
	203 100,0	204 124,4	203 817,05	167,7789	— 1024,36	1024,36
	202 963,0	203 984,8	203 678,28	75,8142	— 1021,83	1021,83
	203 689,0	203 754,1	203 734,57	69,95 566	— 65,09	65,09
	203 954,0	203 804,5	203 849,37	83,40 866	149,48	149,48
	206 211,0	203 932,8	204 616,24	288,449	2278,23	2278,23
	204 569,0	204 904,7	204 803,98	258,2368	— 335,69	335,69
	204 998,0	205 062,2	205 042,95	252,457	— 64,22	64,22
	204 568,0	205 295,4	205 077,19	186,99	— 727,41	727,41
	207 123,0	205 264,2	205 821,82	354,2839	1858,82	1858,82
	205 456,0	206 176,1	205 960,08	289,4742	— 720,11	720,11
	207 897,0	206 249,6	206 743,79	437,7447	1647,45	1647,45
	прогноз28	207 181,5			сраб ош	932,77
					сигма	1292,037

Лучшей оказалась модель с параметрами 0,3 и 0,7.

Выбор лучшей модели Сведем все интересующие нас результаты в единую таблицу (Таблица 10).

Таблица 10

Глядя на таблицу, можно сделать вывод, что лучшей является модель полинома второго порядка, полученная методом наименьших квадратов. Она обладает самыми меньшими значениями абсолютных ошибок, высоким значением коэффициента детерминации (0.64).

Проверка на адекватность выбранной модели Воспользуемся модулем Множественная регрессия в пакете STATISTICA.

Statistics=> Multiple Regression.

Исходные данные в системе STATISTICA организованы в виде таблицы.

Рис. 5

После нажатия кнопку ОК система произведет вычисления.

Рис. 6

В информационной части мы прежде всего смотрим на значение коэффициента множественной корреляции: R = 0,721, что говорит о тесной связи переменных. После этого нужно обратить внимание на скорректированный коэффициент детерминации: в нашем примере R2 = 0,519, это означает, что доля влияния независимой переменной на зависимую значительна (51%). Гипотезу о том, что коэффициенты при независимых переменных равны нулю, мы отвергаем, т.к. р = 0,22 < = 0,05. Т. е. множественная регрессия высоко значима. Здесь же оценивается значимость свободного члена: р = 0,22 < = 0,05, это означает, что нулевая гипотеза о незначимости свободного члена отвергается.

При нажатии на кнопку Краткие результаты регрессии вы увидите следующую электронную таблицу с результатами анализа:

Рис. 7

Составим уравнение множественной регрессии в стандартизованной и естественной форме.

Бета — стандартизованные коэффициенты регрессии:

X' =0,721 042*t,

где X' и t' - стандартизованные значения, В — нестандартизованные коэффициенты регрессии.

X =201 587,1+153,9*t.

P — level позволяет оценить значимость каждого коэффициента. Т.к. значения P для VAR1 меньше 0,05 — нулевую гипотезу о незначимости коэффициента a2 отвергаем.

Остатки — это разность между исходными (наблюдаемыми) значениями зависимой переменной и предсказанными значениями. Исследуя остатки, можно оценить степень адекватности модели.

В модуле Множественная регрессия в STATISTICA остатки можно исследовать в специальном окне Анализ остатков:

Рис. 8

С помощью функциональных кнопок в данном окне можно всесторонне просмотреть остатки модели, как в графическом виде, так и в электронных таблицах.

Рис. 9

В первом столбце этой таблице отображаются наблюдаемые значения переменной X, во втором — рассчитанные с помощью составленного уравнения множественной регрессии, а в третьем столбце — вычисленные остатки (Residual).

Для оценки адекватности нашей модели рассмотрим значение d=1.965 644 (относительно близко к 2), что говорит об адекватности нашей модели.

Рис. 10

Сделаем прогноз объема кредитов на момент времени t=28, получим x=207 998.

Заключение

В данной курсовой работе рассматривались данные с января 2005 года по май 2007 года и осуществлялся прогноз на июнь 2007 года. Были построены четыре модели прогнозирования объема кредитов:

— с использованием Метода наименьших квадратов (расчеты производились в таких программных продуктах, как Statistica и Excel),

— линейная модель (Excel)

— полином 2-го порядка (Excel)

— экспонециальное сглаживание (Excel)

— модель Хольта (Excel)

Выбранные модели дают довольно различные результаты, и лучшие результаты были получены при использовании Метода наименьших квадратов. Результаты вычислений представлены в таблицах. Рассчитана абсолютная ошибка прогноза и средняя относительная ошибка прогноза, статистика Дарбина-Уотсона. Именно эти показатели рассматривались в качестве критерия для выбора модели, дающей наилучшее прогнозное значение интересующей нас переменной, т. е. объема кредита. Итак, прогнозное значение объема кредитов на июнь 2007 года составляет 207 998 млн. рублей.

1. Бабкова Е. В. Статистическое моделирование и прогнозирование показателей развития социально-экономических систем. Учеб. пособие / Уфимск. гос. авиац. техн. ун-т. Уфа, 2005. 128 с.

2. Боровиков В. 8ТАТ18Т1СА: искусство анализа данных на компьютере: для профессионалов.- СПб.: Питер, 2001. 656 с.

3. Бююль А., Цёфель П. ЗР55: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей.- СПб.: ООО «ДиаСофтЮП», 2001. 608 с.

4. Пвахненко А. Г. Непрерывность и дискретность. Переборные методы прогнозирования и кластеризации.- Киев: Наук. Думка, 1990.-123 с.

5. Конюховский П. В. Математические методы исследования операций в экономике. — СПб.: Питер, 2000. 208 с.

6. Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования. — М.: Статистика, 1975.-254 с.

7. Мухачева А. С. Развитие генетических алгоритмов для решения задач прямоугольной упаковки // Принятие решений в условиях неопределенности: Межвуз. науч. сб.-Уфа: УГАТУ, 2001. С.87−94.

8. Народное хозяйство Российской Федерации. Статистический сборник. — М.: Финансы и статистика, 2000. 500 с.

9. Нейлор Т. Машинные имитационные эксперименты с моделями экономических систем, — М.: Мир, 1975. 496 с.

10. Николаева М. А., Муфтахова Е. Е., Биглова А. Ф. Принятие решений в сигнальной системе стоимостных и объемных индикаторов // Принятие решений в условиях неопределенности: Межвуз. науч. сб.-Уфа: УГАТУ, 2001,-С. 149−157.

Показать весь текст

Заполнить форму текущей работой