Помощь в написании студенческих работ
Антистрессовый сервис

Корреляционно-регрессионный анализ. 
Исследование зависимости производства ликероводочных изделий с экономическими показателями

РефератПомощь в написанииУзнать стоимостьмоей работы

Из данной таблицы видно, что наиболее точной моделью прогноза считается регрессия от факторов, т.к. Gt=2.5273. Eпр-сред указывает о точности высокой точности прогноза, К — о том что данная модель довольно сильно близка к эталонной (простая экстрополяция), КН — модель близка к совершенной, а КН1 — что модель лучше чем модель на уровне средней, V — что модель близка к простой экстрополяции, Vмю… Читать ещё >

Корреляционно-регрессионный анализ. Исследование зависимости производства ликероводочных изделий с экономическими показателями (реферат, курсовая, диплом, контрольная)

Анализ коэффициентов парной корреляции говорит о наличии интенсивной связи Y с Х5 (0.9834), средней с Х4 (-0.5315) -знак минус указывает на обратную зависимостьи Х3 (-0.4266), слабой с Х2 (-0.1890) и Х1 (0.1176). Значит в модель стоит включить факторы Х3, Х4, Х5.

Следующим этапом идет проверка на мультиколлениарность, существует несколько способов данной проверки.

Способ 1. При проверке на мультиколлениарность (коэффициенты частной корреляции и t-статистика) видно, что существует взаимосвязь между:

Табл. 1.

x1.

x2.

x3.

x4.

x2.

x1.

x1.

x4.

x4.

x2.

Следовательно в модель включается Х5 и Х4, т.к. коэффициент парной корреляции Y-X4 (-0.5315) больше, чем коэффициенты парной корреляции Y-X1 (0.1170) и Y-X3 (-0.4266) и Y-Х2(-0.1890).

Способ 2. Этот метод основан на анализе распределения корреляционной матрицы. Идея метода заключается в том что вводятся некоторые критерии на основе которого можно проверить о значимости отклонения корреляционной матрицы от ортогональной, для этого вводится величина:

Х2= N-1−1/6(2*n+5)*ln|R|.

по расчетам ХИ квадрат равно 80.469 больше табличного, значит между переменными существует мультиколлениарность. Для определения степени мультиколлениарности вводим величину:

W=(Cii-1)-(N-n)/(n-1).

где Сii — диагональный элемент матрицы обратной корреляционной.

Табл. 2.

Wii.

Wii.

f-критерий.

W11.

3.622.

0.0139.

W22.

1.93.

0.12 648.

W33.

6.18.

0.81.

W44.

2.181.

0.8 999.

W55.

6.225.

0.77.

Данная таблица указывает, что наиболее коллениарна Х2, затем Х4 и можно сказать что Х3 и Х5 вовсе не коллениарны. Следовательно в модель лучше включить Х3 и Х5, но проведенный последующий регрессионный анализ указывает что лучше включать в модель Х2 и Х3, т. е. производство ликеро-водочных изделий (Y) зависит от валового сбора сахарной свеклы (X2) и потребления пива (X3).

Анализ уравнения регрессии говорит, что при росте Х5 на 1 единицу в своих единицах измерения увеличит Y на 1.0552 единицы в своих единицах измерения, Отклонения основного тренда носят случайный характер, а данная модель определяет Y на 96.71% (R-квадрат). Относительная ошибка апроксимации указывает об адекватности математической модели. Степень рассеянности Y мала (дисперсия=3.909). Распределение Y является нормальным, в ряду нет автокорреляции нельзя, а проверка на стационарность случайного компонента с помощью Х2 (Х2=10.04) указывает что коэффициенты корреляции неоднородны.

Метод пресс.

Основан на выборе наилучшего уравнения регрессии для этого рассчитывают значения сумм квадратов расхождения:

Табл. 3.

Хi.

отклонение.

Хi.

отклонение.

Хi.

отклонение.

Хi.

отклонение.

Хi.

отклонение.

9174.74.

5598.67.

5589.96.

538.735.

185.547.

8969.93.

7329.06.

545.654.

217.694.

7608.97.

2226.17.

217.86.

185.690.

6674.29.

256.857.

1176.13.

236.652.

305.611.

7607.95.

240.845.

224.784.

256.856.

256.53.

227.26.

3506.0.

5628.28.

224.949.

275.868.

226.924.

266.522.

236.662.

Из таблицы видно лучше всего взять модель 25 или 125.

Табл. 4.

модель.

R2.

дисперсия.

0.9756.

3.3709.

0.9766.

3.3005.

Последующая проверка говорит, что модель 25 наиболее выгодна. Значит производство ликероводочных изделий (Y) зависит от 2- валового сбора сахарной свеклы (X2), 5- потребления водки (X5) на 97.66%.

Метод исключения.

Метод исключения основан на анализе коэффициентов регрессионного уравнения при условии, что переменная при этом коэффициенте в модель была включена последней.

Табл. 5.

переменные в модели.

f-критерий.

переменные в модели.

f-критерий.

переменные в модели.

f-критерий.

переменные в модели.

f-критерий.

переменные в модели.

f-критерий.

Х1.

3.1719.

Х1.

0.5331.

Х1.

0.7335.

Х2.

4.1314.

Х2.

1.7014.

Х2.

3.0429.

Х2.

1.8365.

Х3.

0.0115.

Х3.

0.0121.

Х4.

2.5988.

Х4.

8.6594.

Х5.

28.553.

Х5.

394.844.

Х5.

419.872.

Х5.

23.6498.

Fкр

4.4100.

Fкр

4.4100.

Fкр

4.4100.

Fкр

4.4100.

Fкр

4.4100.

Следовательно в модель включается только Х5. Данная модель определяет Y на 96.71%, значит потребление водки (X5) значительно влияет на производство ликероводочных изделий (Y).

Метод главных компонент.

Метод главных компонент был предложен К. Пирсоном в 1901 году, а в дальнейшем развит и доработан. Метод основан на стандартизации переменных для чего используют следующие формулы:

Zij=(Xij-Xiсред)Si;

Si=[1/(n-1)*сумма (Xij-Xiсред)2](½);

где Zij стандартизованные переменные;

Si стандартизированное отклонение.

В модели участвуют главные компоненты Wj, которые представляют собой следующее:

Wj=V1Z1+V2Z2+…+VrZr,.

где Vj собственный вектор, который удовлетворяет системе уравнений:

(Z'z-KI)*Vj=0,.

где Z’z корреляционная матрица; КI характеристические корни уравнения |Z'z-KI|=0.

Корреляция главных компонент показывает тесноту связи Хi с главными компонентами. Переменные Х1, Х2,Х4 имеют интенсивную связь с первой главной компонентой, а Х3 среднюю, вторая главная компонента интенсивно связана с переменной Х5. Следовательно валовый сбор зерна (X1), валовый сбор сахарной свеклы (X2), население России (X4), потребление пива (X5) имеют некоторую гипотетическую величину, зависимую от них. Модель полученная по методу главных компонент определяет величину Y на 87.43% (R квадрат).

Прогнозирование.

Проведем прогнозы по полученным моделям и сделаем оценки прогнозов.

Табл. 6.

прогноз.

Gt.

Dср

Eпр-сред.

K.

KH.

KH1.

V.

Vмю.

Vs.

Vl.

регрессия от факторов.

2.5273.

1.55 208.

0.84 378.

0.13 734.

0.1 591.

0.016.

0.137.

0.008.

0.969.

169.434.

регрессия от главных компонент.

6.63 374.

4.78 329.

2.58 704.

0.36 043.

0.4 176.

0.043.

0.360.

0.002.

0.7 612.

124.152.

экспоненциальное сглаживание.

11.4203.

7.73 952.

3.97 460.

0.62 061.

0.7 189.

0.074.

0.620.

0.006.

0.16 918.

168.113.

метод гармонических весов.

8.63 744.

3.71 190.

2.3 568.

0.46 938.

0.5 437.

0.056.

0.469.

0.018.

0.7 478.

157.969.

регрессия от времени.

16.6170.

11.8509.

6.213 912.

0.903 012.

0.104 615.

0.1083.

0.903.

0.012.

0.169 182.

263.5587.

Из данной таблицы видно, что наиболее точной моделью прогноза считается регрессия от факторов, т.к. Gt=2.5273. Eпр-сред указывает о точности высокой точности прогноза, К — о том что данная модель довольно сильно близка к эталонной (простая экстрополяция), КН — модель близка к совершенной, а КН1 — что модель лучше чем модель на уровне средней, V — что модель близка к простой экстрополяции, Vмю — что центральная тенденция определена точно, Vs — что отклонения фактических и прогнозных достаточно точно совпадают, Vl — слабая связь между прогнозными и фактическими значениями.

Показать весь текст
Заполнить форму текущей работой