Помощь в написании студенческих работ
Антистрессовый сервис

Основы эконометрики

КурсоваяПомощь в написанииУзнать стоимостьмоей работы

Так как Х2набл=10,38 991 > Х2крит =9,49, то гипотеза о гетероскедастичности подтверждается и модель считается гетероскедастичной. Критическое значение распределения Кси-квадрат найдено с помощью действий: fx>Статистические>ХИ2ОБР (m), где m — число переменных, входящих в уравнение регрессии. Проверка модели на отсутствие автокорреляции Автокорреляция в остатках свидетельствует о неудачном подборе… Читать ещё >

Основы эконометрики (реферат, курсовая, диплом, контрольная)

Государственное образовательное учреждение высшего профессионального образования

" ЧЕЛЯБИНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ"

Институт экономики отраслей, бизнеса и администрирования

  • Основы эконометрики
  • Выполнил: Ибатуллин И.А.
  • Группа: 28ПС-202
  • Проверил: Шатин И.А.
  • Челябинск
  • 2012

Задание для выполнения практической работы

Работа включает в себя анализ реальных экономических данных при помощи изученных эконометрических моделей.

Работа должны быть выполнена в соответствии со следующими этапами:

1) Рассчитайте корреляцию между, экономическими показателями (не менее 5) из статистических данных по выборке не менее 45 наблюдений (из Интернета, печатных источников или Вашего предприятия). Интерпретируйте полученные данные.

2) Постройте линейную множественную регрессию. Определите теоретическое уравнение множественной регрессии. Оцените адекватность построенной модели. Определите значимость переменных, найдите среднюю ошибку аппроксимации (вручную в экселе), коэффициент детерминации, линейные коэффициенты корреляции между всеми членами регрессии, найти критерий Фишера, Т-статистику и т. д.

3) Проверьте модели на отсутствие автокорреляции.

4) Проверка на гетероскедастичность моделей.

Таблица 1. Данные для анализа

Годы

Общий валовой внутренний продукт, трлн. руб.

Оплата труда наемных работников, трлн. руб

Чистые налоги на производство и импорт, трлн. руб

Наличие основных фондов в РФ

Оборот оптовой торговли, трлн. руб.

Y

X1

X2

X3

X4

7305,6

2937,2

1248,5

14 334,8

3,1

8943,6

3848,4

1402,6

17 464,2

4,3

10 819,2

5065,1

1847,2

21 495,2

5,5

13 208,2

6231,4

2112,5

26 333,3

6,8

17 027,2

7845,0

2875,5

32 173,3

8,9

21 609,8

9474,3

4248,4

34 873,7

11,4

26 917,2

11 985,9

5386,7

41 493,6

15,6

33 247,5

15 526,1

6334,3

47 489,5

19,9

41 276,8

19 559,8

8218,4

60 391,5

24,0

38 808,7

20 412,5

6474,5

74 441,1

31,1

45 166,0

22 531,6

8252,3

82 303,0

28,3

54 369,1

26 757,2

10 919,2

93 185,6

32,0

1. Коррелямция

Коррелямция (корреляционная зависимость) — статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин приводят к систематическому изменению значений другой или других величин.

На основании данных таблицы 1 проведем корреляционный анализ зависимости Потребления электроэнергии от 4 факторов.

Анализ производим с помощью пакета анализа данных в программе MS Excel. Результаты анализа внесем в таблицу 2.

корреляция регрессия гетероскедастичность еxcel

Таблица 2. Корреляционная зависимость

Y

X1

X2

X3

X4

Y

X1

0,99 677 508

X2

0,992 734 543

0,981 151 785

X3

0,97 816 225

0,98 936 714

0,953 116 118

X4

0,975 846 077

0,98 654 557

0,946 253 028

0,980 103 417

По данным таблицы видно, что наибольшее влияние на общий валовой внутренний продукт оказывает оплата труда наемных работников.

2. Построим линейную множественную регрессию

Таблица 3. Регрессионная статистика

Множественный R

0,999 749 182

R-квадрат

0,999 498 426

Нормированный R-квадрат

0,999 211 813

Стандартная ошибка

444,1 809 142

Наблюдения

Если знак при коэффициенте регрессии — положительный, связь зависимой переменной с независимой будет положительной. В нашем случае знак коэффициента регрессии положительный, следовательно, связь также является положительной.

Для анализа общего качества уравнения регрессии используют обычно множественный коэффициент детерминации R2, называемый также квадратом коэффициента множественной корреляции R. R2 (мера определенности) всегда находится в пределах интервала [0;1].

Если значение R2 близко к единице, это означает, что построенная модель объясняет почти всю изменчивость соответствующих переменных. И наоборот, значение R-квадрата, близкое к нулю, означает плохое качество построенной модели, в нашем случае построенная модель объясняет почти всю изменчивость соответствующих переменных.

Коэффициент детерминации R2 показывает, на сколько процентов () найденная функция регрессии описывает связь между исходными значениями факторов X и Y

где — объясненная вариация; - общая вариация.

В нашем случае, функция регрессии описывает связь между исходными значениями факторов X и Y на 99,97%.

Таблица 4. Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

688 026 634,9

3487,269 116

1,2712E-11

Остаток

1 381 076,79

197 296,6846

Итого

Число регрессоров m = 4 число n-m-1 = 12−4-1=7, где n — число наблюдений.

Для уровня значимости б = 0,05 и при степенях свободы 4, 7 табличное значение критерия Фишера Fтаб = 4,12. Значение F=3487,27 выше табличного, данное уравнение регрессии будет статистически значимым. Уравнение регрессии является пригодным для практического использования, т.к. F расч > Fтаб не менее чем в 4 раза.

Таблица 5. Коэффициенты регрессии

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

1882,373 846

322,7 076 624

5,833 062 133

0,64 155

1119,29 148

2645,45 621

Переменная X 1

1,21 497 104

0,421 875 014

2,879 931 261

0,2 365 391

0,21 739 515

2,21 254 693

Переменная X 2

1,973 119 612

0,428 183 437

4,608 117 553

0,246 044

0,96 062 667

2,98 561 255

Переменная X 3

— 0,35 488 734

0,50 250 561

— 0,706 235 581

0,50 286 322

— 0,15 431 243

0,8 333 496

Переменная X 4

70,97 386 696

117,4 208 705

0,604 439 966

0,56 462 024

— 206,682 371

348,630 105

В столбце «Коэффициенты» получены коэффициенты уравнения регрессии:

у=1882,37+1,21Х1+1,97Х2−0,035Х3+70,97Х4

Видно, что отрицательное влияние на показатель Общий валовой внутренний продукт оказывает переменная Х3 — наличие основных фондов в РФ.

Стандартные ошибки mi, t-статистики ti могут быть вычислены по формулам

Где уY — среднее квадратическое отклонение для отклика Y,

уXi — среднее квадратическое отклонение для регрессора Xi (X1, X2, …)

R2— коэффициент детерминации для уравнения множественной регрессии,

— коэффициент детерминации для зависимости отклика Y от всех регрессоров кроме Xi,

— коэффициент детерминации для зависимости Xi от всех регрессоров кроме Xi.

Табличные t-критерии Стьюдента зависят от принятого уровня значимости и от числа степеней свободы (n-m-1). Если вычисленные значения t-критерия превышают табличные, то говорят, что соответствующий коэффициент регрессии является статистически значимым и на него можно опираться в анализе и прогнозе.

Более того, используя табличное значение t-критерия и стандартную ошибку mi коэффициента регрессии bi можно с вероятностью 1 — б сделать вывод о том, что истинное значение коэффициента регрессии попадет в интервал (bi — tтаб*mi, bi + tтаб*mi).

Для нашего примера:

m(X1) =0,42 188,

m(X2) =0,42 818,

m(X3) =0,5 025,

m(X4) =117,42 087,

m(y) =322,707 662

t(X1) =2,87 993,

t(X2) =4,60 812,

t(X3) -0,70 624,

t(X4) =0,60 444,

t(y) =5,833 062

Табличное значение t-критерия Стьюдента при уровне значимости б = 0,05 и числе степеней свободы 7 tтаб =3,335. Коэффициенты tстатистики при регрессорах Х2, Х3 и Х4 меньше t таб., и согласно t-критерию не являются статистически значимыми. Регрессор Х1, больше t таб. И является статистически значимым.

По величине Р-значения возможно определять значимость коэффициентов, не находя критическое значение t-статистики. Если значение t-статистики велико, то соответствующее значение вероятности значимости мало — меньше 0,05, и можно считать, что коэффициент регрессии значим. И наоборот, если значение t-статистики мало, соответственно вероятность значимости больше 0,05 — коэффициент считается незначимым.

Для коэффициентов b0, b1, b2 значения вероятности меньше 0,05 и для них коэффициент регрессии значим. Для коэффициентов b3, b4 значения вероятности стремятся к единице и следовательно, коэффициенты незначимы.

Таблица 6. Относительная ошибка аппроксимации

Наблюдение

Предсказанное Y

Остатки Е

Стандартные остатки

7628,114 123

— 322,4 678 232

— 0,910 067 939

9007,906 163

— 64,32 376 269

— 0,181 534 373

11 309,22878

— 490,165 306

— 1,382 923 511

13 171,03006

37,20 372 121

0,104 996 255

16 576,47912

450,7 117 376

1,271 997 615

21 348,95794

260,8 075 472

0,736 050 452

26 710,01154

207,1 898 359

0,584 730 672

32 973,10354

274,4 096 897

0,774 438 387

41 424,11435

— 147,2 651 676

— 0,415 611 413

39 026,03672

— 217,2 888 587

— 0,613 232 111

44 625,22264

540,8 239 548

1,526 312 105

54 898,86821

— 529,7 843 435

— 1,49 515 614

СУММА

18,52

Средняя ошибка аппроксимации

1,54%

Средняя ошибка аппроксимации — среднее отклонение расчетных значений от фактических:

В нашем случае средняя ошибка аппроксимации составляет 1,54%. Это значит, что качество тренда, исходя из относительных отклонений по каждому наблюдения, признается хорошим, так в норме средняя ошибка аппроксимации колеблется в пределах до 10%.

3. Проверка модели на отсутствие автокорреляции Автокорреляция в остатках свидетельствует о неудачном подборе модели, о ее несовершенстве. Наличие автокорреляции может быть выявлено при помощи d-критерия Дарбина-Уотсона. Значение критерия вычисляется по формуле:

Таблица 7. Расчет критерия d — Дарбина-Уотсона

Yтеор

e=Yтеор-Yпракт

e (t)-e (t-1)

{e (t)-e (t-1)}^2

e2

7616,608 284

4679,41

4679,41

21 896 861,89

21 896 861,89

8992,915 076

7744,42

3065,01

9 394 266,64

59 975 964,87

11 288,76759

9886,17

2141,75

4 587 103,85

97 736 309,70

13 146,3031

11 299,06

1412,89

1 996 262,60

127 668 738,07

16 544,19681

14 431,68

3132,62

9 813 308,35

208 273 364,90

21 305,60371

18 430,15

3998,47

15 987 794,90

339 670 550,07

26 653,83973

22 405,48

3975,33

15 803 224,87

502 005 547,36

32 899,29085

27 512,58

5107,10

26 082 460,95

756 942 023,66

41 330,66224

34 996,35

7483,77

56 006 752,70

1 224 744 185,41

38 940,62487

30 722,22

— 4274,12

18 268 105,61

943 855 100,73

44 527,58441

38 053,09

7330,86

53 741 536,78

1 448 037 415,48

54 777,209

46 524,87

8471,79

71 771 156,44

2 164 563 780,92

СУММА

161 568 036,73

3 338 913 545,92

Критерий d

0,48 389 404

В таблице значений критерия Дарбина-Уотсона для уровня значимости 5% при m=4и n=7 критические значения d1=0,048, d2=1,739,

В нашем расчете значение d-критерия попадает в интервал от 0 до d1, автокорреляция положительна.

4. Проверка на гетероскедастичность моделей Для проверки на гетероскедастичность воспользуемся тестом Бреуша-Пагана и данными таблиц 6, 7.

Затем строим регрессию, в которой за зависимую переменную берется столбец квадратов остатков еi2, а за зависимые переменные — переменные Х1, Х2, Х3, Х4 (табл. 8).

Таблица 8. Данные для проверки на гетероскедастичность моделей

Y

X1

X2

X3

X4

21 896 861,89

2937,2

1248,5

14 334,8

3,1

9 394 266,64

3848,4

1402,6

17 464,2

4,3

4 587 103,85

5065,1

1847,2

21 495,2

5,5

1 996 262,60

6231,4

2112,5

26 333,3

6,8

9 813 308,35

7845,0

2875,5

32 173,3

8,9

15 987 794,90

9474,3

4248,4

34 873,7

11,4

15 803 224,87

11 985,9

5386,7

41 493,6

15,6

26 082 460,95

15 526,1

6334,3

47 489,5

19,9

56 006 752,70

19 559,8

8218,4

60 391,5

24,0

18 268 105,61

20 412,5

6474,5

74 441,1

31,1

53 741 536,78

22 531,6

8252,3

82 303,0

28,3

71 771 156,44

26 757,2

10 919,2

93 185,6

32,0

Таблица 9. Регрессионная статистика

Множественный R

0,930 497 653

R-квадрат

0,865 825 882

Нормированный R-квадрат

0,789 154 957

Стандартная ошибка

10 373 968,8

Наблюдения

Таблица 10. Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

4,86127E+15

1,21532E+15

11,29 275

0,3 566

Остаток

7,53335E+14

1,07619E+14

Итого

5,6146E+15

Таблица 11. Коэффициенты регрессии

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

— 7 716 696,169

7 531 171,974

— 1,24 634

0,339 634 688

— 25 525 088,1

10 091 695,7

X 1

8591,412 764

9901,407 348

0,867 696 123

0,414 314 396

— 14 821,695

32 004,521

X 2

1338,454 016

10 043,71882

0,133 262 792

0,897 735 707

— 22 411,167

25 088,075

X 3

— 160,918 196

1171,530 429

— 0,1 366 519

0,895 153 163

— 2930,321 083

2610,1374

X 4

— 4 722 028,49

2 779 183,309

— 1,6 990 705

0,133 108 615

— 11 293 752,74

1 849 695,8

Найдена статистика:

Х2наб = nR2=12*0,865 825 882=10,38 991

Так как Х2набл=10,38 991 > Х2крит =9,49, то гипотеза о гетероскедастичности подтверждается и модель считается гетероскедастичной. Критическое значение распределения Кси-квадрат найдено с помощью действий: fx>Статистические>ХИ2ОБР (m), где m — число переменных, входящих в уравнение регрессии.

Выводы Наибольшее влияние на образование общего валового внутреннего продукта оказывает размер оплаты труда наемных работников.

Функция регрессии описывает связь между исходными значениями факторов X и Y на 99,97%.

Значение F=3487,27 выше табличного, данное уравнение регрессии будет статистически значимым. Уравнение регрессии является пригодным для практического использования, т.к. F расч > Fтаб не менее чем в 4 раза.

Уравнение регрессии: у=1882,37+1,21Х1+1,97Х2−0,035Х3+70,97Х4

Видно, что отрицательное влияние на показатель Общий валовой внутренний продукт оказывает переменная Х3 — наличие основных фондов в РФ.

Коэффициенты tстатистики при регрессорах Х2, Х3 и Х4 меньше t таб., и согласно t-критерию не являются статистически значимыми. Регрессор Х1, больше t таб. И является статистически значимым.

Для коэффициентов b0, b1, b2 значения вероятности меньше 0,05 и для них коэффициент регрессии значим. Для коэффициентов b3, b4 значения вероятности стремятся к единице и следовательно, коэффициенты незначимы.

Средняя ошибка аппроксимации составляет 1,54%. Это значит, что качество тренда, исходя из относительных отклонений по каждому наблюдения, признается хорошим, так в норме средняя ошибка аппроксимации колеблется в пределах до 10%.

Значение d-критерия попадает в интервал от 0 до d1, автокорреляция положительна.

Х2наб =1,169 121. Так как Х2набл=1,578< Х2крит =9,48, то гипотеза о гетероскедастичности подтверждена и модель считается гетероскедастичной.

1. Берндт Э. Р. Практика эконометрики: классика и современность: Учебник для студентов вузов. — М.: ЮНИТИ-ДАНА, 2005. — 863 с.

2. Луговская Л. В. Эконометрика в вопросах и ответах: учебное пособие. — М.: ТК Велби, Изд-во Проспект, 2006. — 208 с.

3. Практикум по эконометрике: Учеб. пособие / Под ред. И. И. Елисеевой. — М.: Финансы и статистика, 2006. — 344 с.

4. Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2-х т. — Т. 1. Айвазян С. А., Мхитарян В. С. Теория вероятностей и прикладная статистика. — М.: ЮНИТИ-ДАНА, 2001. — 656 с.

5. Эконометрика: Учебник / Тихомиров Н. П., Дорохина Е. Ю. — М.: Издательство «Экзамен», 2003. — 512 с

6. Эконометрика: учебное пособие / А. В. Гладилин, А. Н. Герасимов, Е. И. Громов. — М.: КНОРУС, 2008. — 232 с.

Показать весь текст
Заполнить форму текущей работой