Помощь в написании студенческих работ
Антистрессовый сервис

Проверка истинности моделей множественной регрессии

КурсоваяПомощь в написанииУзнать стоимостьмоей работы

Коэффициенты парной и частной корреляции отличаются незначительно что говорит о слабой межфакторной связи. Связь между динамикой валового накопления основного капитала и динамикой валового внутреннего продукта (связь прямая и средне тесная) выше, чем связь между числом студентов и динамикой ВВП (связь прямая слабая). По двум показателям линейная модель лучше остальных, это говорит о том, что… Читать ещё >

Проверка истинности моделей множественной регрессии (реферат, курсовая, диплом, контрольная)

Министерство образования и науки Российской Федерации Государственное образовательное учреждение высшего профессионального образования АЛТАЙСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ им. И.И. ПОЛЗУНОВА ИНСТИТУТ ЭКОНОМИКИ И УПРАВЛЕНИЯ РЕГИОНАЛЬНЫМ РАЗВИТИЕМ Расчётное задание по дисциплине: Эконометрика Проверка истинности моделей множественной регрессии Выполнил:

Филатов М.И.

Исходные данные

Численность студентов (на 1000 человек населения)

Динамика Валового Внутреннего Продукта (в постоянных ценах)

Динамика валового накопления основного капитала (в постоянных ценах)

x1

y

x2

Россия

131,2

Австралия

Австрия

Азербайджан

177,3

103,4

Армения

184,1

263,5

Беларусь

164,9

162,2

Бельгия

Венгрия

Германия

Грузия

169,3

112,4

Дания

Италия

Казахстан

163,4

126,7

Канада

Киргизия

134,7

83,3

Китай

Мексика

Нидерланды

Норвегия

Польша

Республика Молдова

129,1

134,1

Румыния

Соединенное Королевство Великобритания

США

Таджикистан

116,4

143,5

Украина

122,7

122,6

Финляндия

Франция

Швеция

Япония

91№

Все данные взяты за 2003 год. Данные взяты из статистического сборника Регионы России Социально-экономические показатели.

2003. Федеральная служба государственной статистики Построение модели множественной регрессии

Расчет параметров

Рассчитаем необходимые параметры:

Признак

Ср. знач.

СКО

Характеристики тесноты связи

вi

bi

Коэф-ты частной корр.

F-критерий фактический

Табличный F-критерий

y

131,77

22,74

Ryx1x2=0,5963

x1

44,9

30,41

ryx1=0,2152

0,2639

0,1973

0,0672

ryx1х2=0,3112

Fx1факт=2,8954

4,21

x2

146,19

60,57

ryx2=0,5353

0,5583

0,2097

0,2326

ryx2х1=0,5695

Fx2факт=12,95

4,21

rx1x2=-0,0872

a=92,26

rx1х2у=-0,2453

Fфакт=7,45

3,35

Уравнение регрессии в стандартизованном масштабе:

ty =2639tx1+0,5583tx2

Уравнение множественной регрессии в естественной форме:

yтеор =92,26+0,1973x1 +0,2097x2

Рассчитаем по этой формуле теоретические значения динамики ВВП и определим среднюю ошибку аппроксимации. Она равна 9,5254.

Выбор фактора, оказывающего большее влияние

1. Динамика валового накопления основного капитала оказывает большее влияние на динамику ВВП, чем численность студентов, так как

2|=0,5583 > |в1|=0,2639.

2. С помощью средних коэффициентов эластичности можно оценить относительную силу влияния динамики валового накопления основного капитала (х2) и числа студентов (х1) на динамику ВВП (у):

=0,0672, =0,2326,

следовательно, с увеличением валового накопления основного капитала на 1% от их среднего значения, динамика ВВП возрастает на 0,23% от своего среднего значения. А при увеличении числа студентов на 1% от своего среднего значения, динамика ВВП увеличится на 0,067% от своего среднего значения. Очевидно, что сила влияния второго фактора (динамики валового накопления основного капитала) на результативный признак (динамику ВВП) значительно больше, чем сила влияния первого фактора (числа студентов).

3.Сравнивая коэффициенты парной и частной корреляции

ryx1

0,2152

ryx2

0,5353

ryx1x2

0,3112

ryx2x1

0,5695

Коэффициенты парной и частной корреляции отличаются незначительно что говорит о слабой межфакторной связи. Связь между динамикой валового накопления основного капитала и динамикой валового внутреннего продукта (связь прямая и средне тесная) выше, чем связь между числом студентов и динамикой ВВП (связь прямая слабая).

4. По коэффициенту множественной корреляции: Rуx1x2=0,5963 можно сделать вывод, что зависимость динамики ВВП от динамики валового накопления основного капитала и числа студентов характеризуется как средне тесная, в которой 59,63% вариации результативного признака определяется вариацией учтённых в модели факторов. Прочие факторы, не включённые в модель, составляют соответственно 35,56% от общей вариации.

4. Так как F — критерий Фишера превышает табличное значение:

Fфакт=7,45 >Fтабл=3,35

то можно говорить о статистической значимости и надёжности уравнения регрессии.

5. Сравнивая частные F — критерии фактические с пороговой константой Fтабл=4,21, делаем вывод: Fх2факт=12,95 > Fтабл, следовательно статистически подтверждена целесообразность включения в модель динамики валового накопления основного капитала, после числа студентов, т.к. этот фактор оказывает большее влияние.

Построение парных моделей регрессии

Представим данные полученные при построении парных моделей в таблице:

Модель

Aср.

r (с)

Уравнение

Fфакт

Линейная

10,89

0,5353

у=102,38+0,201х1

11,24

Степенная

11,008

0,4934

у=38,26Чх10,2481

9,01

Показательная

10,47

0,5350

у=106,53Ч1,001х1

11,23

Гиперболическая

12,59

0,3786

у=165,92−4546,04/х1

4,68

Определение лучшей модели

1. Недопустимую ошибку аппроксимации имеют все 4 модели, однако у показательной модели она наименьшая, это говорит о том что линейная модель лучше аппроксимирует исходные данные чем остальные модели.

2. У линейной модели теснота связи самая сильная по сравнению с другими моделями. Это говорит о том, что показательная модель лучше подходит к нашим данным.

3. Проверив гипотезу о стат. значимости и надежности, получив значения Fфакт больше табличного во всех случаях, получаем, что все 4 уравнения являются стат. значимыми и надежными. Хотя линейная модель имеет наибольшее Fфакт по сравнению с другими моделями, это говорит о большей точности линейной модели.

По двум показателям линейная модель лучше остальных, это говорит о том, что линейная модель лучше аппроксимирует исходные данные. Однако множественная модель, на мой взгляд, лучше аппроксимирует данные, чем линейная, потому что множественная модель имеет допустимую ошибку аппроксимации и большую тесноту связи.

Проверка предпосылок МНК

1.Первую предпосылку проверим путём вычисления суммы значений остатков:

x1

x2

y

x1x2

yx1

yx2

y^x

y-y^x

131,2

8396,8

13 513,6

126,48

4,72

137,56

— 14,56

122,09

— 5,09

103,4

177,3

2274,8

3900,6

18 332,82

118,28

59,02

263,5

184,1

6259,4

48 510,35

154,21

29,89

162,2

164,9

32 155,5

26 746,78

164,75

0,15

125,11

— 10,11

137,87

1,13

119,17

— 9,17

112,4

169,3

4720,8

7110,6

19 029,32

124,11

45,19

128,25

— 14,25

125,18

— 14,18

126,7

163,4

7728,7

9967,4

20 702,78

130,86

32,54

133,25

— 12,25

83,3

134,7

3831,8

6196,2

11 220,51

118,80

15,90

183,27

0,73

133,29

— 11,29

125,82

— 6,82

128,79

— 8,79

135,20

4,80

134,1

129,1

4559,4

4389,4

17 312,31

127,08

2,02

126,25

— 11,25

130,37

— 8,37

133,69

— 16,69

143,5

116,4

3013,5

2444,4

16 703,4

126,49

— 10,09

122,6

122,7

6252,6

6257,7

15 043,02

128,03

— 5,33

135,99

— 5,99

126,41

— 11,41

128,78

— 7,78

117,65

— 12,65

сумма

0,0000

2.Случайный характер остатков. Проверим графически:

Из графика зависимости остатков еi от теоретических значений результативного признака видно, что точки распределены случайно, следовательно, еi представляют собой случайные величины и МНК оправдан.

3. Наличие гомоскедастичности. Воспользуемся методом Гольдфельда — Квандта. Число исключаемых центральных наблюдений примем равным 8. Тогда в каждой группе будет по 11 наблюдений. Результаты расчетов представим в таблице:

x1

x2

y

x1x2

yx1

yx2

y^x

y-y^x

Ai

(y-y^x)^2

83,3

134,7

3831,8

6196,2

11 220,51

132,15

2,55

1,8961

6,52

128,41

— 23,41

22,2973

548,13

127,98

— 17,98

16,3451

323,27

131,2

8396,8

13 513,6

139,08

— 7,88

6,0058

62,09

103,4

177,3

2274,8

3900,6

18 332,82

126,24

51,06

28,7972

2606,87

112,4

169,3

4720,8

7110,6

19 029,32

133,02

36,28

21,4308

1316,41

129,22

— 12,22

10,4468

149,40

132,65

— 17,65

15,3447

311,40

122,6

122,7

6252,6

6257,7

15 043,02

136,51

— 13,81

11,2549

190,71

131,48

— 20,48

18,4460

419,23

126,7

163,4

7728,7

9967,4

20 702,78

139,87

23,53

14,4012

553,73

0,0000

15,1514

6487,74

x1

x2

y

x1x2

yx1

yx2

y^x

y-y^x

Ai

(y-y^x)^2

143,5

116,4

3013,5

2444,4

16 703,4

119,32

— 2,92

2,5060

8,51

124,14

— 2,14

1,7530

4,57

131,22

— 1,22

0,9407

1,50

130,25

9,75

6,9625

95,01

127,90

— 6,90

5,7020

47,60

162,2

164,9

32 155,5

26 746,78

166,75

— 1,85

1,1203

3,41

133,47

— 10,47

8,5103

109,57

128,35

— 6,35

5,2041

40,31

134,04

4,96

3,5697

24,62

263,5

184,1

6259,4

48 510,35

155,95

28,15

15,2883

792,18

195,01

— 11,01

5,9854

121,29

0,0000

5,2311

1248,57

Величина R=0,1924 (1248,57/6487,74), меньше табличного значения F-критерия, следовательно, наличие гомоскедастичности и отсутствие гетероскедастичности.

4.Отсутствие автокорреляции. Тест Дарбина-Уотсона:

x1

x2

y

y^

lу-у^l

(lу-у^l/у)*100

у-у^

ei-ei-1

(ei-ei-1)^2

(у-у^)^2

126,48

4,715 497

3,594

— 4,715

— 4,7155

22,2

22,24

137,56

14,55 865

11,836

14,559

19,27 414

371,5

211,95

122,09

5,93 094

4,353

5,093

— 9,46 555

89,6

25,94

118,28

59,2 032

33,288

— 59,020

— 64,1134

4110,5

3483,40

154,21

29,88 682

16,234

— 29,887

29,13 349

848,8

893,22

164,75

0,151 302

0,092

— 0,151

29,73 552

884,2

0,02

125,11

10,11 485

8,796

10,115

10,26 615

105,4

102,31

137,87

1,133 281

0,815

— 1,133

— 11,2481

126,5

1,28

119,17

9,170 267

8,337

9,170

10,30 355

106,2

84,09

124,11

45,18 646

26,690

— 45,186

— 54,3567

2954,7

2041,82

128,25

14,24 733

12,498

14,247

59,43 379

3532,4

202,99

125,18

14,17 636

12,771

14,176

— 0,7 097

0,0

200,97

130,86

32,53 879

19,914

— 32,539

— 46,7152

2182,3

1058,77

133,25

12,25 437

10,128

12,254

44,79 316

2006,4

150,17

83,3

118,80

15,89 794

11,802

— 15,898

— 28,1523

792,6

252,74

183,27

0,725 914

0,395

— 0,726

15,17 202

230,2

0,53

133,29

11,29 077

9,255

11,291

12,1 669

144,4

127,48

125,82

6,817 621

5,729

6,818

— 4,47 315

20,0

46,48

128,79

8,790 167

7,325

8,790

1,972 546

3,9

77,27

135,20

4,796 736

3,426

— 4,797

— 13,5869

184,6

23,01

127,08

2,15 804

1,561

— 2,016

2,780 932

7,7

4,06

126,25

11,24 923

9,782

11,249

13,26 503

176,0

126,55

130,37

8,368 454

6,859

8,368

— 2,88 077

8,3

70,03

133,69

16,68 649

14,262

16,686

8,318 035

69,2

278,44

126,49

10,8 938

8,668

10,089

— 6,59 711

43,5

101,80

128,03

5,32 814

4,342

5,328

— 4,76 124

22,7

28,39

135,99

5,992 662

4,610

5,993

0,664 522

0,4

35,91

126,41

11,40 967

9,921

11,410

5,417 008

29,3

130,18

128,78

7,777 864

6,428

7,778

— 3,63 181

13,2

60,50

117,65

12,65 349

12,051

12,653

4,875 628

23,8

160,11

19 110,43

10 002,65

Исходя из статистики Дарбина-Уотсона, можно сделать вывод, что автокорреляция отсутствует, так как 1,91 находится в промежутке (1,339;2,661) (d2; 4-d2). Следовательно, значения остатков распределены независимо друг от друга. Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии.

Таким образом, не все предпосылки выполнились, это говорит о недостаточной надежности уравнения множественной регрессии. Возможно, можно было бы и получить надежную модель, если исключить из данных страны значение динамики ВВП, которых сильно отличается от других.

Показать весь текст
Заполнить форму текущей работой