Помощь в написании студенческих работ
Антистрессовый сервис

Построение линейной модели зависимости цены автомобиля от его пробега, года выпуска, мощности и объема двигателя

КонтрольнаяПомощь в написанииУзнать стоимостьмоей работы

А4 > 0, то связь между результативным признаком У — мощностью двигателя автомобиля и фактором Х4 — годом выпуска автомобиля прямая, если фактор Х2 увеличить на 1 л.с., то цена автомобиля увеличится на 225 357,14 руб. А2 > 0, то связь между результативным признаком У — ценой автомобиля и фактором Х2 — годом выпуска автомобиля прямая, если фактор Х2 увеличить на 1 год, то цена автомобиля увеличится… Читать ещё >

Построение линейной модели зависимости цены автомобиля от его пробега, года выпуска, мощности и объема двигателя (реферат, курсовая, диплом, контрольная)

Челябинский государственный университет Институт экономики отраслей, бизнеса и администрирования ПРАКТИЧЕСКАЯ РАБОТА По дисциплине «Эконометрика»

Выполнил: Гилязов Р. Р Студент гр.22ПС-404

Проверил: Шатин И.А.

2013 г.

В таблице представлены экономические данные по автомобилям Honda CR-V с пробегом за 11.08.2013 г.

(Данные взяты с http://autochel.ru).

Таблица № 1

Модель

Пробег, тыс. км

Год выпуска

Мощность, л.с.

Объём двигателя

Стоимость, тыс. руб.

X1

X2

X3

X4

Y

240 000

2,4

2,4

2,4

2,4

2,4

2,4

2,2

Задача состоит в построении линейной модели зависимости цены автомобиля от его пробега, года выпуска, мощности и объёма двигателя.

Цена автомобиля — это зависимая переменная Y. В качестве независимых, объясняющих переменных были выбраны: пробег (км) X1, год выпуска X2, мощность двигателя (л.с.) X3, объём двигателя (л) X4.

1) Корреляция Корреляция (корреляционная зависимость). Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются распространенными показателями тесноты связи при статистическом анализе данных.

Действия для выполнения корреляционного анализа:

· Выбрать команду «Формулы — Фставить функцию».

· В диалоговом окне функций выберите инструмент Корреляция, а затем щелкнуть на кнопке ОК.

· В диалогом окне Корреляция необходимо ввести диапазон ячеек, содержащих исходные данные (значения Х1 и У) и так для каждой переменной.

Таблица № 2

Матрица парных коэффициентов корреляции

Пробег, тыс. км (X1)

Год выпуска (X2)

Мощность, л.с. (X3)

Объём двигателя (X4)

Стоимость, тыс. руб. (Y)

Пробег, тыс. км (X1)

Год выпуска (X2)

— 0,949 144 523

Мощность, л.с. (X3)

— 0,734 488 215

0,77 209 142

Объём двигателя (X4)

— 0,429 421 734

0,45 203 331

0,75 924 021

Стоимость, тыс. руб. (Y)

— 0,950 561 029

0,95 387 207

0,74 541 927

0,52 197 113

Значения коэффициентов корреляции лежат в интервале [-1,1]. Положительное значение коэффициента свидетельствует о положительной связи между показателями, т. е. при увеличении одного из показателей второй показатель также статистически возрастает. Отрицательное значение коэффициента свидетельствует об отрицательной связи между показателями, т. е. при увеличении одного показателя второй статистически уменьшается. Чем ближе абсолютное значение коэффициента к 1, тем теснее связь между показателями.

Связь считается достаточно сильной, если коэффициент корреляции по абсолютной величине больше 0,7, и слабой, если меньше 0,4. Если значение коэффициента равно нулю, то связь между показателями отсутствует. Этот коэффициент дает объективную статистическую оценку тесноты связи между показателями.

Проанализируем связь между зависимой переменной Y и факторами:

r (Y;X1) = -0,950 561 029 — связь сильная и обратная, с увеличением пробега автомобиля, зависимая переменная Y, т. е. цена автомобиля уменьшается.

r (Y;X2) = 0,95 387 207 — сильная и прямая, с увеличением года выпуска автомобиля, его цена увеличивается.

r (Y;X3) = 0,74 541 927 — связь больше средней и прямая, с увеличением мощности двигателя автомобиля, его цена увеличивается.

r (Y;X4) = 0,52 197 113 — связь средняя и прямая, с увеличением объёма двигателя автомобиля, его цена увеличивается.

Проанализируем связь между факторами:

r (X1;X2) = -0,949 144 523 — связь между факторами X1 и X2 сильная и обратная.

r (X1;X3) = -0,734 488 215 — связь между факторами X1 и X3 средняя и обратная.

r (X1;X4) = -0,429 421 734 — связь между факторами X1 и X4 средняя и прямая

r (X2;X3) = 0,77 209 142 — связь между факторами X2 и X3 сильная и прямая.

r (X2;X4) = 0,45 203 331 — связь между факторами X2 и X4 средняя и обратная.

r (X3;X4) = 0,75 924 021 — связи между факторами X3 и X4 сильная и прямая.

2) Множественная регрессия Множественная регрессия — уравнение связи с несколькими независимыми переменными.

Действия для выполнения регрессионного анализа:

· Выбрать команду «Сервис — Анализ данных».

· Выберем инструмент Регрессия, а затем ОК.

· В поле Входной интервал У введем адрес значений У из заданной таблицы. В поле Входной интервал Х — адрес значений Х.

Таблица № 3

Регрессионная статистика

Множественный R

0,97 392 084

R-квадрат

0,948 521 803

Нормированный R-квадрат

0,940 285 292

Стандартная ошибка

78 880,02577

Наблюдения

Таблица № 4

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2,86614E+12

7,16536E+11

115,1 606 239

1,01022E-15

Остаток

1,55551E+11

Итого

3,0217E+12

Таблица № 5

Показатели качества модели

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

— 63 491 995,27

17 366 279,82

— 3,656 050 458

0,1 191 486

— 99 258 517,77

— 27 725 472,77

— 99 258 517,77

— 27 725 472,77

Переменная X 1

— 1,697 586 114

0,533 652 284

— 3,181 071 578

0,3 892 246

— 2,796 663 558

— 0,59 850 867

— 2,796 663 558

— 0,59 850 867

Переменная X 2

32 046,06567

8674,941 071

3,694 096 065

0,1 081 994

14 179,69024

49 912,4411

14 179,69024

49 912,4411

Переменная X 3

— 5085,609 336

2626,4833

— 1,936 280 857

0,64 216 372

— 10 494,95291

323,7 342 344

— 10 494,95291

323,7 342 344

Переменная X 4

428 928,5801

145 582,7861

2,946 286 382

0,6 867 326

129 095,222

728 761,9381

129 095,222

728 761,9381

Таблица № 6

Коэффициенты

Y-пересечение

— 63 491 995,27

Переменная X 1

— 1,697 586 114

Переменная X 2

32 046,06567

Переменная X 3

— 5085,609 336

Переменная X 4

428 928,5801

3) Уравнение множественной регрессии Уравнение множественной регрессии — метод определения зависимости среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. В отличие от чисто функциональной зависимости у = f (х), когда каждому значению независимой переменной х соответствует одно определенное значение величины у, при регрессионной связи одному и тому же значению х могут соответствовать в зависимости от случая различные значения величины у.

Y = a0 + a1*x1 + a2*x2 +…+ an*xn — уравнение множественной регрессии.

Уравнение будет иметь вид:

Yрасч= -63 491 995,27−1,697×1 +32 046,06567×2 -5085,609 336×3+428 928,5801x4

4) Критерий Фишера Критерий Фишера — (Значимость полученного уравнения) определение значимых различий между групповыми средними в установке дисперсионного анализа.

Фактическое значение F критерия Фишера = Fрасч =115,1 606 239

Таблица № 7

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2,86614E+12

7,16536E+11

115,1 606 239

1,01022E-15

Остаток

1,55551E+11

Итого

3,0217E+12

Рассчитываем Fкр «FРАСПОБР» с заданными условиями (0,05;4;26).

Fкр = 2,75 871 047

Fрасч > F кр

115,1 606 239> 2,75 871 047 — Вывод: уравнение регрессии значимо.

5) T — статистика — используем для проверки значимости параметров уравнения (критерий Стьюдента) Используем функцию «СТЬЮДРАСПОБР» с заданными условиями

(0,05/4;25).

Tкр = 2,691 557 635

Таблица № 8

t-статистика

t табл.(0,05/4;25)

— 3,181 071 578

<

2,691 557 635

Не значим

3,694 096 065

>

2,691 557 635

Значим

— 1,936 280 857

<

2,691 557 635

Не значим

2,946 286 382

>

2,691 557 635

Значим

По полученным параметрам оценки адекватности коэффициентов наиболее значимым показателем будет второй аргумент Х2 (пробег автомобиля) и X4 (объём двигателя).

Вывод: Наиболее важным фактором, влияющим да переменную Y (Цена автомобиля) является X2 (Год выпуска автомобиля) и X4 (объём двигателя) Таблица № 9

Регрессионная статистика

Множественный R

0,959 286 917

R-квадрат

0,92 023 139

Нормированный R-квадрат

0,914 322 604

Стандартная ошибка

94 484,27065

Наблюдения

Таблица № 10

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2,78066E+12

1,39033E+12

155,7 395 041

1,49531E-15

Остаток

2,41036E+11

Итого

3,0217E+12

Таблица № 11

Показатели качества модели

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

— 100 588 954,1

6 695 547,456

— 15,2 326 057

1,23959E-14

— 114 327 082,5

— 86 850 825,64

— 114 327 082,5

— 86 850 825,64

X2

50 270,40816

3394,951 729

14,80 739 998

1,75891E-14

43 304,54268

57 236,27364

43 304,54268

57 236,27364

X4

225 357,1429

120 347,3999

1,872 555 146

0,71 997 146

— 21 575,32192

472 289,6076

— 21 575,32192

472 289,6076

Уравнение будет иметь вид:

У расч = -100 588 954,1+ 50 270,40816×2 +225 357,1429x4

а2 > 0, то связь между результативным признаком У — ценой автомобиля и фактором Х2 — годом выпуска автомобиля прямая, если фактор Х2 увеличить на 1 год, то цена автомобиля увеличится на 50 270,40 руб.

а4 > 0, то связь между результативным признаком У — мощностью двигателя автомобиля и фактором Х4 — годом выпуска автомобиля прямая, если фактор Х2 увеличить на 1 л.с., то цена автомобиля увеличится на 225 357,14 руб.

6) Коэффициент детерминации Коэффициент детерминации — это доля объясненной дисперсии отклонений зависимой переменной от ее среднего значения. Зависимая переменная объясняется (прогнозируется) с помощью функции от объясняющих переменных. R2 коэффициент детерминации — показывает, какая доля дисперсии результативного признака объясняется влиянием объясняющих переменных.

Таблица № 12

Регрессионная статистика

Множественный R

0,959 286 917

R-квадрат

0,92 023 139

Нормированный R-квадрат

0,914 322 604

Стандартная ошибка

94 484,27065

Наблюдения

R2ху = (0,959 286 917)2 = 0,92 023 139

Данный показатель 0,92 023 139 или 92% говорит о том, что связь сильная. На долю вариации факторных признаков приходится большая часть по сравнению с неучтенными в модели факторами, влияющими на изменение результата. Вариация стоимости Цена автомобиля, (руб.) (Y) объясняется вариациями факторов: Год выпуска автомобиля (Х2) и объём двигателя автомобиля (X4)

7) Критерий Фишера Фактическое значение F критерия Фишера = Fрасч = 155,7 395 041

Таблица № 13

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2,78066E+12

1,39033E+12

155,7 395 041

1,49531E-15

Остаток

2,41036E+11

Итого

3,0217E+12

Рассчитываем Fкр «FРАСПОБР» с заданными условиями (0,05;2;27).

Fкр = 3,354 130 829

Fрасч > F кр

155,7 395 041> 3,354 130 829 — Вывод: уравнение регрессии значимо.

8) T — статистика Используем функцию «СТЬЮДРАСПОБР» с заданными условиями (0,05/2;27).

Tкр = 2,373 417 186

Таблица № 14

t-статистика

t табл.(0,05/3;27)

14,80 739 998

>

2,373 417 186

Значим

1,872 555 146

<

2,373 417 186

Не значим

Второй коэффициент не подтвердил свою значимость, тогда как первый очень значительный.

Уравнение будет иметь вид:

У расч = -100 588 954,1+ 50 270,40816х2

9) Средняя ошибка аппроксимации Средняя ошибка аппроксимации — среднее отклонение расчетных значений от фактических.

Таблица 15

Y

X2

Yрасч.

Ex

E2

(E-Eср)^2

(Et — Et-1)^2

E/Y

(Y-Yср)^2

302 791,9463

— 3 792

14 378 857

— 3791,946 308

;

— 0,12 682 095

1,08921E+11

196 503,7666

43 496

1 891 922 319

43 496,23339

3,52517E+18

0,181 234 306

302 791,9463

22 208

493 197 649

22 208,05369

1,95643E+18

0,68 332 473

1,05625E+11

302 791,9463

— 7 792

60 714 427

— 7791,946 308

1,87042E+17

— 0,26 413 377

834 232,8448

— 14 233

202 573 872

— 14 232,84482

2,01241E+16

— 0,17 357 128

6,724E+11

834 232,8448

35 767

1 279 289 390

35 767,15518

1,15932E+18

0,41 111 673

7,569E+11

834 232,8448

— 24 233

587 230 768

— 24 232,84482

4,78945E+17

— 0,29 917 092

6,561E+11

887 376,9347

— 59 377

3 525 620 370

— 59 376,93467

8,63413E+18

— 0,71 711 274

6,85584E+11

302 791,9463

22 208

493 197 649

22 208,05369

9,19559E+18

0,68 332 473

1,05625E+11

834 232,8448

64 767

4 194 784 391

64 767,15518

1,37017E+19

0,72 043 554

8,08201E+11

1 046 809,204

183 191

33 558 867 659

183 190,7958

8,62249E+20

0,148 935 606

1,5129E+12

1 046 809,204

53 191

2 829 260 756

53 190,79578

9,44309E+20

0,48 355 269

1,21E+12

834 232,8448

— 84 233

7 095 172 146

— 84 232,84482

1,8198E+19

— 0,11 231 046

5,625E+11

834 232,8448

— 4 233

17 916 975

— 4232,844 815

5,00875E+19

— 0,5 099 813

6,889E+11

302 791,9463

— 7 792

60 714 427

— 7791,946 308

1,83162E+15

— 0,26 413 377

993 665,1144

206 335

42 574 085 029

206 334,8856

1,80739E+21

0,171 945 738

1,44E+12

781 088,755

— 31 089

966 510 685

— 31 088,75496

1,73119E+21

— 0,41 451 673

5,625E+11

196 503,7666

38 496

1 481 959 985

38 496,23339

2,65688E+17

0,163 813 759

834 232,8448

— 34 233

1 171 887 664

— 34 232,84482

9,61448E+16

— 0,42 791 056

6,4E+11

993 665,1144

86 335

7 453 712 477

86 334,88563

3,94613E+19

0,79 939 709

1,1664E+12

993 665,1144

— 43 665

1 906 642 213

— 43 665,11437

3,077E+19

— 0,45 963 278

9,025E+11

621 656,4854

— 46 656

2 176 827 631

— 46 656,48541

7,30002E+16

— 0,81 141 714

3,30625E+11

887 376,9347

42 623

1 816 725 698

42 623,06533

1,29673E+17

0,45 831 253

8,649E+11

302 791,9463

— 97 792

9 563 264 763

— 97 791,94631

6,00089E+19

— 0,477 033 884

249 647,8565

70 352

4 949 424 101

70 352,14354

2,12875E+19

0,219 850 449

1,024E+11

302 791,9463

— 22 792

519 472 817

— 22 791,94631

1,96245E+19

— 0,81 399 808

781 088,755

— 23 089

533 090 606

— 23 088,75496

1,85444E+14

— 0,30 460 099

5,74564E+11

781 088,755

— 70 089

4 912 433 573

— 70 088,75496

1,91786E+19

— 0,98 577 714

5,05521E+11

887 376,9347

— 362 377

131 317 042 778

— 362 376,9347

1,59781E+22

— 0,69 024 178

2,75625E+11

196 503,7666

68 496

4 691 733 989

68 496,23339

1,6034E+22

0,258 476 352

19 500 000

272 339 655 664

37 655 270 478 505 700 000 000

0,32 276

15 716 216 291 363

Аппроксимация:

Е отн = 1,758 767 или 1%

Далее проверяем модель на наличие автокорреляции.

10) Автокорреляция Расчет коэффициентов для проверки наличия автокорреляция Таблица № 16

Y практ.

Y теор.

e=Yтеор-Yпракт

e (t)-e (t-1)

{e (t)-e (t-1)}^2

e2

— 43 496

— 47 288

— 22 208

— 35 767

— 50 000

— 22 208

— 81 585

— 64 767

— 42 559

— 183 191

— 118 424

— 53 191

— 80 000

— 206 335

— 214 127

— 38 496

— 69 585

— 86 335

— 120 568

— 42 623

— 89 280

— 70 352

— 168 144

— 68 496

— 430 873

Сумма

Автокорреляция

2,46 693 583

Критерий Дарбина-Уотсона определим по формуле:

Осуществим проверку автокорреляции и выполнение условия Дарбина Уотсона 1? DW? 4.

В данном случае DW ~ 2, автокорреляция отсутствует.

11) Гетероскедастичность Гетероскедастичность — различие дисперсионных случайных отклонений при различных значениях зависимой переменной. Гетероскедастичность характерна, в первую очередь, для перекрестных данных (относящихся к одному моменту времени, но к разным единицам наблюдения).

Тест Голдфельда — Куандта:

Таблица № 17

Модель

Пробег, тыс. км

Год выпуска

Y

X2

Таблица № 18

Первая половина регрессии

Модель

Пробег, тыс. км

Год выпуска

Y

X2

299 000,0000

1998,0000

240 000,0000

1996,0000

325 000,0000

1998,0000

295 000,0000

1998,0000

820 000,0000

2008,0000

870 000,0000

2008,0000

810 000,0000

2008,0000

828 000,0000

2009,0000

325 000,0000

1998,0000

899 000,0000

2008,0000

1 230 000,0000

2012,0000

Таблица № 19

Вторая половина регрессии

Модель

Пробег, тыс. км

Год выпуска

Y

X2

1 080 000,0000

2011,0000

950 000,0000

2011,0000

575 000,0000

2004,0000

930 000,0000

2009,0000

205 000,0000

1998,0000

320 000,0000

1997,0000

280 000,0000

1998,0000

758 000,0000

2007,0000

711 000,0000

2007,0000

525 000,0000

2009,0000

265 000,0000

1996,0000

Таблица № 20

Регрессионная статистика для первой половины регрессии

Множественный R

0,983 634 063

R-квадрат

0,96 753 597

Нормированный R-квадрат

0,963 928 855

Стандартная ошибка

64 618,57026

Наблюдения

Таблица № 21

Регрессионная статистика для второй половины регрессии

Регрессионная статистика

Множественный R

0,920 186 995

R-квадрат

0,846 744 106

Нормированный R-квадрат

0,829 715 673

Стандартная ошибка

127 482,0739

Наблюдения

Таблица № 22

Дисперсионный анализ для первой половины регрессии

df

SS

MS

F

Значимость F

Регрессия

1,12001E+12

1,12001E+12

268,2 299 056

5,24735E-08

Остаток

Итого

1,15759E+12

Таблица № 23

Дисперсионный анализ для второй половины регрессии

df

SS

MS

F

Значимость F

Регрессия

8,0812E+11

8,0812E+11

49,72 531 078

5,97533E-05

Остаток

1,46265E+11

Итого

9,54385E+11

Таблица № 24

Показатели качества модели для первой половины регрессии

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

— 111 103 852,3

6 822 394,553

— 16,2 851 696

5,51359E-08

X2

55 763,50328

3404,837 987

16,3 777 259

5,24735E-08

Таблица № 25

Показатели качества модели для второй половины регрессии

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

— 95 682 709,5

13 654 030,26

— 7,7 653 247

6,27155E-05

X2

48 038,6812

6812,434 243

7,516 176

5,97533E-05

Ряд остатков для первой половины регрессии:

E1 = У — У пересечение — Х2 пересечение * Х2

показатель корреляция регрессия матрица Ряд остатков для второй половины регрессии:

E2 = У — У пересечение — Х2 пересечение * Х2

Таблица 26

Е1

Е2

Е12

E22

— 12 627,20848

156 921,5992

39 899,79808

26 921,59917

724 772 501,8

13 372,79152

— 11 807,6324

139 420 182,9

— 16 627,20848

102 998,9616

276 464 061,9

— 49 262,24129

— 93 575,54517

737,7 587 077

69 463,13603

544 287,9108

— 59 262,24129

— 18 575,54517

345 050 878,4

— 97 025,74457

27 076,32399

733 127 320,7

13 372,79152

— 19 923,67601

396 952 865,8

29 737,75871

— 302 001,0384

137 683,7456

62 501,81724

Cумма

1,46265E+11

Fрасч

0,256 930 966

Fстат

5,117 355 008

0,256 930 966 < 5,117 355 008

Fрасч < Fстат

— гетероскедастичнойсть присутсвует Заключение Проведенный анализ обработанных данных по автомобилям Honda CR-V с пробегом за 11.08.2013 г. Позволяет сформулировать следующие выводы.

Связь между результативным признаком У — ценой автомобиля и фактором Х2 — год выпуска автомобиля прямая, если фактор Х2 увеличить на 1 год, то цена автомобиля увеличится на 50 270,40 руб.

Связь между результативным признаком У — мощностью двигателя автомобиля и фактором Х4 — годом выпуска автомобиля прямая, если фактор Х2 увеличить на 1 л.с., то цена автомобиля увеличится на 225 357,14 руб., но при дальнейшем анализе данный показатель не подтвердил своей значимости.

Так как R2у = 0,950 373 311 534 228, то связь с зависимой переманенной У с факторами включенными в модель очень тесная.

Коэффициент показывает долю вариации зависимой переменной У под влиянием факторов, включенным в модель. 95% изменения цены квартиры происходит под влиянием факторов включенный в модель.

По критерию Фишера модель множественной регрессии является точной (Fрасч > F кр) и значимой.

Для факторов Х2 имеет место гетероскедастичность.

Показать весь текст
Заполнить форму текущей работой