Прогноз заработной платы
Коэффициент детерминации позволяет сделать вывод о том, что гиперболическое уравнение вполне адекватно описывает зависимость между и (вариация на 92,34% объясняется влиянием показателя). Коэффициент детерминации позволяет сделать вывод о том, что показательное уравнение вполне адекватно описывает зависимость между и (вариация на 99,6% объясняется влиянием показателя). Таким образом, с увеличением… Читать ещё >
Прогноз заработной платы (реферат, курсовая, диплом, контрольная)
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ Воронежский филиал
(МИИТ) КОНТРОЛЬНАЯ РАБОТА по «Эконометрике»
Воронеж
— 2010;
Задание № 1
Вариант № 1
По данным таблицы 1.1 требуется:
1. Для характеристики зависимости рассчитать параметры следующих функций:
а) линейной;
б) степенной;
в) показательной;
г) равносторонней гиперболы.
2. Оценить каждую модель через среднюю ошибку аппроксимации и F-критерий Фишера.
Таблица 1.1
Номер региона | Расходы на покупку продовольственных товаров в общих расходах, %, Y | Среднедневная заработная плата одного работающего, руб., X | |
49,1 | 61,1 | ||
48,6 | 60,8 | ||
50,1 | 60,18 | ||
52,2 | 59,2 | ||
53,6 | 58,1 | ||
58,1 | 55,2 | ||
69,1 | 49,1 | ||
Решение:
а) В соответствии с методом наименьших квадратов уравнение линейной регрессии имеет вид:
где
— параметры уравнения парной линейной регрессии.
При этом
— эмпирический корреляционный момент случайных величин
среднее квадратическое отклонение случайной величины ,
дисперсия случайной величины ,
— выборочное среднее значение случайной величины ,
— выборочное среднее значение случайной величины ,
— выборочное среднее значение случайной величины ,
— выборочное среднее значение случайной величины ,
— объем выборки.
В нашем случае. Вычислим все необходимые суммы. Результаты расчетов представим в виде таблицы:
Таблица 1.2
Номер региона | ||||||
61,1 | 49,1 | 3000,01 | 3733,21 | 2410,81 | ||
60,8 | 48,6 | 2954,88 | 3696,64 | 2361,96 | ||
60,18 | 50,1 | 3015,018 | 3621,6324 | 2510,01 | ||
59,2 | 52,2 | 3090,24 | 3504,64 | 2724,84 | ||
58,1 | 53,6 | 3114,16 | 3375,61 | 2872,96 | ||
55,2 | 58,1 | 3207,12 | 3047,04 | 3375,61 | ||
49,1 | 69,1 | 3392,81 | 2410,81 | 4774,81 | ||
Итого | 403,68 | 380,8 | 21 774,238 | 23 389,5824 | ||
Среднее | 57,6686 | 54,4 | 3110,6054 | 3341,3689 | 3004,4286 | |
Получаем:
Тогда
Параметры линейного регрессионного уравнения:
Следовательно, уравнение линейной регрессии имеет вид:
Значит с увеличением на 1 уменьшается в среднем на 1,691.
Таким образом, с увеличением среднедневной заработной платы работающего на 1 руб. доля расходов на покупку продовольственных товаров (в общих расходах) снижается в среднем на 1,691%.
Найдем линейный коэффициент парной корреляции, являющийся мерой тесноты связи между переменными и. Для этого воспользуемся формулой:
где
Итак,
Значит линейный коэффициент парной корреляции:
Коэффициент корреляции характеризует зависимость от и меняется от -1 до 1.
По коэффициенту корреляции можно сделать вывод, что линейная связь между и обратная (так как) и весьма сильная, так как
Коэффициент детерминации позволяет сделать вывод о том, что линейное уравнение вполне адекватно описывает зависимость между и (вариация на 99,7% объясняется влиянием показателя).
Точность модели характеризуется величиной отклонения расчетных значений от фактических. Средняя относительная ошибка аппроксимации — среднее отклонение расчетных значений от фактических, определяется по формуле:
где
n — объем выборки,
значение регрессионной функции.
Составим расчетную таблицу:
Таблица 1.3
Номер региона | |||||||
61,1 | 49,1 | 48,5799 | 0,5201 | 0,10 592 668 | 0,10 592 668 | ||
60,8 | 48,6 | 49,0872 | — 0,4872 | — 0,1 002 469 | 0,1 002 469 | ||
60,18 | 50,1 | 50,13 562 | — 0,3 562 | — 0,71 098 | 0,71 098 | ||
59,2 | 52,2 | 51,7928 | 0,4072 | 0,7 800 766 | 0,7 800 766 | ||
58,1 | 53,6 | 53,6529 | — 0,0529 | — 0,98 694 | 0,98 694 | ||
55,2 | 58,1 | 58,5568 | — 0,4568 | — 0,786 231 | 0,786 231 | ||
49,1 | 69,1 | 68,8719 | 0,2281 | 0,3 301 013 | 0,3 301 013 | ||
Итого | 403,68 | 380,8 | 380,67 712 | 0,12 288 | 0,2 109 531 | 0,41 279 363 | |
В нашем случае Таким образом, в среднем расчетные значения линейной модели
отклоняются от фактических на 0,59%.
Проверим значимость с доверительной вероятностью (то есть на уровне значимости) с помощью критерия Фишера.
Наблюдаемое (фактическое) значение критерия Фишера определяется как
Критическое значение критерия Фишера определяется как
по таблице критических точек распределения Фишера — Снедекора, где
число степеней свободы большей дисперсии,
число степеней свободы меньшей дисперсии
(число факторных переменных, определяющих модель).
При гипотеза об отсутствии линейной связи (то есть о том, что) отклоняется, и соответственно коэффициент парной корреляции является значимым.
При гипотеза об отсутствии связи линейной верна, и соответственно коэффициент парной корреляции является незначимым.
В нашем случае
Оказалось, что, следовательно, гипотеза об отсутствии линейной связи неверна, и соответственно коэффициент парной корреляции
является значимым.
Таким образом, найденное линейное уравнение в целом довольно точно описывает зависимость между среднедневной заработной платой работающего и долей расходов на покупку продовольственных товаров (в общих расходах).
б) Найдем уравнение степенной регрессии:
Прологарифмируем обе части уравнения
После замены переменных получим линейную модель, то есть .
В соответствии с методом наименьших квадратов параметры уравнения линейной регрессии определим по формулам:
Вычислим все необходимые суммы. Результаты расчетов представим в виде таблицы:
Таблица 1.4
Номер региона | |||||||
61,1 | 49,1 | 4,112 511 866 | 3,893 859 035 | 16,1 354 149 | 16,91 275 385 | ||
60,8 | 48,6 | 4,107 589 789 | 3,883 623 531 | 15,95 233 236 | 16,87 229 387 | ||
60,18 | 50,1 | 4,97 340 071 | 3,914 021 008 | 16,3 707 512 | 16,78 819 566 | ||
59,2 | 52,2 | 4,80 921 542 | 3,955 082 495 | 16,14 038 135 | 16,65 392 063 | ||
58,1 | 53,6 | 4,62 165 664 | 3,981 549 068 | 16,17 371 191 | 16,50 118 988 | ||
55,2 | 58,1 | 4,10 962 953 | 4,62 165 664 | 16,29 319 599 | 16,8 782 381 | ||
49,1 | 69,1 | 3,893 859 035 | 4,235 554 731 | 16,49 265 306 | 15,16 213 818 | ||
Итого | 403,68 | 380,8 | 28,36 535 092 | 27,92 585 553 | 113,1 028 913 | 114,9 783 159 | |
Среднее | 57,6686 | 54,4 | 4,0522 | 3,9894 | 16,157 556 | 16,4255 | |
Получаем:
Тогда Параметры линейного регрессионного уравнения :
Соответственно параметры степенного регрессионного уравнения
Следовательно, уравнение степенной регрессии имеет вид:
Найдем коэффициент нелинейной парной корреляции (индекс корреляции) являющийся мерой тесноты связи между переменными и. Для этого воспользуемся формулой:
где
значение регрессионной функции в точке
Таблица 1.5
Номер региона | ||||||||
61,1 | 49,1 | 49,1 611 442 | — 0,611 442 | 0,3 738 614 | — 5,3 | 28,09 | ||
60,8 | 48,6 | 49,54 812 545 | — 0,94 812 545 | 0,898 941 861 | — 5,8 | 33,64 | ||
60,18 | 50,1 | 50,36 377 814 | — 0,26 377 814 | 0,69 578 905 | — 4,3 | 18,49 | ||
59,2 | 52,2 | 51,69 840 583 | 0,501 594 167 | 0,251 596 708 | — 2,2 | 4,84 | ||
58,1 | 53,6 | 53,26 636 385 | 0,333 636 146 | 0,111 313 078 | — 0,8 | 0,64 | ||
55,2 | 58,1 | 57,79 319 168 | 0,30 680 832 | 0,94 131 345 | 3,7 | 13,69 | ||
49,1 | 69,1 | 69,64 546 034 | — 0,54 546 034 | 0,29 752 698 | 14,7 | 216,09 | ||
Итого | 403,68 | 380,8 | 381,4 764 695 | — 0,67 646 949 | 1,72 682 749 | 1,42 109 | 315,48 | |
Среднее | 57,6686 | 54,4 | 54,4 966 385 | — 0,966 385 | 0,246 689 641 | 2,3 012 | 45,6 857 143 | |
Следовательно, индекс корреляции для степенной модели :
По индексу корреляции можно сделать вывод, что степенная связь между и весьма сильная, так как
Коэффициент детерминации позволяет сделать вывод о том, что степенное уравнение вполне адекватно описывает зависимость между и (вариация на 99,4% объясняется влиянием показателя).
Для нахождения средней относительной ошибки аппроксимации составим расчетную таблицу:
Таблица 1.6
Номер региона | |||||||
61,1 | 49,1 | 49,1 611 442 | — 0,611 442 | — 0,12 453 | 0,1 245 299 | ||
60,8 | 48,6 | 49,54 812 545 | — 0,94 812 545 | — 0,1 950 875 | 0,1 950 875 | ||
60,18 | 50,1 | 50,36 377 814 | — 0,26 377 814 | — 0,526 503 | 0,526 503 | ||
59,2 | 52,2 | 51,69 840 583 | 0,501 594 167 | 0,9 609 084 | 0,9 609 084 | ||
58,1 | 53,6 | 53,26 636 385 | 0,333 636 146 | 0,6 224 555 | 0,6 224 555 | ||
55,2 | 58,1 | 57,79 319 168 | 0,30 680 832 | 0,5 280 694 | 0,5 280 694 | ||
49,1 | 69,1 | 69,64 546 034 | — 0,54 546 034 | — 0,789 378 | 0,789 378 | ||
Итого | 403,68 | 380,8 | 381,4 764 695 | — 0,67 646 949 | — 0,12 798 536 | 0,55 027 201 | |
В нашем случае Таким образом, в среднем расчетные значения степенной модели
отклоняются от фактических на 0,786%.
Проверим значимость с доверительной вероятностью (то есть на уровне значимости) с помощью критерия Фишера.
Наблюдаемое (фактическое) значение критерия Фишера определяется как:
где число параметров при переменных ,
число наблюдений.
Критическое значение критерия Фишера определяется как
по таблице критических точек распределения Фишера — Снедекора, где
число степеней свободы большей дисперсии,
число степеней свободы меньшей дисперсии,
число параметров при переменных .
При гипотеза об отсутствии нелинейной связи (то есть о том, что) отклоняется, и соответственно индекс корреляции является значимым.
При гипотеза об отсутствии нелинейной связи верна, и соответственно индекс корреляции является незначимым.
В нашем случае
Оказалось, что следовательно, гипотеза об отсутствии нелинейной связи неверна, и соответственно индекс корреляции является значимым.
Таким образом, найденное степенное уравнение в целом довольно точно описывает зависимость между среднедневной заработной платой работающего и долей расходов на покупку продовольственных товаров (в общих расходах.) При этом характеристики степенной модели указывают, что она несколько хуже линейной функции описывает эту зависимость.
в) Найдем уравнение показательной (экспоненциальной) регрессии:
Прологарифмируем обе части уравнения
После замены, получим линейную модель, то есть
В соответствии с методом наименьших квадратов параметры уравнения линейной регрессии определим по формулам:
Вычислим все необходимые суммы. Результаты расчетов представим в виде таблицы:
Таблица 1.7
Номер региона | ||||||
61,1 | 49,1 | 3,893 859 035 | 237,914 787 | 3733,21 | ||
60,8 | 48,6 | 3,883 623 531 | 236,1 243 107 | 3696,64 | ||
60,18 | 50,1 | 3,914 021 008 | 235,5 457 843 | 3621,6324 | ||
59,2 | 52,2 | 3,955 082 495 | 234,1 408 837 | 3504,64 | ||
58,1 | 53,6 | 3,981 549 068 | 231,3 280 009 | 3375,61 | ||
55,2 | 58,1 | 4,62 165 664 | 224,2 315 446 | 3047,04 | ||
49,1 | 69,1 | 4,235 554 731 | 207,9 657 373 | 2410,81 | ||
Итого | 403,68 | 380,8 | 27,92 585 553 | 1607,251 048 | 23 389,5824 | |
Среднее | 57,6686 | 54,4 | 3,9894 | 229,6073 | 3341,3689 | |
Получаем:
Тогда Параметры линейного регрессионного уравнения
Соответственно параметры показательного регрессионного уравнения
Следовательно, уравнение показательной регрессии имеет вид:
то есть
Найдем коэффициент нелинейной парной корреляции (индекс корреляции) являющийся мерой тесноты связи между переменными и. Для этого воспользуемся формулой:
где значение регрессионной функции в точке
Таблица 1.8
Номер региона | ||||||||
61,1 | 49,1 | 48,9 800 375 | 0,119 962 497 | 0,14 391 001 | — 5,3 | 28,09 | ||
60,8 | 48,6 | 49,40 827 409 | — 0,80 827 409 | 0,653 307 009 | — 5,8 | 33,64 | ||
60,18 | 50,1 | 50,30 519 793 | — 0,20 519 793 | 0,42 106 191 | — 4,3 | 18,49 | ||
59,2 | 52,2 | 51,75 624 082 | 0,44 375 918 | 0,196 922 209 | — 2,2 | 4,84 | ||
58,1 | 53,6 | 53,43 487 723 | 0,16 512 277 | 0,27 265 529 | — 0,8 | 0,64 | ||
55,2 | 58,1 | 58,12 598 539 | — 0,2 598 539 | 0,675 241 | 3,7 | 13,69 | ||
49,1 | 69,1 | 69,38 121 864 | — 0,28 121 864 | 0,79 083 921 | 14,7 | 216,09 | ||
Итого | 403,68 | 380,8 | 381,3 918 316 | — 0,5 918 316 | 1,13 751 101 | 1,42 109 | 315,48 | |
Среднее | 57,6686 | 54,4 | 54,48 454 737 | — 0,8 454 737 | 0,144 821 586 | 2,3 012 | 45,6 857 143 | |
Следовательно, индекс корреляции для показательной модели
По индексу корреляции можно сделать вывод, что показательная связь между и весьма сильная, так как
Коэффициент детерминации позволяет сделать вывод о том, что показательное уравнение вполне адекватно описывает зависимость между и (вариация на 99,6% объясняется влиянием показателя).
Для нахождения средней относительной ошибки аппроксимации составим расчетную таблицу:
Таблица 1.9
Номер региона | |||||||
61,1 | 49,1 | 48,9 800 375 | 0,119 962 497 | 0,2 443 228 | 0,2 443 228 | ||
60,8 | 48,6 | 49,40 827 409 | — 0,80 827 409 | — 0,1 663 115 | 0,1 663 115 | ||
60,18 | 50,1 | 50,30 519 793 | — 0,20 519 793 | — 0,409 577 | 0,409 577 | ||
59,2 | 52,2 | 51,75 624 082 | 0,44 375 918 | 0,8 501 134 | 0,8 501 134 | ||
58,1 | 53,6 | 53,43 487 723 | 0,16 512 277 | 0,3 080 649 | 0,3 080 649 | ||
55,2 | 58,1 | 58,12 598 539 | — 0,2 598 539 | — 0,44 725 | 0,44 725 | ||
49,1 | 69,1 | 69,38 121 864 | — 0,28 121 864 | — 0,406 973 | 0,406 973 | ||
Итого | 403,68 | 380,8 | 381,3 918 316 | — 0,5 918 316 | — 0,11 218 898 | 0,39 268 919 | |
В нашем случае Таким образом, в среднем расчетные значения показательной модели отклоняются от фактических на 0,56%.
Проверим значимость с доверительной вероятностью (то есть на уровне значимости) с помощью критерия Фишера.
В нашем случае
Оказалось, что, следовательно, гипотеза об отсутствии нелинейной связи неверна, и соответственно индекс корреляции является значимым.
Таким образом, найденное показательное уравнение в целом довольно точно описывает зависимость между среднедневной заработной платой работающего и долей расходов на покупку продовольственных товаров (в общих расходах). При этом характеристики показательной модели указывают, что она с примерно той же точностью, что и линейная функция описывает эту зависимость.
г) Найдем уравнение гиперболической регрессии:
После замены получим линейную модель
В соответствии с методом наименьших квадратов параметры уравнения линейной регрессии определим по формулам:
Вычислим все необходимые суммы. Результаты расчетов представим в виде таблицы:
Таблица 1.10
Номер региона | ||||||
61,1 | 49,1 | 0,16 366 612 | 0,803 600 655 | 0,267 866 | ||
60,8 | 48,6 | 0,16 447 368 | 0,799 342 105 | 0,270 516 | ||
60,18 | 50,1 | 0,16 616 816 | 0,832 502 493 | 0,276 119 | ||
59,2 | 52,2 | 0,16 891 892 | 0,881 756 757 | 0,285 336 | ||
58,1 | 53,6 | 0,17 211 704 | 0,922 547 332 | 0,296 243 | ||
55,2 | 58,1 | 0,18 115 942 | 1,52 536 232 | 0,328 187 | ||
49,1 | 69,1 | 0,20 366 599 | 1,407 331 976 | 0,414 798 | ||
Итого | 403,68 | 380,8 | 0,122 016 933 | 6,699 617 549 | 0,2 139 065 | |
Среднее | 57,6686 | 54,4 | 0,0174 | 0,957 088 | 0,3 056 | |
Получаем:
Тогда Параметры линейного регрессионного уравнения
Соответственно параметры гиперболического регрессионного уравнения
Следовательно, параметры гиперболической регрессии имеет вид:
Найдем коэффициент нелинейной парной корреляции (индекс корреляции), являющийся мерой тесноты связи между переменными и Для этого воспользуемся формулой:
где значение регрессионной функции в точке
Таблица 1.11
Номер региона | ||||||||
61,1 | 49,1 | 50,5 710 311 | — 1,4 710 311 | 2,163 932 487 | — 5,3 | 28,09 | ||
60,8 | 48,6 | 50,87 039 474 | — 2,27 039 474 | 5,154 692 261 | — 5,8 | 33,64 | ||
60,18 | 50,1 | 51,49 853 772 | — 1,39 853 772 | 1,955 907 755 | — 4,3 | 18,49 | ||
59,2 | 52,2 | 52,51 824 324 | — 0,31 824 324 | 0,101 278 762 | — 2,2 | 4,84 | ||
58,1 | 53,6 | 53,70 378 657 | — 0,10 378 657 | 0,10 771 653 | — 0,8 | 0,64 | ||
55,2 | 58,1 | 57,557 971 | 1,44 202 899 | 1,90 359 693 | 3,7 | 13,69 | ||
49,1 | 69,1 | 65,39 898 167 | 3,70 101 833 | 13,69 753 668 | 14,7 | 216,09 | ||
Итого | 403,68 | 380,8 | 381,6 167 721 | — 0,81 677 214 | 24,17 447 929 | 1,42 109 | 315,48 | |
Среднее | 57,6686 | 54,4 | 54,51 668 173 | — 0,11 668 173 | 3,453 497 041 | 2,3 012 | 45,6 857 143 | |
Следовательно, индекс корреляции для гиперболической модели
По индексу корреляции можно сделать вывод, что гиперболическая связь между и весьма сильная, так как
Коэффициент детерминации позволяет сделать вывод о том, что гиперболическое уравнение вполне адекватно описывает зависимость между и (вариация на 92,34% объясняется влиянием показателя).
Для нахождения средней относительной ошибки аппроксимации составим расчетную таблицу:
Таблица 1.12
Номер региона | |||||||
61,1 | 49,1 | 50,5 710 311 | — 1,4 710 311 | — 0,299 599 | 0,299 599 | ||
60,8 | 48,6 | 50,87 039 474 | — 2,27 039 474 | — 0,4 671 594 | 0,4 671 594 | ||
60,18 | 50,1 | 51,49 853 772 | — 1,39 853 772 | — 0,2 791 492 | 0,2 791 492 | ||
59,2 | 52,2 | 52,51 824 324 | — 0,31 824 324 | — 0,609 661 | 0,609 661 | ||
58,1 | 53,6 | 53,70 378 657 | — 0,10 378 657 | — 0,193 632 | 0,193 632 | ||
55,2 | 58,1 | 57,557 971 | 1,44 202 899 | 0,17 972 511 | 0,17 972 511 | ||
49,1 | 69,1 | 65,39 898 167 | 3,70 101 833 | 0,53 560 323 | 0,53 560 323 | ||
Итого | 403,68 | 380,8 | 381,6 167 721 | — 0,81 677 214 | — 0,41 090 862 | 0,184 156 531 | |
В нашем случае
Таким образом, в среднем расчетные значения гиперболической модели отклоняются от фактических на 2,63%.
Проверим значимость с доверительной вероятностью (то есть на уровне значимости) с помощью критерия Фишера.
В нашем случае Оказалось, что, следовательно, гипотеза об отсутствии нелинейной связи неверна, и соответственно индекс корреляции является значимым.
Таким образом, найденное гиперболическое уравнение в целом довольно точно описывает зависимость между среднедневной заработной платой работающего и долей расходов на покупку продовольственных товаров (в общих расходах). При этом характеристики гиперболической модели указывают, что она несколько хуже линейной функции описывает эту зависимость.
Ответ: а) линейная модель
б) степенная модель
в) показательная модель
г) гиперболическая модель
все модели довольно точно описывает зависимость между среднедневной заработной платой работающего и долей расходов на покупку продовольственных товаров (в общих расходах); при этом самыми точными являются линейная модель и показательная модель
модель аппроксимация прогноз точность
Задание № 2
Вариант № 1
По данным таблицы 2.1 требуется:
1. Построить линейное уравнение парной регрессии от .
2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
3. Оценить статистическую значимость параметров регрессии и корреляции.
4. Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума, составляющем 107% от среднего уровня.
5. Оценить точность прогноза, рассчитать ошибку прогноза и его доверительный интервал.
Таблица 2.1
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного, руб., | Среднедневная заработная плата, руб., | |
Решение:
1) В соответствии с методом наименьших квадратов уравнение линейной регрессии имеет вид:
где
параметры уравнения парной линейной регрессии.
При этом
— эмпирический корреляционный момент случайных величин
среднее квадратическое отклонение случайной величины ,
дисперсия случайной величины ,
— выборочное среднее значение случайной величины ,
— выборочное среднее значение случайной величины ,
— выборочное среднее значение случайной величины ,
— выборочное среднее значение случайной величины ,
— объем выборки.
В нашем случае Вычислим все необходимые суммы. Результаты расчетов представим в виде таблицы:
Таблица 2.2
Номер региона | ||||||
Итого | ||||||
Среднее | 80,2 | 143,4 | 11 547,1 | 6486,2 | 20 617,8 | |
Получаем:
Тогда Параметры линейного регрессионного уравнения:
Следовательно, уравнение линейной регрессии имеет вид:. Значит с увеличением на 1 увеличивается в среднем на 0,857.
Таким образом, с увеличением среднедушевого прожиточного минимума в день на 1 руб. среднедневная заработная плата увеличивается в среднем на 0,857 руб.
2) Найдем линейный коэффициент парной корреляции, являющийся мерой тесноты связи между переменными и. Для этого воспользуемся формулой:
где среднее квадратическое отклонение случайной величины ,
дисперсия случайной величины ,
— выборочное среднее значение случайной величины .
Итак, Значит линейный коэффициент парной корреляции:
Коэффициент корреляции характеризует зависимость и и меняется от -1 до 1.
По коэффициенту корреляции можно сделать вывод, что линейная связь между и прямая (так как) и очень сильная, так как
Коэффициент детерминации позволяет сделать вывод о том, что линейной уравнение вполне адекватно описывает зависимость между и (вариация на 73,3% объясняется влиянием показателя).
Точность модели характеризуется величиной отклонения расчетных значений от фактических. Средняя относительная ошибка аппроксимации — среднее отклонение расчетных значений от фактических, определяется по формуле:
где объем выборки,
значение регрессионной функции в точке .
Составим расчетную таблицу:
Таблица 2.3
Номер региона | |||||||
135,5156 | — 4,5156 | — 0,3 447 023 | 0,3 447 023 | ||||
139,8006 | 2,1994 | 0,15 488 732 | 0,15 488 732 | ||||
144,0856 | — 8,0856 | — 0,5 945 294 | 0,5 945 294 | ||||
132,0876 | 1,9124 | 0,14 271 642 | 0,14 271 642 | ||||
142,3716 | — 1,3716 | — 0,972 766 | 0,972 766 | ||||
144,9426 | 4,0574 | 0,27 230 872 | 0,27 230 872 | ||||
150,0846 | 0,9154 | 0,6 062 252 | 0,6 062 252 | ||||
141,5146 | 5,4854 | 0,37 315 646 | 0,37 315 646 | ||||
150,9416 | — 0,9416 | — 0,627 733 | 0,627 733 | ||||
152,6556 | 0,3444 | 0,225 098 | 0,225 098 | ||||
Итого | — 0,7 308 038 | 0,212 548 288 | |||||
В нашем случае Таким образом, в среднем расчетные значения линейной модели
отклоняются от фактических на 2,1%.
3) Оценим статистическую значимость параметров регрессии и корреляции Проверим значимость с доверительной вероятностью (то есть на уровне значимости) с помощью критерия Фишера.
Наблюдаемое (фактическое) значение критерия Фишера определяется как:
Критическое значение критерия Фишера определяется как
по таблице критических точек распределения Фишера — Снедекора, где
число степеней свободы большей дисперсии,
число степеней свободы меньшей дисперсии,
(число факторных переменных, определяющих модель).
При гипотеза об отсутствии линейной связи (то есть о том, что) отклоняется, и соответственно коэффициент парной корреляции является значимым.
При гипотеза об отсутствии связи линейной верна, и соответственно коэффициент парной корреляции является незначимым.
В нашем случае Оказалось, что, следовательно, гипотеза об отсутствии линейной связи неверна, и соответственно коэффициент парной корреляции
является значимым.
Таким образом, найденное линейное уравнение в целом довольно точно описывает зависимость между среднедневной заработной платой и среднедушевым прожиточным минимумом в день.
Значимость параметра линейного уравнения парной регрессии проверим с помощью критерия Стьюдента.
Наблюдаемое (фактическое) значение критерия Стьюдента определяется как:
где число фактических наблюдений (в нашем случае);
значение регрессионной функции в точке .
Критическое значение критерия Стьюдента определяется как
по таблице критических точек распределения Стьюдента.
При гипотеза о равенстве нулю параметра линейного уравнения парной регрессии отклоняется, и соответственно параметр является значимым.
При параметр линейного уравнения парной регрессии является незначимым, его можно считать равным нулю.
Вычислим и
для чего составим расчетную таблицу:
Таблица 2.4
Номер региона | ||||||||
135,5156 | — 4,5156 | 20,39 064 336 | — 9,2 | 84,64 | ||||
139,8006 | 2,1994 | 4,83 736 036 | — 4,2 | 17,64 | ||||
144,0856 | — 8,0856 | 65,37 692 736 | 0,8 | 0,64 | ||||
132,0876 | 1,9124 | 3,65 727 376 | — 13,2 | 174,24 | ||||
142,3716 | — 1,3716 | 1,88 128 656 | — 1,2 | 1,44 | ||||
144,9426 | 4,0574 | 16,46 249 476 | 1,8 | 3,24 | ||||
150,0846 | 0,9154 | 0,83 795 716 | 7,8 | 60,84 | ||||
141,5146 | 5,4854 | 30,8 961 316 | — 2,2 | 4,84 | ||||
150,9416 | — 0,9416 | 0,88 661 056 | 8,8 | 77,44 | ||||
152,6556 | 0,3444 | 0,11 861 136 | 10,8 | 116,64 | ||||
Итого | 144,5388 | 541,6 | ||||||
Среднее | 80,2 | 143,4 | ||||||
Таким образом, В нашем случае Оказалось, что, следовательно, гипотеза о равенстве нулю параметра линейного уравнения парной регрессии отклоняется, и соответственно параметр является значимым.
Значимость параметра линейного уравнения парной регрессии также проверим с помощью критерия Стьюдента.
Наблюдаемое (фактическое) значение критерия Стьюдента определяется как:
где число фактических наблюдений (в нашем случае);
значение регрессионной функции в точке .
Критическое значение критерия Стьюдента определяется как
по таблице критических точек распределения Стьюдента.
При гипотеза о равенстве нулю параметра линейного уравнения парной регрессии отклоняется, и соответственно параметр является значимым.
При параметр линейного уравнения парной регрессии является незначимым, его можно считать равным нулю.
Ранее было найдено В нашем случае Оказалось, что, следовательно, параметр линейного уравнения парной регрессии является незначимым.
4) Выполним прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума, составляющем 107% от среднего уровня, то есть при Прогнозное значение заработной платы определим по регрессионному уравнению, подставив в него прогнозное значение среднедушевого прожиточного минимума:
5) Оценим точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
Определим доверительный интервал прогноза для уровня значимости
Средняя квадратическая ошибка прогноза находится по формуле:
где планируемая (прогнозируемая) величина среднедушевого прожиточного минимума (в нашем случае);
дисперсия отклонений фактических наблюдений от расчетных;
число фактических наблюдений (в нашем случае);
число нормальных уравнений, связывающих независимые наблюдения случайной величины (в нашем случае);
значение регрессионной функции в точке, то есть значение заработной платы, рассчитанное по регрессионному уравнению
.
В нашем случае Значит средняя квадратическая ошибка прогноза Предельная ошибка прогноза определяется по формуле:
где критическое значение критерия Стьюдента, определяется как по таблице критических точек распределения Стьюдента;
средняя квадратическая ошибка прогноза.
Следовательно, в нашем случае предельная ошибка прогноза
Значит, доверительный интервал прогноза:
Таким образом, с вероятностью можно утверждать, что если среднедушевой прожиточный минимум составит руб. (107% от среднего уровня), то среднедневная заработная плата будет заключена в пределах от 136,915 (руб.) до 159,507 (руб.).
Ответ:1)
2)
3) является значимым; параметр является незначимым, а параметр является значимым;
4)
5) с вероятностью ,
1. Елисеева И. И., Курышева С. В., Горденко Н. М. и др. Эконометрика/Под ред. И. И. Елисеевой. — М.: Изд-во «Финансы и статистика», 2001.
2. Доугерти К.
Введение
в эконометрику. — М.: Изд-во Финансы и статистика, 1999.
3. Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика: Начальный курс. — М.: Изд-во «Дело», 1998.