Линейное уравнение регрессии
Критическое значение коэффициента корреляции rкр = 0,2002. Это означает, что все коэффициенты корреляции, значения которых меньше rкр принимаются равными нулю, а связь между этими параметрами считается незначимой. Табличное значение F-критерия (Fкрит) при доверительной вероятности 0,95 при n1 = 8 и n2 = 58 составляет 2,10. Проверка гипотезы о значимости уравнения регрессии проводится на основании. Читать ещё >
Линейное уравнение регрессии (реферат, курсовая, диплом, контрольная)
Всероссийский заочный финансово-экономический институт Лабораторная работа по дисциплине «Эконометрика»
Брянск 2010
Задание В таблице 1 представлены данные о рынке строящегося жилья в Санкт-Петербурге (по состоянию на декабрь 1996 г.).
Таблица 1 — Исходные данные
№ п/п | Х1 | Х2 | Х3 | Х4 | Х5 | Х6 | Х7 | Х8 | У | |
8,2 | 15,9 | |||||||||
68,4 | 40,5 | 10,7 | ||||||||
34,8 | 10,7 | 13,5 | ||||||||
8,5 | 15,1 | |||||||||
54,7 | 10,7 | 21,1 | ||||||||
74,7 | 46,3 | 10,7 | 28,7 | |||||||
71,7 | 45,9 | 10,7 | 27,2 | |||||||
74,5 | 47,5 | 10,4 | 28,3 | |||||||
137,7 | 87,2 | 14,6 | 52,3 | |||||||
17,7 | ||||||||||
31,1 | ||||||||||
48,7 | ||||||||||
65,8 | ||||||||||
62,6 | 21,4 | 34,4 | ||||||||
45,3 | 20,6 | 10,4 | 24,7 | |||||||
56,4 | 29,7 | 9,4 | 30,8 | |||||||
17,8 | 8,3 | 15,9 | ||||||||
67,5 | 43,5 | 8,3 | ||||||||
17,8 | 8,3 | 15,4 | ||||||||
42,4 | 8,3 | 28,6 | ||||||||
8,3 | 15,6 | |||||||||
69,1 | 41,3 | 8,3 | 27,7 | |||||||
38,1 | 35,4 | 34,1 | ||||||||
75,3 | 41,4 | 12,1 | 37,7 | |||||||
83,7 | 48,5 | 12,1 | 41,9 | |||||||
48,7 | 22,3 | 12,4 | 24,4 | |||||||
39,9 | 8,1 | 21,3 | ||||||||
68,6 | 35,5 | 36,7 | ||||||||
9,2 | 21,5 | |||||||||
48,6 | 26,4 | |||||||||
53,9 | ||||||||||
68,5 | 30,7 | 8,3 | 34,2 | |||||||
71,1 | 36,2 | 13,3 | 35,6 | |||||||
7,4 | ||||||||||
93,2 | 49,5 | 46,6 | ||||||||
55,2 | 58,5 | |||||||||
10,2 | 24,2 | |||||||||
35,7 | ||||||||||
52,3 | 11,5 | 51,2 | ||||||||
89,6 | 75,9 | |||||||||
40,8 | 19,2 | 10,1 | 21,2 | |||||||
59,2 | 31,9 | 11,2 | 30,8 | |||||||
65,4 | 38,9 | 9,3 | ||||||||
60,2 | 36,3 | 10,9 | 31,9 | |||||||
82,2 | 49,7 | 13,8 | 43,6 | |||||||
98,4 | 52,3 | 15,3 | 52,2 | |||||||
76,7 | 44,7 | 43,1 | ||||||||
38,7 | 10,2 | |||||||||
56,4 | 32,7 | 10,1 | 35,2 | |||||||
76,7 | 44,7 | 40,8 | ||||||||
38,7 | 10,2 | 18,2 | ||||||||
41,5 | 10,2 | 20,1 | ||||||||
48,8 | 28,5 | 22,7 | ||||||||
57,4 | 33,5 | 10,1 | 27,6 | |||||||
76,7 | 44,7 | |||||||||
17,5 | 8,3 | 17,8 | ||||||||
30,5 | 8,3 | 25,9 | ||||||||
42,5 | 8,3 | 32,6 | ||||||||
40,5 | 19,8 | |||||||||
29,9 | ||||||||||
45,6 | 39,2 | |||||||||
21,2 | 11,2 | 22,4 | ||||||||
78,1 | 11,6 | 35,2 | ||||||||
91,6 | 53,8 | 41,2 | ||||||||
39,9 | 19,3 | 8,4 | 17,8 | |||||||
56,2 | 31,4 | 11,1 | ||||||||
79,1 | 42,4 | 15,5 | 35,2 | |||||||
91,6 | 55,2 | 9,4 | 40,8 | |||||||
Принятые в таблице обозначения:
Y — цена квартиры, тыс.долл.;
Х1 — число комнат в квартире;
Х2 — район города (1 — Приморский, Шувалово-Озерки, 2 — Гражданка, 3 — Юго-запад, 4 — Красносельский);
Х3 — общая площадь квартиры (м2);
Х4 — жилая площадь квартиры (м2);
Х5 — площадь кухни (м2);
Х6 — тип дома (1 — кирпичный, 0 — другой);
Х7 — наличие балкона (1 — есть, 0 — нет);
Х8 — число месяцев до окончания срока строительства.
1) Введите фиктивную переменную z, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы: квартиры на севере города (Приморский район, Шувалово-Озерки, Гражданка) и на юге города (Юго-запад, Красносельский район).
2) Составьте матрицу парных коэффициентов корреляции исходных переменных. Вместо переменной х2 используйте фиктивную переменную z.
3) Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов в линейной форме. Установите, какие факторы мультиколлинеарны.
4) Постройте модель у = f (х3, х6, х7, х8, z) в линейной форме. Какие факторы значимо воздействуют на формирование цены квартиры в этой модели?
5) Существует ли разница в ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга?
6) Оцените статистическую значимость параметров регрессионной модели с помощью t-критерия Стьюдента; нулевую гипотезу о значимости уравнения регрессии проверьте с помощью F-критерия Фишера; оцените качество уравнения регрессии с помощью коэффициента детерминации R2.
Решение
1) Введем фиктивную переменную Z вместо Х2, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы. Первые 47 квартир относятся к северной части города (Приморский район, Шувалово-Озерки, Гражданка), а оставшиеся 22 квартиры относятся к южной части города (Юго-запад, Красносельский район). Составим матрицу парных коэффициентов корреляции исходных переменных.
Х1 | Z | Х3 | Х4 | Х5 | Х6 | Х7 | Х8 | У | |
8,2 | 15,9 | ||||||||
68,4 | 40,5 | 10,7 | |||||||
34,8 | 10,7 | 13,5 | |||||||
8,5 | 15,1 | ||||||||
54,7 | 10,7 | 21,1 | |||||||
74,7 | 46,3 | 10,7 | 28,7 | ||||||
71,7 | 45,9 | 10,7 | 27,2 | ||||||
74,5 | 47,5 | 10,4 | 28,3 | ||||||
137,7 | 87,2 | 14,6 | 52,3 | ||||||
17,7 | |||||||||
31,1 | |||||||||
48,7 | |||||||||
65,8 | |||||||||
62,6 | 21,4 | 34,4 | |||||||
45,3 | 20,6 | 10,4 | 24,7 | ||||||
56,4 | 29,7 | 9,4 | 30,8 | ||||||
17,8 | 8,3 | 15,9 | |||||||
67,5 | 43,5 | 8,3 | |||||||
17,8 | 8,3 | 15,4 | |||||||
42,4 | 8,3 | 28,6 | |||||||
8,3 | 15,6 | ||||||||
69,1 | 41,3 | 8,3 | 27,7 | ||||||
38,1 | 35,4 | 34,1 | |||||||
75,3 | 41,4 | 12,1 | 37,7 | ||||||
83,7 | 48,5 | 12,1 | 41,9 | ||||||
48,7 | 22,3 | 12,4 | 24,4 | ||||||
39,9 | 8,1 | 21,3 | |||||||
68,6 | 35,5 | 36,7 | |||||||
9,2 | 21,5 | ||||||||
48,6 | 26,4 | ||||||||
53,9 | |||||||||
68,5 | 30,7 | 8,3 | 34,2 | ||||||
71,1 | 36,2 | 13,3 | 35,6 | ||||||
7,4 | |||||||||
93,2 | 49,5 | 46,6 | |||||||
55,2 | 58,5 | ||||||||
10,2 | 24,2 | ||||||||
35,7 | |||||||||
52,3 | 11,5 | 51,2 | |||||||
89,6 | 75,9 | ||||||||
40,8 | 19,2 | 10,1 | 21,2 | ||||||
59,2 | 31,9 | 11,2 | 30,8 | ||||||
65,4 | 38,9 | 9,3 | |||||||
60,2 | 36,3 | 10,9 | 31,9 | ||||||
82,2 | 49,7 | 13,8 | 43,6 | ||||||
98,4 | 52,3 | 15,3 | 52,2 | ||||||
76,7 | 44,7 | 43,1 | |||||||
38,7 | 10,2 | ||||||||
56,4 | 32,7 | 10,1 | 35,2 | ||||||
76,7 | 44,7 | 40,8 | |||||||
38,7 | 10,2 | 18,2 | |||||||
41,5 | 10,2 | 20,1 | |||||||
48,8 | 28,5 | 22,7 | |||||||
57,4 | 33,5 | 10,1 | 27,6 | ||||||
76,7 | 44,7 | ||||||||
17,5 | 8,3 | 17,8 | |||||||
30,5 | 8,3 | 25,9 | |||||||
42,5 | 8,3 | 32,6 | |||||||
40,5 | 19,8 | ||||||||
29,9 | |||||||||
45,6 | 39,2 | ||||||||
21,2 | 11,2 | 22,4 | |||||||
78,1 | 11,6 | 35,2 | |||||||
91,6 | 53,8 | 41,2 | |||||||
39,9 | 19,3 | 8,4 | 17,8 | ||||||
56,2 | 31,4 | 11,1 | |||||||
79,1 | 42,4 | 15,5 | 35,2 | ||||||
91,6 | 55,2 | 9,4 | 40,8 | ||||||
2) Проведем корреляционный анализ на выявление зависимости Y от представленных факторов в среде «СтатЭксперт» .
Протокол корреляционного анализа Главная цель анализа данных состоит в выявлении корреляционной связи зависимой переменной Y с независимыми переменными Хi, а также выявление независимых переменных, имеющих высокий уровень корреляции между собой.
Критическое значение коэффициента корреляции rкр = 0,2002. Это означает, что все коэффициенты корреляции, значения которых меньше rкр принимаются равными нулю, а связь между этими параметрами считается незначимой.
Влияние независимой переменной Х3, Х4, включенной в исследование, имеет высокий уровень (r > 0,7), причем это влияние положительно (rух3 = 0,872, rух4 = 0,917).
Х5 оказывает умеренное положительное влияние на величину Y (rух5 = 0,303).
Х1, Х2, Х6, Х7, Х8 не оказывают влияния на величину Y (rух2 = 0,010, rух6 = = -0,104, rух7 = 0,119, rух8 = -0,005).
3) Построим уравнение регрессии, характеризующее зависимость цены от всех факторов, в линейной форме.
Линейная регрессия Уравнение будет иметь вид:
у (х) = -0,505 — 0,966х1 + 0,824х2 + 0,390х3 + 0,191х4 + 0,091х5 + 5,835х6 + 1,244х7 — 0,011х8
Линейная или близкая к ней связь между факторами называется мультиколлинеарностью. Считают явление мультиколлинеарности в исходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0,7.
Рассмотрим матрицу парных коэффициентов корреляции между факторами Хj, включенными в дальнейшем анализ.
Матрица парных корреляций Явление сильной коллинеарности наблюдается между факторами:
Х1 и Х3, т.к. rх1х3 = 0,872 > 0,7
Х1 и Х4, т.к. rх1х4 = 0,917 > 0,7
Х3 и Х4, т.к. rх3х4 = 0,966 > 0,7
4) Построим модель у = f (х3, х6, х7, х8, z) в линейной форме.
Результаты регрессионного анализа Модель в линейной форме будет иметь вид:
у (х) = -5,64 + 0,715х2 + 0,475х3 + 6,786х6 + 1,284х7 — 0,037х8
Х6 (тип дома), значимо воздействует на формирование цены квартиры в модели.
5) Оценим статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения регрессии проверим с помощью F-критерия; оценим качество уравнения регрессии с помощью коэффициента детерминации R2.
Характеристика остатков линейной регрессии
Характеристика | Значение | |
Среднее значение | 0,000 | |
Дисперсия | 10,579 | |
Приведенная дисперсия | 12,220 | |
Средний модуль остатков | 2,237 | |
Относительная ошибка | 7,144 | |
Критерий Дарбина-Уотсона | 1,154 | |
Коэффициент детерминации | 0,991 | |
F — значение (n1 = 8, n2 = 58) | 764,697 | |
Критерий адекватности | 36,993 | |
Критерий точности | 47,492 | |
Критерий качества | 44,867 | |
Уравнение значимо с вероятностью 0.95 | ||
Коэффициент детерминации показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 99,1% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
Табличное значение F-критерия (Fкрит) при доверительной вероятности 0,95 при n1 = 8 и n2 = 58 составляет 2,10. Проверка гипотезы о значимости уравнения регрессии проводится на основании:
если Fфакт > Fкрит, то модель статистически значима;
если Fфакт < Fкрит, то модель статистически незначима.
Fфакт > Fкрит, значит модель статистически значима, т. е. пригодна к использованию.
Оценим с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения регрессии.
Табличное значение t-критерия при 5% уровне значимости и степени свободы k = 69−8-1 = 60 составляет 2,0003.
Если tрасч > tтабл, то коэффициент статистически значим.
Характеристика модели
Коэффициенты | Стандартная ошибка | t-статистика | ||
Y-пересечение | — 6,10 491 | 1,867 676 003 | — 3,268 720 937 | |
Переменная Х 1 | — 0,16 426 | 1,96 321 271 | — 0,149 825 399 | |
Переменная Х 2 | 0,744 173 | 0,335 026 167 | 2,221 237 839 | |
Переменная Х 3 | 0,36 827 | 0,92 869 614 | 3,965 447 278 | |
Переменная Х 4 | 0,147 869 | 0,132 602 783 | 1,115 126 788 | |
Переменная Х 5 | 0,177 213 | 0,195 399 452 | 0,906 925 347 | |
Переменная Х 6 | 6,93 635 | 0,869 661 345 | 7,975 921 084 | |
Переменная Х 7 | 1,777 648 | 1,124 095 736 | 1,581 402 513 | |
Переменная Х 8 | — 0,4 802 | 0,72 432 334 | — 0,662 966 567 | |
tb0 = 3,2687 > 2,0003 => коэффициент регрессии b0 статистически значим;
tb1 = 0,1498 < 2,0003 => коэффициент регрессии b0 статистически незначим;
tb2 = 2,2212 > 2,0003 => коэффициент регрессии b0 статистически значим;
tb3 = 3,9654 > 2,0003 => коэффициент регрессии b0 статистически значим;
tb4 = 1,1151 < 2,0003 => коэффициент регрессии b0 статистически незначим;
tb5 = 0,9069 < 2,0003 => коэффициент регрессии b0 статистически незначим;
tb6 = 7,9759 > 2,0003 => коэффициент регрессии b0 статистически значим;
tb7 = 1,5814 < 2,0003 => коэффициент регрессии b0 статистически незначим;
tb7 = 0,6630 < 2,0003 => коэффициент регрессии b0 статистически незначим;
6) существует ли разница в ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга?
tb2 = 2,2212 > 2,0003, tb3 = 3,9654 > 2,0003 и tb6 = 7,9759 > 2,0003,
значит факторы Х2 (район города), Х3 (общая площадь квартиры) и Х6 (тип дома) значимо влияют на формирование цен на квартиры.
Анализ показал, что разница в ценах на квартиры, расположенные в северной и южной частях Санкт-Петербурга существенна, т.к. tb2 = 2,2212 > 2,0003.