Помощь в написании студенческих работ
Антистрессовый сервис

Линейное уравнение регрессии

Лабораторная работаПомощь в написанииУзнать стоимостьмоей работы

Критическое значение коэффициента корреляции rкр = 0,2002. Это означает, что все коэффициенты корреляции, значения которых меньше rкр принимаются равными нулю, а связь между этими параметрами считается незначимой. Табличное значение F-критерия (Fкрит) при доверительной вероятности 0,95 при n1 = 8 и n2 = 58 составляет 2,10. Проверка гипотезы о значимости уравнения регрессии проводится на основании. Читать ещё >

Линейное уравнение регрессии (реферат, курсовая, диплом, контрольная)

Всероссийский заочный финансово-экономический институт Лабораторная работа по дисциплине «Эконометрика»

Брянск 2010

Задание В таблице 1 представлены данные о рынке строящегося жилья в Санкт-Петербурге (по состоянию на декабрь 1996 г.).

Таблица 1 — Исходные данные

№ п/п

Х1

Х2

Х3

Х4

Х5

Х6

Х7

Х8

У

8,2

15,9

68,4

40,5

10,7

34,8

10,7

13,5

8,5

15,1

54,7

10,7

21,1

74,7

46,3

10,7

28,7

71,7

45,9

10,7

27,2

74,5

47,5

10,4

28,3

137,7

87,2

14,6

52,3

17,7

31,1

48,7

65,8

62,6

21,4

34,4

45,3

20,6

10,4

24,7

56,4

29,7

9,4

30,8

17,8

8,3

15,9

67,5

43,5

8,3

17,8

8,3

15,4

42,4

8,3

28,6

8,3

15,6

69,1

41,3

8,3

27,7

38,1

35,4

34,1

75,3

41,4

12,1

37,7

83,7

48,5

12,1

41,9

48,7

22,3

12,4

24,4

39,9

8,1

21,3

68,6

35,5

36,7

9,2

21,5

48,6

26,4

53,9

68,5

30,7

8,3

34,2

71,1

36,2

13,3

35,6

7,4

93,2

49,5

46,6

55,2

58,5

10,2

24,2

35,7

52,3

11,5

51,2

89,6

75,9

40,8

19,2

10,1

21,2

59,2

31,9

11,2

30,8

65,4

38,9

9,3

60,2

36,3

10,9

31,9

82,2

49,7

13,8

43,6

98,4

52,3

15,3

52,2

76,7

44,7

43,1

38,7

10,2

56,4

32,7

10,1

35,2

76,7

44,7

40,8

38,7

10,2

18,2

41,5

10,2

20,1

48,8

28,5

22,7

57,4

33,5

10,1

27,6

76,7

44,7

17,5

8,3

17,8

30,5

8,3

25,9

42,5

8,3

32,6

40,5

19,8

29,9

45,6

39,2

21,2

11,2

22,4

78,1

11,6

35,2

91,6

53,8

41,2

39,9

19,3

8,4

17,8

56,2

31,4

11,1

79,1

42,4

15,5

35,2

91,6

55,2

9,4

40,8

Принятые в таблице обозначения:

Y — цена квартиры, тыс.долл.;

Х1 — число комнат в квартире;

Х2 — район города (1 — Приморский, Шувалово-Озерки, 2 — Гражданка, 3 — Юго-запад, 4 — Красносельский);

Х3 — общая площадь квартиры (м2);

Х4 — жилая площадь квартиры (м2);

Х5 — площадь кухни (м2);

Х6 — тип дома (1 — кирпичный, 0 — другой);

Х7 — наличие балкона (1 — есть, 0 — нет);

Х8 — число месяцев до окончания срока строительства.

1) Введите фиктивную переменную z, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы: квартиры на севере города (Приморский район, Шувалово-Озерки, Гражданка) и на юге города (Юго-запад, Красносельский район).

2) Составьте матрицу парных коэффициентов корреляции исходных переменных. Вместо переменной х2 используйте фиктивную переменную z.

3) Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов в линейной форме. Установите, какие факторы мультиколлинеарны.

4) Постройте модель у = f (х3, х6, х7, х8, z) в линейной форме. Какие факторы значимо воздействуют на формирование цены квартиры в этой модели?

5) Существует ли разница в ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга?

6) Оцените статистическую значимость параметров регрессионной модели с помощью t-критерия Стьюдента; нулевую гипотезу о значимости уравнения регрессии проверьте с помощью F-критерия Фишера; оцените качество уравнения регрессии с помощью коэффициента детерминации R2.

Решение

1) Введем фиктивную переменную Z вместо Х2, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы. Первые 47 квартир относятся к северной части города (Приморский район, Шувалово-Озерки, Гражданка), а оставшиеся 22 квартиры относятся к южной части города (Юго-запад, Красносельский район). Составим матрицу парных коэффициентов корреляции исходных переменных.

Х1

Z

Х3

Х4

Х5

Х6

Х7

Х8

У

8,2

15,9

68,4

40,5

10,7

34,8

10,7

13,5

8,5

15,1

54,7

10,7

21,1

74,7

46,3

10,7

28,7

71,7

45,9

10,7

27,2

74,5

47,5

10,4

28,3

137,7

87,2

14,6

52,3

17,7

31,1

48,7

65,8

62,6

21,4

34,4

45,3

20,6

10,4

24,7

56,4

29,7

9,4

30,8

17,8

8,3

15,9

67,5

43,5

8,3

17,8

8,3

15,4

42,4

8,3

28,6

8,3

15,6

69,1

41,3

8,3

27,7

38,1

35,4

34,1

75,3

41,4

12,1

37,7

83,7

48,5

12,1

41,9

48,7

22,3

12,4

24,4

39,9

8,1

21,3

68,6

35,5

36,7

9,2

21,5

48,6

26,4

53,9

68,5

30,7

8,3

34,2

71,1

36,2

13,3

35,6

7,4

93,2

49,5

46,6

55,2

58,5

10,2

24,2

35,7

52,3

11,5

51,2

89,6

75,9

40,8

19,2

10,1

21,2

59,2

31,9

11,2

30,8

65,4

38,9

9,3

60,2

36,3

10,9

31,9

82,2

49,7

13,8

43,6

98,4

52,3

15,3

52,2

76,7

44,7

43,1

38,7

10,2

56,4

32,7

10,1

35,2

76,7

44,7

40,8

38,7

10,2

18,2

41,5

10,2

20,1

48,8

28,5

22,7

57,4

33,5

10,1

27,6

76,7

44,7

17,5

8,3

17,8

30,5

8,3

25,9

42,5

8,3

32,6

40,5

19,8

29,9

45,6

39,2

21,2

11,2

22,4

78,1

11,6

35,2

91,6

53,8

41,2

39,9

19,3

8,4

17,8

56,2

31,4

11,1

79,1

42,4

15,5

35,2

91,6

55,2

9,4

40,8

2) Проведем корреляционный анализ на выявление зависимости Y от представленных факторов в среде «СтатЭксперт» .

Протокол корреляционного анализа Главная цель анализа данных состоит в выявлении корреляционной связи зависимой переменной Y с независимыми переменными Хi, а также выявление независимых переменных, имеющих высокий уровень корреляции между собой.

Критическое значение коэффициента корреляции rкр = 0,2002. Это означает, что все коэффициенты корреляции, значения которых меньше rкр принимаются равными нулю, а связь между этими параметрами считается незначимой.

Влияние независимой переменной Х3, Х4, включенной в исследование, имеет высокий уровень (r > 0,7), причем это влияние положительно (rух3 = 0,872, rух4 = 0,917).

Х5 оказывает умеренное положительное влияние на величину Y (rух5 = 0,303).

Х1, Х2, Х6, Х7, Х8 не оказывают влияния на величину Y (rух2 = 0,010, rух6 = = -0,104, rух7 = 0,119, rух8 = -0,005).

3) Построим уравнение регрессии, характеризующее зависимость цены от всех факторов, в линейной форме.

Линейная регрессия Уравнение будет иметь вид:

у (х) = -0,505 — 0,966х1 + 0,824х2 + 0,390х3 + 0,191х4 + 0,091х5 + 5,835х6 + 1,244х7 — 0,011х8

Линейная или близкая к ней связь между факторами называется мультиколлинеарностью. Считают явление мультиколлинеарности в исходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0,7.

Рассмотрим матрицу парных коэффициентов корреляции между факторами Хj, включенными в дальнейшем анализ.

Матрица парных корреляций Явление сильной коллинеарности наблюдается между факторами:

Х1 и Х3, т.к. rх1х3 = 0,872 > 0,7

Х1 и Х4, т.к. rх1х4 = 0,917 > 0,7

Х3 и Х4, т.к. rх3х4 = 0,966 > 0,7

4) Построим модель у = f (х3, х6, х7, х8, z) в линейной форме.

Результаты регрессионного анализа Модель в линейной форме будет иметь вид:

у (х) = -5,64 + 0,715х2 + 0,475х3 + 6,786х6 + 1,284х7 — 0,037х8

Х6 (тип дома), значимо воздействует на формирование цены квартиры в модели.

5) Оценим статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения регрессии проверим с помощью F-критерия; оценим качество уравнения регрессии с помощью коэффициента детерминации R2.

Характеристика остатков линейной регрессии

Характеристика

Значение

Среднее значение

0,000

Дисперсия

10,579

Приведенная дисперсия

12,220

Средний модуль остатков

2,237

Относительная ошибка

7,144

Критерий Дарбина-Уотсона

1,154

Коэффициент детерминации

0,991

F — значение (n1 = 8, n2 = 58)

764,697

Критерий адекватности

36,993

Критерий точности

47,492

Критерий качества

44,867

Уравнение значимо с вероятностью 0.95

Коэффициент детерминации показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 99,1% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.

Табличное значение F-критерия (Fкрит) при доверительной вероятности 0,95 при n1 = 8 и n2 = 58 составляет 2,10. Проверка гипотезы о значимости уравнения регрессии проводится на основании:

если Fфакт > Fкрит, то модель статистически значима;

если Fфакт < Fкрит, то модель статистически незначима.

Fфакт > Fкрит, значит модель статистически значима, т. е. пригодна к использованию.

Оценим с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения регрессии.

Табличное значение t-критерия при 5% уровне значимости и степени свободы k = 69−8-1 = 60 составляет 2,0003.

Если tрасч > tтабл, то коэффициент статистически значим.

Характеристика модели

Коэффициенты

Стандартная ошибка

t-статистика

Y-пересечение

— 6,10 491

1,867 676 003

— 3,268 720 937

Переменная Х 1

— 0,16 426

1,96 321 271

— 0,149 825 399

Переменная Х 2

0,744 173

0,335 026 167

2,221 237 839

Переменная Х 3

0,36 827

0,92 869 614

3,965 447 278

Переменная Х 4

0,147 869

0,132 602 783

1,115 126 788

Переменная Х 5

0,177 213

0,195 399 452

0,906 925 347

Переменная Х 6

6,93 635

0,869 661 345

7,975 921 084

Переменная Х 7

1,777 648

1,124 095 736

1,581 402 513

Переменная Х 8

— 0,4 802

0,72 432 334

— 0,662 966 567

tb0 = 3,2687 > 2,0003 => коэффициент регрессии b0 статистически значим;

tb1 = 0,1498 < 2,0003 => коэффициент регрессии b0 статистически незначим;

tb2 = 2,2212 > 2,0003 => коэффициент регрессии b0 статистически значим;

tb3 = 3,9654 > 2,0003 => коэффициент регрессии b0 статистически значим;

tb4 = 1,1151 < 2,0003 => коэффициент регрессии b0 статистически незначим;

tb5 = 0,9069 < 2,0003 => коэффициент регрессии b0 статистически незначим;

tb6 = 7,9759 > 2,0003 => коэффициент регрессии b0 статистически значим;

tb7 = 1,5814 < 2,0003 => коэффициент регрессии b0 статистически незначим;

tb7 = 0,6630 < 2,0003 => коэффициент регрессии b0 статистически незначим;

6) существует ли разница в ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга?

tb2 = 2,2212 > 2,0003, tb3 = 3,9654 > 2,0003 и tb6 = 7,9759 > 2,0003,

значит факторы Х2 (район города), Х3 (общая площадь квартиры) и Х6 (тип дома) значимо влияют на формирование цен на квартиры.

Анализ показал, что разница в ценах на квартиры, расположенные в северной и южной частях Санкт-Петербурга существенна, т.к. tb2 = 2,2212 > 2,0003.

Показать весь текст
Заполнить форму текущей работой