Помощь в написании студенческих работ
Антистрессовый сервис

Методика проведения парного корреляционно-регрессионного анализа

МетодичкаПомощь в написанииУзнать стоимостьмоей работы

Таким образом, вариация доля сельского населения на 4,8% зависит от вариации уровня денежных доходов населения, а на остальные (100%-4,8%) 95,2%? от вариации факторов, не включенных в модель. Средний коэффициент эластичности показывает, на сколько процентов в среднем изменится результат при изменении фактора на 1% и рассчитывается по формуле (для линейной функции): Для характеристики зависимости… Читать ещё >

Методика проведения парного корреляционно-регрессионного анализа (реферат, курсовая, диплом, контрольная)

линейная функция коэффициент эластичность кореляция

Методические указания к выполнению расчетно-графической работы содержат цели, задачи, теоретические положения, примеры определения параметров парной линейной регрессии и корреляции по формулам, а также с использованием табличного процессора Microsoft Excel, задания для самостоятельной работы студентов, позволяющие освоить и закрепить методику проведения парного корреляционно-регрессионного анализа, а также интерпретировать полученные результаты.

1. Теоретические положения

Цель выполнения расчетно-графической работы — овладеть навыками построения модели парной регрессии с использованием формул и табличного процессора MS Excel.

Уравнение парной линейной регрессии имеет вид:

(1)

где теоретическое значение результативного признака, найденное из уравнения регрессии;

независимая переменная (факторный признак);

параметры уравнения регрессии (а — экономического содержания не имеет; b — коэффициент регрессии);

случайная величина, характеризующая отклонения реального значения результативного признака от теоретического.

Параметры линейной регрессии оценивают с помощью метода наименьших квадратов (МНК).

Система нормальных уравнений МНК имеет вид:

(2)

где n — количество наблюдений.

Для решения системы можно воспользоваться готовыми формулами:

(3)

(4)

где ковариация признаков;

дисперсия признака х.

Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата при изменении фактора на одну единицу.

Тесноту связи изучаемых явлений характеризует коэффициент корреляции (r), который определяется по формуле:

. (5)

Коэффициент корреляции может принимать значения. Если, то связь между признаками прямая, если — связь обратная.

Для оценки тесноты связи используют шкалу Чэддока:

до 0,3 — связь отсутствует или очень слабая;

от 0,3 до 0,5 — связь слабая;

от 0,5 до 0,7 — связь умеренная;

от 0,7 до 1,0 — связь сильная.

Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции — коэффициент детерминации (), который показывает, на сколько процентов вариация результативного признака определяется вариацией факторов, включенных в модель.

Качество построенной модели оценивает также средняя ошибка аппроксимации — это среднее отклонение расчетных значений от фактических:

. (6)

Допустимый предел значений не более 8−10%.

Средний коэффициент эластичности показывает, на сколько процентов в среднем изменится результат при изменении фактора на 1% и рассчитывается по формуле (для линейной функции):

. (7)

Значимость уравнения регрессии в целом оценивается с помощью F-критерия Фишера, который определяется из соотношения значений факторной и остаточной дисперсии, рассчитанных на одну степень свободы:

(8)

где n — число единиц совокупности;

m — число параметров при переменных x.

Для оценки значимости уравнения регрессии Fфакт. сравнивается с Fтабл. при, ,. Если Fфакт. > Fтабл., то уравнение регрессии значимо, статистически надежно и может быть использовано для прогнозирования.

1.1 Решение задачи

По регионам Центрального федерального округа за 2008 год изучается зависимость доли сельского населения от величины среднедушевых денежных доходов населения. Исходные данные представлены в таблице 1.

Таблица 1.

Исходные данные для корреляционно-регрессионного анализа

Регионы

Доля сельского населения, %

Среднедушевой денежный доход, тыс. руб.

1 Белгородская область

33,6

12,8

2 Брянская область

31,4

3 Владимирская область

22,2

9,6

4 Воронежская область

36,7

10,3

5 Ивановская область

19,2

8,4

6 Калужская область

23,8

11,8

7 Костромская область

31,5

9,4

8 Курская область

35,8

11,4

9 Липецкая область

35,9

12,3

10 Московская область

19,2

19,8

11 Орловская область

35,6

9,8

12 Рязанская область

11,3

13 Смоленская область

28,3

11,5

14 Тамбовская область

11,3

15 Тверская область

25,7

10,9

16 Тульская область

11,4

17 Ярославская область

18,2

12,6

Задание:

1) Для характеристики зависимости среднего размера вклада физических лиц от величины среднедушевых денежных доходов населения рассчитать параметры линейной функции.

2) Определить средний коэффициент эластичности.

3) Рассчитать коэффициент корреляции.

4) Оценить значимость модели через показатель детерминации, среднюю ошибку аппроксимации и F-критерий Фишера.

5) С вероятностью 0,95 указать доверительный интервал ожидаемого значения величины вклада в предположении роста среднего дохода на душу населения на 10,0% от своего среднего уровня и найти доверительный интервал прогноза.

6) Проанализировать все рассчитанные показатели.

Решение:

1) Параметры a и b линейной регрессии рассчитываются с помощью метода наименьших квадратов. Для этого составим систему нормальных уравнений (2).

По исходным данным определим, ,, , в расчетной таблице 2.

Таблица 2

Расчет показателей парной линейной регрессии и корреляции

33,6

12,8

430,1

163,8

11,1

0,13

2,89

23,04

31,4

11,2

0,12

1,44

6,76

22,2

9,6

213,1

492,8

92,2

0,25

5,76

43,56

36,7

10,3

1346,9

106,1

10,8

0,05

0,25

62,41

19,2

8,4

161,3

368,6

70,6

12,2

0,45

14,44

92,16

23,8

11,8

280,8

566,4

139,2

11,9

0,01

0,01

31,5

9,4

296,1

992,3

88,4

11,2

0,19

3,24

7,29

35,8

11,4

408,1

1281,6

10,9

0,04

0,25

35,9

12,3

441,6

1288,8

151,3

10,9

0,11

1,96

50,41

19,2

19,8

380,2

368,6

12,2

0,38

57,76

92,16

35,6

9,8

348,9

1267,4

10,9

0,11

1,21

46,24

11,3

127,7

11,4

0,01

0,01

1,44

28,3

11,5

325,5

800,9

132,3

11,5

0,25

11,3

474,6

127,7

10,4

0,08

0,81

174,24

25,7

10,9

280,1

660,5

118,8

11,7

0,07

0,64

9,61

11,4

12,2

0,07

0,64

77,44

18,2

12,6

229,3

331,2

158,8

12,3

0,02

0,09

112,36

Итого

489,1

194,6

5528,7

2324,9

194,8

2,09

91,4

873,37

Среднее

28,8

11,4

325,2

879,1

136,8

11,5

0,12

5,4

51,4

1 — для упрощения расчетов исходные данные округлены до 0,0.

Система нормальных уравнений составит:

Решив систему, получим: a = 13,76; b = -0,08.

Уравнение линейной регрессии имеет вид:

.

Параметры уравнения можно определить и по следующим формулам:

= 11,4+0,063•28,8 = 13,21

Как видно, параметры a и b, рассчитанные двумя способами не совпадают. В дальнейшем при решении мы будем использовать значения параметров, полученные при решении системы нормальных уравнений.

Величина коэффициента регрессии b = -0,08 означает, что с ростом денежных доходов на 1 тыс. руб. величина вкладов уменьшиться в среднем на 0,08 тыс. руб. или на 80 руб.

2) Средний коэффициент эластичности для линейной регрессии находится по формуле:

— 0,2

При увеличении величины денежного дохода на 1%, величина вклада в среднем уменьшиться на 0,2%.

3) Линейный коэффициент парной корреляции (r) определяется по формуле:

где средние квадратические отклонения:

тогда =-0,22, значит связь между вкладами населения и уровнем денежных доходов обратная слабая или отсутствует.

4) Определим коэффициент детерминации:

.

Таким образом, вариация доля сельского населения на 4,8% зависит от вариации уровня денежных доходов населения, а на остальные (100%-4,8%) 95,2%? от вариации факторов, не включенных в модель.

Подставляя в уравнение регрессии фактические значения x, определим теоретические (расчетные) значения (таблица 2) и найдем величину средней ошибки аппроксимации ():

=.

Так как допустимый предел значений не более 8−10%, качество модели по данному показателю неудовлетворительное. Однако средняя ошибка аппроксимации не является главным критерием оценки значимости модели.

С помощью F?критерия Фишера оценим статистическую надежность результатов регрессионного моделирования:

Fфакт==.

Fтабл = 4,54 при .

Так как Fфакт < Fтабл, уравнение регрессии не значимо, статистически не надежно. Его нельзя использовать для прогнозирования.

Показать весь текст
Заполнить форму текущей работой