Помощь в написании студенческих работ
Антистрессовый сервис

Прикладная статистика и основы эконометрики

КонтрольнаяПомощь в написанииУзнать стоимостьмоей работы

Оцените статистическую значимость уравнения множественной регрессии. Какие факторы значимо воздействуют на формирование средней продолжительности жизни в этом уравнении? Оценим статистическую значимость уравнения множественной регрессии. Какие факторы значимо воздействуют на формирование средней продолжительности жизни в этом уравнении? Так как расчетные значения коэффициентов t, меньше чем… Читать ещё >

Прикладная статистика и основы эконометрики (реферат, курсовая, диплом, контрольная)

Задача 16

Зависимость меду величинами x и y описывается функцией y = f (x, a, b), где a и b — неизвестные параметры. Найти эти параметры, сведя исходную задачу к линейной задаче метода наименьших квадратов (Линейной регрессии).

Х

Y

0,5

1,9813

0,6

2,2809

0,7

2,3182

0,8

2,8358

0,9

2,8962

3,2425

1,1

3,9918

1,2

4,6459

1,3

6,0938

1,4

7,6587

1,5

10,8872

Оценить полученную точность аппроксимации.

Решение.

Сведем исходную задачу к линейной задаче МНК, для этого сделаем подходящую замену переменных.

Так как исходная зависимость имеет вид, то прологарифмировав исходное неравенство и введя новые переменные:

t = х3; A = lna; lny = s

Получаем задачу об определении коэффициентов линейной зависимости s = A + bt.

Рассчитаем параметры A и b уравнения линейной регрессии s = A + b· t. Для расчетов заполним таблицу.

№п/п

Х

Y

t

s

st

t2

0,5

1,9813

0,125

0,684

0,085

0,016

2,139 099

0,79 644

0,6

2,2809

0,216

0,825

0,178

0,047

2,238 269

0,18 691

0,7

2,3182

0,343

0,841

0,288

0,118

2,384 403

0,28 558

0,8

2,8358

0,512

1,042

0,534

0,262

2,593 766

0,8 535

0,9

2,8962

0,729

1,063

0,775

0,531

2,889 769

0,222

3,2425

1,176

1,176

1,000

3,307 309

0,19 987

1,1

3,9918

1,331

1,384

1,842

1,772

3,899 985

0,23 001

1,2

4,6459

1,728

1,536

2,654

2,986

4,752 538

0,22 953

1,3

6,0938

2,197

1,807

3,971

4,827

6,2 888

0,14 919

1,4

7,6587

2,744

2,036

5,586

7,530

7,882 513

0,29 223

1,5

10,887

3,375

2,388

8,058

11,391

10,79 286

0,8 665

Итого

48,832

14,3

14,782

25,149

30,478

0,333

Среднее

4,439

1,3

1,344

2,286

2,771

— линейное уравнение регрессии

Можно было воспользоваться MS Excel, Анализ данных — Регрессия

.

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,997 054

R-квадрат

0,994 116

Нормированный R-квадрат

0,993 462

Стандартная ошибка

0,44 122

Наблюдения

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2,960 104

2,960 104

1520,53

2,38E-11

Остаток

0,17 521

0,1 947

Итого

2,977 625

Коэффициен-ты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

0,695 131

0,21 301

32,63 388

1,17E-10

0,646 945

0,743 317

Переменная X 1

0,498 998

0,12 797

38,99 398

2,38E-11

0,470 049

0,527 946

Перейдем обратно к начальным данным:

A = lna; следовательно,

Получим:

Оценим полученную точность аппроксимации.

Так как полученная точность менее 5%, то модель достаточно точная.

Задача 2.16. Построение однофакторной регрессии Имеются данные по цене некоторого блага (Х) и количеству (Y) данного блага, приобретаемого домохозяйством ежемесячно в течении года.

Предполагается, что генеральное уравнение регрессии — линейное.

Цена, Х

Приобретаемое количество, Y

1. Найти оценки коэффициентов регрессии b0 и b1.

2. С надежностью 0,9 определить интервальные оценки теоретических коэффициентов регрессии.

3. Определить коэффициент детерминации и сделать соответствующие выводы о качестве уравнения регрессии.

4. С доверительной вероятностью 0,05 определить интервальную оценку условного математического ожидания Y при Х = 23.

Решение.

Найти оценки коэффициентов регрессии b0 и b1.

Генеральное уравнение регрессии — линейное: .

№ п/п

X

Y

Х2

XY

Итого

Среднее

74,28 571

1632,143

2. С надежностью 0,9 определим интервальные оценки теоретических коэффициентов регрессии.

Для уровня значимости =0,1 и числа степеней свободы k = n — 2 = 7 — 2 = = 5 критерий Стьюдента равен .

Дисперсии средние квадратичные отклонения коэффициентов и уравнения регрессии определим из равенств:

Для определения математической значимости коэффициентов b0 и b1 найдем t — статистику Стьюдента:

;

Сравнение расчетных и табличных величин критерия Стьюдента показывает, что или и или 9,987 > 2,5706, т. е. с надежностью 0,9 оценка b0 теоретического коэффициента регрессии 0 значима, оценка b1 теоретического коэффициента регрессии 1 значима.

Доверительные интервалы для этих коэффициентов равны:

Подставив числовые значения, значения коэффициентов b0 и b1, их средние квадратичные отклонения и значение для t имеем:

Одинаковые по знаку значения верхней и нижней границ измерений коэффициента 0 и 1 свидетельствует о его статистической значимости.

3. Определим коэффициент детерминации и сделаем соответствующие выводы о качестве уравнения регрессии.

Для определения коэффициента детерминации воспользуемся результатами расчетов.

По таблице 1 найдем:

общую ошибку:

ошибку объясняемую регрессией остаточную ошибку Причем имеем TSS = RSS + ESS

Тогда коэффициент детерминации равен Полученная величина коэффициента детерминации свидетельствует о том, что необъясненная ошибка составляет около 95,23% от общей ошибки. Уравнение качественное.

4. С доверительной вероятностью 0,05 определим интервальную оценку условного математического ожидания Y при Х = 23.

Дисперсия математического ожидания прогнозируемой величины yp равна Среднее квадратичное отклонение математического ожидания прогнозируемой величины равно С уровнем значимости =0,05 доверительный интервал для условного математического ожидания yp при данном xp равен:

или .

Задача 3.16. Построение и анализ множественной регрессии По данным, представленным в таблице, изучается зависимость средней ожидаемой продолжительности жизни (лет) Y от переменных: Х1 — ВВП в паритетах покупательской способности; Х2 — темпы прироста населения по сравнению с предыдущим годом, %; Х3 — темпы прироста рабочей силы по сравнению с предыдущим годом, %; Х4 — коэффициент младенческой смертности, %.

Страна

Y

X1

X2

X3

X4

Мозамбик

2,6

2,4

Бурунди

2,3

2,6

2,7

Чад

2,6

2,5

2,5

Непал

4,3

2,5

2,4

Буркина-Фасо

2,9

2,8

2,1

Мадагаскар

2,4

3,1

3,1

Бангладеш

5,1

1,6

2,1

Гаити

3,4

1,7

Мали

2,9

2,7

Нигерия

4,5

2,9

2,8

Кения

5,1

2,7

2,7

Того

4,2

2,8

Индия

5,2

1,8

Бенин

6,5

2,9

2,5

Никарагуа

7,4

3,1

Гана

7,4

2,8

2,7

Ангола

4,9

3,1

2,8

Пакистан

8,3

2,9

3,3

Мавритания

5,7

2,5

2,7

Зимбабве

7,5

2,4

2,2

Гондурас

3,8

Китай

10,8

1,1

1,1

Камерун

7,8

2,9

3,1

Конго

7,6

2,9

2,6

Шри-Ланка

12,1

1,3

Египед

14,2

2,7

Индонезия

14,1

1,6

2,5

Филлипины

10,6

2,2

2,7

Марокко

12,4

2,6

Папуа-Новая Гвинея

2,3

2,3

Гватемала

12,4

2,9

3,5

Эквадор

15,6

2,2

3,2

Доминиканская Республика

14,3

1,9

2,6

Ямайка

13,1

1,8

Алдир

19,6

2,2

4,1

Республика Эль-Сальвадор

9,7

2,2

3,4

Парагвай

13,5

2,7

2,9

Тунис

18,5

1,9

Белоруссия

15,6

0,2

0,2

Перу

3,1

Тайланд

0,9

1,3

Панама

22,2

1,7

2,4

Турция

20,7

1,7

2,1

Польша

0,3

0,6

Словакия

13,4

0,3

0,7

Венесуэла

29,3

2,3

ЮАР

18,6

2,2

2,4

Мексика

23,7

1,9

2,8

Мавритания

1,3

1,8

Бразилия

1,5

1,6

Тринидад

31,9

0,8

1,8

Малайзия

33,4

2,4

2,7

Чили

35,3

1,5

2,1

Уругвай

24,6

0,6

Аргентина

30,8

1,3

Греция

43,4

0,6

0,9

Республика Корея

42,4

0,9

1,9

Испания

53,8

0,2

Новая Зеландия

60,6

1,4

1,5

Ирланлия

58,1

0,5

1,7

Израиль

61,1

3,5

3,5

Австралия

70,2

1,1

1,4

Италия

73,7

0,2

0,4

Канада

78,3

1,3

Финляндия

65,8

0,5

0,1

Гонконг

85,1

1,6

1,3

Швеция

68,7

0,6

0,3

Нидерланды

73,9

0,7

0,6

Бельгия

80,3

0,4

0,5

Франция

0,5

0,8

Сингапур

84,4

1,7

Автрия

78,8

0,8

0,5

США

1,1

Дания

78,7

0,3

Япония

0,3

0,6

Швейцария

95,6

0,8

1. Постройте матрицу парных коэффициентов корреляции. Установите, какие факторы коллинеарны.

2. Постройте уравнение множественной регрессии, обосновав отбор факторов.

3. Проведите тестирование ошибок уравнения множественной регрессии на гетероскедатичность, применив тест Гельфельда-Квандта.

4. Оцените статистическую значимость уравнения множественной регрессии. Какие факторы значимо воздействуют на формирование средней продолжительности жизни в этом уравнении?

5. Постройте уравнение множественной регрессии со статистически значимыми факторами.

Решение.

Воспользуемся MS Excel.

1. Построим матрицу парных коэффициентов корреляции. Установим, какие факторы коллинеарны.

Сервис — Анализ данных — Корреляция

Y

X1

X2

X3

X4

Y

X1

0,780 323

X2

— 0,72 516

— 0,62 259

X3

— 0,53 368

— 0,65 827

0,873 778

X4

— 0,96 876

— 0,74 343

0,736 073

0,553 603

Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т. е. средняя ожидаемая продолжительность жизни, имеет тесную связь с коэффициентом младенческой смертности (ryx4=-0,969), с ВВП в паритетах покупательской способности (ryx1=0,780), с темпами прироста населения (ryx2=0,725). Однако факторы Х2 и Х3 тесно связаны между собой (rx2x3=0,874) и факторы Х2 и Х4 также тесно связаны (rx2x4=0,736), что свидетельствует о наличии коллинеарности.

Коллинеарность — зависимость между факторами. В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:

r (xjy) > r (xkxj); r (xky) > r (xkxj).

Коллинеарны факторы х2 и х3, х2 и х4, а также х3 и х4.

2. Построим уравнение множественной регрессии, обосновав отбор факторов.

Из модели исключим фактор х3, так как зависимая переменная слабо зависит от этого фактора и чтобы исключить мультиколлинеарность.

Сервис — Анализ данных — Регрессия

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,972 926

R-квадрат

0,946 586

Нормированный R-квадрат

0,94 436

Стандартная ошибка

2,267 593

Наблюдения

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

6560,936

2186,979

425,3186

1,05E-45

Остаток

370,2223

5,141 977

Итого

6931,158

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

75,43 822

0,998 632

75,54 159

2,59E-70

73,44 749

77,42 896

X1

0,44 695

0,1 381

3,236 416

0,183

0,17 165

0,72 225

X2

— 0,0452

0,421 364

— 0,10 727

0,91 487

— 0,88 518

0,794 772

X4

— 0,23 956

0,13 205

— 18,1409

1,45E-28

— 0,26 588

— 0,21 323

Уравнение множественной регрессии:

y = 75,438 + 0,045×1 — 0,045×2 — 0,239x4

3. Проведем тестирование ошибок уравнения множественной регрессии на гетероскедатичность, применив тест Гельфельда-Квандта.

Упорядочим по возрастанию значения переменной, затем исключим С центральных наблюдений, при этом (n — C)/2 > p, где р — число оцениваемых параметров, затем разделим совокупность на две группы и определим в каждой группе остаточные суммы S1 и S2 и находим их отношение R.

Гетероскедатичность по Y:

Критерий Табличное значение F-критерия

9,75 > 3,9685

Гетероскедатичность по X1:

Критерий Табличное значение F-критерия

201,08 > 3,9685

Гетероскедатичность по X2:

Критерий Табличное значение F-критерия

188,59 > 3,9685

Гетероскедатичность по X4:

Критерий Табличное значение F-критерия

11,540 > 3,9685

Все значения больше табличного значения F-критерия, следовательно, дисперсии остаточных величин не равны.

4. Оценим статистическую значимость уравнения множественной регрессии. Какие факторы значимо воздействуют на формирование средней продолжительности жизни в этом уравнении?

Fтабл = 3,9685

Так как F = 425,3 (см таблицу Вывод итогов) > Fтабл., то уравнение множественной регрессии статистически значимо.

Коэффициент Стьюдента при n = 77 и уровне значимости 0,05 равен t (77; 0,05) = 1,9921.

Так как расчетные значения коэффициентов t, меньше чем табличное только для фактора х2, следовательно фактор х2 — не значим, факторы х1 и х4 — значимы.

5. Построим уравнение множественной регрессии со статистически значимыми факторами.

Построим уравнение с факторами х1 и х4.

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,972 922

R-квадрат

0,946 577

Нормированный R-квадрат

0,945 114

Стандартная ошибка

2,252 188

Наблюдения

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

6560,876

3280,438 203

646,7 295 717

3,6476E-47

Остаток

370,2815

5,72 349 165

Итого

6931,158

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

75,38 184

0,843 346

89,38 425 291

2,48751E-76

73,70 105 265

77,6 262

X1

0,44 942

0,13 525

3,322 917 729

0,1 394 518

0,17 986 926

0,71 897

X4

— 0,2403

0,11 187

— 21,48 060 931

2,77613E-33

— 0,262 593 269

— 0,218

Y = 75,382 + 0,045Х1 — 0,240Х4.

Список используемой литературы регрессия аппроксимация дисперсия уравнение Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики. Учебник для вузов. — М. ЮНИТИ, 1998. — 1022 с.

Бородич С. А. Эконометрика: Учеб. пособие. — Мн.: Новое знание, 2001. — 408 с.

Кремер Н.Ш., Путко Б. А. Эконометрика: Учебник для вузов / Под ред. Проф. Н. Ш. Кремера. — М.: ЮНИТИ-ДАНА, 2002. — 311 с.

Кулинич Е. И. Эконометрия. — М.: Финансы и статистика, 2001. — 304 с.

Орлов А. И. Эконометрика: Учебное пособие для вузов / А. И. Орлов — М.: Экзамен, 2002. — 576 с.

www.

Показать весь текст
Заполнить форму текущей работой