Прикладная статистика и основы эконометрики
Оцените статистическую значимость уравнения множественной регрессии. Какие факторы значимо воздействуют на формирование средней продолжительности жизни в этом уравнении? Оценим статистическую значимость уравнения множественной регрессии. Какие факторы значимо воздействуют на формирование средней продолжительности жизни в этом уравнении? Так как расчетные значения коэффициентов t, меньше чем… Читать ещё >
Прикладная статистика и основы эконометрики (реферат, курсовая, диплом, контрольная)
Задача 16
Зависимость меду величинами x и y описывается функцией y = f (x, a, b), где a и b — неизвестные параметры. Найти эти параметры, сведя исходную задачу к линейной задаче метода наименьших квадратов (Линейной регрессии).
Х | Y | |
0,5 | 1,9813 | |
0,6 | 2,2809 | |
0,7 | 2,3182 | |
0,8 | 2,8358 | |
0,9 | 2,8962 | |
3,2425 | ||
1,1 | 3,9918 | |
1,2 | 4,6459 | |
1,3 | 6,0938 | |
1,4 | 7,6587 | |
1,5 | 10,8872 | |
Оценить полученную точность аппроксимации.
Решение.
Сведем исходную задачу к линейной задаче МНК, для этого сделаем подходящую замену переменных.
Так как исходная зависимость имеет вид, то прологарифмировав исходное неравенство и введя новые переменные:
t = х3; A = lna; lny = s
Получаем задачу об определении коэффициентов линейной зависимости s = A + bt.
Рассчитаем параметры A и b уравнения линейной регрессии s = A + b· t. Для расчетов заполним таблицу.
№п/п | Х | Y | t | s | st | t2 | |||
0,5 | 1,9813 | 0,125 | 0,684 | 0,085 | 0,016 | 2,139 099 | 0,79 644 | ||
0,6 | 2,2809 | 0,216 | 0,825 | 0,178 | 0,047 | 2,238 269 | 0,18 691 | ||
0,7 | 2,3182 | 0,343 | 0,841 | 0,288 | 0,118 | 2,384 403 | 0,28 558 | ||
0,8 | 2,8358 | 0,512 | 1,042 | 0,534 | 0,262 | 2,593 766 | 0,8 535 | ||
0,9 | 2,8962 | 0,729 | 1,063 | 0,775 | 0,531 | 2,889 769 | 0,222 | ||
3,2425 | 1,176 | 1,176 | 1,000 | 3,307 309 | 0,19 987 | ||||
1,1 | 3,9918 | 1,331 | 1,384 | 1,842 | 1,772 | 3,899 985 | 0,23 001 | ||
1,2 | 4,6459 | 1,728 | 1,536 | 2,654 | 2,986 | 4,752 538 | 0,22 953 | ||
1,3 | 6,0938 | 2,197 | 1,807 | 3,971 | 4,827 | 6,2 888 | 0,14 919 | ||
1,4 | 7,6587 | 2,744 | 2,036 | 5,586 | 7,530 | 7,882 513 | 0,29 223 | ||
1,5 | 10,887 | 3,375 | 2,388 | 8,058 | 11,391 | 10,79 286 | 0,8 665 | ||
Итого | 48,832 | 14,3 | 14,782 | 25,149 | 30,478 | 0,333 | |||
Среднее | 4,439 | 1,3 | 1,344 | 2,286 | 2,771 | ||||
— линейное уравнение регрессии
Можно было воспользоваться MS Excel, Анализ данных — Регрессия
.
ВЫВОД ИТОГОВ | |||||||
Регрессионная статистика | |||||||
Множественный R | 0,997 054 | ||||||
R-квадрат | 0,994 116 | ||||||
Нормированный R-квадрат | 0,993 462 | ||||||
Стандартная ошибка | 0,44 122 | ||||||
Наблюдения | |||||||
Дисперсионный анализ | |||||||
df | SS | MS | F | Значимость F | |||
Регрессия | 2,960 104 | 2,960 104 | 1520,53 | 2,38E-11 | |||
Остаток | 0,17 521 | 0,1 947 | |||||
Итого | 2,977 625 | ||||||
Коэффициен-ты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | ||
Y-пересечение | 0,695 131 | 0,21 301 | 32,63 388 | 1,17E-10 | 0,646 945 | 0,743 317 | |
Переменная X 1 | 0,498 998 | 0,12 797 | 38,99 398 | 2,38E-11 | 0,470 049 | 0,527 946 | |
Перейдем обратно к начальным данным:
A = lna; следовательно,
Получим:
Оценим полученную точность аппроксимации.
Так как полученная точность менее 5%, то модель достаточно точная.
Задача 2.16. Построение однофакторной регрессии Имеются данные по цене некоторого блага (Х) и количеству (Y) данного блага, приобретаемого домохозяйством ежемесячно в течении года.
Предполагается, что генеральное уравнение регрессии — линейное.
Цена, Х | ||||||||
Приобретаемое количество, Y | ||||||||
1. Найти оценки коэффициентов регрессии b0 и b1.
2. С надежностью 0,9 определить интервальные оценки теоретических коэффициентов регрессии.
3. Определить коэффициент детерминации и сделать соответствующие выводы о качестве уравнения регрессии.
4. С доверительной вероятностью 0,05 определить интервальную оценку условного математического ожидания Y при Х = 23.
Решение.
Найти оценки коэффициентов регрессии b0 и b1.
Генеральное уравнение регрессии — линейное: .
№ п/п | X | Y | Х2 | XY | |
Итого | |||||
Среднее | 74,28 571 | 1632,143 | |||
2. С надежностью 0,9 определим интервальные оценки теоретических коэффициентов регрессии.
Для уровня значимости =0,1 и числа степеней свободы k = n — 2 = 7 — 2 = = 5 критерий Стьюдента равен .
Дисперсии средние квадратичные отклонения коэффициентов и уравнения регрессии определим из равенств:
Для определения математической значимости коэффициентов b0 и b1 найдем t — статистику Стьюдента:
;
Сравнение расчетных и табличных величин критерия Стьюдента показывает, что или и или 9,987 > 2,5706, т. е. с надежностью 0,9 оценка b0 теоретического коэффициента регрессии 0 значима, оценка b1 теоретического коэффициента регрессии 1 значима.
Доверительные интервалы для этих коэффициентов равны:
Подставив числовые значения, значения коэффициентов b0 и b1, их средние квадратичные отклонения и значение для t имеем:
Одинаковые по знаку значения верхней и нижней границ измерений коэффициента 0 и 1 свидетельствует о его статистической значимости.
3. Определим коэффициент детерминации и сделаем соответствующие выводы о качестве уравнения регрессии.
Для определения коэффициента детерминации воспользуемся результатами расчетов.
По таблице 1 найдем:
общую ошибку:
ошибку объясняемую регрессией остаточную ошибку Причем имеем TSS = RSS + ESS
Тогда коэффициент детерминации равен Полученная величина коэффициента детерминации свидетельствует о том, что необъясненная ошибка составляет около 95,23% от общей ошибки. Уравнение качественное.
4. С доверительной вероятностью 0,05 определим интервальную оценку условного математического ожидания Y при Х = 23.
Дисперсия математического ожидания прогнозируемой величины yp равна Среднее квадратичное отклонение математического ожидания прогнозируемой величины равно С уровнем значимости =0,05 доверительный интервал для условного математического ожидания yp при данном xp равен:
или .
Задача 3.16. Построение и анализ множественной регрессии По данным, представленным в таблице, изучается зависимость средней ожидаемой продолжительности жизни (лет) Y от переменных: Х1 — ВВП в паритетах покупательской способности; Х2 — темпы прироста населения по сравнению с предыдущим годом, %; Х3 — темпы прироста рабочей силы по сравнению с предыдущим годом, %; Х4 — коэффициент младенческой смертности, %.
Страна | Y | X1 | X2 | X3 | X4 | |
Мозамбик | 2,6 | 2,4 | ||||
Бурунди | 2,3 | 2,6 | 2,7 | |||
Чад | 2,6 | 2,5 | 2,5 | |||
Непал | 4,3 | 2,5 | 2,4 | |||
Буркина-Фасо | 2,9 | 2,8 | 2,1 | |||
Мадагаскар | 2,4 | 3,1 | 3,1 | |||
Бангладеш | 5,1 | 1,6 | 2,1 | |||
Гаити | 3,4 | 1,7 | ||||
Мали | 2,9 | 2,7 | ||||
Нигерия | 4,5 | 2,9 | 2,8 | |||
Кения | 5,1 | 2,7 | 2,7 | |||
Того | 4,2 | 2,8 | ||||
Индия | 5,2 | 1,8 | ||||
Бенин | 6,5 | 2,9 | 2,5 | |||
Никарагуа | 7,4 | 3,1 | ||||
Гана | 7,4 | 2,8 | 2,7 | |||
Ангола | 4,9 | 3,1 | 2,8 | |||
Пакистан | 8,3 | 2,9 | 3,3 | |||
Мавритания | 5,7 | 2,5 | 2,7 | |||
Зимбабве | 7,5 | 2,4 | 2,2 | |||
Гондурас | 3,8 | |||||
Китай | 10,8 | 1,1 | 1,1 | |||
Камерун | 7,8 | 2,9 | 3,1 | |||
Конго | 7,6 | 2,9 | 2,6 | |||
Шри-Ланка | 12,1 | 1,3 | ||||
Египед | 14,2 | 2,7 | ||||
Индонезия | 14,1 | 1,6 | 2,5 | |||
Филлипины | 10,6 | 2,2 | 2,7 | |||
Марокко | 12,4 | 2,6 | ||||
Папуа-Новая Гвинея | 2,3 | 2,3 | ||||
Гватемала | 12,4 | 2,9 | 3,5 | |||
Эквадор | 15,6 | 2,2 | 3,2 | |||
Доминиканская Республика | 14,3 | 1,9 | 2,6 | |||
Ямайка | 13,1 | 1,8 | ||||
Алдир | 19,6 | 2,2 | 4,1 | |||
Республика Эль-Сальвадор | 9,7 | 2,2 | 3,4 | |||
Парагвай | 13,5 | 2,7 | 2,9 | |||
Тунис | 18,5 | 1,9 | ||||
Белоруссия | 15,6 | 0,2 | 0,2 | |||
Перу | 3,1 | |||||
Тайланд | 0,9 | 1,3 | ||||
Панама | 22,2 | 1,7 | 2,4 | |||
Турция | 20,7 | 1,7 | 2,1 | |||
Польша | 0,3 | 0,6 | ||||
Словакия | 13,4 | 0,3 | 0,7 | |||
Венесуэла | 29,3 | 2,3 | ||||
ЮАР | 18,6 | 2,2 | 2,4 | |||
Мексика | 23,7 | 1,9 | 2,8 | |||
Мавритания | 1,3 | 1,8 | ||||
Бразилия | 1,5 | 1,6 | ||||
Тринидад | 31,9 | 0,8 | 1,8 | |||
Малайзия | 33,4 | 2,4 | 2,7 | |||
Чили | 35,3 | 1,5 | 2,1 | |||
Уругвай | 24,6 | 0,6 | ||||
Аргентина | 30,8 | 1,3 | ||||
Греция | 43,4 | 0,6 | 0,9 | |||
Республика Корея | 42,4 | 0,9 | 1,9 | |||
Испания | 53,8 | 0,2 | ||||
Новая Зеландия | 60,6 | 1,4 | 1,5 | |||
Ирланлия | 58,1 | 0,5 | 1,7 | |||
Израиль | 61,1 | 3,5 | 3,5 | |||
Австралия | 70,2 | 1,1 | 1,4 | |||
Италия | 73,7 | 0,2 | 0,4 | |||
Канада | 78,3 | 1,3 | ||||
Финляндия | 65,8 | 0,5 | 0,1 | |||
Гонконг | 85,1 | 1,6 | 1,3 | |||
Швеция | 68,7 | 0,6 | 0,3 | |||
Нидерланды | 73,9 | 0,7 | 0,6 | |||
Бельгия | 80,3 | 0,4 | 0,5 | |||
Франция | 0,5 | 0,8 | ||||
Сингапур | 84,4 | 1,7 | ||||
Автрия | 78,8 | 0,8 | 0,5 | |||
США | 1,1 | |||||
Дания | 78,7 | 0,3 | ||||
Япония | 0,3 | 0,6 | ||||
Швейцария | 95,6 | 0,8 | ||||
1. Постройте матрицу парных коэффициентов корреляции. Установите, какие факторы коллинеарны.
2. Постройте уравнение множественной регрессии, обосновав отбор факторов.
3. Проведите тестирование ошибок уравнения множественной регрессии на гетероскедатичность, применив тест Гельфельда-Квандта.
4. Оцените статистическую значимость уравнения множественной регрессии. Какие факторы значимо воздействуют на формирование средней продолжительности жизни в этом уравнении?
5. Постройте уравнение множественной регрессии со статистически значимыми факторами.
Решение.
Воспользуемся MS Excel.
1. Построим матрицу парных коэффициентов корреляции. Установим, какие факторы коллинеарны.
Сервис — Анализ данных — Корреляция
Y | X1 | X2 | X3 | X4 | ||
Y | ||||||
X1 | 0,780 323 | |||||
X2 | — 0,72 516 | — 0,62 259 | ||||
X3 | — 0,53 368 | — 0,65 827 | 0,873 778 | |||
X4 | — 0,96 876 | — 0,74 343 | 0,736 073 | 0,553 603 | ||
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т. е. средняя ожидаемая продолжительность жизни, имеет тесную связь с коэффициентом младенческой смертности (ryx4=-0,969), с ВВП в паритетах покупательской способности (ryx1=0,780), с темпами прироста населения (ryx2=0,725). Однако факторы Х2 и Х3 тесно связаны между собой (rx2x3=0,874) и факторы Х2 и Х4 также тесно связаны (rx2x4=0,736), что свидетельствует о наличии коллинеарности.
Коллинеарность — зависимость между факторами. В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:
r (xjy) > r (xkxj); r (xky) > r (xkxj).
Коллинеарны факторы х2 и х3, х2 и х4, а также х3 и х4.
2. Построим уравнение множественной регрессии, обосновав отбор факторов.
Из модели исключим фактор х3, так как зависимая переменная слабо зависит от этого фактора и чтобы исключить мультиколлинеарность.
Сервис — Анализ данных — Регрессия
ВЫВОД ИТОГОВ | |||||||
Регрессионная статистика | |||||||
Множественный R | 0,972 926 | ||||||
R-квадрат | 0,946 586 | ||||||
Нормированный R-квадрат | 0,94 436 | ||||||
Стандартная ошибка | 2,267 593 | ||||||
Наблюдения | |||||||
Дисперсионный анализ | |||||||
df | SS | MS | F | Значимость F | |||
Регрессия | 6560,936 | 2186,979 | 425,3186 | 1,05E-45 | |||
Остаток | 370,2223 | 5,141 977 | |||||
Итого | 6931,158 | ||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | ||
Y-пересечение | 75,43 822 | 0,998 632 | 75,54 159 | 2,59E-70 | 73,44 749 | 77,42 896 | |
X1 | 0,44 695 | 0,1 381 | 3,236 416 | 0,183 | 0,17 165 | 0,72 225 | |
X2 | — 0,0452 | 0,421 364 | — 0,10 727 | 0,91 487 | — 0,88 518 | 0,794 772 | |
X4 | — 0,23 956 | 0,13 205 | — 18,1409 | 1,45E-28 | — 0,26 588 | — 0,21 323 | |
Уравнение множественной регрессии:
y = 75,438 + 0,045×1 — 0,045×2 — 0,239x4
3. Проведем тестирование ошибок уравнения множественной регрессии на гетероскедатичность, применив тест Гельфельда-Квандта.
Упорядочим по возрастанию значения переменной, затем исключим С центральных наблюдений, при этом (n — C)/2 > p, где р — число оцениваемых параметров, затем разделим совокупность на две группы и определим в каждой группе остаточные суммы S1 и S2 и находим их отношение R.
Гетероскедатичность по Y:
Критерий Табличное значение F-критерия
9,75 > 3,9685
Гетероскедатичность по X1:
Критерий Табличное значение F-критерия
201,08 > 3,9685
Гетероскедатичность по X2:
Критерий Табличное значение F-критерия
188,59 > 3,9685
Гетероскедатичность по X4:
Критерий Табличное значение F-критерия
11,540 > 3,9685
Все значения больше табличного значения F-критерия, следовательно, дисперсии остаточных величин не равны.
4. Оценим статистическую значимость уравнения множественной регрессии. Какие факторы значимо воздействуют на формирование средней продолжительности жизни в этом уравнении?
Fтабл = 3,9685
Так как F = 425,3 (см таблицу Вывод итогов) > Fтабл., то уравнение множественной регрессии статистически значимо.
Коэффициент Стьюдента при n = 77 и уровне значимости 0,05 равен t (77; 0,05) = 1,9921.
Так как расчетные значения коэффициентов t, меньше чем табличное только для фактора х2, следовательно фактор х2 — не значим, факторы х1 и х4 — значимы.
5. Построим уравнение множественной регрессии со статистически значимыми факторами.
Построим уравнение с факторами х1 и х4.
ВЫВОД ИТОГОВ | |||||||
Регрессионная статистика | |||||||
Множественный R | 0,972 922 | ||||||
R-квадрат | 0,946 577 | ||||||
Нормированный R-квадрат | 0,945 114 | ||||||
Стандартная ошибка | 2,252 188 | ||||||
Наблюдения | |||||||
Дисперсионный анализ | |||||||
df | SS | MS | F | Значимость F | |||
Регрессия | 6560,876 | 3280,438 203 | 646,7 295 717 | 3,6476E-47 | |||
Остаток | 370,2815 | 5,72 349 165 | |||||
Итого | 6931,158 | ||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | ||
Y-пересечение | 75,38 184 | 0,843 346 | 89,38 425 291 | 2,48751E-76 | 73,70 105 265 | 77,6 262 | |
X1 | 0,44 942 | 0,13 525 | 3,322 917 729 | 0,1 394 518 | 0,17 986 926 | 0,71 897 | |
X4 | — 0,2403 | 0,11 187 | — 21,48 060 931 | 2,77613E-33 | — 0,262 593 269 | — 0,218 | |
Y = 75,382 + 0,045Х1 — 0,240Х4.
Список используемой литературы регрессия аппроксимация дисперсия уравнение Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики. Учебник для вузов. — М. ЮНИТИ, 1998. — 1022 с.
Бородич С. А. Эконометрика: Учеб. пособие. — Мн.: Новое знание, 2001. — 408 с.
Кремер Н.Ш., Путко Б. А. Эконометрика: Учебник для вузов / Под ред. Проф. Н. Ш. Кремера. — М.: ЮНИТИ-ДАНА, 2002. — 311 с.
Кулинич Е. И. Эконометрия. — М.: Финансы и статистика, 2001. — 304 с.
Орлов А. И. Эконометрика: Учебное пособие для вузов / А. И. Орлов — М.: Экзамен, 2002. — 576 с.
www.