Методы решения уравнений линейной регрессии
Т. е. увеличение объема капиталовложений на величину среднеквадратического отклонения этого показателя приведет к увеличению среднего значения объема выпуска продукции на 0,07 среднеквадратического отклонения этого показателя. Равенство нулю математического ожидания остаточной компоненты для линейной модели, коэффициенты которой определены по МНК, выполняется автоматически. С помощью функции… Читать ещё >
Методы решения уравнений линейной регрессии (реферат, курсовая, диплом, контрольная)
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
ФИЛИАЛ В Г. ЛИПЕЦКЕ
Контрольная работа
по эконометрике
Липецк, 2009 г.
Задача
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (Y, млн.руб.) от объема капиталовложений (Х, млн.руб.)
Y | |||||||||||
Х | |||||||||||
Требуется:
1. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
2. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков; построить график остатков.
3. Проверить выполнение предпосылок МНК.
4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (б=0,05).
5. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (б=0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве.
6. Осуществить прогнозирование среднего значения показателя Y при уровне значимости б=0,01 при Х=80% от его максимального значения.
7. Представить графически фактических и модельных значений Y, точки прогноза.
8. Составить уравнения нелинейной регрессии:
· Гиперболической;
· Степенной;
· Показательной.
Привести графики построенных уравнений регрессии.
9. Для указанных моделей найти коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
Решение
1. Уравнение линейной регрессии имеет вид:
= а0 + а1x.
Построим линейную модель.
Для удобства выполнения расчетов предварительно упорядочим всю таблицу исходных данных по возрастанию факторной переменной Х (Данные => Сортировка). (рис. 1).
Рис.1
Используем программу РЕГРЕССИЯ и найдем коэффициенты модели (рис.2)
Рис.2
Коэффициенты модели содержатся в таблице 3 (столбец Коэффициенты).
Таким образом, модель построена и ее уравнение имеет вид
Yт = 12,70 755+0,721 698Х.
Коэффициент регрессии b=0,721 698, следовательно, при увеличении объема капиталовложений (Х) на 1 млн руб. объем выпуска продукции (Y) увеличивается в среднем на 0,721 698 млн руб.
2. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков SІe; построить график остатков.
Остатки содержатся в столбце Остатки итогов программы РЕГРЕССИЯ (таблица 4).
Программой РЕГРЕССИЯ найдены также остаточная сумма квадратов SSост=148,217 и дисперсия остатков MS=18,52 712 (таблица 2).
Для построения графика остатков нужно выполнить следующие действия:
· Вызвать Матер Диаграмм, выбрать тип диаграммы Точечная (с соединенными точками).
· Для указания данных для построения диаграммы зайти во вкладку Ряд, нажать кнопку Добавить; в качестве значений Х указать исходные данные Х (таблица 1);значения Y — остатки (таблица 4).
Рис. 3 График остатков
3. Проверить выполнение предпосылок МНК.
Предпосылками построения классической линейной регрессионной модели являются четыре условия, известные как условия Гаусса-Маркова.
· В уравнении линейной модели Y=a+b*X+е слагаемое е — случайная величина, которая выражает случайный характер результирующей переменной Y.
· Математическое ожидание случайного члена в любом наблюдении равно нулю, а дисперсия постоянна.
· Случайные члены для любых двух разных наблюдений независимы (некоррелированы).
· Распределение случайного члена является нормальными.
1) Проведем проверку случайности остаточной компоненты по критерию повторных точек.
Количество повторных точек определим по графику остатков: p=5
Вычислим критическое значение по формуле:
.
При найдем
Схема критерия:
Сравним, следовательно, свойство случайности для ряда остатков выполняется.
1. Равенство нулю математического ожидания остаточной компоненты для линейной модели, коэффициенты которой определены по МНК, выполняется автоматически. С помощью функции СРЗНАЧ для ряда остатков можно проверить: .
Свойство постоянства дисперсии остаточной компоненты проверим по критерию Гольдфельда-Квандта.
В упорядоченных по возрастанию переменной X исходных данных () выделим первые 4 и последние 4 уровня, средние 2 уровня не рассматриваем.
С помощью программы РЕГРЕССИЯ построим модель по первым четырем наблюдениям (регрессия-1), для этой модели остаточная сумма квадратов .
Дисперсионный анализ | |||||||
df | SS | MS | F | Значимость F | |||
Регрессия | 107,7 894 737 | 107,7 894 737 | 15,67 347 | 0,15 751 | |||
Остаток | 6,877 192 982 | 6,877 192 982 | |||||
Итого | 114,6 666 667 | ||||||
С помощью программы РЕГРЕССИЯ построим модель по последним четырем наблюдениям (регрессия-2), для этой модели остаточная сумма квадратов .
Дисперсионный анализ | |||||||
df | SS | MS | F | Значимость F | |||
Регрессия | 4,166 666 667 | 4,166 666 667 | 0,186 916 | 0,707 647 | |||
Остаток | 44,58 333 333 | 22,29 166 667 | |||||
Итого | 48,75 | ||||||
Рассчитаем статистику критерия:
.
Критическое значение при уровне значимости и числах степеней свободы составляет .
Схема критерия:
Сравним, следовательно, свойство постоянства дисперсии остатков выполняется, модель гомоскедастичная.
2. Для проверки независимости уровней ряда остатков используем критерий Дарбина-Уотсона
.
Предварительно по столбцу остатков с помощью функции СУММКВРАЗН определим; используем найденную программой РЕГРЕССИЯ сумму квадратов остаточной компоненты .
Таким образом, Схема критерия:
Полученное значение d=2,375, что свидетельствует об отрицательной корреляции. Перейдем к d'=4-d=1,62 и сравним ее с двумя критическими уровнями d1=0,88 и d2=1,32.
D'=1,62 лежит в интервале от d2=1,32 до 2, следовательно, свойство независимости остаточной компоненты выполняются.
С помощью функции СУММПРОИЗВ найдем для остатков, следовательно r (1)=2,4869Е-14/148,217=1,67 788Е-16.
Критическое значение для коэффициента автокорреляции определяется как отношение n и составляет для данной задачи
Сравнения показывает, что r (1)= 1,67 788Е-16<0,62, следовательно, ряд остатков некоррелирован.
4) Соответствие ряда остатков нормальному закону распределения проверим с помощью критерия:
.
С помощью функций МАКС и МИН для ряда остатков определим,. Стандартная ошибка модели найдена программой РЕГРЕССИЯ и составляет. Тогда:
Критический интервал определяется по таблице критических границ отношения и при составляет (2,67; 3,57).
Схема критерия:
2,995 (2,67; 3,57), значит, для построенной модели свойство нормального распределения остаточной компоненты выполняется.
Проведенная проверка предпосылок регрессионного анализа показала, что для модели выполняются все условия Гаусса-Маркова.
4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента ().
t-статистика для коэффициентов уравнения приведены в таблице 4.
Для свободного коэффициента определена статистика .
Для коэффициента регрессии определена статистика .
Критическое значение найдено для уравнения значимости и числа степеней свободы с помощью функции СТЬЮДРАСПОБР.
Схема критерия:
Сравнение показывает:
следовательно, свободный коэффициент a является значимым.
значит, коэффициент регрессии b является значимым.
5. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Коэффициент детерминации R-квадрат определен программой РЕГРЕССИЯ и составляет .
Таким образом, вариация объема выпуска продукции Y на 79,5% объясняется по полученному уравнению вариацией объема капиталовложений X.
Проверим значимость полученного уравнения с помощью F-критерия Фишера.
F-статистика определена программой РЕГРЕССИЯ (таблица 2) и составляет .
Критическое значение найдено для уровня значимости и чисел степеней свободы, .
Схема критерия:
Сравнение показывает:; следовательно, уравнение модели является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенной в модель факторной переменной Х.
Для вычисления средней относительной ошибки аппроксимации рассчитаем дополнительный столбец относительных погрешностей, которые вычислим по формуле
с помощью функции ABS (таблица 5).
ВЫВОД ОСТАТКА | ||||
Наблюдение | Предсказанное Y | Остатки | Отн. Погр-ти | |
27,14 150 943 | 6,858 490 566 | 20,17% | ||
29,30 660 377 | — 3,306 603 774 | 12,72% | ||
30,2 830 189 | — 6,28 301 887 | 25,12% | ||
35,8 018 868 | 2,919 811 321 | 7,68% | ||
35,80 188 679 | — 0,801 886 792 | 2,29% | ||
40,13 207 547 | — 0,132 075 472 | 0,33% | ||
45,90 566 038 | — 3,905 660 377 | 9,30% | ||
45,90 566 038 | 5,94 339 623 | 9,99% | ||
46,62 735 849 | — 1,627 358 491 | 3,62% | ||
48,7 075 472 | 0,929 245 283 | 1,90% | ||
По столбцу относительных погрешностей найдем среднее значение (функция СРЗНАЧ).
Схема проверки:
Сравним: 9,31% < 15%, следовательно, модель является точной.
Вывод: на основании проверки предпосылок МНК, критериев Стьюдента и Фишера и величины коэффициента детерминации модель можно считать полностью адекватной. Дальнейшее использование такой модели для прогнозирования в реальных условиях целесообразно.
6. Осуществить прогнозирование среднего значения показателя Y при уровне значимости, если прогнозное значение фактора X составит 80% от его максимального значения.
Согласно условию задачи прогнозное значение факторной переменной Х составит 80% от 49, следовательно,. Рассчитаем по уравнению модели прогнозное значение показателя У:
.
Таким образом, если объем капиталовложений составит 39,2 млн руб., то ожидаемый объем выпуска продукции составит около 48 млн руб.
Зададим доверительную вероятность и построим доверительный прогнозный интервал для среднего значения Y.
Для этого нужно рассчитать стандартную ошибку прогнозирования:
Предварительно подготовим:
— стандартную ошибку модели (Таблица 2);
— по столбцу исходных данных Х найдем среднее значение (функция СРЗНАЧ) и определим (функция КВАДРОТКЛ).
Следовательно, стандартная ошибка прогнозирования для среднего значения составляет:
При размах доверительного интервала для среднего значения Границами прогнозного интервала будут Таким образом, с надежностью 90% можно утверждать, что если объем капиталовложений составит 39,2 млн руб., то ожидаемый объем выпуска продукции будет от 45,3 млн руб. до 50,67 млн руб.
7. Представить графически фактические и модальные значения Y точки прогноза.
Для построения чертежа используем Мастер диаграмм (точечная) — покажем исходные данные (поле корреляции).
Затем с помощью опции Добавить линию тренда… построим линию модели:
тип > линейная; параметры > показывать уравнение на диаграмме.
Покажем на графике результаты прогнозирования. Для этого в опции Исходные данные добавим ряды:
Имя > прогноз; значения; значения ;
Имя > нижняя граница; значения; значения ;
Имя > верхняя граница; значения; значения
8. Составить уравнения нелинейной регрессии: гиперболической; степенной; показательной.
8.1 Гиперболическая модель Уравнение гиперболической функции:
= a + b/x.
Произведем линеаризацию модели путем замены X = 1/x. В результате получим линейное уравнение
= a + bX.
Рассчитаем параметры уравнения по данным таблицы 2.
b = =
а = =38,4+704,48*0,03=60,25.
Получим следующее уравнение гиперболической модели:
= 60,25−704,48/х.
8.2 Степенная модель Уравнение степенной модели имеет вид: =аxb
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
lg = lg a + b lg x.
Обозначим через
Y=lg, X=lg x, A=lg a.
Тогда уравнение примет вид: Y = A + bX — линейное уравнение регрессии. Рассчитаем его параметры, используя данные таблицы 3.
b = =
A = = 1,57−0,64*1,53=0,59
Уравнение регрессии будет иметь вид: Y = 0,59+0,64* Х.
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения.
= 100,59* х0,64.
Получим уравнение степенной модели регрессии:
= 3,87* х0,64.
8.3 Показательная модель Уравнение показательной кривой: =abx.
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения:
lg = lg a + x lg b.
Обозначим: Y = lg, B = lg b, A = lg a. Получим линейное уравнение регрессии: Y = A + B x. Рассчитаем его параметры, используя данные таблицы 4.
В = =
А = = 1,57−0,01*35,6=1,27
Уравнение будет иметь вид: Y = 1,27+0,01х.
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:
=101,27* (100,01)х = 18,55*1,02х.
Графики построенных моделей:
Рис. 3. Гиперболическая Рис. 4. Степенная Рис. 5. Показательная
9. Сравнение моделей по характеристикам: коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Вывод.
9.1 Гиперболическая модель Коэффициент детерминации:
=
Вариация результата Y на 70,9% объясняется вариацией фактора Х.
Коэффициент эластичности:
= = 0,05.
Это означает, что при увеличении фактора Х на 1% результирующий показатель изменится на 0,05%.
Бета-коэффициент:
Sx==0,01 Sy==8,5 60,25*0,01/8,5=0,07.
Т.е. увеличение объема капиталовложений на величину среднеквадратического отклонения этого показателя приведет к увеличению среднего значения объема выпуска продукции на 0,07 среднеквадратического отклонения этого показателя.
Средняя относительная ошибка аппроксимации:
отн = 109,7/ 10= 10,97%.
В среднем расчетные значения для гиперболической модели отличаются от фактических значений на 10,97%.
9.2 Степенная модель Коэффициент детерминации:
=
Вариация результата Y на 73,6% объясняется вариацией фактора Х. Коэффициент эластичности:
= = 0,57.
Это означает, что при увеличении факторного признака на 1% результирующий показатель увеличится на 0,57%.
Бета-коэффициент:
Sy= и Sx=.
Sx==0,14 Sy==0,10 0,59*0,14/0,1=0,78.
Т.е. увеличение объема капиталовложений на величину среднеквадратического отклонения этого показателя приведет к увеличению среднего значения объема выпуска продукции на 0,78 среднеквадратического отклонения этого показателя.
отн= = 93,77/10 = 9,34%.
В среднем расчетные значения для степенной модели отличаются от фактических значений на 9,34%.
9.3 Показательная модель Коэффициент детерминации:
=
Вариация результата Y на 75,7% объясняется вариацией фактора Х. Коэффициент эластичности:
= 28,71.
Это означает, что при росте фактора Х на 1% результирующий показатель Y изменится на 28,71%.
Бета-коэффициент:
Sx==10,5 Sy==0,10 1,27*10,5/0,10=129,10.
Т.е. увеличение объема капиталовложений на величину среднеквадратического отклонения этого показателя приведет к увеличению среднего значения объема выпуска продукции на 129,1 среднеквадратического отклонения этого показателя.
отн= 91,9/ 10 = 9,19%.
В среднем расчетные значения для показательной модели отличаются от фактических значений на 9,19%.
Вывод
Лучшей из уравнений нелинейной регрессии является показательная: выше коэффициент детерминации, наименьшая относительная ошибка. Модель можно использовать для прогнозирования.