Содержание
По исходным данным за 16 месяцев, представленным в таблице 1, постройте уравнение зависимости объема предложения некоторого блага Y для функционирующей в условиях конкуренции фирмы от цены X1 этого блага и заработной платы X2 сотрудников этой фирмы.
Таблица 1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Y 20 35 30 45 60 69 75 90 105 110 120 130 130 130 135 140
X1 10 15 20 25 40 37 43 35 38 55 50 35 40 55 45 65
X2 12 10 9 9 8 8 6 4 4 5 3 1 2 3 1 2
Задание:
1. Для заданного набора данных постройте линейную модель множественной регрессии. Оцените точность и адекватность построенного уравнения регрессии.
2. Дайте экономическую интерпретацию параметров модели.
3. Для полученной модели проверьте выполнение условия гомоскедастичности остатков, применив тест Голдфельда-Квандта.
4. Проверьте полученную модель на наличие автокорреляции остатков с помощью теста Дарбина-Уотсона.
R-квадрат это. В нашем примере значение = 0,97 свидетельствует о том, что изменения зависимой переменной (балансовой прибыли) в основном (на 97%) можно объяснить изменениями включенных в модель объясняющих переменных Х1, Х2. Такое значение свидетельствует об адекватности модели.
Рассмотрим таблицу с результатами дисперсионного анализа.
df degrees of freedom число степеней свободы связано с числом единиц совокупности n и с числом определяемых по ней констант (m+1).
SS sum of squares сумма квадратов (регрессионная (RSS regression sum of squares), остаточная (ESS error sum of squares) и общая (TSS total sum of squares), соответственно).
MS mean sum — сумма квадратов на одну степень свободы.
F — расчетное значение F-критерия Фишера. Если нет табличного значения, то для проверки значимости уравнения регрессии в целом можно посмотреть Значимость F. На уровне значимости уравнение регрессии признается значимым в целом, если Значимость, и незначимым, если Значимость .
Для нашего примера имеем следующие значения:
df SS MS F Значимость F
Регрессия m= 2 25 161,71497
12 580,85748
207,47 717
1,36946E-10
Остаток n-m-1= 13 788,2 850 346
60,63 731 035
Итого n-1=15 25 950
В нашем случае расчетное значение F-критерия Фишера составляет 207.48. Значимость F = 1,369Е-10, что меньше 0,05. Таким образом, полученное уравнение в целом значимо.
В последней таблице приведены значения параметров (коэффициентов) модели, их стандартные ошибки и расчетные значения t-критерия Стьюдента для оценки значимости отдельных параметров модели.
Коэффициенты Стандартная ошибка t;
статистика P-Значение Нижние 95% Верхние 95%
Y b0 = 114.78 11.8333
9.6994
2,561E-07 89.21 140.34
Х1 b1 = 0.67 0.2026
3.3191
0,55 399 0.23 1.11
Х2 b2 = -9.44 0,8705
— 10.8451
6,964E-08 -11.32 -7.56
Анализ таблицы для рассматриваемого примера позволяет сделать вывод о том, что на уровне значимости коэффициенты при факторах Х1 и Х2 оказываются значимыми, так для них Р-значение меньше 0,05.
Границы доверительного интервала для коэффициентов регрессии не содержат противоречивых результатов:
1) с надежностью 0.95 (c вероятностью 95%) коэффициент b1 лежит в интервале 0.23 1.11;
2) с надежностью 0.95 (c вероятностью 95%) коэффициент b2 лежит в интервале 11.32 -7.56
Таким образом, модель объема предложения некоторого блага фирмы запишется в следующем виде:
Рассмотрим теперь экономическую интерпретацию параметров модели.
Коэффициент b1 = 0,67, означает, что при увеличении только цены на товар (Х1) на 1 дн. ед. объем предложение некоторого блага в среднем возрастает на 0,67 ден. ед., а то, что коэффициент b2 = -9,44, означает, что увеличение только заработной платы сотрудников фирмы (Х2) на 1 ден. ед. приводит в среднем к уменьшению объема некоторого блага на 0,065 ден. ед.
В соответствии со схемой теста Голдфельда-Квандта упорядочим данные по возрастанию переменной Х2, предполагая, что дисперсии ошибок зависят от величины этой переменной. В нашем примере m = n/2 = 16/2=8.
Результаты дисперсионного анализа модели множественной регрессии, построенной по первым 8 наблюдениям (после ранжирования по возрастанию переменной Х2), приведены в следующей таблице.