Доверительный интервал для функции регрессии.
Построим доверительный интервал для функции регрессии, т. е. для условного математического ожидания М^У), который с заданной надежностью (доверительной вероятностью) у = 1—а накрывает неизвестное значение Мх (Y).
Найдем дисперсию групповой средней у, представляющей выборочную оценку MX(Y). С этой целью уравнение регрессии (3.12) представим в виде:
На рис. 3.5 линия регрессии (3.28) изображена графически. Для произвольного наблюдаемого значения у, — выделены его составляющие: средняя у, приращение b^Xj-x), образующие расчетное значение >>,•, и остаток е,.
Дисперсия групповой средней равна сумме дисперсий двух независимых[1] слагаемых выражения (3.28):
(Здесь учтено, что (х-х) — неслучайная величина, при вынесении которой за знак дисперсии ее необходимо возвести в квадрат.).
Рис. 3.5.
Дисперсия выборочной средней у
Для нахождения дисперсии ст^ представим коэффициент регрессии (3.16) в виде.
Найдем оценку дисперсии групповых средних (3.29), учитывая (3.30) и (3.32) и заменяя ст2 ее оценкой s2:
Основываясь на предпосылках 1—5 регрессионного анализа.
.. у-МЛУ)
(§ 3.4), можно показать, что статистика {= ——1 имеет.
sy
/-распределение Стьюдента с к = п — 2 степенями свободы и построить доверительный интервал для условного математического ожидания МХ(У):
где 5;. = yjsj — стандартная ошибка групповой средней у.
Из формул (3.33) и (3.34).
видно, что величина (длина) доверительного интервала зависит от значения объясняющей переменной х: при х = х она минимальна, а по мере удаления х от х величина доверительного интервала увеличивается (рис. 3.6). Таким образом, прогноз значений (определение неизвестных значений) Р,1С. з. б зависимой переменной У по уравнению регрессии оправдан, если значение х объясняющей переменной X не выходит за диапазон ее значений по выборке (причем тем более точный, чем ближе л: к х). Другими словами, экстраполяция кривой регрессии, т.е. ее использование вне пределов обследованного диапазона значений объясняющей переменной (даже если она оправдана для рассматриваемой переменной исходя из смысла решаемой задачи) может привести к значительным погрешностям.
- [1] Доказательство этого факта здесь нс приводится.