Основы корреляционно-регрессионного анализа
Точечные же оценки неизвестных других параметров получают с помощью формул, аналогичных формулам вычисления самих параметров через генеральные начальные моменты. Таким образом, будем иметь: х — оценка для jliv; х2 — оценка для М (х2); у — оценка для xlf у2 — оценка для М (г/2); ху — оценка для М (ху). Где Xjj — значение i-го наблюдения j-ro фактора; r}j — выборочный парный коэффициент корреляции… Читать ещё >
Основы корреляционно-регрессионного анализа (реферат, курсовая, диплом, контрольная)
Корреляционный анализ является одним из методов статистического анализа взаимозависимости нескольких признаков — компонент случайного векторах. Основная задача корреляционного анализа состоит в оценке степени зависимости между случайными величинами. Когда говорят, что две случайные переменные коррелированы, имеют в виду, как правило, что они друг с другом как-то связаны. Стандартной мерой связи переменных является коэффициент корреляции. Следует, однако, помнить, что он измеряет лишь силу линейной связи.
Коэффициент корреляции изменяется в пределах от -1 до 1 и измеряет степень линейной связи двух случайных переменных. Положительное значение коэффициента корреляции означает, что с ростом одной из переменных другая также растет, с убыванием одной из них убывает и другая. Отрицательное значение означает, что с ростом одной из переменных другая убывает, с убыванием одной из них другая растет. Коэффициент корреляции, равный 0, означает, что между переменными отсутствует линейная связь. Обратите внимание: даже если коэффициент корреляции равен 1 по абсолютной величине и, следовательно, переменные функционально связаны (линейно), ничего нельзя сказать о причинно-следственной связи между ними.
В статистической практике используются два коэффициента корреляции: для числовых переменных — коэффициент корреляции Пирсона, для ранговых — коэффициент корреляции Спирмена.
Степень линейной зависимости между количественными переменными характеризуется с помощью парных, частных и множественных коэффициентов корреляции и детерминации.
Парный коэффициент корреляции характеризует тесноту линейной зависимости между двумя переменными на фоне действия всех остальных показателей, входящих в модель.
Частный коэффициент корреляции характеризует тесноту линейной зависимости между двумя переменными при исключении влияния всех остальных показателей, входящих в модель. Данные коэффициенты корреляции изменяются в пределах от -1 до 1, причем чем ближе коэффициент корреляции к 1, гем сильнее зависимость между переменными. Если коэффициент корреляции больше 0, то связь положительная, а если меньше нуля — отрицательная.
Множественный коэффициент корреляции характеризует тесноту линейной связи между одной переменной (результативной) и остальными, входящими в модель; изменяется в пределах от 0 до 1. Квадрат множественного коэффициента корреляции называется множественным коэффициентом детерминации. Он характеризует долю дисперсии одной переменной (результативной), обусловленной влиянием всех остальных переменных (аргументов), входящих в модель.
Исходной для анализа является матрица размерностью (п • k), i-я строка которой характеризует i-e наблюдение (объект) по всем k-м показателям (7=1,2,…, к):
В корреляционном анализе матрицу X рассматривают как выборку объема п из-мерной генеральной совокупности, подчиняющейся-мерному нормальному закону распределения. По выборке определяют оценки параметров генеральной совокупности: вектор средних (х), вектор среднеквадратических отклонений s и корреляционную матрицу ® порядка (k • k)
Матрица R является симметричной 0}/ = г^-) и положительно определенной:
где Xjj — значение i-го наблюдения j-ro фактора; r}j — выборочный парный коэффициент корреляции, характеризует тесноту линейной связи между показателями х-} и Xj. При этом Гц является оценкой генерального парного коэффициента корреляции.
Кроме того, находятся точечные оценки частных и множественных коэффициентов корреляции любого порядка. Например, частный коэффициент корреляции (к — 2)-го порядка между факторами Х( и Х2 равен.
где Rji — алгебраическое дополнение элемента Гц корреляционной матрицы R. При этом Rji = (-1 )J+I Мц, где М;/ — минор, определитель матрицы, получаемой из матрицы R путем вычеркивания j-й строки и /-го столбца.
Множественный коэффициент корреляции (k — 1)-го порядка фактора (результативного признака) Xt определяется по формуле.
где R — определитель матрицы R.
Для простоты рассмотрения распределения экономических показателей за основу рассмотрения генеральной совокупности принимается двумерный нормальный закон распределения, который можно записать следующим образом:
где |хх, р/у — математические ожидания соответственно случайных величин X и У; Gr, Gz/ — средние квадратические отклонения этих величин; г — коэффициент корреляции X и У.
При данных параметрах можно получить уравнения линий регрессии, показывающих изменение условных математических ожиданий в зависимости от изменения соответствующих значений случайных аргументов:
М (у/х) — Му = Рух(х-Мх) — линейное уравнение регрессии у на х
М (у/х) — Мх = рху(у-Му) — линейное уравнение регрессии х на у
а//.
Pwr= Р— — коэффициент регрессии у на х;
°х
а
Рг… = р^- — коэффициент регрессии х на у.
J о.
У
Квадрат коэффициента корреляции р2, т. е. коэффициент детерминации, в рассматриваемой модели указывает долю дисперсии одной случайной величины, обусловленную вариацией другой. Коэффициент регрессии Р//Л показывает, на сколько единиц своего измерения увеличится (Р > 0) или уменьшится (р < 0) в среднем у (М (у / х)), если х увеличить на единицу своего измерения.
Задача двумерного корреляционного анализа состоит прежде всего в оценке пяти параметров, определяющих генеральную совокупность.
В качестве точечных оценок неизвестных начальных моментов первого и второго порядка генеральной совокупности берутся соответствующие выборочные моменты.
Точечные же оценки неизвестных других параметров получают с помощью формул, аналогичных формулам вычисления самих параметров через генеральные начальные моменты. Таким образом, будем иметь: х — оценка для jliv; х2 — оценка для М (х2); у — оценка для xlf у2 — оценка для М (г/2); ху — оценка для М (ху).
Соответственно, отсюда.
=х2 -(х)2 — оценка для ад.2; s2 — у2 -(у)2 — оценка для ст/у2; ху-х-у
г = ———— оценка для р.
Оценки генеральных коэффициентов регрессии Р//Л. и РЛ/у получаются соответственно по формулам.
Отсюда оценки уравнений регрессии имеют вид.
При этом у/х и х / у — обозначения оценок для условных математических ожиданий М (у/х) и М (х/у) генеральной совокупности.
Следует отметить, что вышеприведенные точечные оценки являются состоятельными, а х и у несмещенными и эффективными. Кроме того, распределение выборочных средних (х, у) не зависит от распределения (s?,
г). Выборочный коэффициент корреляции г по абсолютной величине нс больше 1.