Основы корреляционно-регрессионного анализа

РефератПомощь в написанииУзнать стоимостьмоей работы

Точечные же оценки неизвестных других параметров получают с помощью формул, аналогичных формулам вычисления самих параметров через генеральные начальные моменты. Таким образом, будем иметь: х — оценка для jliv; х2 — оценка для М (х2); у — оценка для xlf у2 — оценка для М (г/2); ху — оценка для М (ху). Где Xjj — значение i-го наблюдения j-ro фактора; r}j — выборочный парный коэффициент корреляции… Читать ещё >

Основы корреляционно-регрессионного анализа (реферат, курсовая, диплом, контрольная)

Корреляционный анализ является одним из методов статистического анализа взаимозависимости нескольких признаков — компонент случайного векторах. Основная задача корреляционного анализа состоит в оценке степени зависимости между случайными величинами. Когда говорят, что две случайные переменные коррелированы, имеют в виду, как правило, что они друг с другом как-то связаны. Стандартной мерой связи переменных является коэффициент корреляции. Следует, однако, помнить, что он измеряет лишь силу линейной связи.

Коэффициент корреляции изменяется в пределах от -1 до 1 и измеряет степень линейной связи двух случайных переменных. Положительное значение коэффициента корреляции означает, что с ростом одной из переменных другая также растет, с убыванием одной из них убывает и другая. Отрицательное значение означает, что с ростом одной из переменных другая убывает, с убыванием одной из них другая растет. Коэффициент корреляции, равный 0, означает, что между переменными отсутствует линейная связь. Обратите внимание: даже если коэффициент корреляции равен 1 по абсолютной величине и, следовательно, переменные функционально связаны (линейно), ничего нельзя сказать о причинно-следственной связи между ними.

В статистической практике используются два коэффициента корреляции: для числовых переменных — коэффициент корреляции Пирсона, для ранговых — коэффициент корреляции Спирмена.

Степень линейной зависимости между количественными переменными характеризуется с помощью парных, частных и множественных коэффициентов корреляции и детерминации.

Парный коэффициент корреляции характеризует тесноту линейной зависимости между двумя переменными на фоне действия всех остальных показателей, входящих в модель.

Частный коэффициент корреляции характеризует тесноту линейной зависимости между двумя переменными при исключении влияния всех остальных показателей, входящих в модель. Данные коэффициенты корреляции изменяются в пределах от -1 до 1, причем чем ближе коэффициент корреляции к 1, гем сильнее зависимость между переменными. Если коэффициент корреляции больше 0, то связь положительная, а если меньше нуля — отрицательная.

Множественный коэффициент корреляции характеризует тесноту линейной связи между одной переменной (результативной) и остальными, входящими в модель; изменяется в пределах от 0 до 1. Квадрат множественного коэффициента корреляции называется множественным коэффициентом детерминации. Он характеризует долю дисперсии одной переменной (результативной), обусловленной влиянием всех остальных переменных (аргументов), входящих в модель.

Исходной для анализа является матрица размерностью (п • k), i-я строка которой характеризует i-e наблюдение (объект) по всем k-м показателям (7=1,2,…, к):

Основы корреляционно-регрессионного анализа.

В корреляционном анализе матрицу X рассматривают как выборку объема п из^{-мерной} генеральной совокупности, подчиняющейся^{-мерному} нормальному закону распределения. По выборке определяют оценки параметров генеральной совокупности: вектор средних (х), вектор среднеквадратических отклонений s и корреляционную матрицу ® порядка (k • k)

Матрица R является симметричной 0}/ = г^-) и положительно определенной:

где Xjj — значение i-го наблюдения j-ro фактора; r_}j — выборочный парный коэффициент корреляции, характеризует тесноту линейной связи между показателями х-_} и Xj. При этом Гц является оценкой генерального парного коэффициента корреляции.

Кроме того, находятся точечные оценки частных и множественных коэффициентов корреляции любого порядка. Например, частный коэффициент корреляции (к — 2)-го порядка между факторами Х₍ и Х₂ равен.

где Rji — алгебраическое дополнение элемента Гц корреляционной матрицы R. При этом Rji = (-1 )J^+I Мц, где М_;/ — минор, определитель матрицы, получаемой из матрицы R путем вычеркивания j-й строки и /-го столбца.

Множественный коэффициент корреляции (k — 1)-го порядка фактора (результативного признака) X_t определяется по формуле.

где R — определитель матрицы R.

Для простоты рассмотрения распределения экономических показателей за основу рассмотрения генеральной совокупности принимается двумерный нормальный закон распределения, который можно записать следующим образом:

где |х_х, р_/у — математические ожидания соответственно случайных величин X и У; G_r, G_z/ — средние квадратические отклонения этих величин; г — коэффициент корреляции X и У.

При данных параметрах можно получить уравнения линий регрессии, показывающих изменение условных математических ожиданий в зависимости от изменения соответствующих значений случайных аргументов:

М (у/х) — Му = Р_ух(х-Мх) — линейное уравнение регрессии у на х

М (у/х) — Мх = р_ху(у-Му) — линейное уравнение регрессии х на у

^а//.

Pwr⁼ Р— ^— коэффициент регрессии у на х;

°х

Р_г… = р^- — коэффициент регрессии х на у.

^J о.

Квадрат коэффициента корреляции р², т. е. коэффициент детерминации, в рассматриваемой модели указывает долю дисперсии одной случайной величины, обусловленную вариацией другой. Коэффициент регрессии Р_//Л показывает, на сколько единиц своего измерения увеличится (Р > 0) или уменьшится (р < 0) в среднем у (М (у / х)), если х увеличить на единицу своего измерения.

Задача двумерного корреляционного анализа состоит прежде всего в оценке пяти параметров, определяющих генеральную совокупность.

В качестве точечных оценок неизвестных начальных моментов первого и второго порядка генеральной совокупности берутся соответствующие выборочные моменты.

Точечные же оценки неизвестных других параметров получают с помощью формул, аналогичных формулам вычисления самих параметров через генеральные начальные моменты. Таким образом, будем иметь: х — оценка для jli_v; х² — оценка для М (х²); у — оценка для x_lf у² — оценка для М (г/²); ху — оценка для М (ху).

Соответственно, отсюда.

=х² -(х)² — оценка для а_д.²; s² — у² -(у)² — оценка для ст_/у²; ху-х-у

г = ———— оценка для р.

Оценки генеральных коэффициентов регрессии Р_//Л. и Р_Л/у получаются соответственно по формулам.

Отсюда оценки уравнений регрессии имеют вид.

При этом у/х и х / у — обозначения оценок для условных математических ожиданий М (у/х) и М (х/у) генеральной совокупности.

Следует отметить, что вышеприведенные точечные оценки являются состоятельными, а х и у несмещенными и эффективными. Кроме того, распределение выборочных средних (х, у) не зависит от распределения (s?,

г). Выборочный коэффициент корреляции г по абсолютной величине нс больше 1.

Показать весь текст

Заполнить форму текущей работой

Другие работы

Выручка от продажи товаров, работ и услуг. Факторы влияющие на ее размер

Управление факторами прибыльной работы осуществляется не только с помощью натурально-стоимостных индикаторов, но и путем регулярного исчисления разнообразных показателей рентабельности. Управление рентабельностью означает, по сути, обеспечение желаемой динамики значений этих коэффициентов. Поскольку при расчете тех или иных коэффициентов рентабельности используются различные базы (т. е…

Курсовая