Корреляционно-регрессионный анализ однофакторной стохастической связи
И сопоставляется с Если нулевая гипотеза верна, то r = 0 и распределение t — критерия подчиняется закону Стьюдента с заданными параметрами: уравнением значимости и числом степеней свободы поэтому в каждом конкретном случае по таблице распределения t — критерия Стьюдента при уровне значимости, равным 0,05 находится такое критическое значение «t», которое допустимо при справедливости нулевой… Читать ещё >
Корреляционно-регрессионный анализ однофакторной стохастической связи (реферат, курсовая, диплом, контрольная)
НОО ВПО НП ТУЛЬСКИЙ ИНСТИТУТ ЭКОНОМИКИ И ИНФОРМАТИКИ Кафедра «Экономики и менеджмента»
КОНТРОЛЬНАЯ РАБОТА
По дисциплине:«Статистика»
На тему:
«Корреляционно — регрессионный анализ однофакторной стохастической связи»
Выполнила: студентка группы ТлБиА 06 (б) специальности «Бухгалтерский учет, анализ и аудит»
Жукова Виктория Викторовна Проверил: Глухарев Юрий Геннадьевич Тула 2010
1 Корреляционные взаимосвязи
1.1 Понятие корреляционной связи
1.2 Методы выявления корреляционной связи
1.3 Связь между качественными признаками на основе таблиц сопряженности
1.4 Показатели тесноты связи между двумя количественными признаками
1.4.1 Ковариация и линейный коэффициент корреляции
1.4.2 Проверка коэффициента корреляции на существенность
2 Регрессионный анализ
2.1 Определение коэффициентов уравнения линейной регрессии методом наименьших квадратов
2.2 Нелинейная регрессия. Виды функциональных связей нелинейной регрессии
2.3 Оценка значимости уравнений регрессии по критерию Фишера
2.4 Понятие о множественном корреляционно-регрессионом анализе
3 Практическая часть Заключение Список литературы
В современном обществе важную роль в механизме управления экономикой выполняет статистика. Она осуществляет сбор, научную обработку, обобщение и анализ информации, характеризующей развитие экономики страны, культуры и уровня жизни населения. В результате предоставляется возможность выявления взаимосвязей в экономике, изучения динамики ее развития, проведения международных сопоставлений и в конечном итоге — принятия эффективных управленческих решений на государственном и региональном уровнях.
Термин «статистика» происходит от латинского слова status, что в Средние века означало политическое состояние государства.
Большим шагом в развитии статистической науки послужили применение экономико-математических методов и широкое использование компьютерной техники в анализе социально-экономических явлений.
В настоящее время ведется работа по совершенствованию статистической методологии и завершению перехода Российской Федерации на принятую в международной практике систему учета и статистики в соответствии с требованиями развития рыночной экономики.
Статистика, как любая наука, требует определения предмета исследования. Предметом статистики выступают размеры и количественные соотношения качественно определенных социально-экономических явлений, закономерности их связи и развития в конкретных условиях места и времени. Свой предмет статистика изучает методом обобщающих показателей.
Теоретической основой статистики являются положения социально-экономической теории, которые рассматривают законы развития социально-экономических явлений, выясняют их природу и значение в жизни общества.
Итак, статистика — комплекс учебных дисциплин, обеспечивающих овладение методологией статистического исследования массовых социально-экономических явлений и процессов с целью выявления закономерностей их развития в конкретных условиях места и времени.
Для изучения предмета статистики разработаны и применяются специфические приемы, совокупность которых образует методологию статистики (методы массовых наблюдений, группировок, обобщающих показателей, динамических рядов, индексный метод и др.). Применение в статистике конкретных методов предопределяется поставленными задачами и зависит от характера исходной информации.
Исследование связей в условиях массового наблюдения и действия случайных факторов осуществляется, как правило, с помощью экономико-статистических моделей. В широком смысле модель — это аналог, условный образ (изображение, описание, схема, чертеж и т. п.) какого-либо объекта, процесса или события, приближенно воссоздающий «оригинал». Модель представляет собой логическое или математическое описание компонентов и функций, отображающих существенные свойства моделируемого объекта или процесса, дает возможность установить основные закономерности изменения оригинала. В модели оперируются показателями, исчисленными для качественно однородных массовых явлений (совокупностей). Выражение моделей в виде функциональных уравнений используют для расчета средних значений моделируемого показателя по набору заданных величин и для выявления степени влияния на него отдельных факторов.
По количеству включаемых факторов модели могут быть однофакторными и многофакторными (два и более факторов).
В зависимости от познавательной цели статистические модели подразделяются на структурные, динамические и модели связи.
Наиболее разработанной в теории статистики является методология так называемой парной корреляции, рассматривающая влияние вариации факторного признака х на результативный признак у и представляющая собой однофакторный корреляционный и регрессионный анализ.
1 Корреляционные взаимосвязи
1.1 Понятие корреляционной связи
Среди статистически взаимосвязанных признаков одни могут рассматриваться как определенные факторы, влияющие на изменение других, а вторые — как следствие, или результат изменения первых. Соответственно, первые — это факторные признаки, а вторые — результативные. Связь между двумя переменными «x» и «y» является функциональной, если определенному значению переменной «x» соответствует строго определенное значение «y». Это жестко детерминированная связь. Но существует и другая взаимосвязь, при которой взаимно действуют многие факторы, неравномерно влияющие на изменение результативного признака. Такие связи являются стохастическими (вероятностными).
Корреляционная связь является частным случаем стохастической связи. Это соотношение, соответствие между средним значением результативного признака и признаками-факторами. При этом, если рассматривается связь средней величины результативного показателя «y' c одним признаком-фактором „x“, корреляционная связь называется „парной“, а если факторных признаков два и более множественной. По характеру изменений „y“,"x» в парной корреляции различают прямую и обратную взаимосвязи. При прямой — с увеличением «x» возрастает и «y», при обратной — уменьшается.
Изучение корреляционных связей сводится к решению следующих задач:
1) выявление наличия или отсутствия корреляционной связи между изучаемыми признаками, где эта задача может быть решена на основе параллельного сопоставления (сравнения) значений «x» и «y» y «n» единиц совокупности, а также с помощью группировок и путем построения и анализа специальных корреляционных таблиц;
2) измерение тесноты связи между двумя и более признаками с помощью специальных коэффициентов (коэффициентов корреляции), и эта часть исследований называется «корреляционным анализом»;
3) определение уравнения регрессии — математической модели, в которой среднее значение результативного признака «y» рассматривается как функция одной или нескольких переменных — факторных признаков, — и эта часть исследования носит название «регрессионный анализ». Общий термин «корреляционно-регрессионный анализ» подразумевает всестороннее исследование корреляционных связей, в том числе и определение уравнений регрессии, измерение тесноты связей, а также определение возможных ошибок как параметров уравнений регрессии, так и показателей тесноты связей.
1.2 Методы выявления корреляционной связи
Для выявления наличия и характера корреляционной связи в статистике применяются следующие методы:
1) применение параллельных данных (значений «x"и «y» y «n» единиц);
2) графический метод;
3) метод аналитических группировок и корреляционных таблиц;
4) расчет коэффициентов корреляции.
1.При небольшом числе наблюдений наличие корреляционной связи между 2-мя признаками «y» и «x» можно выявить визуально путем простого параллельного сравнения их значений у отдельных единиц. Для этого единицы наблюдения располагают по возрастанию значения факторного признака «x» и затем сравнивают с ним поведение значений результативного признака «y». Данные вносятся в таблицу, где значениям соответствуют значения в 2-х первых столбцах таблицы, а в 2-х следующих столбцах таблицы знаки отклонений величин имеющие значения + или —. Далее, если совпадение знаков имеет место в строке, то это обозначают символом «С», а если несовпадение знаков — то это обозначается через «Н», затем определяется коэффициент Фехнера:
(1.2.1.)
Если знаки совпадут, то, и это прямая связь; если все знаки не совпадут и тогда и это обратная связь, а если .
2. Корреляционную зависимость можно изобразить графически. Имея «n» взаимосвязанных пар значений наносят их на координатную сетку" X o Y", и точки соединяют, — получается ломаная линия, которая и является линией регрессии.
3. Метод аналитических группировок с составлением корреляционных таблиц применяется при большом числе наблюдений. В этом случае производится группировка единиц совокупности по факторному признаку «x», и для каждой группы рассчитывается среднее значение. Если «y» зависит от «x», то в изменении будет прослеживаться определенная закономерность по корреляционной таблице взаимной сопряженности, где имеется количественное распределение единиц совокупности. Корреляционная таблица строится по типу шахматной, т. е. в подлежащем таблицы выделяются группы по факторному признаку «x», в сказуемом — по результативному «y», или наоборот, а в клетках таблицы, на пересечении «x» и «y» показано число случаев совпадения каждого значения «x» с соответствующим значением «y». Далее, на основании корреляционных таблиц можно определить корреляционное отношение:
межгрупповая дисперсия,
а общая дисперсия по всем группам;
m — число групп по факторному признаку «x» ;
h — число единиц совокупности;
среднее значение результативного признака по группам; общее среднее значение результативного признака;
индивидуальные значения результативного признака;
частота в jтой группе по «x»;
частота в iтой группе по «y»,
эмпирический коэффициент детерминации.
1.3 Связь между качественными признаками на основе таблиц сопряженности
Простейшая форма таблицы взаимной сопряженности — таблица 4-х полей (4-х клеточная) где по каждому признаку выделяются только 2 группы, чаще по альтернативному признаку (принципу) — это «да — нет», «хорошо — плохо», «удовлетворительно — неудовлетворительно». Для измерения корреляционных связей между двумя качественными показателями используются:
1) коэффициент ассоциации:
;
2) коэффициент контингенции:
Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь достаточно значительная, так при ;
3) коэффициенты взаимной сопряженности Пирсона и Чупрова на основе критерия — Пирсона, — коэффициент Пирсона:
где;
коэффициент Чупрова:
где в формулах (1.3.3.)-(1.3.5.):
эмпирические и теоретические частоты по группам;
критерий Пирсона;
n — число единиц наблюдения;
N — общее число единиц совокупности;
соответственно, число строк и граф в таблице.
1.4 Показатели тесноты связи между двумя количественными признаками
1.4.1 Ковариация и линейный коэффициент корреляции
Связь между двумя стохастическими величинами «y» и «x» в простейшем ненормированном виде оценивается ковариационной связью или просто «ковариацией», которая определяется по соотношению: а в нормированном виде — линейным коэффициентом корреляции. Как и коэффициент Фехнера, линейный коэффициент корреляции определяется на основе отклонений индивидуальных значений «x» и «y» от соответствующей средней величины, представляет собой среднюю величину из произведений нормированных отклонений для «x» и для «y»:
.
Соотношение
представляет собой среднее произведение отклонений значений признаков от их средних, называемое «ковариацией», таким образом, Иногда линейный коэффициент корреляции удобно рассчитывать по итоговым значениям (суммам) исходных переменных:
.
Линейный коэффициент корреляции также можно определить по следующей формуле:
где
коэффициент регрессии в уравнении связи на основе линейной модели уравнения регрессии вида соответственно, среднеквадратические отклонения в ряду «x» и в ряду «y». Линейный коэффициент корреляции может принимать значения от -1 до +1, причем знак определяется в ходе решения. Если В первом случае связь прямая, во втором — обратная. При что означает отсутствие линейной зависимости между «x» и «y», но не означает, что отсутствует вообще между ними какая-то стохастическая связь. В этом случае необходимо произвести расчет «индекса корреляции», как и при расчете после расчета по определению какого-то вида зависимости нелинейной функциональной аппроксимации в виде уравнения регрессии, например, тогда:
1.4.2 Проверка коэффициента корреляции на существенность
Интерпретируя значение коэффициента корреляции, следует отметить, что он рассчитан для ограниченного числа наблюдений и подвержен случайным колебаниям, как и сами значения «x» и «y», на основе которых он и рассчитан, т. е. как и любой выборочный показатель, он содержит случайную ошибку и не всегда однозначно отражает действительно реальную связь между изучаемыми показателями. Для того, чтобы оценить значимость самого коэффициента корреляции и соответственно реальность измеряемой связи между «x» и «y», необходимо рассчитать среднюю квадратическую ошибку коэффициента корреляции — Оценка значимости линейного коэффициента корреляции основана на сопоставлении значений «r» c его средней квадратической ошибкой: Укажем особенности расчета этого критерия в зависимости от числа наблюдений (объема выборки) — n.
1)Если число наблюдений достаточно велико (n>50) и есть основание полагать, что выборка осуществлена из нормальной совокупности, то средняя ошибка коэффициента корреляции определяется по следующей приближенной формуле:
При большом значении «n», если «r» превышает свою среднюю ошибку больше, чем в 3 р он считается существенным, а связь — реальной. Задавшись определенной вероятностью, можно определить доверительные границы «r». При р=0,95, для которой коэффициент доверия t =1,96 (таблица значений интеграла вероятностей F (t)) доверительные границы «r» составят: при вероятности р = 0,997, для которой коэффициент доверия t = 3 (та же таблица F (t)), доверительные границы составят:
Поскольку значение «r» не может превысить 1-цу, то в случае, если следует указывать только нижний предел, т. е. утверждать, что реальный «r» не менее, чем
2) При небольшом числе наблюдений (n<30) средняя ошибка линейного коэффициента корреляции будет определяться зависимостью:
а значимость «r» проверяется на основе t — критерия Стьюдента. При этом проверяется и выдвигается нулевая гипотеза о равенстве коэффициента корреляции нулю, т. е об отсутствии связи между «x» и «y» в генеральной совокупности. Для этого определяется расчетное значение критерия:
и сопоставляется с Если нулевая гипотеза верна, то r = 0 и распределение t — критерия подчиняется закону Стьюдента с заданными параметрами: уравнением значимости и числом степеней свободы поэтому в каждом конкретном случае по таблице распределения t — критерия Стьюдента при уровне значимости, равным 0,05 находится такое критическое значение «t», которое допустимо при справедливости нулевой гипотезы и с ним сравнивается фактическое значение «t». Если то нулевая гипотеза отвергается, и линейный коэффициент корреляции считается значимым, связь между «x» и «y» — существенной, а если наоборот, то нулевая гипотеза не отвергается, и коэффициент корреляции считается незначительным, т. е. считается, что связь между «x» и «y» отсутствует и значение «r», отличное от 0-ля, получено случайно.
2 Регрессионный анализ
2.1 Определение коэффициентов уравнения линейной регрессии методом наименьших квадратов
Линейная зависимость — наиболее часто используемая форма связи между двумя коррелируемыми признаками и выражается при парной корреляции уравнением прямой линии следующего вида: Согласно «методу наименьших квадратов» сумма квадратов величин минимизируется. В соответствии с этим:
.
Учитывая зависимости (2.1.1.) и (2.1.2.), получим:
Из уравнения (2.1.3.) найдем частные производные по «a» и по «b», приравняв их к 0-лю:
произведя преобразования, т. е. сократив каждое уравнение на -2, раскрыв скобки и перенеся члены с «x» в правую часть, а члены с «y» — в левую, получим систему нормальных уравнений для определения коэффициентов уравнения линейной регрессии, т. е. «a» и «b»:
(2.1.4.)
2.2 Нелинейная регрессия
Виды функциональных связей нелинейной регрессии Кроме линейной зависимости (2.1.1.) уравнения регрессии, для определения закономерности стохастической связи двух случайных величин и существуют и нелинейные зависимости, с помощью которых также можно произвести аппроксимацию такого же типа. Рассмотрим по порядку особо распространенные виды нелинейной функциональной стохастической связи:
1) парабола, уравнение регрессии для которой имеет вид: По методу наименьших квадратов получим: Используя соотношение
(2.2.2.), возьмем от него частные производные по «a»,"b","c" b и после преобразований получим следующую систему нормальных уравнений:
(2.2.3.)
Полученная система трех уравнений с тремя неизвестными а, в, с, позволяет определить уравнение регрессии параболы вида (2.2.1.).
2) гипербола, уравнение которой имеет вид:
Произведя в (2.2.4.) замену переменной, Z=1/x, получим:
y = a + bZ
Если взять частные производные по «а» и по «в», от .(2.2.5.) произведя обратную замену переменной, получим систему уравнений вида:
(2.2.6)
Система уравнений (1.2.6.) позволяет определить коэффициенты «а» и «в» уравнения регрессии гиперболы.
3) экспоненциальная функция вида: Произведя преобразования аналогично предыдущему варианту для гиперболы, получим:
и окончательно система уравнений будет иметь следующий вид:
(2.2.7.)
3) степенная функция вида:. Прологарифмировав (2.2.8), получим:
Взяв частные производные в соотношении (2.2.9.) по, А и по b, и произведя обратную замену переменных, получим систему уравнений следующего вида:
(2.2.10.)
4) показательная функция вида
.
Тогда, произведя замену, получим:
W = A + Bx…(2.2.11)
и взяв частные производные по, А и по В, произведя преобразования, аналогичные предыдущим вариантам, получим:
(2.2.12.)
5) логарифмическая функция вида: и по аналогии с гиперболой и экспоненциальной функцией получим систему уравнений вида:
(2.2.13.)
6) обратнологарифмическая функция вида:
произведя аналогичные преобразования, как и в предыдущих случаях, получим:
(2.2.14.)
Из перечисленного количества вариантов нелинейной аппроксимации наиболее «универсальным» вариантом является степенная функция т.к. эта зависимость может аппроксимировать с удовлетворительным результатом практически все виды стохастических связей, т.к. изменение, а и b предполагается в широких пределах и в этой функциональной зависимости нет такой жесткой связи, как в других.
2.3 Оценка значимости уравнений регрессии
по критерию Фишера Для уравнения регрессии каждого вида по линейной или по нелинейной зависимости можно определить следующие параметры оценки значимости:
1) индекс корреляции:
2) среднюю ошибку аппроксимации:
3) коэффициент детерминации:
Где общая дисперсия всей совокупности;
факторная дисперсия;
среднее значение y по уравнению регрессии;
значение в каждом по уравнению регрессии;
остаточная дисперсия.
Критерий значимости Фишера для оценки точности уравнения регрессии определяется по соотношению:
где
«n" — количество пар значений «x'и «y» статистической совокупности;
«m" — количество коэффициентов уравнения регрессии.
Дале используется соотношение:, где р — доверительная вероятность, а уровень значимости.
2.4 Понятие о множественном корреляционно-регрессионом анализе
Переменная величина может зависеть статистически не от одной, а от нескольких величин как, например, урожайность зависит: от количества внесенных удобрений, от погодных условий, от степени прополки сорняков и т. д. Рассмотрим 3 величины, из которых одна «z"зависит статистически от двух лругих „x“,"y». Предположим, произведено «n» наблюдений, результаты которых сведены в таблицу, где колонки таблицы. Простейшая корреляционная зависимость z от x и y — линейная множественная корреляция, где уравнение линейной регрессии имеет вид:
где
некоторые постоянные параметры, определяющие вид уравнения регрессии. Тогда, в соответствии с «методом наименьших квадратов», получим соотношение:
Искомые параметры в соответствии с «методом наименьших квадратов"дают минимум функции S. Применяя далее необходимое условие экстремума функции 3-х переменных, когда частные производные по должны обращаться в нуль, получим систему:
(2.4.3.)
Для решения множественной линейной регрессии с «n» факторами: система нормальных уравнений будет:
(2.4.4.)
Между линейным коэффициентом корреляции и коэффициентом регрессии есть определенная зависимость: в однофакторной линейной регрессии числовой коэффициент при факторном признаке «x» и есть коэффициент регрессии, или:
Множественный коэффициент корреляции для 2-х факторных признаков определяется :
парные коэффициенты корреляции между признаками. Множественный коэффициент корреляции изменяется в пределах от 0 до 1-цы и по определению положительный. Частные коэффициенты корреляции характеризуют степень тесноты связи между двумя признаками при фиксированном значении других признаков, т. е. влияние данных признаков на связь рассматриваемых признаков исключается. В случае зависимости «y» от двух факторных признаков, коэффициенты частной корреляции имеют вид:
С целью расширения возможностей экономического анализа используются «частные коэффициенты эластичности», определяемые по формуле:
Где среднее значение соответствующего факторного признака в множественной регрессии; среднее значение результативного признака; коэффициент регрессии при соответствующем факторном признаке. Частный коэффициент детерминации будет:
Где соответствующий стандартизованный коэффициент уравнения множественной регрессии, а другой множитель в (2.4.9.) — парный коэффициент корреляции между результативным и каким-то факторным признаком.
Практическая часть Исходные данные:
Х | 8.0 | 7.1 | 9.6 | 9.1 | 5.6 | 3.8 | 3.3 | 9.3 | 7.0 | 5.3 | 9.5 | 9.4 | 9.1 | 7.5 | 4.6 | 7.4 | |
У | 1.1 | 6.5 | 8.7 | 7.3 | 4.7 | 1.5 | 1.0 | 7.7 | 1.2 | 4.8 | 6.4 | 8.1 | 6.0 | 5.1 | 3.3 | 6.2 | |
1. Построим линейную модель: .
Все вычисления занесем в таблицу:
8,0 | 1,1 | 64,0 | 8,8 | 1,2 | 5,7 | — 4,6 | 80,6 | 368,8 | ||
7,1 | 6,5 | 50,4 | 46,2 | 42,3 | 4,9 | 1,6 | 33,7 | 55,2 | ||
9,6 | 8,7 | 92,2 | 83,5 | 75,7 | 7,1 | 1,6 | 22,2 | 35,1 | ||
9,1 | 7,3 | 82,8 | 66,4 | 53,3 | 6,7 | 0,6 | 9,5 | 6,0 | ||
5,6 | 4,7 | 31,4 | 26,3 | 22,1 | 3,5 | 1,2 | 34,0 | 40,5 | ||
3,8 | 1,5 | 14,4 | 5,7 | 2,3 | 1,9 | — 0,4 | 20,4 | 7,8 | ||
3,3 | 1,0 | 10,9 | 3,3 | 1,0 | 1,4 | — 0,4 | 30,2 | 13,0 | ||
9,3 | 7,7 | 86,5 | 71,6 | 59,3 | 6,8 | 0,9 | 12,4 | 10,6 | ||
7,0 | 1,2 | 49,0 | 8,4 | 1,4 | 4,8 | — 3,6 | 74,9 | 267,4 | ||
5,3 | 4,8 | 28,1 | 25,4 | 23,0 | 3,2 | 1,6 | 48,3 | 75,4 | ||
9,5 | 6,4 | 90,3 | 60,8 | 41,0 | 7,0 | — 0,6 | 8,9 | 5,6 | ||
9,4 | 8,1 | 88,4 | 76,1 | 65,6 | 6,9 | 1,2 | 16,7 | 19,4 | ||
9,1 | 6,0 | 82,8 | 54,6 | 36,0 | 6,7 | — 0,7 | 10,0 | 6,7 | ||
7,5 | 5,1 | 56,3 | 38,3 | 26,0 | 5,2 | — 0,1 | 2,4 | 0,3 | ||
4,6 | 3,3 | 21,2 | 15,2 | 10,9 | 2,6 | 0,7 | 26,7 | 18,5 | ||
7,4 | 6,2 | 54,8 | 45,9 | 38,4 | 5,1 | 1,1 | 20,8 | 22,2 | ||
Итого | 115,6 | 79,6 | 903,2 | 636,5 | 499,5 | 79,6 | 0,0 | 451,6 | 952,5 | |
Среднее значение | 7,2 | 5,0 | 56,5 | 39,8 | 31,2 | 5,0 | 0,0 | 28,2 | 59,5 | |
b | 0,9027 | |
a | — 1,547 | |
r | 0,732 | |
R2 | 0,5359 | |
F | 16,163 | |
A | 28,2 | |
xрасч. | 59,5 | |
Параболическая
8,0 | 1,1 | 64,0 | 512,0 | 4096,0 | 8,8 | 70,4 | 5,383 | — 4,3 | 79,5653 | 18,3 | 340,7782 | 15,1 563 | ||
7,1 | 6,5 | 50,4 | 357,9 | 2541,2 | 46,15 | 327,665 | 4,42 702 | 2,1 | 46,82 563 | 4,3 | 97,6 859 | 2,325 625 | ||
9,6 | 8,7 | 92,2 | 884,7 | 8493,5 | 83,52 | 801,792 | 7,49 052 | 1,2 | 16,14 681 | 1,5 | 19,52 924 | 13,87 563 | ||
9,1 | 7,3 | 82,8 | 753,6 | 6857,5 | 66,43 | 604,513 | 6,77 582 | 0,5 | 7,736 038 | 0,3 | 4,55 076 | 5,405 625 | ||
5,6 | 4,7 | 31,4 | 175,6 | 983,4 | 26,32 | 147,392 | 3,20 092 | 1,5 | 46,83 279 | 2,2 | 70,20 609 | 0,75 625 | ||
3,8 | 1,5 | 14,4 | 54,9 | 208,5 | 5,7 | 21,66 | 2,33 548 | — 0,8 | 35,77 337 | 0,7 | 29,88 794 | 12,7 563 | ||
3,3 | 1,0 | 10,9 | 35,9 | 118,6 | 3,3 | 10,89 | 2,21 238 | — 1,2 | 54,79 981 | 1,5 | 66,43 819 | 15,80 063 | ||
9,3 | 7,7 | 86,5 | 804,4 | 7480,5 | 71,61 | 665,973 | 7,5 558 | 0,6 | 9,13 348 | 0,4 | 5,885 797 | 7,425 625 | ||
7,0 | 1,2 | 49,0 | 343,0 | 2401,0 | 8,4 | 58,8 | 4,331 | — 3,1 | 72,29 277 | 9,8 | 226,3487 | 14,25 063 | ||
5,3 | 4,8 | 28,1 | 148,9 | 789,0 | 25,44 | 134,832 | 3,1 078 | 1,8 | 59,42 713 | 3,2 | 106,3282 | 0,30 625 | ||
9,5 | 6,4 | 90,3 | 857,4 | 8145,1 | 60,8 | 577,6 | 7,3435 | — 0,9 | 12,8481 | 0,9 | 12,12 218 | 2,30 625 | ||
9,4 | 8,1 | 88,4 | 830,6 | 7807,5 | 76,14 | 715,716 | 7,19 852 | 0,9 | 12,52 313 | 0,8 | 11,28 935 | 9,765 625 | ||
9,1 | 6,0 | 82,8 | 753,6 | 6857,5 | 54,6 | 496,86 | 6,77 582 | — 0,8 | 11,44 983 | 0,6 | 8,883 009 | 1,50 625 | ||
7,5 | 5,1 | 56,3 | 421,9 | 3164,1 | 38,25 | 286,875 | 4,8315 | 0,3 | 5,55 728 | 0,1 | 1,49 213 | 0,15 625 | ||
4,6 | 3,3 | 21,2 | 97,3 | 447,7 | 15,18 | 69,828 | 2,63 852 | 0,7 | 25,7 012 | 0,4 | 16,58 338 | 2,805 625 | ||
7,4 | 6,2 | 54,8 | 405,2 | 2998,7 | 45,88 | 339,512 | 4,72 732 | 1,5 | 31,15 253 | 2,2 | 45,87 771 | 1,500 625 | ||
Итого | 115,6 | 79,6 | 903,2 | 7436,8 | 63 389,8 | 636,5 | 5330,3 | 79,7 | — 0,1 | 527,1 | 47,2 | 1062,8 | 103,5 | |
Среднее знач | 7,2 | 5,0 | 56,5 | 464,8 | 3961,9 | 39,8 | 333,1 | 5,0 | 0,0 | 32,9 | 2,9 | 66,4 | 6,5 | |
a | 2,679 | |||||||||||||
b | — 0,478 | |||||||||||||
c | 0,102 | |||||||||||||
R | 0,7374 | |||||||||||||
R2 | 0,5438 | |||||||||||||
F | 7,7472 | |||||||||||||
xрасч. | 32,9 | |||||||||||||
Степенная
lg (x) | (lg (x))2 | lg (y) | lg (x)*lg (y) | lg (x2) | |||||||||||
Итого | 115,6 | 79,6 | 13,4 | 11,5 | 9,7 | 8,6 | 64,3 | 15,3 | 120,6 | 0,0 | 990,1 | 3013,0 | 103,5 | 26,8 | |
Среднее значение | 7,2 | 5,0 | 0,8 | 0,7 | 0,6 | 0,5 | 4,0 | 1,0 | 7,5 | 0,0 | 61,9 | 188,3 | 6,5 | 1,7 | |
8,0 | 1,1 | 0,90 309 | 0,815 572 | 0,41 393 | 0,37 381 | 3,998 416 | — 2,9 | 8,4 | — 3,9 | 72,48 911 | 210,1036 | 15,0 | 1,80 618 | ||
7,1 | 6,5 | 0,851 258 | 0,724 641 | 0,812 913 | 0,691 999 | 4,13 559 | 2,5 | 6,2 | 1,5 | 61,95 104 | 154,0376 | 2,3 | 1,702 517 | ||
9,6 | 8,7 | 0,982 271 | 0,964 857 | 0,939 519 | 0,922 863 | 3,975 394 | 4,7 | 22,3 | 3,7 | 118,8462 | 561,5016 | 13,9 | 1,964 542 | ||
9,1 | 7,3 | 0,959 041 | 0,91 976 | 0,863 323 | 0,827 962 | 3,982 134 | 3,3 | 11,0 | 2,3 | 83,31 878 | 276,4405 | 5,4 | 1,918 083 | ||
5,6 | 4,7 | 0,748 188 | 0,559 785 | 0,672 098 | 0,502 856 | 4,43 841 | 0,7 | 0,4 | — 0,3 | 16,22 614 | 10,64 693 | 0,1 | 1,496 376 | ||
3,8 | 1,5 | 0,579 784 | 0,336 149 | 0,176 091 | 0,102 095 | 4,93 811 | — 2,6 | 6,7 | — 3,5 | 63,35 932 | 164,3421 | 12,1 | 1,159 567 | ||
3,3 | 1,0 | 0,518 514 | 0,268 857 | 4,112 144 | — 3,1 | 9,7 | — 4,0 | 75,68 178 | 235,5326 | 15,8 | 1,37 028 | ||||
9,3 | 7,7 | 0,968 483 | 0,937 959 | 0,886 491 | 0,858 551 | 3,979 393 | 3,7 | 13,8 | 2,7 | 93,49 683 | 347,8649 | 7,4 | 1,936 966 | ||
7,0 | 1,2 | 0,845 098 | 0,714 191 | 0,79 181 | 0,66 916 | 4,15 362 | — 2,8 | 7,9 | — 3,8 | 70,11 478 | 197,3985 | 14,3 | 1,690 196 | ||
5,3 | 4,8 | 0,724 276 | 0,524 576 | 0,681 241 | 0,493 407 | 4,50 899 | 0,7 | 0,6 | — 0,2 | 18,49 222 | 13,85 254 | 0,0 | 1,448 552 | ||
9,5 | 6,4 | 0,977 724 | 0,955 943 | 0,80 618 | 0,788 221 | 3,976 713 | 2,4 | 5,9 | 1,4 | 60,93 695 | 147,6677 | 2,0 | 1,955 447 | ||
9,4 | 8,1 | 0,973 128 | 0,946 978 | 0,908 485 | 0,884 072 | 3,978 046 | 4,1 | 17,0 | 3,1 | 103,6176 | 427,1069 | 9,8 | 1,946 256 | ||
9,1 | 6,0 | 0,959 041 | 0,91 976 | 0,778 151 | 0,746 279 | 3,982 134 | 2,0 | 4,1 | 1,0 | 50,67 297 | 102,2512 | 1,1 | 1,918 083 | ||
7,5 | 5,1 | 0,875 061 | 0,765 732 | 0,70 757 | 0,619 167 | 4,6 598 | 1,1 | 1,2 | 0,1 | 27,29 005 | 29,839 | 0,0 | 1,750 123 | ||
4,6 | 3,3 | 0,662 758 | 0,439 248 | 0,518 514 | 0,343 649 | 4,69 113 | — 0,8 | 0,6 | — 1,7 | 18,90 125 | 14,53 721 | 2,8 | 1,325 516 | ||
7,4 | 6,2 | 0,869 232 | 0,755 564 | 0,792 392 | 0,688 772 | 4,8 301 | 2,2 | 4,8 | 1,2 | 54,67 899 | 119,8399 | 1,5 | 1,738 463 | ||
b | — 0,3 167 | |
a | 4,270 617 | |
R | ||
R2 | ||
F | 61,9 | |
x2расч. | 188,3 | |
А | 61,9 | |
Найдем значения неизвестных параметров:
Тогда, т. е. с увеличением Х на 1 ед. У увеличится в среднем на 0,076 ед.
Коэффициент корреляции:
Т.к. 0,807>0,7; то связь между рассматриваемыми признаками тесная.
Коэффициент детерминации:
Т.е. вариация результирующего фактора У на 65,1% объясняется вариацией фактора Х.
Проверим значимость уравнения регрессии с помощью F-критерия Фишера:
По таблице для;; находим, что .
Т.к. 26,131>4,600; то уравнение регрессии в целом статистически значимо.
Средняя относительная ошибка аппроксимации:
Т.е. в среднем расчетные значения для модели отличаются от фактических значений на 9,339%.
Критерий Пирсона:
По таблице для; находим, что .
Т.к. 0,0389<23,7; то гипотеза о выбранном теоретическом распределении согласуется с исходными данными.
2. Построим параболическую модель: .
Найдем значения неизвестных параметров:
Тогда
Коэффициент корреляции:
Т.к. 0,814>0,7; то связь между рассматриваемыми признаками тесная.
Коэффициент детерминации:
Т.е. вариация результирующего фактора У на 66,3% объясняется вариацией фактора Х.
Проверим значимость уравнения регрессии с помощью F-критерия Фишера:
По таблице для;; находим, что .
Т.к. 12,767>3,806; то уравнение регрессии в целом статистически значимо.
Средняя относительная ошибка аппроксимации:
Т.е. в среднем расчетные значения для модели отличаются от фактических значений на 9,251%.
3. Построим степенную модель: .
Найдем значения неизвестных параметров:
и
Тогда .
Коэффициент корреляции:
Т.к. 0,776>0,7; то связь между рассматриваемыми признаками тесная.
Коэффициент детерминации:
Т.е. вариация результирующего фактора У на 60,2% объясняется вариацией фактора Х.
Проверим значимость уравнения регрессии с помощью F-критерия Фишера:
По таблице для;; находим, что .
Т.к. 21,133>4,600; то уравнение регрессии в целом статистически значимо.
Средняя относительная ошибка аппроксимации:
Т.е. в среднем расчетные значения для модели отличаются от фактических значений на 10, 765%.
Критерий Пирсона:
По таблице для; находим, что .
Т.к. 0,044<23,7; то гипотеза о выбранном теоретическом распределении согласуется с исходными данными.
Сводная таблица:
Модель | ||||||
Линейная | 0,807 | 0,651 | 26,131 | 9,339 | 0,0389 | |
Параболическая | 0,814 | 0,663 | 12,767 | 9,251 | ; | |
Степенная | 0,776 | 0,602 | 21,133 | 10,5762 | 0,0436 | |
Заключение
Кроме линейной зависимости уравнения регрессии, для определения закономерности стохастической связи двух случайных величин Х и У существуют и нелинейные зависимости, с помощью которых также можно произвести аппроксимацию такого же типа. Наиболее распространенные виды нелинейной функциональной стохастической связи это: парабола, гипербола, степенная функция, показательная функция, логарифмическая функция, обратнологарифмическая функция. Из перечисленного количества вариантов нелинейной аппроксимации наиболее оптимальным вариантом является степенная функция, так как эта зависимость может аппроксимировать с удовлетворительным результатом практически все виды стохастических связей, так как, а и b предполагает в широких пределах и в этой функциональной зависимости, нет такой жесткой связи как в других.
По результатам сводной таблицы статистического исследования однофакторной стохастической связи, на основании представленных выше десяти функций аппроксимации установлено, что наиболее близкую аппроксимацию имеет показательная функция с наибольшим значением критерия Фишера.
Так же в процессе выполнения работы были изучены и применялись на практике следующие методы математической статистики:
линейный регрессионный анализ, множественный регрессионный анализ, корреляционный анализ, проверка стационарности и независимости выборок,
выявление тренда,
критерий.
1. Гусаров В. М. Статистика: Учебное пособие для вузов. — М.: ЮНИТИ-ДАНА, 2003;
2. Методологические положения по статистике. Вып. 1 — Госкомстат России. — М. 1996;
3. Методологические положения по статистике. Вып. 2 — Госкомстат России. — М. 1998;
4. Практикум по статистике: Учебное пособие для вузов / Под ред. В. М. Симчеры / ВЗФЭИ. — М.: Финстатинформ, 2002;
5. Статистика: Курс лекций для вузов / Под редакцией В. Г. Ионина. — М.: ИНФРА-М, 2006.