Корреляционный и регрессионный анализ
В результате проведенного корреляционного анализа исходных данных была выявлена функциональная зависимость между значениями «х» и «у», то есть:. Данная зависимость обладает максимальным значением индекса корреляции и детерминации, а так же F-критерия Фишера. Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью р=1-?=1−0,05=0,95 параметры, а и b… Читать ещё >
Корреляционный и регрессионный анализ (реферат, курсовая, диплом, контрольная)
- 1. Исходные данные 2
- 2. Решение задачи 1 3
- 3. Решение задачи 2 7
- Вывод: 11
- Список использованных источников 12
1. Исходные данные
Задание 1
1. Построить линейное уравнение парной регрессии;
2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации;
3. Оценить статистическую зависимость параметров регрессии и корреляции (с помощью F-критерия Фишера и Т-статистики Стьюдента).
Задание 2
1. Построить уравнение парной регрессии в виде нелинейной функции: степенной у = ахb, экспоненты у = аеbх, показательной у = abx, любой на выбор;
2. Для оценки параметров модель линеаризируется путем логарифмирования или потенцирования;
3. Определяется коэффициент эластичности и индекс корреляции;
4. Значимость определяется по критерию Фишера.
Исходные данные для решения задач приведены в таблице 1.
Таблица 1 — Исходные данные
N | X | Y | |
2. Решение задачи 1
Определим линейное уравнение парной регрессии.
Для этого составим и решим следующую систему уравнений:
;
.
;
.
Решая данную систему уравнений получаем:
а=81,232;
b=0,76.
Итого получаем:
Рассчитаем линейные коэффициенты парной корреляции и среднюю ошибку аппроксимации
Расчет будем вести табличным способом, и представим в таблице 2.
Таблица 2 — Расчет линейных коэффициентов парной корреляции и средняя ошибка аппроксимации
N | X | Y | X•Y | X2 | Y2 | Y; | ||||
98,71 | 11,29 | 127,42 | 10,26 | |||||||
115,43 | 9,57 | 91,55 | 7,65 | |||||||
107,07 | 3,93 | 15,43 | 3,54 | |||||||
119,99 | 1,01 | 1,02 | 0,83 | |||||||
102,51 | 6,49 | 42,09 | 5,95 | |||||||
128,35 | — 1,35 | 1,83 | 1,06 | |||||||
135,19 | 7,81 | 60,96 | 5,46 | |||||||
129,11 | — 8,11 | 65,80 | 6,70 | |||||||
134,43 | 19,57 | 382,91 | 12,71 | |||||||
115,43 | — 7,43 | 55,23 | 6,88 | |||||||
119,99 | 16,01 | 256,26 | 11,77 | |||||||
101,75 | 7,25 | 52,53 | 6,65 | |||||||
128,35 | — 3,35 | 11,24 | 2,68 | |||||||
124,55 | — 14,55 | 211,76 | 13,23 | |||||||
129,11 | — 9,11 | 83,03 | 7,59 | |||||||
133,67 | 0,33 | 0,11 | 0,24 | |||||||
137,47 | — 6,47 | 41,89 | 4,94 | |||||||
107,83 | — 2,83 | 8,02 | 2,70 | |||||||
97,19 | — 23,19 | 537,87 | 31,34 | |||||||
126,83 | — 6,83 | 46,68 | 5,69 | |||||||
2093,62 | 147,90 | |||||||||
Ср. | 50,55 | 119,65 | 6263,5 | 2838,45 | 14 584,35 | 119,65 | 104,68 | 7,39 | ||
На рисунке 1 представим поле корреляции.
Рисунок 1 — Поле корреляции
Оценим статистическую зависимость параметров регрессии и корреляции (с помощью F-критерия Фишера и Т-статистики Стьюдента).
Определение коэффициента корреляции
Для определения коэффициента корреляции, определим дисперсию:
;
.
Определим коэффициент корреляции:
.
Данный коэффициент корреляции характеризует высокую тесноту связи
Определим коэффициент детерминации:
Это значит, что 61% вариации «у» объясняется вариацией фактор «х» .
Определение статистической значимости уравнения регрессии с помощью F-критерия Фишера
Определим Fкритерий Фишера:
.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы 1 и (20−2)=18 составляет Fтаб = 4,45.
Имеем F> Fтаб, следовательно уравнение регрессии признается статистическим значимым.
Оценка статистической значимости параметров регрессии с помощью t-статистики Стьюдента
Табличное значение t-критерия для числа степеней свободы df=n-2=20−2=18 и уровня значимости ?=0,05 составит tтабл=1,743.
Определим стандартные ошибки:
;
;
.
Тогда
;
;
.
Фактические значения t-статистики превосходят табличное значение:
поэтому параметры а, b, и rxy не случайно отличаются от нуля, а статистически значимы.
Рассчитаем доверительные интервалы для параметров регрессии, а и b. Для этого определим предельную ошибку для каждого показателя:
;
.
Получаем доверительные интервалы:
и ;
и .
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью р=1-?=1−0,05=0,95 параметры, а и b, находятся в указанных границах, не принимают нулевых значений, т. е. являются статистически значимыми и существенно отличны от нуля.
3. Решение задачи 2
В качестве уравнения нелинейной функции примем показательную, т. е.
у = a•bx.
Определим экспоненциальное уравнение парной регрессии
Для определения параметров, а и b прологарифмируем данное уравнение:
ln (у) =ln (а)+ x•ln (b),
Произведем следующую замену: А= ln (а), B= ln (b).
Составим и решим систему уравнений:
;
.
;
.
Решая данную систему уравнений получаем:
А=4,436 следовательно a=84,452;
B= 0,0067 следовательно b=1,0067.
Итого получаем
.
Рассчитаем линейные коэффициенты парной корреляции и среднюю ошибку аппроксимации
Расчет будем вести табличным способом, и представим в таблице 3.
Таблица 3 — Расчет линейных коэффициентов парной корреляции и средняя ошибка аппроксимации
N | X | Y | X•Y | X2 | Y2 | Y; | |||||
529,00 | 98,47 | 11,53 | 132,90 | 201,64 | 10,48 | ||||||
2025,00 | 114,05 | 10,95 | 119,80 | 0,64 | 8,76 | ||||||
1156,00 | 105,98 | 5,02 | 25,23 | 174,24 | 4,53 | ||||||
2601,00 | 118,72 | 2,28 | 5,21 | 10,24 | 1,89 | ||||||
784,00 | 101,82 | 7,18 | 51,62 | 231,04 | 6,59 | ||||||
3844,00 | 127,77 | — 0,77 | 0,59 | 7,84 | 0,60 | ||||||
5041,00 | 135,68 | 7,32 | 53,59 | 353,44 | 5,12 | ||||||
3969,00 | 128,62 | — 7,62 | 58,09 | 10,24 | 6,30 | ||||||
4900,00 | 134,78 | 19,22 | 369,54 | 888,04 | 12,48 | ||||||
2025,00 | 114,05 | — 6,05 | 36,66 | 262,44 | 5,61 | ||||||
2601,00 | 118,72 | 17,28 | 298,70 | 139,24 | 12,71 | ||||||
729,00 | 101,14 | 7,86 | 61,82 | 231,04 | 7,21 | ||||||
3844,00 | 127,77 | — 2,77 | 7,65 | 0,64 | 2,21 | ||||||
3249,00 | 123,57 | — 13,57 | 184,15 | 201,64 | 12,34 | ||||||
3969,00 | 128,62 | — 8,62 | 74,33 | 17,64 | 7,18 | ||||||
4761,00 | 133,88 | 0,12 | 0,01 | 96,04 | 0,09 | ||||||
5476,00 | 138,43 | — 7,43 | 55,13 | 46,24 | 5,67 | ||||||
1225,00 | 106,69 | — 1,69 | 2,85 | 368,64 | 1,61 | ||||||
441,00 | 97,17 | — 23,17 | 536,63 | 2520,04 | 31,30 | ||||||
3600,00 | 126,07 | — 6,07 | 36,85 | 17,64 | 5,06 | ||||||
56 769,00 | 2381,97 | 11,03 | 2111,36 | 5778,60 | 147,73 | ||||||
Ср. | 50,55 | 119,65 | 6263,50 | 2838,45 | 14 584,35 | 119,10 | 0,55 | 105,57 | 288,93 | 7,39 | |
На рисунке 3 представим поле корреляции.
Рисунок 2 — Поле корреляции
Определяется коэффициент эластичности и индекс корреляции
Определим коэффициент эластичности
где
следовательно при изменении фактора" х" на 1% от своего среднего значения, «у» изменится на 0,334% от своей средней величины.
Определение индекс корреляции
.
Данный коэффициент корреляции характеризует высокую тесноту связи
Определим индекс детерминации:
Это значит, что 63,5% вариации «у» объясняется вариацией фактор «х» .
Определение статистической значимости уравнения регрессии с помощью F-критерия Фишера
Определим Fкритерий Фишера:
.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы 1 и (20−2)=18 составляет Fтаб = 4,45.
Имеем F> Fтаб, следовательно уравнение регрессии признается статистическим значимым.
Вывод
В результате проведенного корреляционного анализа исходных данных была выявлена функциональная зависимость между значениями «х» и «у», то есть:. Данная зависимость обладает максимальным значением индекса корреляции и детерминации, а так же F-критерия Фишера.
Список использованных источников
1. Учебно-методическое пособие к изучению курса «Статистика». Н. Н. Щуренко, Г. В. Девликамиова: Уфа, 2004. 55с.
2. Эконометрика для начинающих. Основные понятия, элементарные методы, границы применимости, интерпретация результатов В. П. Носко: Москва, 2000. — 249с.
3. Эконометрика. И. И. Елисеева: Москва «Финансы и статистика», 2003. 338с.
4. Общая теория статистики. Н. М. Виноградова, В. Т. Евдокимов, Е. М. Хитарова, Н. И. Яковлева: Москва, 1968. 381с.