Дисперсионный анализ
Эмпирическое корреляционное отношение показывает тесноту связи между результативным и факторным признаком. Оно равно 0,76, следовательно, связь между объемом вложений и прибылью — тесная. Для определения степени влияния при были на объем вложений, определяем группировочный признак и строим таблицу. результативным признаком является объем вложений, факторным — прибыль. Определить степень влияния… Читать ещё >
Дисперсионный анализ (реферат, курсовая, диплом, контрольная)
ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ НОВГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Имени ЯРОСЛАВА МУДРОГО ИНСТИТУТ ЭКОНОМИКИ И УПРАВЛЕНИЯ Кафедра: Статистики и экономико-математических методов Лабораторная работа
По дисциплине статистика по теме:
Дисперсионный анализ Выполнила студентка гр.8431
Гарбузова Ю.
Егарева Т. Н Ерошенко Н. Н Великий Новгород
Цель работы:
Получение практических навыков статистической обработки многовариантных, многофакторных экспериментов, когда анализируются влияние одного, двух, трех и большего числа факторов на изменение величины какого-либо признака.
Ход работы:
1. Установление основных источников варьирования и определение объемов вариации по источникам образования.
2. Определение числа степеней свободы вариации
3. Вычисление дисперсий и анализ соотношений между ними
4. Интерпретация полученных результатов Дисперсионный анализ — метод оценки существенности различий не скольких средних. Его применяют при статистической обработке многовариантных, многофакторных опытов.
Задание 1
Таблица 1. Данные о прибыли 24 предприятий, млн. руб.
№банка | Вложения млрд. руб. | |
1,9 | ||
2,4 | ||
2,5 | ||
2,7 | ||
2,8 | ||
3,20 | ||
3,2 | ||
3,4 | ||
3,4 | ||
3,7 | ||
3,7 | ||
4,1 | ||
4,3 | ||
4,3 | ||
4,6 | ||
4,6 | ||
4,8 | ||
4,8 | ||
4,9 | ||
5,6 | ||
Определить степень влияния прибыли на объем вложений в ценные бумаги, если первые 15 банков имели прибыль до 50 млрд руб., а остальные 9- свыше 50 млрд руб.
Для определения степени влияния при были на объем вложений, определяем группировочный признак и строим таблицу. результативным признаком является объем вложений, факторным — прибыль
Таблица 2. Распределение предприятий в зависимости от объема вложений
Прибыль до 50 млрд. руб | Объем вложений, млрд. руб | xi-xiср. | (xi-xiср.)^2 | прибыль свыше 50 млрд. руб | объем вложений, млрд. руб | xi-xiср. | (xi-xiср.)^2 | |
1,9 | — 1,36 | 1,8496 | 4,1 | — 0,56 666 667 | 0,321 111 111 | |||
2,4 | — 0,86 | 0,7396 | 4,3 | — 0,36 666 667 | 0,134 444 444 | |||
2,5 | — 0,76 | 0,5776 | 4,3 | — 0,36 666 667 | 0,134 444 444 | |||
2,7 | — 0,56 | 0,3136 | 4,6 | — 0,6 666 667 | 0,4 444 444 | |||
2,8 | — 0,46 | 0,2116 | 4,6 | — 0,6 666 667 | 0,4 444 444 | |||
3,20 | — 0,06 | 0,0036 | 4,8 | 0,13 333 333 | 0,17 777 778 | |||
3,2 | — 0,06 | 0,0036 | 4,8 | 0,13 333 333 | 0,17 777 778 | |||
3,4 | 0,14 | 0,0196 | 4,9 | 0,23 333 333 | 0,54 444 444 | |||
3,4 | 0,14 | 0,0196 | 5,6 | 0,93 333 333 | 0,871 111 111 | |||
3,7 | 0,44 | 0,1936 | ||||||
3,7 | 0,44 | 0,1936 | ||||||
0,74 | 0,5476 | |||||||
0,74 | 0,5476 | |||||||
0,74 | 0,5476 | |||||||
0,74 | 0,5476 | |||||||
Итого | 48,9 | 6,316 | 1,56 | |||||
Внутригрупповые дисперсии определим по формуле:
3,26 4,66
= 0,421
Внутригрупповые дисперсии показывают вариацию объема вложений по группам, вызванные различными факторами, кроме прибыли.
Среднюю из внутригрупповых дисперсий определим по формуле:
= 0,34
Межгрупповая дисперсия исчисляется по формуле:
Определим общую среднюю по формуле средней арифметической:
Межгрупповая дисперсия показывает вариацию объема вложений, обусловленную влиянием прибыли.
Общую дисперсию определяем на основании правила сложения дисперсий:
0,8
Определим долю межгрупповой дисперсии в общей с помощью эмпирического коэффициента детерминации:
=0,575
На 57,5% вариация объема вложений обусловлена влиянием прибыли, и на 42,5% влиянием прочих факторов, не учтенных в группировке.
Эмпирическое корреляционное отношение:
=
Эмпирическое корреляционное отношение показывает тесноту связи между результативным и факторным признаком. Оно равно 0,76, следовательно, связь между объемом вложений и прибылью — тесная.
Задание 2
Дисперсионный анализ при группировке данных по одному признаку (неслучайное распределение наблюдений в группах).
Необходимо проанализировать производительность труда рабочих одного из цехов НПО «Виктория». С целью была образована контрольная группа рабочих, имеющих стаж до 1 года, во вторую группу вошли рабочие со стажем от 1 до 3 лет и в третью группу объединили рабочих с большим стажем. Для чистоты эксперимента были сформированы пять групп, приблизительно равноценных по показателям.
Таблица 3. Производительность труда рабочих цеха НПО «Виктория», деталей за смену, штук.
вариант опыта | Повторность | суммы | среднее | |||||
1 группа | ||||||||
2 группа | 331,2 | |||||||
3 группа | 388,6 | |||||||
суммы | 981,8 | |||||||
среднее | 328,6 666 667 | 330,6667 | 311,6 666 667 | 326,3 333 333 | 1636,333 333 | |||
Ход работы:
1. Выдвигаем гипотезу, что различия в средней производительности труда случайны, и рассчитаем показатели, необходимые для заключения выдвинутой гипотезы.
2. данные таблицы 3 для удобства вычислений целесообразно уменьшить на величину (А), близкую к значению средней.
Результаты занесем в таблицу 4.
Таблица 4. отклонения от условного начала y = x-A, A=327
Вариант опыта | Повторность | сумма | |||||
1 группа | — 49 | — 42 | — 127 | — 71 | — 36 | — 325 | |
2 группа | — 8 | ||||||
3 группа | |||||||
суммы | — 46 | — 2 | |||||
Проверим правильность вычислений:
N=15 kчисло вариантов n-число наблюдений в каждом варианте
4909= 4+15*327
Таблица 5. Таблица квадратов
вариант опыта | Повторность | сумма квадратов | квадрат суммы | |||||
1 группа | ||||||||
2 группа | ||||||||
3 группа | ||||||||
сумма квадратов | ||||||||
квадрат суммы | ||||||||
Wo= 46 274,93
Wст = - =40 184,93
Wповт = - =1186,27
Определим остаточную сумму квадратов как разность :
Wост = WoWстWповт = 4903,73
Далее определяем число степеней свободы вариации для каждой суммы квадратов отклонений:
Wo= v=N-1=15−1=14
Wст = vст = k-1 = 3−1=2
Wповт= vповт = n-1 = 5−1=4
Wост =vост = (N-1)-(k-1)-(n-1)=14−2-4=8
Для того чтобы определить дисперсии, следует разделить суммы квадратов отклонений на соответствующее число степеней свободы.
Таблица 6. Анализ дисперсий
Источник вариации | Сумма квадратов отклонений | Степень свободы вариации | Дисперсия | Отношение дисперсии | ||
F факт. | F табл. | |||||
Стаж | 40 184,93333 | 4,46 | ||||
Повторности | 1186,266 667 | 0,483 660 131 | 3,84 | |||
Остаточная | 4903,733 333 | |||||
Общая | 46 274,93333 | x | ||||
Fфакт =
Fфакт = 0,483 660 131
Fфакт =
Проведенные расчеты показывают, что дисперсии стажа и повторностей значительно превышают остаточную дисперсию.
F табл. определяем с помощью приложения А.
Фактическое отношение дисперсии 32 значительно превышает предел возможного случайного колебания 4,46.
Приступим к оценке существенности разностей между каждой парой средних. Для этого необходимо вычислить среднюю ошибку разности средних:
= 15,65
= 24,738
Обратимся к приложению Б. При вероятности 0,05 и 8 степенях свободы вариации значение нормированного t равно 2,3060~ 2,31. Тогда предельная ошибка составит:
= t* = 2,31*15,65= 36,14
Мы определили величину возможных случайных колебаний при заданном уровне вероятности. Сопоставим разность производительность труда рабочих соответствующей стажу работы и размер предельной ошибки. Если разность превышает предельную ошибку, то её принято считать существенной.
Возможны следующие сопоставления:
= 69,2
= 7,4
= 126,6
Полученные результаты превышают по абсолютной величине предельную ошибку. Это позволяет нам заключить, что они существенны.
Двухфакторный дисперсионный анализ с повторениями.
Требуется оценить достоверность различий между средними по вариантам опыта, используя дисперсионный метод анализа.
Для того чтобы выполнить двухфакторный дисперсионный анализ с повторениями исходные данные необходимо представить в следующем виде:
Контроль | 1год | 2года | 3 года | ||
Прежнее | 19,5 | 23,7 | |||
18,4 | 21,3 | 22,4 | |||
16,8 | 18,9 | 21,7 | 23,9 | ||
Новое | 22,9 | 25,5 | 31,1 | ||
22,6 | 28,5 | 28,8 | 29,5 | ||
21,6 | 25,7 | 31,2 | |||
Это осуществляется при помощи транспортирования. Транспортирование строк и столбцов при вставке данных. Затем выполняется с помощью «Анализ данных» «Двухфакторный дисперсионный анализ с повторениями».
Двухфакторный дисперсионный анализ с повторениями | ||||||||
ИТОГИ | Контроль | 1год | 2года | 3 года | Итого | |||
Прежнее |
|
|
|
|
| |||
Счет | ||||||||
Сумма | 51,2 | 66,4 | 250,6 | |||||
Среднее | 17,6 667 | 22,13 333 | 23,33 333 | 20,88 333 | ||||
Дисперсия | 1,493 333 | 25,90 333 | 0,79 | 0,663 333 | 11,28 515 | |||
Новое |
|
|
|
|
| |||
Счет | ||||||||
Сумма | 67,1 | 79,7 | 85,8 | 91,8 | 324,4 | |||
Среднее | 22,36 667 | 26,56 667 | 28,6 | 30,6 | 27,3 333 | |||
Дисперсия | 0,463 333 | 2,813 333 | 2,28 | 0,91 | 11,31 333 | |||
Итого |
|
|
| |||||
Счет | ||||||||
Сумма | 118,3 | 146,1 | 148,8 | 161,8 | ||||
Среднее | 19,71 667 | 24,35 | 24,8 | 26,96 667 | ||||
Дисперсия | 9,209 667 | 17,383 | 18,556 | 16,47 067 | ||||
Дисперсионный анализ | ||||||||
Источник вариации | SS | df | MS | F | P-Значение | F критическое | ||
Выборка | 226,935 | 226,935 | 51,40 576 | 2,23E-06 | 4,493 998 | |||
Столбцы | 167,4217 | 55,80 722 | 12,64 156 | 0,172 | 3,238 872 | |||
Взаимодействие | 10,52 833 | 3,509 444 | 0,794 966 | 0,514 445 | 3,238 872 | |||
Внутри | 70,63 333 | 4,414 583 | ||||||
Итого | 475,5183 | |||||||