Обработка экспериментальных данных методами математической статистики
Число интервалов ly=lx-1=, увеличим размах варьирования, отодвинув yнб до. статистический пирсон регрессия корреляция Тогда длина интервала. Вывод т. е. Dэм Dкр, следовательно, выдвинутая гипотеза о нормальном распределении с уровнем значимости б=0,1 и с уровнем значимости б=0,05. По заполненным клеточкам корреляционной таблицы, делаем вывод о наличии положительной зависимости между случайными… Читать ещё >
Обработка экспериментальных данных методами математической статистики (реферат, курсовая, диплом, контрольная)
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение Высшего и профессионального образования
«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ пищевых производств»
Зачётная работа по теме
«Обработка экспериментальных данных методами математической статистики»
Вариант №
Работу выполнил:
студент группы 10-ТПМ-14
Работу проверил:
Галушкина Ю.И.
Москва 2012
Обработать эти данные методом математической статистики
X | Y | X | Y | X | Y | X | Y | |
Задача 1. Обработка одномерной выборки признака Х методами математического статистического анализа
1. n =; xнм =; xнб =; hx =
Вариационный ряд
2. Число интервалов
Тогда длина интервала =
Статистический ряд
№ | Интервалы xi xi+1 | Середины x?i | Частота mi | Относительная частота pi*= | Кумулятивная частота F*n (x) | |
49−54 | 51,5 | 0,05 | 0,05 | |||
54−59 | 56,5 | 0,133 | 0,183 | |||
59−64 | 61,5 | 0,2 | 0,383 | |||
64−69 | 66,5 | 0,25 | 0,633 | |||
69−74 | 71,5 | 0,217 | 0,85 | |||
74−79 | 76,5 | 0,117 | 0,967 | |||
79−84 | 81,5 | 0,033 | ||||
У | ||||||
3. Оценки числовых характеристик.
№ | Интервалы xi — xi+1 | Середина ?xi | pi* | F*n (x) | ?xi pi* | ?xi - x?i | (?xi - x?i)2pi* | (?xi - x?i)3pi* | (?xi - x?i)4pi* | |
49−54 | 51,5 | 0,05 | 0,05 | 2,575 | — 14,67 | 10,7604 | — 157,8557 | 2315,7435 | ||
54−59 | 56,5 | 0,133 | 0,183 | 7,515 | — 9,67 | 12,4367 | — 120,2627 | 1162,9406 | ||
59−64 | 61,5 | 0,2 | 0,383 | 12,300 | — 4,67 | 4,3618 | — 20,3695 | 95,1256 | ||
64−69 | 66,5 | 0,25 | 0,633 | 16,625 | 0,33 | 0,0272 | 0,0090 | 0,0030 | ||
69−74 | 71,5 | 0,217 | 0,85 | 15,516 | 5,33 | 6,1647 | 32,8580 | 175,1332 | ||
74−79 | 76,5 | 0,117 | 0,967 | 8,951 | 10,33 | 12,4849 | 128,9694 | 1332,2544 | ||
79−84 | 81,5 | 0,033 | 2,690 | 15,33 | 7,7553 | 118,8887 | 1822,5630 | |||
У | 66,170 | 53,9911 | — 17,7629 | 6903,7634 | ||||||
x? = Уi ?xi pi* = 66,170
Mo=64 +5
Me =
S2 = У (?xi - x?i)2pi* = 53,9911
S=== 7,3479
V= 100% =100%=11,1046%
A===-0,0448
E=3=3= -0,6317
x? | Mo | Me | Sx2 | Sx | V% | A | E | |
Поправки Шеппарда
S2 = У (?xi - x?i)2pi* - 53,9911−2,0833=51,9078
Sx=7,2047
V=100% = 10,8882%
A==-0,0475
E=3=-0,4727
x? | Mo | Me | Sx2 | Sx | V% | A | E | |
Выводы: 1. x?, Mo, Me — принадлежат одному интервалу;
2. Интервал (x? — 3S; x? +3S)? () содержит выборку;
3. А= длинная часть лежит от центра;
4. Е=, распределение имеет в окрестности центра более вершину.
Для сравнения гистограммы и кривой нормального распределения заполним следующую таблицу:
№ | Интервалы | Середины x?i | pi* | Нормированные середины | |||
У | |||||||
Здесь нормированные середины:
, =
На графике представлена гистограмма статистического ряда, а также подобная теоретическая кривая нормального распределения. Можно видеть, что теоретическая кривая отличается от эмпирического распределения
4. Выдвигаем гипотезу о том, что выборка извлечена из нормальной генеральной совокупности, где за неизвестные параметры распределения б и у принимаются соответственно их числовые оценки x? = и S=, и проверим эту гипотезу с помощью критерия Колмогорова-Смирнова (К-С) и критерия Пирсона, с уровнем значимости б=0,1; 0,05.
Проверка гипотезы с помощью критерия Колмогорова-Смирнова.
Функция K(л)=1- б=1−0,1=0,9???л1=1,23;
K(л)=1- б=1−0,05=0,95???л2=1,36;
Dкр= ???Dкр==0,1587
Dкр= ???Dкр==0,1754
Таблица для расчёта Dэм
№ | Середины интервалов ?xi | Кумулятивн-ая частота F*n (x) | Нормирован-ные середины | |||
Dэм=0,1219
Вывод т. е. Dэм Dкр, следовательно, выдвинутая гипотеза о нормальном распределении с уровнем значимости б=0,1 и с уровнем значимости б=0,05.
Проверка гипотезы с помощью критерия Пирсона
ч2кр=7,8 при б=0,1; ч2кр=9,5 при б=0,05; k=7−2-1=4
Таблица для расчёта ч2эм
№ | Интервалы xi xi+1 | Частота mi | pi =P (xixi+1) | npi | ||
0,0399 | ||||||
0,177 | ||||||
0,2186 | ||||||
0,2696 | ||||||
0,206 | ||||||
0,1022 | ||||||
0,0328 | ||||||
У | ||||||
p1 = P(49<x <54) = Ф ()-Ф ()=Ф (-1,65)-Ф (-2,34)=0,0495−0,0096=0,0399
p2 = P(54<x <59) = Ф ()-Ф ()=Ф (-0,98)-Ф (-1,65)=0,1635−0,0465=0,177
p3 = P(59<x <64) = Ф ()-Ф ()=Ф (-0,3)-Ф (-0,98)=0,3821−0,1635=0,2186
p4 = P(64<x <69) = Ф ()-Ф ()=Ф (0,39)-Ф (-0,3)=0,6517−0,3821=0,2696
p5 = P(69<x <74) = Ф ()-Ф ()=Ф (1,07)-Ф (0,39)=0,8577−0,6517=0,206
p6 = P(74<x <79) = Ф ()-Ф ()=Ф (1,75)-Ф (1,07)=0,9599−0,8577=0,1022
p7 = P(79<x <84) = Ф ()-Ф ()=Ф (2,43)-Ф (1,75)=0,9927−0,9599=0,0328
ч2эм=1,1367
Вывод. т. е. ч2эм ч2кр, и при б=0,1, и при б=0,05 выдвигаемая гипотеза с уровнем значимости б=0,1 и с уровнем значимости б=0,05.
5. Считая, что выборка извлечена из нормальной генеральной совокупности, построим доверительные интервалы, накрывающее неизвестное математическое ожидание с доверительными вероятностями 0,9; 0,95; 0,99. Строим доверительные интервалы
для =66,17; S=7,3479;=7,746
№ | в | б | t | Левая граница | Правая граница | Длина интервала | |
0,9 | 0,1 | 1,67 | 64,5859 | 66,75 | 2,1641 | ||
0,95 | 0,05 | 2,00 | 64,2728 | 68,0672 | 3,7944 | ||
0,99 | 0,01 | 2,66 | 63,6467 | 68,6933 | 5,0466 | ||
0,9;
0,95;
0,99
С увеличением доверительно вероятности последовательно 0,9; 0,95; 0,99 ширина доверительного интервала увеличивается соответственно
Задача 2. Обработка одномерной выборки признака Y методами статистического анализа
1. n =; yнм =; yнб =; hy=.
Вариационный ряд
2. Число интервалов ly=lx-1=, увеличим размах варьирования, отодвинув yнб до. статистический пирсон регрессия корреляция Тогда длина интервала
Статистический ряд
№ | Интервалы yj yj+1 | Середины ?yj | Частота mj | Относительная частота pj*= | ?yj pj* | ?yj -?? y | (?yj -??y)2pj* | |
71−77 | 0,117 | 8,633 | — 15,000 | 26,250 | ||||
77−83 | 0,133 | 10,667 | — 9,000 | 10,800 | ||||
83−89 | 0,200 | 17,200 | — 3,000 | 1,800 | ||||
89−95 | 0,317 | 29,133 | 3,000 | 2,850 | ||||
95−101 | 0,150 | 14,700 | 9,000 | 12,150 | ||||
101−107 | 0,083 | 8,667 | 15,000 | 18,750 | ||||
У | 1,000 | 89,000 | 72,600 | |||||
???y= Уi ?yi pi* =89,00
Sy2 = У (?yi - ???yi)2pi* =72,600
Sy==8,5206
Задача 3. Обработка двумерной выборки (X,Y) методами корреляционного и регрессионного анализов
1. Корреляционное поле
По расположению точек на корреляционном поле можно сделать вывод о наличии положительной корреляционной зависимости.
3. Корреляционная таблица
xi-xi+1 | 49−54 | 54−59 | 59−64 | 64−69 | 69−74 | 74−79 | 79−84 | mj | |||
yj-yj+1 | ?xi ?yj | 51,5 | 56,5 | 61,5 | 66,5 | 71,5 | 76,5 | 81,5 | |||
71−77 | |||||||||||
77−83 | |||||||||||
83−89 | |||||||||||
89−95 | |||||||||||
95−101 | |||||||||||
101−107 | |||||||||||
mi | |||||||||||
По заполненным клеточкам корреляционной таблицы, делаем вывод о наличии положительной зависимости между случайными величинами X и Y.
3. Вычисление выборочного коэффициента корреляции.
x?=66,17 Sx=7,3479
???y= 89,00 Sy= 8,5206
Для вычисления выборочного корреляционного момента Kxy используем формулу У У (?xi- ?x)(?yj -?yj)mij и заполним следующую расчётную таблицу:
?xi- ?x ?yj- ?y | У | |||||||||
У | ||||||||||
Kxy= =
rxy===
По шкале Чеддока делаем вывод: корреляционная зависимость между случайными величинами X и Y
4. Проверка гипотезы значимости
Выдвигаем гипотезу о независимости случайных величин и проверим эту гипотезу с помощью критерия Пирсона, выбрав уровень значимости б=0,1;
К= (ly-1) (lx-1) = =
ч2кр=
Таблица для расчета ч2эм
У | ||||||||||
ч2эм=
Так как ч2эм ч2кр, то гипотеза о независимости случайных величин с заданным уровнем значимости б=0,1.
Регрессионный анализ
1. Фиксируем ?xi и найдем соответствующие средние арифметические
?yj=
?xi | |||||||||
???yi | |||||||||
Построим диаграмму рассеивания, нанося на плоскость XY точки с координатами (?xi ; ???yi)
Фиксируем ?yj и найдем соответствующие средние арифметические
?xi=.
?yj | ||||||||
?xj | ||||||||
Построим диаграмму рассеивания, нанося на плоскость XY точки с координатами (???xj ; ?yj)
2. Составим линейную эмпирическую регрессию:
y(x)=a0+a1x;
x(y)=b0+b1y.
Коэффициенты регрессии a0; a1 и b0; b1оценим с помощью метода наименьших квадратов.
y(x)=a0+a1x
Нормальная система метода наименьших квадратов
Расчётная таблица
№ | ?xi | ???yi | ?xi 2 | ?xi???yi | |
У | |||||
??a0=; a1=
y(x)= +x
x(y)=b0+b1y
Нормальная система метода наименьших квадратов
Расчётная таблица
№ | ?yj | ?xj | ?yj 2 | ?yj | |
У | |||||
??b0 =; b1 =
x(y)= +y
По графику линий регрессий x(y) и y(x) делаем вывод о наличии положительной корреляционной зависимости.
3. Проверим адекватность линейной регрессии
y(x)= +x
Для этого составим с помощью метода наименьших квадратов полулогарифмическую модель эмпирической регрессии:
y(x)=a0+a1lg x.
Нормальная система метода наименьших квадратов
Расчётная таблица
№ | ?xi | lg ?xi | (lg ?xi)2 | ???yi | ???yi lg ?xi | |
У | ||||||
??a0 =; a1 =
y(x)= +lgx
Составим таблицу
№ | yi | xi | y(x)= | ||||
y(xi) | |||||||
У | |||||||
Делаем выводы
Модель функции | Остаточная дисперсия | Средняя ошибка аппроксимации | |
y(x)= | |||
y(x)= | |||
Наиболее адекватная модель эмпирической регрессии
y(x)= +lgx
4. Найдем выборочные корреляционные отношения
?x =; ()2; n =
№ | ?xj | mj | ||
У | ||||
=
???y =; Sy2 = ()2 =; n =
№ | ???yi | mi | ||
У | ||||
==
r2xy=()2 =;
— =
— =
Разность свидетельствует о линейной регрессии.
Разность свидетельствует о линейной регрессии.