Выборочные характеристики распределения
Медиана (Med) — варианта, которая расположена в середине распределения и делит вариационный ряд на две равные части. Для ряда с нечетным числом вариант медиана равна варианте под номером (ч + 1)/2. Если число вариант п четно, то медиана определяется как полсуммы двух серединных соседних вариант. Решение. Объем выборки «= 16 <30. Составим вариационный ряд, т. е. данные располагаем в упорядоченном… Читать ещё >
Выборочные характеристики распределения (реферат, курсовая, диплом, контрольная)
Дать точный ответ на вопрос, каково численное значение неизвестного параметра, можно обследовав всю генеральную совокупность, что сделать, как правило, нельзя. Поэтому основной целью статистического оценивания является определение действительных параметров генеральной совокупности на основе изучения выборочных характеристик распределения. В дальнейшем под выборочными характеристиками распределения будем понимать выборочную среднюю, дисперсию и среднюю квадратичного отклонения. Ценность этих выборочных характеристик состоит в том, что с их помощью можно производить оценку неизвестных параметров 0 предполагаемого закона распределения генеральной совокупности.
Пусть 9' есть статистическая оценка неизвестного параметра 0 теоретического распределения генеральной совокупности. Статистическая оценка неизвестной характеристики распределения называется точечной, если она определяется единственной числовой величиной, которая приближенно равна оцениваемой характеристике, т. е. 0*0*.
Такую оценку целесообразно определять в тех случаях, когда объем выборки п достаточно велик.
Рассмотрим основные точечные оценки: состоятельные и эффективные, смещенные и несмещенные, а также ряд других.
Оценка 0' называется состоятельной, если при увеличении объема выборки она сходится по вероятности к оцениваемому параметру 0, т. е.
Оценка 0* называется эффективной, если при заданном объеме выборки п она имеет наименьшую дисперсию.
Оценка 0* называется несмещенной, если ее математическое ожидание (генеральная средняя) равно оцениваемому параметру 0, т. е. АЦ0*)=0, и смещенной, если М (0')*0.
Генеральной средней дискретной генеральной совокупности называют среднее арифметическое всех значений признака X генеральной совокупности:
где N — объем совокупности.
Если значения признака имеют частоты т1, т2, т3…, тк, где m, +т2 + т2 + …+тк = N, то.
Наилучшей оценкой генеральной средней X является выборочная средняя 5В, определяемая как среднее арифметическое значение признака Xвыборочной совокупности:
где п — объем выборки.
Если значения признака имеют частоты где.
/и, +т2 +""з +… + тк = п, то.
где р‘ =mjn — относительная частота.
Выборочная средняя Зг" является несмещенной и состоятельной оценкой генеральной средней, поэтому имеет место приближенное равенство Пример 7.5. По случайной выборке 14,5, 14,7, 14,8, 14,9, 15,1,.
15,3, 15,5, 15,8, 15,9 содержания кальция (в мг %) в сыворотке крови подопытных животных определить выборочную среднюю содержания кальция в крови.
Решение. Объем приведенной выборки равен п = 9. Используя условие задачи по формуле (17.15), находим искомую выборочную среднюю:
Отсюда согласно формуле (7.18) точечная оценка генеральной совокупности
Пример 7.6. Дать точечную оценку генеральной средней X количества таблеток в упаковках, произведенных в фармацевтической фабрике по данным примера 7.1.
Решение. Объем выборки и = 15. Используя данные табл. 7.3, по формуле (7.15) найдем выборочную среднюю:
В соответствии с формулой (7.18) точечная оценка генеральной совокупности
Генеральной дисперсией Dr(X) (другое обозначение о2) называют среднее арифметическое квадратов отклонений всех значений признака X генеральной совокупности от их генеральной средней:
Выборочной дисперсией называют среднее арифметическое квадратов отклонения наблюдаемых значений признака выборки от их среднего значения. Если все признаки выборки объема и имеют различные значения хх, х2, х3,…, х", то.
Если же значения признака имеют частоты т, mi, mi,…, тк, где /и, +т2 + т3 +…+ тк = п, то.
или На практике часто используют выборочную исправленную дисперсию выборки, которая является несмещенной и состоятельной оценкой генеральной дисперсии Dr(X) и определяемой по формуле (признаки имеют разные значения).
Если же значения признака имеют частоты т, тг. тз,…, /я*, где mi + тг + /из + • • • + ю* = п, то.
Связь между выборочной исправленной дисперсией и выборочной дисперсией выражается формулой Выборочная исправленная дисперсия S2 является наилучшей оценкой генеральной дисперсии DA>0 и имеет место соотношение.
При достаточно больших и выборочная и выборочная исправленная дисперсии мало отличаются, поэтому на практике исправленной выборочной дисперсией пользуются, если п < 30.
Генеральным средним квадратичным отклонением называется квадратный корень из генеральной диспепсии:
Выборочное среднее квадратичное отклонение равно корню квадратному из выборочной дисперсии:
Наилучшей оценкой генерального среднего квадратичного отклонения о является выборочное исправленное среднее квадратичное отклонение (стандартное отклонение), равное.
и имеет место приближенное равенство.
Пример 7.7. В результате измерений мембранного потенциала покоя в мышечной клетке получены следующие значения, мВ: 33, 34, 35, 36, 37, 38, 39, 40, 41. Найти выборочную среднюю и выборочную исправленную дисперсию, а также выборочное среднее квадратичное отклонение и исправленное среднее квадратичное отклонение мембранного потенциала покоя.
Решение. Предварительно по формуле (7.15) вычислим выборочную среднюю.
Выборочная дисперсия, вычисленная по формуле (7.20), будет равна.
По формуле (7.25) выборочная исправленная дисперсия.
Выборочное среднее квадратичное отклонение равно.
По формуле (7.29) вычислим выборочное исправленное среднее квадратичное отклонение
Пример 7.8. Случайная величина X объема л = 40 задана дискретным рядом распределения относительных частот (табл. 7.12).
Таблица 7.12. Ряд распределения относительных частот.
X | |||||
р | 0,2. | 0,4. | 0,3. | 0.08. | 0,02. |
Найти выборочные характеристики распределения х" и ах.
Решение. По формуле (7.17) находим выборочную среднюю.
Объем выборки л = 40 >30. С учетом этого выборочную дисперсию вычислим по формуле (17.22).
Подставляя это значение в формулу (7.28), найдем искомое выборочное среднее квадратичное отклонение.
Пример 7.9. При измерении объема грудной клетки X мужчин получены следующие результаты, см: 102, 88, 94, 98, 102, 98, 100, 100, 86, 87, 112, 108, 98, 100, 88, 113. Найти выборочную среднюю и выборочную исправленную дисперсию.
Решение. Объем выборки «= 16 <30. Составим вариационный ряд, т. е. данные располагаем в упорядоченном (ранжированном) виде (86, 87, 88, 94, 98, 100, 102, 108, 112, 113), на основе которого представим в форме таблицы статистический дискретный ряд распределения частот (табл. 7.13).
Таблица 7.13. Статистический ряд распределения частот объема грудной клетки мужчин.
X | ИЗ. | |||||||||
т |
Используя данные табл. 7.13, найдем искомую выборочную среднюю.
По формуле (7.21) вычислим выборочную дисперсию.
Затем по формуле (7.24) вычислим искомую выборочную исправленную дисперсию:
или по формуле (17.25).
Мода (Mod) равна варианте, которой соответствует наибольшая частота или относительная частота.
Медиана (Med) — варианта, которая расположена в середине распределения и делит вариационный ряд на две равные части. Для ряда с нечетным числом вариант медиана равна варианте под номером (ч + 1)/2. Если число вариант п четно, то медиана определяется как полсуммы двух серединных соседних вариант.
Пример 7.10. Найти медиану выборки: 9, 3, 5, 8,4,11, 13.
Решение. Упорядочим выборку: 3, 4, 5, 8, 9, 11, 13. Здесь объем выборки н = 7. Поскольку имеется нечетное число ва;
4+1 7+1 «.
риант, то медиана равна варианте под номером -=-= 4,.
т.е. Med = 8.
Пример 7.11. Найти медиану выборки: 20, 9, 13, 1,4, 11.
Решение. Упорядочим выборку: 1, 4, 9, 11, 13, 20. Так как число вариант 4 = 6 четно, то искомая медиана равна.
Пример 7.12. При анализе числа случаев заболевания дифтерией среди детей в возрасте от 2 до 16 лет был получен статистический ряд распределения (табл. 7.14).
Таблица 7.14. Число случаев заболевания дифтерией.
Возраст X, лет. | ||||||||
Число больных, т | ПО. | I80. |
Постройте полигон частот данного распределения, найдите выборочную среднюю, среднее квадратичное отклонение и моду. Выберите показатель заболевания для решения вопроса о профилактике заболевания.
Решение. Анализируемый показатель X — возраст больного, т — число (частота) заболеваний среди детей. Объем выборки равен 4 = 110 + 203 +180+…+ 48 + 40 = 834.
Построенный по данным табл. 17.14 полигон частот (зависимость частоты заболевания дифтерией от возраста больного) представлен на рис. 7.9.
В соответствии с формулой (7.16) выборочная средняя возраста заболевших.
Отсюда выборочное среднее квадратичное отклонение.
Для нашего примера вариантах с наибольшей частотойт = = 203 равна 4 годам (рис. 7.9), следовательно, Mod = 4 года. Заметим, что знание среднего возраста заболевших (хв = 7,1 лет).
По формуле (7.21) вычислим выборочную дисперсию менее важно, чем знание возраста, в котором чаще всего возникает это заболевание и который представляет собой моду (Mod =.
= 4 года). Поэтому именно этот показатель следует взять для решения вопроса о профиРис. 7.9. Полигон частот заболевания дифтерией лактике данного заболевания в дошкольных учреждениях.