Проверка гипотез о параметрах распределения
Статистическая гипотеза — это предположение о законе распределения выборки и отдельных параметров (статистик) этого распределения. Конкурирующей, или альтернативной, называется гипотеза, которая противоречит нулевой. Обозначается через Ни например, Нр 0 = 0а. Статистика Т является случайной величиной, поэтому при проверке гипотезы Н0 можно допустить ошибки двух видов (табл. 7.1): Верное решение… Читать ещё >
Проверка гипотез о параметрах распределения (реферат, курсовая, диплом, контрольная)
Нулевая и конкурирующая гипотезы, выбор критической области
Статистическая гипотеза — это предположение о законе распределения выборки и отдельных параметров (статистик) этого распределения.
Например, можно выдвинуть гипотезу о том, что распределение производительности труда работников, выполняющих на данном предприятии одинаковую работу, имеет нормальный закон распределения. Выдвинутая гипотеза называется нулевой, обозначается через HQ. Если f (X, 0) — закон распределения случайной величины X, зависящий от параметра 0, то может быть выдвинута нулевая гипотеза о величине этого параметра, Н0: 0 = 0О.
Конкурирующей, или альтернативной, называется гипотеза, которая противоречит нулевой. Обозначается через Ни например, Нр 0 = 0а.
Задача состоит в проверке гипотезы Н0 относительно альтернативы Нх на основании выборки (ха, х2,…, хп) из п независимых наблюдений над случайной величиной X. Для конкретной задачи выбирают критерий Т (тест). Определяют так называемую критическую область К — множество значений критерия Т, при которых нулевую гипотезу Н0 отвергают в пользу альтернативы Hv
Принципы выбора области К были сформулированы в работах математиков Ю. Неймана и Э. Пирсона. Критическая область удовлетворяет условию Р (Т е К | Н0 верна) < а, а — заданный уровень значимости.
Метод проверки заключается в следующем. Для выборки определяется значение теста T=t. Если t лежит в критической области, то от гипотезы Н0 отказываются, так как осуществляется событие, имеющее малую вероятность а; если t не лежит в критической области, то данные наблюдения не противоречат выдвинутой гипотезе.
Статистика Т является случайной величиной, поэтому при проверке гипотезы Н0 можно допустить ошибки двух видов (табл. 7.1):
- • ошибку первого рода — отвержение гипотезы в случае, когда она в действительности верна. Ее вероятность а выбирается так, чтобы это событие было практически невозможно (обычно, а = = 0,01, 0,02, 0,05, чем весомее потери от ошибочного отвержения Н0, тем, а должна быть меньше);
- • ошибку второго рода — принятие гипотезы Н0, когда в действительности верна альтернатива Н1. Вероятность ошибки второго рода обозначается через (3. Область К обычно выбирают таким образом, чтобы при заданной а минимизировать ошибку второго рода (Р —" min).
Таблица 7.1
Типы ошибок при проверке гипотез.
^''—-Событие Решение'—'^^. | Н0верна. | Н0 не верна (верна Hj). |
Отвергнуть Н0 | Ошибка 1-го рода, вероятность а | Верное решение, вероятность 1 — р (мощность критерия). |
Принять Н0 | Верное решение, вероятность 1 — а. | Ошибка 2-го рода, вероятность (5. |
При уменьшении уровня значимости, а критическая область К сужается. Например, пусть проверяется гипотеза Н0: р = 0 против Нр. р = pj > 0 (рис. 7.11). В данном случае Т = х, К: х >хкр. Может оказаться, что при начальном значении критерия t будет справедливо событие t е К, после уменьшения, а (области К) станет верным событие t е. К, т. е. можно так уменьшить величину, а (область К), что гипотеза Н0 не будет отвергнута. Действительно, чем меньше задается вероятность ошибки 1-го рода а, тем больше вероятность 1 — а того, что гипотеза Н0 не должна быть отвергнута.
Рис. 7.11. Проверка гипотезы Н0: р = 0 против Нр. р = рх > 0.
На практике часто используют вычисленный уровень значимости Он равен вероятности ошибки 1-го рода, если за границу критической области принять вычисленное значение критерия t. Для случая, приведенного на рис. 7.11, авыч = Р (х > хВЬ1Ч | Н0 верна). Гипотеза Н0 отвергается при авыч < а.