Оценки параметров многомерной генеральной совокупности
Таким образом, элементы ху матрицы X можно рассматривать либо как случайные (одномерные) величины (независимые, но г), либо как конкретные наблюдаемые значения — координаты п точек в-мерном евклидовом пространстве (или п точек в А-мерном пространстве). По данным выборки найдем среднюю арифметическую х и среднее квадратическое отклонение 5. Тогда доверительные интервалы отдельно для… Читать ещё >
Оценки параметров многомерной генеральной совокупности (реферат, курсовая, диплом, контрольная)
Выборку объема п из-мерной (k > 1) генеральной совокупности X можно представить в виде матрицы данных, строки которой рассматриваются как п независимых реализаций-мерного случайного вектора и которую будем обозначать также буквой X:
Таким образом, элементы ху матрицы X можно рассматривать либо как случайные (одномерные) величины (независимые, но г), либо как конкретные наблюдаемые значения — координаты п точек в-мерном евклидовом пространстве (или п точек в А-мерном пространстве).
Приведем точечные оценки моментов генеральной совокупности, которые получили наибольшее практическое применение [4, 13].
Оценка начального момента т-го порядка l-й компоненты случайного вектора X) вычисляется по формуле , при т = 1 имеем среднюю арифметическую.
Оценка ковариационной матрицы 2 случайного вектора (матрицы выборочных дисперсий и ковариации) определяется как.
причем — выборочная дисперсия 1-й компоненты случайного вектора; S/j — выборочная ковариация компонент / и j вектора. Вместо S употребляют также несмещенную оценку.
При алгоритмизации задач многомерного анализа полезным может оказаться вычисление оценок параметров генеральной совокупности с использованием операций над матрицами.
Оценка корреляционной матрицы К с элементами rtj, где оценка парного коэффициента корреляции между /-Й и j-й компонентами вектора, /, j = 1,… k, имеет вид.
или
Определения и понятия интервального оценивания можно перенести на случай векторного параметра с заменой доверительного интервала доверительной областью в соответствующем ш-мерном пространстве.
Доверительной областью вектора параметров 8 генеральной совокупности называется случайная область, полностью определяемая результатами наблюдений, которая с близкой к единице доверительной вероятностью (надежностью) у содержит неизвестное значение вектора 9.
Очевидно, что существует бесконечное множество доверительных областей, соответствующих одному и тому же значению у. Обычно стараются определить доверительные области, имеющие минимальные размеры при данной надежности у. Этому условию удовлетворяют области, симметричные относительно вектора оценок 0 параметров 0.
Основную трудность в построении доверительной области представляет определение законов распределений подходящих статистик. В настоящее время эти вопросы достаточно хорошо разработаны только для нормального распределения наблюдаемых случайных величин.
Доверительная область для вектора математического ожидания. Пусть по результатам п наблюдений из генеральной совокупности X с 6-мерным нормальным распределением найдены вектор средних х и несмещенная оценка S ковариационной матрицы . Требуется найти с вероятностью у доверительную область для 6-мерного вектора генеральных средних р.
Предположим, что ковариационная матрица известна. Найдем такую подходящую статистику, чтобы ее распределение было известным и по которой однозначно можно определить доверительную область.
Напомним, что для одномерной нормально распределенной генеральной совокупности доверительный интервал для р определяется из формул.
где статистика t подчиняется стандартному закону . Последнее равенство можно переписать в виде.
полагая при 6=1.
Полученное равенство обобщается на случай 6-мерной совокупности следующим образом:
Отметим, что статистика t2 имеет распределение с числом степеней свободы v = 6, где 6=1,2.
Таким образом, с надежностью у можно утверждать, что вектор р накрывается доверительной областью, задаваемой неравенством.
Пусть теперь ковариационная матрица неизвестна.
Чтобы при 6=1 построить доверительный интерват для р, используют статистику.
которая имеетраспределение с v = n-l степенями свободы. Равенство можно переписать в эквивалентной форме:
По аналогии строится статистика Хотеллинга которую используют при построении доверительной области для вектора средних р:
(2.12).
где - матрица, обратная ковариационной матрице .
Учитывая, что Fи-распределения связаны соотношением.
(2.13).
получим уравнение поверхности, ограничивающей доверительную область k генеральных средних с надежностью у:
где - точка F-распределения, соответствующая уровню значимости и числам степеней свободы к и п — к.
Уравнения (2.12) и (2.13) определяют /г-мерный эллипсоид (эллипс при к = 2) с центром х, так как его левая часть представляет собой положительно определенную квадратичную форму относительно р.
Пример 2.9
В таблице приведены данные о численности работников .v, и товарообороте фирмы x2 [13].
Численность работников. | х. | ||||||||
Товарооборот, млн руб. | *2. | 3,5. | 5,4. | 2,7. | 9.8. | 10,1. | 6.2. | 2,4. | 9,5. |
Найдем оценки математических ожиданий, дисперсии и коэффициента корреляции, доверительную область для вектора математических ожиданий с вероятностью у = 0,95.
Решение
Найдем средние арифметические: . Перейдем к центрированным величинам :
Отсюда
Итак, оценки дисперсий и средних квадратических отклонений следующие: Найдем выборочный коэффициент корреляции:
Обратная матрица к будет иметь вид.
Тогда согласно уравнению (2.13).
где Т (0,05; 2; 6) = 5,14 находим, но таблице для, а = 1 — у = 0,05 и чисел степеней свободы V, = 2 и v2 = 6.
После преобразований получаем уравнение эллипса.
которое определяет границы доверительной области для вектора Пусть вектор X подчиняется-мерному распределению , где ковариационная матрица, и пусть С — матрица размерности k х / ранга /, причем . Тогда С’Х подчиняется /-мерному нормальному распределению , так как линейные комбинации нормально распределенных величин также распределены нормально.
В этом случае статистика Т2 имеет вид.
(2.14).
Для вероятности выполняется соотношение.
Поскольку вектор Стц содержит / генеральных средних, то, в отличие от уравнения (2.13), теперь числа степеней свободы равны / и и — /. В частном случае, когда С — единичная матрица порядка k, уравнение (2.14) сводится к уравнению (2.13) и число степеней свободы становится равным, как и прежде, knn-k.
Использование линейных комбинаций компонент вектора р позволяет расширить область применения статистики Т2 Хотеллинга при интервальном оценивании в задачах сравнения.
С помощью линейных комбинаций можно, например, найти совместные доверительные интервалы или проверить гипотезу относительно первых () средних значений генеральной совокупности. Для этого достаточно принять.
Поскольку С1 имеет размерность / х к и ранг /, то вектор С7р имеет размерность / х 1 и содержит / (/ < к) генеральных средних.
Чтобы построить доверительный интервал для генерального среднего р;, у = 1,2,… к, достаточно принять, что С; естьj-й столбец единичной матрицы размерности к. Тогда С7р = р; и статистика Хотеллинга.
имеют распределение, зависящее от чисел степеней свободы 1 и п — 1.
Таким образом, согласно уравнению (2.14), доверительная область для с надежностью у будет ограничена поверхностью.
В частности, с вероятностью у доверительные границы для линейной комбинации (где есть j-й столбец матрицы С) определяются как
Пример 2.10
По данным примера 2.9 с помощью линейных комбинаций найдем с надежностью у = 0,95 интервальные оценки генеральных средних р, и р,.
Решение
Для нашего примера, а = 1 — у = 0,05, v, = 1, v2 = и — 1 = 7. Согласно таблице /-'-распределения /'(0,05; 1; 7) = 5,59.
Для построения интервальной оценки средней р, примем С, = (1; О)7, так что С, х = 42; CfSCf = Of = 275,714. Тогда границы доверительного интервала для р, имеют вид.
откуда 28.120 SP, <55,880.
Для построения интервальной оценки генерального среднего Pi принимаем откуда !.
Тогда с надежностью у = 0,95 границы доверительного интервала таковы; откуда 3,488 < р, < 8,912.
Определение совместной доверительной области для математического ожидания и дисперсии. Один из простых подходов в построении многомерной доверительной области состоит в определении таких интервалов для координат вектора параметров 0, для которых вероятность одновременного накрытия всех соответствующими интервалами была бы не меньше заданного значения у. Таким образом, речь идет о нахождении прямоугольной доверительной области для вектора 0 соответствующей надежности, не меньше чем у [13,30].
Введем события , и обозначим прямоугольную область в m-мсрном пространстве, образованную интервалами /,(0,), , через /(0). На основании свойств вероятностей получим.
где — пересечение событий — объединение событий , противоположных событиям Aj.
Из этого неравенства следует, что для определения доверительной области достаточно найти доверительные интервалы для координат вектора 0, соответствующие доверительной вероятности . Тогда доверительная вероятность для всех параметров будет не меньше у.
Пусть для нормальной генеральной совокупности х с неизвестными параметрами р и ст взята случайная выборка объема п. Требуется с надежностью у найти (совместную) доверительную область для р и ст, т. е. для двумерного вектора параметров
По данным выборки найдем среднюю арифметическую х и среднее квадратическое отклонение 5. Тогда доверительные интервалы отдельно для математического ожидания р и среднего квадратического отклонения ст, отвечающие надежности у, имеют вид.
(2.15).
(2.16).
где, а = 1-у, ta и у} находятся по таблицам распределений Стьюдента и у} для числа степеней свободы v = я-1 и вероятностей, а и соответственно.
Доверительную область для вектора 0 можно определить по формуле.
(2.17).
где
Эта область представляет собой трапецию.
Для построения такой области с заданной доверительной вероятностью у можно руководствоваться следующим.
Так как при нормальном распределении генеральной совокупности х оценки х и s независимы, причем х имеет нормальное распределение - распределение х2 с v = п -1 степенями свободы, то.
Определив Г и из условий •, где С -.
произвольное число, найдем доверительную область вектора параметров 0 = j, соответствующую вероятности у.
По результатам контроля и = 14 изделий найдено, что средняя высота сальниковой камеры равна х = 88 мм, а 5 = 0,96 мм. Требуется определить доверительную область для вектора параметров с надежностью у = 0,95.
Решение
Для сравнения определим сначала с надежностью у — 0,95 доверительные интервалы для математического ожидания И и среднего квадратического отклонения о.
По таблице /-распределения для числа степеней свободы V — л -1 = 13 и уровня значимости а = 1-у = 0,05 находим Г =2,160. Согласно выражению (2.15) имеем.
откуда 87,425 S р < 88,575.
По таблице х2-распределения для числа степеней свободы v = 13 и вероятности найдем верхнюю границу ~ 24,736 доверительного интервала для XJ Отсюда нижняя граница для о равна по формуле (2.16).
Для числа степеней свободы v = 13 и вероятности найдем '.
Отсюда верхняя граница, а имеет вид по формуле (2.16).
Таким образом, 0,722< ст < 1,605.
Чтобы определить доверительную область для вектора (р. а) с вероятностью у = 0,95, найдем по таблице интегральной функции Лапласа t = 2,24 из условия По таблице-распределения находим.
По формуле (2.17) найдем доверительную область:
Теперь для сравнения найдем прямоугольную доверительную область с коэффициентом доверия у = 0,95. Для этого по формулам (2.15) и (2.16) определим доверительные интервалы для р и а. соответствующие вероятности В результате получим.
Стагпистичвской гипотезой называют непротиворечивое множество предположений о виде или параметрах неизвестных законов распределения генеральных совокупностей.
Если гипотеза однозначно определяет закон распределения вероятностей //": F (x) — Fn (x), то она называется простой, в противном случае (//: /¦'(.г) = F0(x, 9), 0 с 0О) — сложной.
Нулевой (Н0) называют выдвинутую гипотезу, которую нужно проверить, конкурирующей (альтернативной) (//]) — гипотезу, противоположную нулевой.
Статистическим критерием называют однозначно определенное правило, устанавливающее условия, при которых проверяемую гипотезу (//0) следует либо отвергнуть, либо не отвергнуть.
Основу критерия представляет специально составленная выборочная характеристика (статистика критерия) 6' = 0' (д, х2 х"), точное или приближенное распределение которой известно [28].
Пусть дана выборка хи х2, … х" объемом п. Каждый критерий разбивает все множество возможных значений статистики 0* = f (xt, х2, …, х") на два непересекающихся подмножества (области): критическую область (область отклонения гипотезы) и область принятия гипотезы.
Основной принцип проверки гипотезы: если наблюденные значения статистики критерия попадают в критическую область, то гипотезу отвергают. В противном случае гипотезу не отвергают.
Такой принцип проверки гипотезы не дает логического доказательства или опровержения гипотезы. При его использовании возможны четыре случая: