Центральная предельная теорема
Если некоторые предположения ЦПТ нарушаются, то сам факт сходимости распределений сумм случайных величин к нормальному распределению может быть неверен. Пусть, например, случайные величины Х, …, х" одинаково распределены по закону Коши с плотностью р (х) =. Вероятность, стоящая в правой части, во всяком случае, меньше 16−10, 6. Таким образом, мы наблюдаем весьма редкое событие и должны… Читать ещё >
Центральная предельная теорема (реферат, курсовая, диплом, контрольная)
Сформулируем эту теорему в условиях Ляпунова. Эти условия подобраны таким образом, чтобы обеспечить сходимость соответствующей последовательности характеристических функций к функции е", 2/2. Таким образом, они являются достаточными условиями справедливости теоремы. Однако эти условия чрезвычайно близки и к необходимым [15−19].
Пусть дана последовательность независимых случайных величин ф, ф, •••> Ф, для каждой из которых существуют математическое ожидание МЦ = а/., дисперсия Эф, = ci/: и третий центральный момент М|ф — й/, р. Положим
Пусть выполнено следующее условие Ляпунова:
Тогда справедлива следующая центральная предельная теорема в форме Ляпунова.
Теорема 4.9. При выполнении условия Ляпунова
равномерно по х.
Доказательство. Рассмотрим случайные величины.
" Я
Я Очевидно, что 5,) = ?г|"*. При этом 1−1.
Пусть f"h (t) — характеристическая функция. Тогда.
По формуле Тейлора для получаем, что равномерно в любом интервале |г | < Т
Необходимо отметить, что М|щ"|3 —? 0 при и —" °о равномерно по /г, но тогда и —j = Dr"h —* 0 при w —" равномерно по k. Дей- Вп
ствительно для любого е > О равномерно по k.
Положим
При п — °° имеем |z, J —" 0 равномерно, но к т. е. при достаточно большом п
П
Вычислим теперь характеристическую функцию = ГХ/иДО- Имеем пои п -* °о
Воспользуемся условием Ляпунова, получаем Далее в силу.
при и —> оо и силу того, что max |z"*| -*? 0.
е —
Таким образом ln/y*(f) —" следовательно, fs>(7) —*? е 2 и теорема доказана.
Замечание 4.6. Условие Ляпунова не только обеспечивает соотношение
но из него вытекает еще, что.
Замечания к центральной предельной теореме (ЦПТ).
- 1. В условиях ЦПТ, производя при доказательстве точные оценки, можно получить представления о точности действия приближенной формулы.
- 2. Так, например, можно получить следующее неравенство.
При любом х, если |?"| < L, то.
где < 1. Таким образом, погрешность имеет порядок -7=.
п
Для практического использования это довольно грубая оценка; например, для того чтобы ошибка была меньше 0,01, нужно взять п порядка 10 000.
Следует отметить, что польза основного соотношения ЦПТ определяется не величиной абсолютной погрешности | P (S^ < х) — Ф (х)|, а относительной ошибкой, т. е. отношением этой величины к Ф (х), которое должно быть мало.
2. Если некоторые предположения ЦПТ нарушаются, то сам факт сходимости распределений сумм случайных величин к нормальному распределению может быть неверен. Пусть, например, случайные величины Х, …, х" одинаково распределены по закону Коши с плотностью р (х) =.
=-тг. Характеристическая функция распределения л (1 + *).
Коши равна <�р (/) = е |г|. Тогда сумма S" = Х + … + х" будет иметь характеристическую функцию е~п'1 а так как по характеристической функции распределение определяется одназпачно, то сумма S" будет также распределена по закону Коши, но с другим параметром. Никакого сближения между характеристическими функциями распределения Коши и нормального, а стало быть, и между самими распределениями, не наблюдается (сравните графики характеристической функции Коши и нормального распределения (рис. 4.2)).
Такой вывод объясняется нарушением условием ЦПТ, а именно: случайные величины с распределением Коши имеют не только бесконечную дисперсию, но и бесконечное.
Рис. 4.2.
математическое ожидание (напомним, что существование математического ожидания в этом случае равносильно существованию и конечности интеграла
однако интеграл расходится). По той же причине для последовательности случайных величин с плотностью Коши не выполняется закон больших чисел: арифметическое сред- +… + х".
нее — будет иметь характеристическую функцию,.
п
равную е~* т. е. такую же, какой обладает отдельное слагае;
S
мое, и следовательно, арифметическое среднее — случай;
п
ных величин Х9…, хп будет иметь то же самое распределение Коши, что и каждая случайная величинах/,.
3. Рассмотрим в ЦПТ случайные величины xj,хп с одним и тем же распределением.
Тогда, очевидно, а = Мх* = Р и а2 = Dx* = Pq, следовательно,.
В подобной форме теорема называется теоремой Лапласа и является исторически первым вариантом ЦПТ. Смысл теоремы Лапласа в том, что нормированное число «успехов» в схеме Бернулли имеет асимптотически нормальное распределение с параметрами (0, 1). Для этого случая получена более точная приближенная формула (см., например, Феллер, т. 1, гл. VII):
130 Глава 4. Предельные теоремы.
где — — это поправка на дискретность распределения, которая при больших п несущественна, а при малых п улучшает.
результат. Пусть, например, в схеме Бернулли п = 100, р = ;
(это соответствует 100 бросаниям симметричной монеты). Пусть 5юo=*i + … +*ioo (число появления герба при 100 бросаниях). Найдем с помощью теоремы Лапласа вероятность того, что 35 < Sn < 65. Очевидно, что пР = 50, V прц = 5 и, а = -3, р = 3. Тогда.
так как по таблицам нормального распределения Ф (3) = = 0,99 865.
Можно увеличить точность, учитывая */г: так как, а = -3,1, р = 3,1 и Ф (3,1) = 0,99 903, то.
Эта же вероятность, вычисленная по таблицам биномиального распределения, равна.
Примеры использования ЦПТ приведены ниже.
Пример 4.8. Проверка статистической гипотезы о том, что вероятность «успеха» в схеме Бернулли равна заданному числу.
Пусть при 10 000 бросаний монеты герб появился 5400 раз. Согласуются ли опытные данные с гипотезой о том, что монета симметрична, т. е. Р= ½. Будем считать, что данная гипотеза верна, и вычислим вероятность события P{Sn > 5400}, в которое включается наблюдаемое нами событие {Sw = 5400}. S" — это случайное число гербов, то MSn = 5000, DSn = 2500. По теореме Ла-, S"np
пласа величина Sn = = 6 имеет асимптотически нормальное распределение. Естественно проверять гипотезу р = ½ при альтернативной гипотезе р > ½. Тогда, если гипотеза верна, то.
Вероятность, стоящая в правой части, во всяком случае, меньше 16−10 , 6. Таким образом, мы наблюдаем весьма редкое событие и должны подвергнуть нашу гипотезу о симметричности монеты сомнению или, как поступают обычно в таких случаях, отвергнуть гипотезу.
Пример 4.9. Построение доверительного интервала для неизвестной вероятности успеха в схеме Бернулли.
Пусть в схеме испытаний Бернулли с вероятностью успеха 0<�Р < 1, п — число испытаний, Sn — случайное число успехов, Р* = Stl/n — частота успеха. Пользуясь теоремой Лапласа, можно оценить вероятность отклонения частоты успеха от вероятности Р на заданную величину е:
С другой стороны, по заданному а, 0 < а < 1, можно найти по таблицам нормального распределения такое значение X, что.
2Ф (>.) — 1 = 1 — а; Ф (Х) = 1 — а/2 (обозначим X = Х_<�±).
Таким образом, можно утверждать, что с вероятностью, близкой к (1 — а), происходит событие.
причем это верно при любом значении 0 < р < 1. Обычно на практике р известно, наблюдается лишь величина S" = т, где т — наблюденное чило успехов, и таким образом частота принимает значение т/п. Необходимо указать границы для неизвестной вероятности р, основываясь на значении частоты. Очевидно, что О < р < 1. Указание границ связано с риском совершить ошибку. Доверительным уровнем называется величина у = 1 — а, где, а — вероятность совершить ошибку. Так как р* известно, то последнее неравенство, выполняющееся с вероятностью, близкой к 1 — а, дает возможность найти пределы, в которых лежит неизвестное значение р. Эти границы находятся как корни квадратного уравнения.
и равны.
Полученный интервал (рь р2) со случайными, вообще говоря, концами, называется доверительным интервалом для неизвестного значения р, соответствующим доверительному уровню 1 — а. Следовательно, если утверждается, что интервал (рь/ъ) накрывает значение а, то вероятность ошибочного значения равна а. С помощью доверительного интервала можно проверять гипотезы о том, что вероятность успеха в схеме Бернулли равна заданному числу Р. Если (р, р)~ доверительный интервал, соответствующий доверительному уровню 1 — а, то проверка гипотезы р = р0 проводится следующим образом: если оказывается, что Ро<�р или р{) > р, то гипотеза отвергается, если жер <�р0 < р, то считаем, что гипотеза р= ра нс противоречит полученным наблюдениям. При этом доля случаев, в которых мы будем отвергать на самом деле справедливую гипотезу, приближенно равна а. Рассмотрим данные примера 4.8 и проверим с помощью доверительного интервала гипотезу р = ½. Доверительному уровню 1 — а = 0,05 соответствует интервал с границами р = 0,535 и /3 = 0,545. Так как р = 0,5 ё [р, р |, то отвергаем гипотезу р = ½, при этом мы будем ошибаться в среднем в пяти случаях из 100.
Таблица 4.1 показывает, как при увеличении п сужается доверительный интервал (доверительный уровень 0,05 при значении частоты р* = 0,6).
Таблица 4.1
Значения доверительного интервала.
п | т | Р | Р |
е. | 0,262. | 0,878. | |
0,361. | 0,809. | ||
0,406. | 0,773. | ||
0,433. | 0,751. | ||
0,497. | 0,697. |