Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Стьюдента
Вместе с тем, в описательной статистике распределение Стьюдента практически не используется в качестве аналитической модели, «подгоняемой» к экспериментальным данным. Лишь относительно недавно появились работы, в которых распределение Стьюдента применяется (впрочем, без надлежащего теоретического обоснования) для описания динамики некоторых финансовых индексов, в частности приращений логарифмов… Читать ещё >
Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Стьюдента (реферат, курсовая, диплом, контрольная)
Содержание
- ГЛАВА 1. Вспомогательные результаты
- 1. 1. Распределение Стьюдента
- 1. 2. Распределение Стьюдента как асимптотическая аппроксимация
- 1. 2. 1. Предварительные результаты
- 1. 2. 2. Распределение Стьюдента как предельное при случайном объёме выборки
- 1. 3. Экстремальные энтропийные свойства распределения Стьюдента
- 1. 4. Случай малого параметра 7 = 2г
- ГЛАВА 2. Оценки скорости сходимости распределений некоторых статистик к распределению Стьюдента
- 2. 1. Оценки скорости сходимости отрицательно биномиального распределения к гамма распределению при 0 < г <
- 2. 2. Оценки скорости сходимости некоторых статистик, построенных по выборкам случайного объёма, к распределению Стьюдена
- 2. 3. Применения к U — статистикам и линейным комбинациям порядковых статистик
- ГЛАВА 3. Оценивание центра распределения Стьюдента с малым числом степеней свободы
- 3. 1. Статистическое оценивание центра распределения Стью-дента
- 3. 2. Асимптотическая эффективность эквивариантных оценок
- 3. 3. Оценивание центра в случае малого числа степеней свободы
- 3. 4. М-оценки и оценки максимального правдоподобия
- ГЛАВА 4. Об аппроксимации необходимого резервного капитала страховой компании в случае большого числа различных клиентов
- 4. 1. Описание модели страхования
- 4. 2. Асимптотическое разложение для резервного капитала страховой компании
- 4. 3. Примеры
- 4. 4. Случай случайного числа клиентов страховой компании
Как хорошо известно, распределение Стьюдента, возникающее в задачах проверки гипотез о среднем значении нормального рапределения в случае неизвестной дисперсии, (см., например, (Леман 1964), глава 5, § 2, 3), зависит от целочисленного параметра 7, называемого числом степеней свободы, и имеет плотность где Г (-) — эйлерова гамма-функция (см., например, (Крамер 1948), стр. 263). Здесь параметр 7 тесно связан с объемом выборки и принимает натуральные значения. Однако можно сказать, что в таких задачах роль распределения Стьюдента в значительной мере вспомогательна, оно является в определенном смысле абстрактной идеальной теоретической моделью. (Отметим также здесь, что формально распределение Стьюдента определено при любом положительном значении параметра формы 7 и при 7 = 1 мы имеем «тяжёлохвостное» распределение Коши.).
Вместе с тем, в описательной статистике распределение Стьюдента практически не используется в качестве аналитической модели, «подгоняемой» к экспериментальным данным. Лишь относительно недавно появились работы, в которых распределение Стьюдента применяется (впрочем, без надлежащего теоретического обоснования) для описания динамики некоторых финансовых индексов, в частности приращений логарифмов биржевых цен. В первую очередь здесь следует упомянуть работы П. Прэтца (Praetz 1972) и Р. Блаттберга, Н. Гоундса р7(х) =.
Г ((7 +1)/2).
V/FуГ (7/2).
— оо < х < оо, (0.1).
Blattberg, Gonedes 1974). Лишним подтверждением этого служит то обстоятельство, что автором не удалось найти ни в одном руководстве по теории (или практике) статистического оценивания рассмотрения задачи оценивания параметра формы 7 распределения Стьюдента.
По-видимому, недостаточное доверие прикладных статистиков к распределению Стьюдента как к модели, описывающей статистическое поведение реальных данных, связано с тем, что, в отличие от, скажем, нормального или пуассоновского распределений, фигурирующих в качестве предельных соответственно в центральной предельной теореме и теореме Пуассона о редких событиях, распределение Стьюдента не считается асимптотической аппроксимацией.
В прикладной математике вообще и в статистике в частности, принято считать, что адекватной может быть лишь та аналитическая модель, в основе которой лежит какая-либо предельная теорема с довольно простыми и общими условиями, в то время как та асимптотическая схема, которая используется для обоснования возможности применения распределения Стьюдента в качестве предельной аппроксимации (в тех редких случаях, когда распределение Стьюдента используется в таком качестве) и связана с его безграничной делимостью (кстати, установленной сравнительно недавно), довольно сложна. А именно, известно, что любое безгранично делимое распределение может быть слабым пределом для распределений сумм независимых равномерно предельно малых случайных величин. Поэтому в принципе, если при статистическом анализе реальных данных можно предположить, что каждое наблюдение является результатом суммарного воздействия большого числа случайных факторов, которые вносят примерно одинаковый (в определенном смысле) вклад в наблюдаемое значение, то при выполнении условий, гарантирующих сходимость распределений сумм независимых равномерно предельно малых случайных величин к распределению Стьюдента, последнее вполне может быть использовано в качестве модели, описывающей статистическое поведение экспериментальных данных. Однако упомянутые условия формулируются в терминах элементов так называемого канонического представления безгранично делимой характеристической функции и имеют сложный вид, что серьезно затрудняет их практическую проверку. В результате в рамках такого подхода до сих пор не удалось найти достаточного обоснования возможности более или менее широкого применения распределения Стьюдента в задачах описательной статистики.
Отметим ещё раз, что аналитическая форма плотности распределения Стьюдента (0.1) формально определена для любых положительных значений параметра 7. Здесь следует отметить недавние результаты Бенинга и Королёва. Работа (Бенинг, Королёв 2004) посвящена математическому обоснованию возможности использования распределения Стьюдента, зависящего от параметра формы (число степеней свободы) 7 > 0, в качестве статистической модели, описывающей распределение наблюдаемых случайных величин.
Для обоснования такой возможности показано, что распределение Стьюдента с произвольным 7 > 0 может быть получено в качестве предельного в случае выборки случайного объёма. При этом особо выделен случай когда параметр формы распределения Стьюдента 7 > 0 мал. Этот случай представляет интерес как модель распределения с «тяжёлыми хвостами». В этом случае подчеркивается возможность использования семейства распределений Стьюдента в качестве удобной модели распределений с «тяжелыми хвостами», так как для него (в отличие от устойчивых законов) многие формулы, в частности, функция правдоподобия, приобретают явный вид.
Диссертация посвящена дальнейшему развитию идей работы (Бенинг, Королёв 2004).
Доказана общая теорема, позволяющая автоматически получать оценки скорости сходимости распределений статистик, построенных по выборкам случайного объёма, к распределению Стьюдента из оценок скорости сходимости к нормальному закону этих же статистик, но уже построенным по обычным не случайным выборкам.
В качестве иллюстрации возможностей статистического анализа, основанного на стьюдентовом семействе, рассматривается задача статистического оценивания центра распределения Стьюдента в предположении, что параметр формы (число степеней свободы) 7 > 0 известен. В диссертации рассматриваются эквивариантные оценки центра распределения Стьюдента, основанные на порядковых статистиках, оценки Ходжеса — Лемана, М-оценки и оценки максимального правдоподобия. Находится их асимптотическая относительная эффективность и изучается ее поведение при стремлении числа степеней свободы 7 > 0 к нулю.
Рассматривается также задача из теории риска, а именно, задача оценивания необходимого резервного капитала страховой компании в случае большого числа неодинаковых клиентов. Для этой оценки также используется распределение Стьюдента.
Диссертация состоит из введения, четырёх глав и списка литера-руры, состоящего из 57 названий.
1. У Да, Бенинг В. Е., Об оценивании центра распределения Стьюдента с малым числом степеней свободы. — Вестник Московского Университета, серия 15, Вычислительная Математика и Кибернетика, 2003, 3, с. 30 — 37.
2. Wu Da, Bening V.E., Small degree of freedom for the Student distribution family (in Chinese). Mathematica Applicata, 2003, v. 16, p. 133 — 136.
3. У Да, Бенинг B.E., Об аппроксимации необходимого резервного капитала страховой компании в случае большого числа неоднородных контрактов. Вестник Московского Университета, серия 15, Вычислительная Математика и Кибернетика, 2002, 3, с. 49 — 54.
4. Wu Da, Two theorems for estimating risk refusal function. J. Appl. Math., 2003, v. 18, ser. A, p. 311 — 317.
5. Бенинг В. E. и Королёв В. Ю., Об использовании распределения Стьюдента в задачах теории вероятностей и математической статистики. Теория вероятностей и ее применения, 2004, т. 49, выпуск 3, с. 419 — 535.
6. Student, On the probable error of the mean. Biometrica, 1908, v. 8, n. 1.
7. Praetz P., The distribution of share prices changes. J. Business, 1972, v. 45, p. 49 — 55.
8. Blattberg R. and Gonedes N., A comparison of the stable and Student distributions as statistical models of stock prices. J. Business, 1974, v. 47, p. 244 — 250.
9. Круглов B.M., Королёв В. Ю., Предельные Теоремы для Случайных Сумм. Издательство МГУ, 1990, 269 стр.
10. Королёв В. Ю., Сходимость случайных последовательностей с независимыми случайными индексами. I. Теория вероятн. и ее примен., 1994, т. 39, вып.2, с. 313 — 333.
11. Королёв В. Ю., Сходимость случайных последовательностей с независимыми случайными индексами. II. Теория вероятн. и ее примен., 1995, т. 40, вып. 4, с. 907 — 910.
12. Korolev V.Yu., A general theorem on limit behavior of superpositions of independent random processes with applications to Cox processes. J. Math. Sci., 1996, v. 81, n. 5, p. 2951 — 2956.
13. Bening V.E., Korolev V.Yu., Generalized Poisson Models and their Applications in Insurance and Finance. VSP, Utrecht, 2002, 434 p.
14. Золотарев B.M., Одномерные Устойчивые Распределения. Москва, «Наука», 1983, 304 стр.
15. Alberink I.B., Berry Esseen Bounds for Arbitrary Statistics. — Ph.D. thesis, Enschede, 2000, 126 p.
16. Bentkus V. and Gotze F., Optimal results of convergence in the CLT for quadratic forms. Ann. Probab., 1996, v. 24, p. 466 — 490.
17. Bentkus V. and Gotze F., The Berry Esseen bound for Student’s statistic. — Ann. Probab., 1996, v. 24, p. 491 — 503.
18. Prawitz H., Limits for a distribution, if the the characteristic function is given in a finite domain. Skand. Aktuar. Tidskr., 1972, p. 138 -154.
19. Uchaikin V.V. and Zolotarev V.M., Chance and Stability. Stable Distributions and their Applications. VSP, Utrecht, 1999.
20. Гнеденко Б. В., Об оценивании неизвестных параметров распределений по случайному числу независимых наблюдений. в: Теория вероятностей и математическая статистика. Труды Тбилисского математического института им. А. М. Размадзе, 1989, с. 146 — 150.
21. Gurland J., Some interrelations among compound and generalized distributions. Biometrika, 1957, v. 44, p. 265 — 268.
22. Quenouille M.H., A relation between the logarithmic, Poisson and negative binomial series. Biometrics, 1949, v. 5, p. 162 — 164.
23. Кендалл М.Дж. и Стьюарт А., Теория Распределений. Москва, «Наука», ГИФМЛ, 1966, 587 стр.
24. Greenwood М. and Yule G.U., An inquiry into the nature of frequency-distributions of multiple happenings, etc. J. Roy. Statist. Soc., 1920, v. 83, p. 255 — 279.
25. Bickel P.J., On some robust estimates of location. Ann. Math. Statist., 1965, v. 36, n. 3, p. 847 — 858.
26. Леман Э., Теория Точечного Оценивания. Москва, «Наука», 1991, 443 стр.
27. Леман Э., Проверка Статистических Гипотез. Москва, «Наука», 1964, 498 стр.
28. Крамер Г., Математические Методы Статистики. Москва, «Иностранная Литература», 1948, 631 стр.
29. Bening V.E., Asymptotic Theory of Testing Statistical Hypotheses: Efficient Statistics, Optimality, Power Loss, and Deficiency. VSP, Utrecht, 2000, 277 p.
30. Ибрагимов И. А., Хасьминский P.3., Асимптотическая Теория Оценивания. Москва, «Наука», 1979, 527 стр.
31. Does R.J.M.M., Berry Esseen theorems for simple rank statistics under the null-hypothesis. — Ann. Probab., 1982, v.10, p. 982 — 991.
32. Королюк B.C., Боровских Ю. В., Теория U статистик. — Киев, «Наукова Думка», 1989, 383 стр.
33. Stone C.J., Asymptotic properties of estimators of a location parameter. Ann. Statist., 1974, v. 2, p. 1127- 1137.
34. Port S.C. and Stone C.J., Fisher information and the Pitman estimator of a location parameter. Ann. Statist, 1974, v. 2, p. 225- 247.
35. Serfling R.J., Approximation Theorems of Mathematical Statistics. -John Wiley, 1980, 371 p.
36. Hodges J.L. and Lehmann E.L., Estimates of location based on rank tests. Ann. Math. Statist., 1963, v. 34, p. 598 — 611.
37. Friedrich K.O., A Berry Esseen bound for functions of independent random variables. — Ann. Statist., 1989, v. 17, n. 1, p. 170 — 183.
38. Guan Z., A Berry Esseen bound for k — sample symmetric statistics.- Northeast. Math. J., 1994, v. 10, p. 411 420.
39. Helmers R., Edgeworth Expansions for Linear Combinations of Order Statistics. Amsterdam, 1984, Mathematisch Centrum, 136 p.
40. Helmers R., A Berry Esseen bound for linear combinations of order statistics. — Ann. Probab., 1981, p. 342 — 347.
41. Helmers R., van Zwet W.R., The Berry Esseen bound for U-statistics. — Statistical Decision Theory and Related Topics 3, 1982, Academic Press, p. 497 — 512.
42. Huber P.J., Robust estimation of a location parameter. Ann. Math. Statist., 1964, v. 35, n. 1, p. 73 — 101.
43. Феллер В., Введение в Теорию Вероятностей и е Приложения, т.2. Москва, «Мир», 1984, 746 стр.
44. Двайт Г. Б., Таблицы Интегралов и Другие Математические Формулы. Москва, «Наука», 1977, 224 стр.
45. Kapur J. N., Maximum-Entropy Models in Science and Engineering. Wiley, New York, 1989.
46. Hill B.M., A simple general approach to inference about the tail of a distribution. Ann. Statist., 1975, v. 3, p. 1163−1174.
47. Resnick S.I., Heavy Tail Modeling and Teletraffic Data. Preprint, School of ORIE, Cornell University, Ithaka, NY, 1995.
48. Embrechts P., Kliippelberg C. and Mikosch T. Modeling Extremal Events for Insurance and Finance. Springer, Berlin-New York, 1997.
49. Петров В. В., Суммы Независимых Случайных Величин. Москва, «Наука», 1972, 414 стр.
50. Селиванова Д. О., Оценки Скорости Сходимости в Предельных Теоремах для Случайных Сумм. Дисс. канд. физ.- мат. наук, МГУ, Москва, 1994, 123 стр.
51. Teicher Н., Identifiability of mixtures. Ann. Math. Stat., 1961, vol. 32, p. 244−248.
52. Albers, W., Bickel P.J., Van Zwet W.R. Asymptotic expansions for the power of distributionfree tests in the one sample problem. — Annals of Statistics, 1976, v.4, pp. 108 — 156- correction, 1978, v.6, p. 1170 -1171.
53. Molenaar W., Approximations to the Poisson, binomial and hypergeometric distribution functions. Mathematical Centre Report, 1970, Amsterdam.
54. Гаек Я., Шидак 3., Теория Ранговых Критериев. Москва, «Наука», 1971, 375 стр. 57. van Zwet W.R., A Berry Esseen bound for symmetric statistics. -Z. Wahrsch. verw. Gebiete, 1984, v.66, p. 425 — 440.