Применение колмогоровской теории алгоритмической сложности к логическим основам теории вероятностей

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Применение колмогоровской теории алгоритмической сложности к логическим основам теории вероятностей (реферат, курсовая, диплом, контрольная)

Содержание

Используемые обозначения
1. Случайность конечных объектов
2. Некоторые понятия алгоритмической теории случайности
- 2. 1. Вычислимые функции
- 2. 2. Рекурсивно перечислимые полумеры
- 2. 3. Алгоритмическая случайность
3. Прогнозирование конечных последовательностей
- 3. 1. Виды прогнозирования конечных последовательностей
- 3. 2. Предсказательная сложность
- 3. 3. Трудно предсказуемые последовательности
- 3. 4. Доказательство предложения
- 3. 5. Доказательство предложения
4. Вероятностное прогнозирование бесконечных последовательностей
5. Вероятностное прогнозирование конечных последовательностей
- 5. 1. Перечислимые снизу супермартингалы
- 5. 2. Равномерные тесты случайности
- 5. 3. (о-,/3)-нестохастические последовательности
6. Алгоритмический анализ эргодической теоремы Бирк
- 6. 1. Сходимость по вероятности
- 6. 2. Эргодическая теорема для алгоритмически случайных последовательностей
7. Неустойчивость эргодической теоремы при нарушениях случайности
- 7. 1. Лемма о росте супермартингала
- 7. 2. Метод разрезания и складывания
- 7. 3. Теоремы о неустойчивости
8. Алгоритмически-инвариантные свойства последовательностей
- 8. 1. Алгебра инвариантных свойств
- 8. 2. Сети и потоки
- 8. 3. Доказательство теоремы
- 8. 4. Доказательство теоремы
- 8. 5. Доказательство теоремы
- 8. 6. Сводимость атомов

Актуальность темы

Теория вероятностей в классической формулировке А. Н. Колмогорова [18] представляет собой аксиоматическую теорию, являющуюся частью теории меры. Математическая статистика и теория информации используют аппарат теории вероятностей и имеют те же основания. Одновременно с развитием математической теории постоянно обсуждались вопросы применимости теории вероятностей к явлениям реального мира. В настоявшее время в практических приложениях общепринятой является частотная интерпретация вероятности (см. например, учебники [2, 10, 41]). А. Н. Колмогоров, предложивший глубокие уточнения частотной интерпретации в своей знаменитой книге [18], продолжал исследования в области обоснования приложений теории вероятностей. Первая попытка построить теорию алгоритмической случайности для конечньпс последовательностей была предпринята им в работе [60 .

В результате своих исследований А. Н. Колмогоров предложил в начале 60-тых годов программу построения математической теории, обосновывающей приложения теории вероятностей на основе теории алгоритмов [15,16]. Согласно этой программе практические выводы теории вероятностей могут быть обоснованы в качестве следствий гипотез о предельной (при данных ограничениях) сложности изучаемых явлений. При таком подходе основным является понятие алгоритмической сложности конечного объекта.

Идеи А. Н. Колмогорова были частично реализованы его учениками и последователями. В частности, Левиным [24, 27, 26] и Шнорром 77, 78] были определены различные варианты колмогоровской сложности — префиксная и монотонная сложности, сложность разрешения, была развита колмогоровская теория алгоритмической случайности. Отметим также аналогичные публикации Чейтина [47, 48 .

Классическая теория вероятностей не в состоянии даже поставить задачу определения понятия индивидуальной случайной последовательности. Одним из первых достижений колмогоровской теории сложности было математическое определение, на основе теории алгоритмов, понятия индивидуальной случайной (по Мартин-Лёфу) последовательности [68]. Оказалось, что возможны различные варианты алгоритмического определения бесконечной случайной последовательности, приводящие однако, к одному и тому же классу последовательностей [19].

Следует отметить, что сам Колмогоров неоднократно подчеркивал также важность изучения понятия случайности конечных объектов [15, 17]. Он ввел понятие дефекта случайности d{xA) конечного слова X, принадлежащего конечному множеству Л, относительно этого множества и сформулировал в 1973 г. проблему изучения зависимости дефекта случайности от алгоритмической сложности множества А. Формы кривых зависимостей дефекта случайности от сложности множества, А изучаются в диссертации.

Доклад Колмогорова в 1982 г. на семинаре в Московском университете породил исследования алгоритмического понятия (а, ¡-3)-стохастического объекта. Колмогоров также сформулировал задачу изучения асимптотики меры множества нестохастических последовательностей длины п. Оценки доли (равномерной меры) таких последовательностей были получены Шенем [39]. Обобщение этой задачи Колмогорова возможно в рамках вычислительной теории самообучающихся алгоритмов (Computational Learning Theory), в которой рассматриваются произвольные способы оценки потерь при использовании различных предсказательных алгоритмов. В диссертации проводится анализ предельных возможностей различных алгоритмических методов предсказания (прогнозирования) и классификации на основе понятия предсказательной сложности [90, 92].

Независимо, Р.Дж.Соломонов [80] (см. также [79, 81]) пытался построить универсальный метод для предсказания будущих исходов на основе уже известных исходов. При этом такой метод должен использовать как можно более широкие предположения о механизме порождения данных. Общим в обоих подходах явилось использование универсальной машины Тьюринга, что привело Колмогорова к определению понятия алгоритмической сложности конечного слова как длины самого короткого описания этого слова с помощью этой машины. Соломонов использовал универсальную машину Тьюринга для построения своего универсального предсказателя. Позже эта идея Соломонова нашла точное математическое выражение в 1970 г. в виде понятия универсальной или априорной полумеры, введенного Л. А. Левиным [12 .

Совокупность результатов, связанных с исследованием свойств колмогоровской сложности и ее применений к основаниям теории вероятностей и теории информации, объединяется под общим названием — алгоритмическая теория случайности. Ряд обзоров суммируют результаты исследований: Звонкий и Левин (1970) [12], Вьюгин (1981) [97], Колмогоров и Успенский (1987) [19], Ли и Ви-таньи (1988) [28], Успенский, Семенов, Шень (1990) [36], Мучник, Семенов, Успенский (1998) [71], Вьюгин (1999) [108]. Основополагающая монография в этой области опубликована Ли и Витаньи [65].

Последние годы получено много результатов о колмогоровской сложности и определенном на ее основе понятии количества информации между словами. В частности, в [58] изучались линейные неравенства для колмогоровской сложности, в [84] изучалось информационное расстояние между словами, в работах [70, 33] изучалась возможность материализации общей информации.

Более подробно остановимся на результатах, связанных с применением колмогоровских идей алгоритмической случайности к вопросам обоснования теории вероятностей и математической статистики. Значительный прогресс в развитии алгоритмического подхода и его приложений к теории вероятностей был достигнут в работах В. Г. Вовка. В [3] была установлена связь между колмогоровским определением бернуллиевской последовательности и определением бернуллиевости на основе дефекта случайности. В [4, 6] получены чисто алгоритмические доказательства закона больших чисел и закона повторного логарифма для индивидуальных последовательностей случайных относительно бернуллиевских мер. Были также найдены точные условия выполнимости каждого из этих законов на индивидуальных последовательностях. Условие выполнимости задается в виде специфической для данного закона асимптотики дефекта алгоритмической случайности (1(х) начальных фрагментов этой последовательности: для выполнения закона больших чисел на индивидуальной последовательности и1и)2 • • • достаточно потребовать (¿-{л1. .Шп) = о{п), ДЛЯ выполнения закона повторного логарифма достаточно. .CJJn) = o{loglogn).

Вопросы асимптотической эффективности оценок (множества точек сверхэффективности) изучались в [8] с применением алгоритмической случайности. Анализ и построение оптимальных алгоритмов вероятностного прогнозирования проводились в работах 5, 7, 87].

До последнего времени открытой оставалась проблема применимости эргодической теоремы Биркгофа [42] к индивидуальным случайным последовательностям. Вопрос об этом был поставлен в монографии ван Ламбальгена [62]. Вопросы алгоритмического анализа различных аспектов эргодической теоремы является предметом изучения в диссертации. Часть результатов диссертации связана с исследованием применимости эргодической теоремы к индивидуальным последовательности с малыми отклонениями случайности. Заметим, что данные результаты могут быть переформулированы и в рамках традиционной эргодической теории (см. например, 109]). Однако постановки этих результатов и их мотивировка выглядят более естественными на языке алгоритмической теории случайности.

Следует отметить работы представителей классической статистической школы, которые также в 1980;ых годах развивали частотный подход на основе теории алгоритмов. Дейвид [53, 54, 55 рассматривал задачу вероятностного прогнозирования индивидуальных последовательностей, он ввел понятие калибруемости про-гнозируюп]-ей стратегии на бесконечной последовательности исходов, что соответствует некоторому варианту частотного определения случайности относительно произвольного вычислимого распределения вероятностей. Проблема существования последовательностей, на которых не калибруема никакая вычислимая прогнозирующая стратегия, т. е. последовательностей, не допускающих вычислимого вероятностного прогнозирования, была поставлена Дейвидом 54] в 1985 г. и послужила предметом дискуссии в Королевском статистическом обществе [73]. Вопрос о существовании механизмов, генерирующих такие последовательности изучается в диссертации.

В конце 1990;ьос годов обнаружилась тесная связь между понятиями алгоритмической теории случайности и сформировавшейся в 1980;ых годах теорией самообучающихся алгоритмов В этой области строятся алгоритмы предсказания и классификации, минимизирующие заданные функции потерь [51, 59, 66, 86, 94, 83]. Как выяснилось, сложности колмогоровского типа можно интерпретировать как универсальные способы оценки минимально возможных потерь при предсказании [90, 92].

Идеи алгоритмической теории случайности также послужили основой для теоретико-игрового или чисто мартингального подхода к теории вероятностей и финансовой математике, развиваемого Вовком, Дейвидом и Шейфером [56, 74].

Проблема изучения классов стохастических и нестохастических последовательностей может быть рассмотрена в информационном аспекте. В диссертации рассматриваются вопросы классификации бесконечных последовательностей нулей и единиц, как носителей информации. Л. А. Левин [27, 64] заметил, что множество всех алгоритмически случайных последовательностей (относительно различных вычислимых мер) может быть разделено только на два нетривиальных алгоритмически инвариантных подмножества положительной априорной меры. Первое из них порождается всеми невычислимыми случайными последовательностями, второе — это все вычислимые последовательности. Таким образом, единственной инварианти и м и и II ной характеристикой случайной информации является ее количество, конечное или бесконечное. Л. А. Левин [27] поставил вопрос о том можно ли алгоритмической трансформацией случайных последовательностей получить последовательности, обладающие другими нетривиальными алгоритмически инвариантными свойствами. Существование и свойства таких последовательностей являются предметом изучения в диссертации.

В диссертации получены следующие основные результаты:

1) Решена проблема А. Н. Колмогорова об описании кривых зависимости дефекта алгоритмической случайности конечной последовательности от сложности объемлющего множества.

2) Получены верхние и нижние оценки меры множества всех алгоритмически (а, /?)-нестохастических объектов. Задача получения таких оценок была поставлена А. Н. Колмогоровым.

3) Построен вероятностный алгоритм для порождения бесконечных последовательностей, для которых невозможно корректное вероятностное прогнозирование.

4) Проведен алгоритмический анализ степени конструктивности эргодической теоремы Биркгофа. Показано, что сходимость по вероятности и сходимость в среднем (квазиэргодическая теорема Дж. фон Неймана) в этой теореме не являются алгоритмически эффективными. Получен вариант этой теоремы для индивидуальных случайных последовательностей (ответ на вопрос ван Ламбальге-на).

5) Доказана неустойчивость основного утверждения эргодиче-ской теоремы при наличии в исходных данных отклонений от алгоритмических условий случайности. Доказано, что утверждение эр-годической теоремы для индивидуальной последовательности становится неверным, если допустить даже малый рост дефекта алгоритмической случайности конечных фрагментов последовательности.

6) Известно, что вычислимые меры сконцентрированы на последовательностях, которые не различимы по своим алгоритмически инвариантным свойствам, за исключением свойства содержать бесконечное или конечное количество информации. В диссертации доказывается, что с помощью вероятностных алгоритмов можно производить последовательности, находящиеся за пределами концентрации всех вычислимых мерэти последовательности, в отличие от случайных, обладают бесконечным разнообразием алгоритмически инвариантных свойств. Проведена классификация подобных свойств.

Содержание работы. В главе 1 решается проблема А. Н. Колмогорова об описании кривых зависимости дефекта случайности элемента конечного множества слов в зависимости от алгоритмической сложности этого множества.

Конечные объекты естественным образом отождествляются со своими конструктивными представлениями. Поэтому в дальнейшем мы будем говорить о конструктивных объектах. Конструктивные объекты естественно объединяются в так называемые ансамбли [35]. Типичные примеры таких ансамблей: все слова в конечном алфавите, все конечные множества слов (в заданном алфавите) т.д. В дальнейшем мы будем предполагать, что для каждого такого ансамбля установлено эффективное взаимно-однозначное соответствие между его элементами и конечными двоичными последовательностями.

Пусть В{р, у) — произвольная вычислимая функция от двух аргументов, где р — конечная двоичная последовательность, у — произвольный конструктивный объект. Мера сложности (относительно В) конструктивного объекта х при известном конструктивном объекте у определяется так:

Кв (ху) = тш{1{р) I В{р, у) = х}, где 1(р) — длина двоичного слова р (полагаем штО = со). Важную роль играет выбор функции 5(р, у) — способа декодирования конструктивных объектов, при этом р трактуется как код объекта х при условии у. В основе определения Колмогорова лежит утверждение о том, что среди способов декодирования существует оптимальный. Колмогоров называет оптимальным такой способ декодирования В (р, у), что для любого другого способа декодирования В'{р, у) существует такая константа с, что Кв (ху) < Кв{ху) + с имеет место для всех х л у. Любые два оптимальных способа декодирования определяют меры сложности, отличающиеся на константу. Один из таких оптимальных способов декодирования фиксируется, соответствующая мера сложности обозначается К (ху) и называется (условной) колмогоровской сложностью X относительно у. Безусловная сложность конструктивного объекта х определяется как К (х) •= К (хК), где Л — пустая последовательность.

Конструктивное задание конечного множества, А определяет некоторый порядок перечисления всех его элементов. Поэтому для задания произвольного элемента х Е А, при известном А, достаточно знать порядковый номер х при этом перечислении. Следовательно, выполнено.

К{хА) < log (#A) + с для некоторой константы с (здесь #Л — число элементов множества Ав дальнейшем все логарифмы будут по основанию 2). Более того, для произвольного с > о число всех х Е А, для которых.

К{хА) < log (#A) — с, не превосходит 2~''+А (#Л), т. е. большинство элементов множества, А имеют условную колмогоровскую сложность, близкую к максимальной. А. Н. Колмогоров [17] называет элемент х конечного множества конструктивных объектов, А случайным, если К (хА) А log (#A). Для точного определения он рассматривает разность.

ФИ) = log (#A) — К (хА), которая называется дефектом случайности х относительно множества А. Пусть, а и Р — произвольные натуральные числа. Согласно Колмогорову элемент х некоторого ансамбля конструктивных объектов называется (а, /?)-стохастическим, если существует конечное множество D элементов этого ансамбля такое, что х Е D, K (D) < а и d (xD) < /5.