Актуальность работы.
Одним из важнейших разделов теории игр является теория дифференциальных игр, которая возникла в пятидесятые годы XX века. До середины шестидесятых годов исследовались антагонистические дифференциальные игры, которые рассматривали конфликт между двумя сторонами, имеющими противоположные игнтересы. Но они были применимы лишь в ограниченном классе задач, например, в задачах, возникающих при военном столкновении сторон.
В конце шестидесятых годов стали появляться работы по теории неантагонистических дифференциальных игр, которые применялись при моделировании социально-экономических процессов. Рассматиривались некооперативные дифференциальные игры, где в качестве принципа оптимальности использовалось равновесие по Нэшу. Со временем стала развиваться теория кооперативных дифференциальных игр. В различное время в развитие теории дифференциальных игр свой вклад внесли Р. Айзеке^ H.H. Красовский, JI.A. Петросян, а также H.H. Данилов, Дж. Заккур, В. В. Захаров, H.A. Зенкевич, В. И. Жуковский, С. Йоргенсен, А. Ф. Клейменов, А. Ф. Кононенко, A.B. Кряжимский, Д. В. Кузютин, В. Н. Лагунов, Ю. С. Осипов, JI.C. Понтря-гин, В. В. Розен, Дж. А. Филлар, C.B. Чистяков, Д.В. К. Янг, Е. Б. Яновская и др.
В теории кооперативных дифференциальных игр появляется важное требование — требование динамической устойчивости (временной состоятельности или состоятельности во времени) выбранного в игре принципа оптимальности, в соответствии с которым находится решение игры. Динамическая устойчивость означет, что в процессе реализации решения принцип оптимальности, который был выбран. в начале игры, должен оставаться состоятельным в течение всей игры. То есть при развитии игры вдоль первоначально выбранной оптимальной кооперативной траектории игроки должны следовать одному итому же принципу оптимальности в каждый момент времени.
Необходимо отметить, что почти всегда первоначально выбранное решение в ходе его реализации теряет свою оптимальность. Чтобы этого избежать необходимо специальным образом производить регуляризацию принципа оптимальности. Динамическая устойчивость подробно исследовалась в работе Л. А. Петросяна [11]. Также проблеме динамической устойчивости посвящены работы [4], [15], [16] и др. Л. А. Петросян в [34] предложил производить регуляризацию принципа оптимальности перераспределением выигрыша в соответствии с «процедурой распределения делрка» .
Динамическая устойчивость является не единственным условием устойчивости кооперации на всем отрезке ее реализации. Еще одним важным свойством кооперации является «устойчивость против иррационального поведения игроков». Нет гарантии, что на всем промежутке реализации кооперативного соглашения игроки, входящие в кооперацию будут вести себя «рационально». В процессе игры может возникнуть ситуация, когда какой-либо игрок (или группа игроков) решат расторгнуть первоначально принятое кооперативное соглашение. Начиная с этого момента игроки начнут действовать каждый в своих интересах. Тогда участники должны быть уверены, что в этом случае их затраты будут не выше, чем в случае изначального отсутствия кооперации. Условие, при котором игроки гарантируют себя при этом наихудшем сценарии (аннулирование кооперативного соглашения в процессе игры) затраты не выше, чем те, что они получи ли бы, если бы с самомго начала игры не объединялись в максимальную коалицию, называется «условием устойчивости против иррационального поведения игроков». Это условие было предложено Д.В. К. Янгом в [43] для дифференциальной кооперативной игры с конечной продолжительностью.
Условие устойчивости против иррационального поведения игроков выполняется редко. В работе рассматривается условие устойчивости против иррационального поведения игроков для случая кооперативной дифференциальной игры с бесконечной продолжительностью. Предлагается на кооперативном участке игры использовать динамически устойчивую процедуру распределения дележа. Предложено условие против иррационального поведения игроков для коалиций. В соответствии с этим условием, рассматривается ситуация, когда перед началом игры принимается кооперативное соглашение, выбирается принцип оптимальности. В процессе игры иррациональные дествия игрока (игроков) ведут к распаду кооперации, после чего остается некоторая коалиция Все остальные игроки начинают действовать в своих интересах, выбирая стратегии, равновесные по Нэшу. Условие устойчивости против иррационального поведения игроков для коалиций заключается в том, что в случае распада кооперации в процессе игры оставшаяся коалиция гарантирует себе, что ее затраты будут не выше, чем затраты, которые эта коалиция «понесла» бы, если бы изначально не создавалась кооперация, а существовала бы только эта коалиция Бь, а все остальные игроки придерживались бы стратегий, равновесных по Нэшу., ,.
В частном случае исследуется модель экологического регулирования — модель сокращения вредных выбросов в атмосферу. В последнее время экологический проблемы привлекают внимание не только политиков и ученых, но и все общество, в целом. Происходит это потому, что само общество непосредственно участвует в развитии глобальных экологических проблем.
Полностью избежать последствий глобальных экологических проблем невозможно, но возможно уменьшить их последствия. В связи с этим принимаются различные межгосударственные соглашения по защите окружающей среды. В последнее время все больший интерес вызывают теоретико-игровые методы решения вопросов, связанных с многосторонними межгосударственными соглашениями. Одной из теоретико-игровых моделей, в которой рассматриваются такие межгосударственные соглашения, является модель сокращения вредных выбросов в атмосферу, предложенная Л. А. Петросяном и.
Г. Заккуром в [39].
В работе рассматривается несколько вариаций игры сокращения вредных выбросов в атмосферу: с симметричными затратами, с несимметричными затратами и дифференциальная игра на сети. Для каждого случая исследуются различные принципы оптимальности. Исследуется вопрос динамической устойчивости решений. Также доказывается условие устойчивости против иррационального поведения игроков при условии, что на кооперативном участке игры для распределения кооперативных затрат используется динамически устойчивая процедура распределения дележа.
Основной целью работы являлось изучение условия устойчивости против иррационального поведения игроков в случае, если при кооперации используется динамически устойчивая процедура распределения дележа (или выигрыша, если рассматриваются игры с нетрансферабельными выирыша-ми). В диссертации рассматривалась задача сокращения вредных выбросов в атмосферу и проверялось условие устойчивости против иррационального поведения игроков для различных случаев игры, а также для различных к принципов оптимальности.
Научная новизна работы заключается в том, что в ней:
• предложено условие устойчивости против иррационального поведения игроков, в котором используется динамически устойчивая процедура распределения дележа;
• исследовано условие устойчивости против иррационального поведения игроков для кооперативных дифференциальных игр с нетрансферабельными выигрышами в случае, если используется динамически устойчивая процедура распределения выигрыша;
• определена и впервые исследована дифференциальная игра сокращения вредных выбросов в атмосферу на сети.
Практическая ценность. Результаты, полученные в диссертации, представляют теоретический и практический интерес. Для описания и исследования экономических систем и процессов, а также процессов, происходящих в экологии, менеджменте и других сферах человеческой жизни, все чаще используются математические теоретико-игровые модели. Особый интерес представляют кооперативные дифференциальные игры и динамическая устойчивость их решений (то есть оптимальность в процессе всей игры решения, которое было выбрано в начале игры). Также важное практическое значение имеет условие, гарантирующее игрокам, объединенным в максимальную коалицию, защиту от иррационального поведения какого-либо игрока (или группы игроков), входящего в максимальную коалицию.
Положения, выносимые на защиту:
1. Математически формализовано условие устойчивости против иррационального поведения игроков, в котором при кооперации используется динамически устойчивая процедура распределения дележа. Доказана теорема о выполнении условия устойчивости против иррационального поведения игроков для игры сокращения вредных выбросов в атмосферу, в случае симметричных затрат, если была использована динамически устойчивая процедура распределения дележа. В качестве принципа оптимальности рассмотрен Вектор Шепли. Выполнение аналогичного условия доказано в коалиционнай игре, где принципом оптимальности является РМЗ-вектор.
2. Математически формализовано условие устойчивости против иррационального поведения игроков для коалиций. Доказана теорема о том, что это условие выполнено для игры сокращения вредных выбросов в атмосферу, когда в качестве принципа оптимальности выбран динамически устойчивый вектор Шепли.
3. Для случая несимметричных затрат доказана теорема о выполнении условия устойчивости против иррационального поведения игроков в игре сокращения вредных выбросов в атмосферу, если была использована динамически устойчивая процедура распределения дележа. В качестве принципа оптимальности рассмотрен ES-вектор. Для случая коалиционной игры доказано аналогичное условие, где, в качестве принципа оптимальности, рассматривается PMS-вектор.
4. Доказана теорема о том, что условие устойчивости против иррационального поведения игроков для игры с нетрансферабельными выгрышами выполняется для любого Парето-оптимального решения, если используется динамически устойчивая процедура распределения выигрыша.
5. Определена дифференциальная игра сокращения вредных выбросов в атмосферу на сети. Найдено равновесие по Нэшу, минимальные издержки максимальной коалиции, а также ES-вектор. Получена динамически устойчивая процедура распределения ES-вектора. Получено ограничение на структуру сети, гарантирующее выполнение условия устойчивости против иррационального поведения игроков в дифференциальной игре сокращения вредных выбросов в атмосферу на сети, если используется динамически устойчивая процедура распределения ES-вектора.
Апробация работы. Основные результаты, составляющие содержание v > работы, были представлены на III, V и VI Международных конференциях «Теория игр и менеджмент» GTM'09, GTM’ll и GTM'12 (Санкт-Петербург, 2009, 2011, 2012 гг.) — на I Международной конференции «Chinese Game Theory and Experimental Economies Association» (Пекин, Китай, 2010) — на VIII Международном симпозиуме «International Society of Dynamic Games» ISDG (Па-дова, Италия, 2011) — на Международной научной конференции «Математика, экономика, менеджмент: 100 лет со дня рождения JI.B. Канторовича» (Санкт-Петербург, 2012) — на Междунаровной конференции «Constructive Nonsmooth Analysis and Related Topics» CNSA-2012 (Санкт-Петербург, 2012). Кроме того, результаты докладывались на семинарах кафедры математической теории игрна Международном семинаре «Scientific Publications. Qualitative Research Methods in Operations» (Санкт-Петербург, 2010 г.) — на Всероссийской конференции «Устойчивость и процессы управления» (Санкт-Петербург, 2010 г.) — на ХЫ и ХЫ1 научных конференциях аспирантов и студентов «Процессы управления и устойчивость» (Санкт-Петербург, 2010 и 2011 гг.).
По материалам диссертации опубликованы работы [2], [6], [7], [8], [19], [28], [47].
Объем и структура диссертации. Диссертация состоит из введения, пяти глав, разбитых на параграфы, заключения и списка используемой литературы.
ЗАКЛЮЧЕНИЕ
.
В работе исследуется динамическая устойчивость различных кооперативных соглашений, а также устойчивость против иррационального поведения игроков. Основные кооперативные принципы оптимальности не обладают свойством динамической устойчивости (временной состоятельности). В качестве метода регуляризации была рассмотрена процедура распределения дележа (ПРД) для игр с трансферабельными выигрышами и процедура распределения выигрыша (ПРВ) для игр с нетрансферабельными выигрышами (затратами). Строится управления в виде функции специальных выплат, реализуемого на оптимальной траектории, на основе применения ПРД (либо ПРВ). Таким образом достигается динамическая устойчивость решения.
Исследуется вопрос устойчивости кооперации против иррационального поведения игроков для игры с бесконечной продолжительностью. Рассма-тивается ситуация, когда в процессе реализации кооперативного решения, в какой-то промежуточный момент времени игрок (или группа игроков) отказываются от кооперативного соглашения. Устойчивость против иррационального поведения игроков заключается в том, что даже в этом случае игроки «понесут» издержки меньшие, чем они «понесли» бы, если изначально кооперация не создавалась бы. Доказано, что при использовании динамически устойчивой ПРВ в игре с нетрансферабельными выигрышами для любого Парето-оптимального решения условие устойчивости против иррационального поведения игроков будет выполнено.
Исследовано достаточное условие выполнения условия устойчивости против иррационального поведения игроков.
Также было введено понятие условия устойчивости против иррационального поведения игроков для коалиций. В начале игры принимается кооперативное соглашение. Игроки распределяют затраты в соответствии с динамически устойчивой процедурой распределения дележа. Рассматривается ситуация, когда в процессе игры кооперация распадается, но остается коалиция При этом все остальные игроки, которые не входят в эту коалицию действуют в соответствии со стратегиями, равновесными по Нэшу. В этом случае коалиция гарантиреют себе затраты ниже, чем, если бы изначально кооперация не создавалась, а существовала бы только коалиция Бк.
В частном случае исследована модель сокращения вредных выбросов в атмосферу. Рассмотрено три игры: игра с симметричными выигрышами, игра с несимметричными выигрышами, сетевая игра.
В первой игре в качестве принципов оптимальности рассмотрены вектор Шепли и РМЯ-вектор для коалиционной игры. Была построена динамически устойчивая ПРД для обоих случаев. Доказано, что условие устойчивости против иррационального поведения игроков выполнено для вектора Шепли и для РМЯ-вектора в задаче сокращения вредных выбросов в атмосферу в том случае, если используется динамически устойчивая ПРД.
Во второй игре в качестве принципов оптимальности выбраны ЕЯ-вектор и РМЯ-вектор для коалиционного варианта игры. Также, как и в первом случае, построена динамически устойчивая ПРД и проверено выполнение условия устойчивости против иррационального поведения игроков для этой ПРД.
В третьей игре рассмотрены два случая: «Круговая сеть» и «Произвольная сеть». Построен ЕЯ-вектор, динамически устойчивая процедура распределения ЕЯ-вектора. Для первого случая доказано выполнение условия устойчивости против иррационального поведения игроков при использовании динамически устойчивой процедуры распределения ЕЯ-вектора. Для второго случая доказано, что при некоторых ограничениях на сеть, условие устойчивости против иррационального поведения игроков выполняется, если используется динамически устойчивая процедура распределения ЕЯ-вектора.