Помощь в написании студенческих работ
Антистрессовый сервис

Принцип максимума для задач импульсного управления с ограничениями смешанного типа и численные методы поиска экстремалей

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Одно из направлений развития глобальных вычислительных методов связано с принципом динамического программирования Беллма-на и исследованием уравнения Гамильтона-Якоби. Большая серия вычислительных методов опирается на достаточные условия оптимальности В. Ф. Кротова и принцип расширения, сформулированный в работах В. И. Гурмана. На основе принципа расширения развита серия методов слабого… Читать ещё >

Принцип максимума для задач импульсного управления с ограничениями смешанного типа и численные методы поиска экстремалей (реферат, курсовая, диплом, контрольная)

Содержание

  • 1. Импульсное управление при фазовых и смешанных ограничениях на меру и траекторию
    • 1. 1. Импульсная гибридная система (ИГС). Постановка задачи оптимального управления
      • 1. 1. 1. Формальная модель
      • 1. 1. 2. Понятие решения дифференциального уравнения с мерами. Пополнение графика разрывной траектории
      • 1. 1. 3. Задача оптимального управления ИГС
    • 1. 2. Преобразование задачи
    • 1. 3. Необходимые условия оптимальности
      • 1. 3. 1. Формулировка результата
      • 1. 3. 2. Доказательство необходимых условий оптимальности
      • 1. 3. 3. Обсуждение
  • 2. Вычислительные методы оптимального импульсного управления
    • 2. 1. Улучшение дискретно-непрерывных процессов
      • 2. 1. 1. Задача оптимального управления ДНС
      • 2. 1. 2. Вспомогательные результаты
      • 2. 1. 3. Общая процедура улучшения дискретно-непрерывных процессов
    • 2. 2. Численные методы решения задач оптимального управления нелинейными дифференциальными уравнениями с мерами
  • 3. Численный анализ модельных и прикладных задач
    • 3. 1. Решение тестовых примеров
      • 3. 1. 1. Базовый алгоритм улучшения
      • 3. 1. 2. Вычислительный эксперимент
      • 3. 1. 3. Замечания
    • 3. 2. Прикладные задачи
      • 3. 2. 1. Оптимальное импульсное управление популяцией паразитических организмов
      • 3. 2. 2. Телескопический манипулятор с блокируемой степенью свободы
      • 3. 2. 3. Двузвенный манипулятор с блокируемой степенью свободы

Диссертационная работа посвящена исследованию задач оптимального управления импульсными гибридными системами. Этот класс моделей описывается дифференциальными уравнениями с мерами при ограничениях смешанного типа, связывающих фазовую траекторию и управляющую меру.

Данное исследование инспирировано, в первую очередь, работами [68−74, 123, 170−172] и ориентировано на решение следующих вопросов: разработку методов эквивалентных преобразований задач импульсного управления с ограничениями новых типов, вывод необходимых условий оптимальности и построение вычислительных процедур поиска оптимального импульсного управления. В методологическом плане основной упор сделан на систематическое использование сингулярных пространственно-временных преобразований.

Актуальность темы

работы и обзор имеющихся результатов.

Задачи импульсного управления.

Объектом исследования теории оптимального импульсного управления выступают задачи оптимизации с разрывными траекториями и управлениями типа мер или — более широко — типа обобщенных функций (распределений). Исторически, задачи импульсного управления возникают при расширении некоторых классов вырожденных стандартных задач, решение которых не достигается в исходном множестве допустимых управлений (в первую очередь речь идет о системах с линейной зависимостью от неограниченного управления). Под расширением понимается взятие подходящего замыкания множества допустимых процессов исходной модели. При этом руководствуются желанием обеспечить существование оптимального решения в расширенной постановке.

Внимание к данной тематике было во многом обусловлено потребностями моделирования реальных объектов, управление которыми производится на протяжении пренебрежимо малых промежутков времени, таких что протекающие в них процессы можно идеализировать как мгновенные, а результаты управляющих воздействий выражаются в скачкообразных изменениях фазовой траектории. На практике импульсные системы возникают в различных высокотехнологичных отраслях, таких как ракетодинамика, лазерная технология, телекоммуникация, энергетика, робототехника, квантовая электроника, а также в экономике, экологии, при исследовании демографических и эпидемических процессов [39,43,52,62,107,185,193].

Основы теории импульсного управления были заложены в работах H.H. Красовского, С. Т. Завалищина, A.B. Куржанского, В. Ф. Кротова, В. И. Гурмана, Р. Ришела, Дж. Варги. Дальнейшее развитие этой теории связано с именами российских и зарубежных ученых A.B. Арутюнова, А. Брессана, Р. Винтера, В. А. Дыхты, Б. М. Миллера, М. Мотта, Ф.Л. Пе-рейра, Ф. Рампаццо, А. Н. Сесекина, Ж. Н. Силва, Т. Ф. Филипповой, А. Г. Ченцова и др.

Наибольшую сложность и практический интерес представляют задачи импульсного управления с траекториями ограниченной вариации и управлениями типа векторной меры. Разные классы таких задач при фазовых ограничениях и некоторых типах смешанных ограничений изучались в работах Б. М. Миллера и Е. Я. Рубиновича, A.B. Арутюнова, Д. Ю. Карамзина и Ф. Л. Перейра, В. А. Дыхты и О. Н. Самсонюк и др. Важной спецификой подобных моделей является неоднозначная интерпретация условий фазового и смешанного типа, что порождает различные возможные постановки задач, типы локального оптимума и условия оптимальности.

Преобразование задач импульсного управления.

В оптимизации импульсных систем широко распространен следующий подход: задача с импульсами преобразуется к некоторой задаче с ограниченными управлениями, для исследования которой применяются уже известные регулярные методы. Последние могут быть впоследствии подвергнуты расшифровке с тем, чтобы можно было дать интерпретацию полученных результатов в терминах задачи импульсного управления. На сегодняшний день уже имеется ряд эффективных методов эквивалентного преобразования задач импульсного управления к задачам с ограниченными управлениями (и конструктивных методов расширения, если решение не достигается в исходном классе допустимых), в том числе,.

• метод преобразования Гурмана к производной задаче, предложенный В. И. Гурманом для вырожденных задач оптимального управления [30,31,34]. Для применения этого метода в задаче импульсного управления достаточно, чтобы векторные поля при неограниченном линейно входящем управлении были линейно независимы и обладали свойством инволютивности ;

• нелинейный вариант преобразования Гоха [145,146], близкий по замыслу к методу В. И. Гурмана, но отличающийся большей симметрией. Разработка этого преобразования в задачах импульсного управления принадлежит В. А. Дыхте [36,37,39,40]. Для применения нелинейного преобразования Гоха достаточно, чтобы в импульсной системе были выполнены условия полной интегрируемости Фробениуса (векторные поля при неограниченных управлениях коммутируют);

• метод разрывной замены времени — в различных его вариация — является эффективным инструментом преобразования в задачах с траекториями из BV. В основе метода разрывной замены времени лежит известная теорема Лебега о замене переменной под знаком интеграла Стилтьеса [74]. Этот подход берет свое начало, вероятно, в работах Р. Ришела [182] и Дж. Варги [195]. В принятой нами форме метод замены времени был впервые предложен Б. М. Миллером сначала для задач со скалярным импульсным управлением [68] и затем — для векторного случая [69]. Последующие обобщения метода были получены в работах А. Н. Сесекина [89−92]. Та же идея, что и в подходе Б. М. Миллера, облеченная в несколько иную форму, лежит в основе техники, которая применялась в работах А. Брессана и Ф. Рампаццо [125,127], а также Ф. Рампаццо и М. Мотта [173−175]. Для гибридных систем с односторонними ограничениями специальное сингулярное преобразование предложено Б. М. Миллером и Дж. Бентсманом как развитие метода пенализации [123,171,172]. В работах Р. Винтера, Ф. Л. Перейра и Ж. Силва [176−178,180,186,188] техника разрывной замены времени была распространена на задачи, в которых динамика описывается нелинейным дифференциальным включением с мерами.

Метод замены времени успешно применялся при решении широкого круга задач, примыкающих к теории импульсного управления. Преобразования этого типа использовались при обосновании различных подходов к определению понятия решения дифференциальных уравнений с мерами, а также в качестве конструктивного приема расширения в моделях, описываемых уравнениями в распределениях (Дж. Дал Мазо, А. Брес-сан, Ф. Рампаццо, М. Мотта [128,138,173−175], С. Т. Завалищин, А.Н. Се-секин [43,92], Т. Ф. Филиппова [141−143,179], Р. Винтер, Ф. Л. Перейра и Ж. Силва [176,186] и др.).

Рассмотрим задачу оптимального управления дифференциальным уравнением с мерами:

I = F (x (T)) min, dx = f{t, x, u)dt + G (t, x) dv, x (0-)=x°, (0.1) u (t) ei/, [ dv < M,.

J о в предположении, что матрица G удовлетворяет условию корректности типа Фробениуса: г г.

G?(t:r), G^(i, x)] :=— G?(t, x) Gj{t, x)-— ж) = 0.

CJ Jb J Jo.

Здесь i, j — 1, m, Gk означает к-й столбец матрицы G, [•, •] — скобка Ли. Метод разрывной замены времени.

В основе метода [74] лежит специальное сингулярное пространственно-временное преобразование, при котором время в исходной модели становится новой фазовой переменной. Преобразование времени состоит в растяжении моментов приложения импульса в интервалы конечной длины, пропорциональной интенсивности соответствующего импульсного воздействия, и в «раскрытии» соответствующих сингулярностей. Это позволяет уложить в единую временную шкалу «быстрые движения» и процессы, протекающие в естественном масштабе времени. Соответствующая (0.1) редуцированная задача [74] определена на нефиксированном отрезке времени [0, S], Т < S < Т + М, и имеет вид.

J = F (y (S)) ^ min, у = а/К, у, v) + (1 — a) G (?, у) е, у (0) — х°,? = а, ?(0) = 0, (0.2) = Г, v (s) Е U, a (s) е [0,1], e (s) е В, s G [0, S}.

Здесь управления о-(-) = (г>(-), а (-), е (-)) — ограниченные измеримые по Борелю функции, траектории z (-) = (?(•), у (-)) G Ж7([0, ?], Rn+1), В — единичный шар в Ш. т с нормой | • | = || • ||i и центром в нуле.

Любому допустимому процессу (z (-), u (-), S) задачи (0.1) соответствует допустимый процесс задачи (0.2). Прямое преобразование осуществляется следующим образом. Определим на [0, Т] функцию Г (-):

T (t) = t+ fdv{?), *е[0,Т]. J о.

Поскольку функция Г (-) монотонно возрастает, существует обратная к ней? = Г-1. Функция ?(•) абсолютно непрерывна и не убывает на отрезке [0,Г (Т)]. Положим S = Г (Т). Определим управление v (-) как суперпозицию tt (?(-)), а в качестве управлений а{-) и е (-) возьмем борелевские функции, такие что a (s) = ?(s) и e (s) = l (?(s)) почти всюду по мере.

Лебега С на [0,51. Здесь lit) = f^fl, — производная Радона-Никодима dv{t) меры du по мере полной вариации. Управление cj (-) = (г>(-), а (-), е (-)) удовлетворяет всем ограничениям в задаче (0.2). Решая задачу Коши, мы найдем допустимую траекторию z (-) = (?(•)>?/(¦))• Тем самым будет определен допустимый процесс в преобразованной задаче.

Наоборот, если процесс (z (-), uj (-), S) является допустимым в задаче (0.2), то набор (x (-), u (-), dv), определенный соотношениями гт x (t) = y (T (t)), u (t) = v (T (t)), v (t) = (1 — a{s))e (s)ds,.

J о.

T (t) = inf{s G [0, S]: ?(s)>t}, оказывается допустимым процессом задачи импульсного управления (0.1).

Утверждение 0.0.1 ([74]) Пусть функция ?(•) абсолютно непрерывна на [0, S] и удовлетворяет условиям o<4w.

Тогда функция Г (-) — определяемая условиями.

T (t) = inf{s: f (s) > t} при t e [0, T), T (t) = S при t>T, есть неубывающая, непрерывная справа функция, и выполняются соотношения:.

Г (г)) = t при всех t е [0, Т), r (?(s)) = s, если t — ?(s) есть точка непрерывности Г (-). Отображение Г (-) задает обратное преобразование времени..

Нелинейное преобразование Гоха.

Нелинейное преобразование Гоха [37] упрощает вид сингулярностей в исходной задаче. Оно задается формулами dv{t)[ где rj (t, х, v) — ((t, х, — а C (t, х, v) есть решение допредельной системы.

CUo = у..

Глобальная разрешимость допредельной системы обеспечивается предположением корректности. Результатом применения преобразования Гоха в задаче (0.1) является следующая задача оптимального управления [39].

F (y{T)) min, у = g (t, y, u, v), u (t)eU С-п.в., du = ld/i, l (t)? В d/jL-п.в., d? > 0, (0.3) ге[о, т], 2/(0) = Ж0, 1/(0-) = о,.

T) < м, где g (t, у, и, I) = {rjt (t, х, I) + rjx (t, х, l) f (t, ж, u)} x=w, y, i), а ф и /(•) — новые управления. Здесь d/i — мера, порожденная полной вариацией функции z/(-) (а значит, скалярная и неотрицательная). Исходная траектория х (-) восстанавливается по у (-) при помощи суперпозиции x (t)=((t, y (t), v (t)), te[0,T}..

Комбинация замены времени с нелинейным преобразованием Гоха.

В задачах, где выполнено условие полной интегрируемости типа Фробе-ниуса, метод разрывной замены времени можно применять в комбинации с модифицированным преобразованием Гоха. Замена времени в задаче (0.3) приводит к еще одному варианту редуцированной задачи с ограниченными управлениями и абсолютно непрерывными траекториями: F (y (S)) min, = у = осд (£, у, v, w), w = (1 — ot) e, «0) = 0, y (0)=s°, w (0) = 0, w (S) < M, as) = T, v (s)Gi/, a (s)G[0,l], e (s) G B, s G [0,5], T < S..

Соответствия между процессами задач (0.3) и (0.4) легко устанавливаются по аналогии с тем, как это делается для задач (0.1) и (0.2)..

Продолжение редуцированной задачи на фиксированный отрезок времени.

Как отмечено выше, преобразование времени (как и его комбинация с преобразованием Гоха) приводят к стандартным задачам оптимального управления, которые, однако, рассматриваются на нефиксированных интервалах времени. Обратимся к постановке (0.2). Заметим, что множество скоростей редуцированной системы в (0.2) содержит нуль. Поэтому всякий процесс задачи (0.2) можно продолжить [74] на максимальный отрезок времени [0, 5], S = Т + М, полагая a (s) = 0 и e (s) = 0 ?-п.в. на (S, S] с сохранением свойства быть измеримыми по Борелю функциями. Данный способ продолжения сохраняет информацию о реальном эффективном расходе ресурса импульсного управления. Такое доопределение процесса можно интерпретировать как выработку остаточного ресурса «на холостом ходу» системы. Таким образом, (0.2) может быть сведена к задаче на фиксированном отрезке времени [0, ?>].

J = F{y (S)) min, у = af (z, v) + (la)G (z)e, y (0) = x°,? = ?(0) = 0, aS) = T, (°'5) u{s)eU, sg[0,5]..

Здесь *(.) = (?(¦), 2/(0), w (-) = («(•),» (•), e (-)), и U = U x [0,1] x B..

Оптимальная продолжительность времени в задаче (0.2) определяется величиной [ (l-a*(s))e*(s)ds, где ?**(•), е*(-) — компоненты оптимального управления оо*{-) в продолженной задаче (0.5). Для того чтобы восстановить оптимальное управление в (0.2), следует переопределить управления из (0.5) сдвигом влево по интервалам времени, где одновременно a*(s) = 0 и e*(s) = 0 ?-п.в..

Продолжение процессов задачи (0.4) осуществляется аналогично..

Необходимые условия оптимальности импульсных процессов.

Необходимые и достаточные условия оптимальности в теории импульсного управления были получены как для задач без ограничений на распределения (когда траектории являются функциями класса LqqU так и при наличии таковых (с траекториями ограниченной вариации). Наиболее сильные необходимые условия первого порядка для импульсных и особых режимов в случае Ь^- траекторного расширения принадлежат В.А. Дых-те и носят название вариационного принципа максимума [36,37,39,40]. Квадратичные необходимые условия оптимальности получены в работах В. А. Дыхты и И. А. Никифоровой [36,78]. Вариационный принцип максимума высокого порядка и его обобщение на нелинейные системы и дифференциальные включения с неограниченной правой частью получены Г. А. Колокольниковой [48]..

Для задач с траекториями ограниченной вариации необходимые условия оптимальности в основном сконцентрированы вокруг различных вариантов принципа максимума, а развитие достаточных условий происходило через обобщение методов динамического программирования и условий типа К. Каратеодори и В. Ф. Кротова. Первые и наиболее полные результаты по необходимым условиям оптимальности в задачах с траекториями ограниченной вариации получены в серии работ Б. М. Миллера [70,71]. В [74,123,171] содержатся необходимые условия оптимальности для специальных классов задач импульсного управления, в том числе, задач оптимального управления дискретно-непрерывными системами (в терминах обобщенных решений), задач с ограниченным числом импульсов, линейно выпуклых задач импульсного управления, задач оптимального управления гибридными системами с односторонними ограничениями, а также для задачи импульсного управления с траекториями ограниченной вариации при фазовых ограничениях. Близкие результаты для гладких задач импульсного управления с траекториями из BV получены А. Брессаном и Ф. Рампаццо [126,127] с привлечением метода разрывной замены времени, а также в работах С. Т. Завалищина и А.Н..

Сесекина [43,91]..

Негладкие задачи оптимального управления в импульсных системах, не обладающих свойством корректности, с терминальными и промежуточными фазоограничениями на фиксированном и свободном отрезках времени рассматривались в [39], где для таких задач получены необходимые условия оптимальности. В этой работе рассматривается случай конечного числа импульсов и тривиальной сингулярной непрерывной компоненты управляющей меры. При обосновании условий оптимальности импульсная система трактуется как модель многоэтапного процесса. Квадратичные необходимые условия оптимальности в задачах импульсного управления с траекториями ограниченной вариации получены О.Н. Сам-сонюк [85]..

Ряд вопросов, связанных с необходимыми условиями первого и второго порядков для задач оптимального управления нелинейными импульсными системами (в частности, проблема вырождения), исследовался в работах A.B. Арутюнова, Д. Ю. Карамзина. Условия второго порядка получены в [108], «невырожденный принцип максимума» — в их совместной работе с Ф. Л. Перейра [109], и необходимые условия второго порядка без априорного предположения нормальности — в работе A.B. Арутюнова, В. А. Дыхты и Ф. Л. Перейра [110]. В [160] исследуются метрические и топологические свойства пространства импульсных управлений..

Необходимые условия экстремума в задачах управления дифференциальными уравнениями с мерами, а также включениями с мерами получены в работах Р. Винтера, Ф. Л. Перейра, Ж. Силва с помощью специального обобщения метода разрывной замены времени [176,177,186,188,194]. Задачи с фазовыми ограничениями исследовались в [144,187]. Необходимые условия оптимальности импульсных процессов в банаховых пространствах получены в [103,104]..

Приближенные методы оптимального управления.

Успех теории оптимального управления динамическими системами и ее активное применение во многих областях приложений естественным образом стимулировали и развитие вычислительных методов..

Для классических задач управления обыкновенными дифференциальными уравнениями большинство известных вычислительных алгоритмов можно условно разделить на два типа: локальные, в основе которых лежит та или иная процедура варьирования в пространстве управлений, и глобальные методы, связанные с построением приближенного синтеза управления. В ряде локальных методов широко распространен подход, основанный на использовании вариаций игольчатого типа. По-видимому, впервые этот подход, получивший название метода последовательных приближений, был предложен И. А. Крыловым и Ф. Л. Черноусько [57], и развивался в дальнейшем в [58], а также в работах A.A. Любушина [63−65], О. В. Васильева и В. А. Срочко [14−16,93]. Некоторые алгоритмы основаны на исследовании первой и второй вариаций функционала [17,18,87,93,96,102,156]. К ним относятся все методы градиентного спуска и их модификации. Такие алгоритмы оказываются эффективными в задачах без ограничений на управление, а также в случае, когда оптимальное управление содержится внутри допустимой области..

Одно из направлений развития глобальных вычислительных методов связано с принципом динамического программирования Беллма-на и исследованием уравнения Гамильтона-Якоби [158]. Большая серия вычислительных методов опирается на достаточные условия оптимальности В. Ф. Кротова и принцип расширения, сформулированный в работах В. И. Гурмана. На основе принципа расширения развита серия методов слабого и сильного улучшения первого и второго порядков (В.И. Гурман, В. А. Батурин, И. В. Расина, Д. Е. Урбанович и др. [4,11,32−35,51−56,153,161]). Эти процедуры позволяют улучшать не оптимальные (в локальном смысле) процессы даже в том случае, когда такие процессы удовлетворяют необходимым условиям оптимальности (принципу максимума Понтрягина, либо условиям стационарности). Близкие по технике методы улучшения, связанные с локальным оцениванием множеств достижимости, развивались в работах В. И. Гурмана, В. А. Батурина, Е. В. Гончаровой [5,6,35]. Методы из [4] были дополнены эффективными процедурами параметрического поиска [8]. В [41] предложена общая процедура нелокального улучшения, где для построения приближенного синтеза управления используется решение квазивариационного неравенства Гамильтона-Якоби и метод проксимального прицеливания..

На фоне внушительного списка работ по численным методам для классических задач оптимального управления библиографию, посвященную вычислительным аспектам исследования задач импульсного управления, едва ли можно назвать обширной. В [33,35,37,117−120] представлены алгоритмы улучшения для задач оптимального управления системами с линейно входящим неограниченным управлением и траекториями из Ь^, использующие преобразование Гурмана к производной задаче и нелинейный вариант преобразования Гоха. Исследование задач управления многоэтапными процессами было проведено в работах [19,61,79]. В [7] были получены достаточные условия оптимальности многоэтапных управляемых процессов, на основе которых разработаны методы улучшения управления первого и второго порядков. Итеративные алгоритмы улучшения управления логико-динамическими системами предложены в [10,121,122]. Обзор приближенных методов оптимального управления в различных гибридных моделях дан в [9]. В [114,115] для задач оптимального управления импульсными гибридными системами с априори конечным числом автономных переключений разработаны методы градиентного спуска. Среди последних работ выделим [38], где на основе аппроксимации многогранниками множеств достижимости и полярных множеств развиты численные алгоритмы синтеза импульсных управлений для линейной системы с траекториями ограниченной вариации. Отметим также диссертацию [197], посвященную, преимущественно, численному исследованию задач оптимального управления механическими системами в форме дифференциальных уравнений с мерами при комплементарных ограничениях..

Гибридные системы.

Термин гибридные системы объединяет в себе большое многообразие моделей, эволюция состояния которых во времени характеризуется взаимодействием обычной непрерывной динамики и динамики, определяемой выделенными «событиями». Нам едва ли удастся охватить весь спектр работ, посвященных моделированию и исследованию качественных свойств гибридных моделей различных классов. Библиография по этим вопросам насчитывает сотни наименований, приведем лишь некоторые из известных нам: [74,105,106,112,124,140,154,166,167,169,183−185,192] (см. также цитируемую в них литературу). В [31, 74,114−116,129,130,133,157,162] изучались задачи оптимального управления для гибридных систем специального вида..

За подробной классификацией гибридных систем можно обратиться к работам М. Браники, см., например, [124]. Большинство гибридных систем можно записать в виде: х = f{x, u), х (т) = д (х (т—), ь>т), если х (т—) G Z. и G U, рт G W. 1.

0.6) (0.7).

0.8).

Дифференциальное уравнение (0.6) описывает непрерывную динамику состояния системы (или семейства подсистем, отвечающих разным режимам поведения моделируемого объекта). Соотношения (0.7) определяют схему переключений между подсистемами. Здесь /ид — векторные функции со стандартным набором свойств, U и W — заданные множества, ограничивающие выбор управляющих воздействий и ж ь>т, Z — подмножество расширенного фазового пространства, формирующее условия переключения..

Выделим частные случаи, наиболее типичные для практических приложений..

Mi) Функция g не зависит от управления у. Объект управления подвержен естественным импульсным воздействиям, которые неизменно проявляются по достижении определенных фазовых состояний, что имеет место, например, в механических системах с ударами и сухим трением [123,131,166−168,171,172]..

М2) Функция g не зависит от ж. В этом случае (0.7) превращается в ограничения на пределы траектории в точках разрыва (т.е. в моменты смены режима функционирования системы): х{т—) G х (т) G Z+, где Z+ = g (W) := {g{y)v G W}. Этот случай типичен для ряда моделей из механики. Скачкообразные изменения состояния могут иметь место только в моменты попадания траектории на заданное подмножество Z расширенного фазового пространства, называемое множеством переключения, англ. «resetting set», «jump permitting set» [124,137,154] (к примеру, повышение или понижение передачи при управлении автомобилем возможно только по достижении определенной скорости). Результатом смены режима является перевод фазовой траектории на множество назначения англ. «jump destination set». Эта ситуация характерна, в частности, для импульсных гибридных систем вида [114−116,166,167] и механических систем с переменным числом степеней свободы [196,197], возникающих в робототехнике при моделировании манипуляторов, передвижных механизмов и т. д. (см., например, [98,100,107,152,163,164])..

М3) Множество Zсовпадает со всем расширенным фазовым пространством. Такие модели называются дискретно-непрерывными системами [74], или системами «с толчками» [97]. Здесь в качестве управлений выступают измеримая функция и (-) и набор 3 = {т, vT} моментов г переключения динамики и параметров ит, подаваемых «на вход» при переключении и выбираемых из ограниченного множества W. Мы рассмотрим этот случай подробнее в § 2.1 в контексте построения численного метода решения соответствующей экстремальной задачи..

В (М2) и (Мз) событие смены динамики, а также моменты переключения являются предметом управления и подлежат выбору. Подобные математические модели можно отнести к гибридным системами с управляемыми переключениями. С другой стороны, в моделях (Mi), т.н. гибридных системах с автономными переключениями, достижение определенных состояний обязательно приводит к смене режима, при этом результат переключения может, по-прежнему, определяться выбором некоторого управления. Перечисленные случаи являются, в своем роде, пограничными. В практических приложениях часто возникают модели следующего вида..

М4) Случай, когда часть компонент фазового вектора — кусочно постоянные функции, описывается логико-динамическими, или переключательными системами (англ. «switched systems») [12,13,124,129,133, 140,162,192]: х = fq (t, x) := f (t, x, q), q (t)eQ,, Q q® = g (r, x (r-), q (r-), uT)..

Здесь Q — некоторый конечный набор индексов (номер подсистемы), д (-) — «логическая» компонента, задающая режим, в котором эволюционирует состояние x{t). Функция g определяет конечный автомат («с памятью»): д (т, х (т—), г, рт) = j (r, x (r—), uT) G Q, где 3{t, x (t-), vt) = jk (vT), если (т, ж (т-), д (т-)) G Zk, а множества Zk задают некоторый набор условий переключения. Переключения логической переменной q (-) между различными значениями из Q трактуются как смена динамики. Точки множества Q могут рассматриваться, к примеру, как узлы некоторого графа, и мгновенный переход из одного узла в другой возможен лишь в случае, если существует ребро графа, связывающее эти узлы..

Дифференциальные уравнения с мерами как универсальный способ описания дискретно-непрерывной динамики.

В процессе развития теории гибридных систем были обнаружены обширные связи с теорией импульсного управления. На сегодняшний день можно наблюдать глубокое взаимное проникновение этих двух парадигм..

Вернемся к гибридной системе (0.6)—(0.8). Предположим, что g{x, v) при любых (ж, v) удается трактовать как результат действия оператора сдвига по траекториям некоторого вспомогательного дифференциального уравнения, т. е. д (х, и) = я (1-х, 1у), где x (-]t, x, p) удовлетворяет на отрезке [0,1] следующей предельной системе x = G (x{0))i>, х (0) =х..

Тогда модель (0.6)-(0.8) эквивалентна дифференциальному уравнению: dx = f (x, и) dt + G (x) dp (0.10) с дискретной мерой dfi (t) = Y2T.

Описание скачка с помощью предельной системы в случае произвольной функции g остается для нас открытым вопросом. Подобное представление заведомо имеет место, если функция g обладает свойством ро-бастности [74] (в частности, полугрупповым свойством по переменной v). Матрица G тогда определяется условием д.

G{x) = —g (x, v) |v=0 •.

В общем случае соотношения (0.7) можно рассматривать как смешанные ограничения, связывающие траекторию ж (-), управления ь>т и некоторое импульсное управление..

Смешанные ограничения на меру и траекторию как условия смены режимов в гибридных системах.

Пусть динамика состояния объекта описывается дифференциальным уравнением с мерами (0.10). Предположим, что в моменты приложения импульсного управления фазовая траектория подчинена дополнительным условиям:.

Q (t, z (t-)) = 0, Q+(t, x{t)) = 0, V (t, x{t)) < 0 |ф|-п.в., (0.11) где компоненты вектор-функций — неотрицательные функции (что не снижает общности). Условия (0.11) могут рассматриваться как некоторое обобщение смешанных ограничений типа равенств и неравенств в классических задачах с ограниченными управлениями..

Отметим, что смешанные ограничения, конечно, возникали в задачах импульсного управления (см., например, [36]), однако речь шла об условиях, содержащих обычное управление. Ограничения же (0.11) определяют зависимость между импульсным управлением и траекторией. При этом сама модель приобретает новое качество: управляющая мера теряет свойство быть «экзогенным» параметром..

Ю.В. Орлов рассматривал задачи оптимального управления уравнениями в распределениях нулевого порядка х — f (t, х, и) + х, и) й, (0.12) при ограничениях 0, (0.13) называемых в [80] смешанными. Управлениями при этом считались функции ограниченной вариации и (-). Мы склонны рассматривать условия (0.13) в модели (0.12) скорее как фазовые ограничения, каковыми они и становятся после введения нового управления V = й и доопределения системы тривиальным уравнением й = V. В ряде случаев не существенно, что рассматривать в качестве управления, меру, или функцию ее распределения. Для нас же важно различать эти случаи: ограничение (0.13) выполняется при всех в то время как в (0.11) мы налагаем условия на фазовую траекторию лишь в точках приложения импульса. Отметим также, что результаты в [80] получены в рамках концепции виброкорректных решений. Последнее, в частности, предполагает выполнение условий Фробениуса, которые, как известно, является весьма жесткими предположениями и существенно сужают круг возможных приложений..

В работе [111] рассматривается задача оптимального импульсного управления при смешанном ограничении вида К (1,х, и) Е С, где Я — некоторая аналитическая функция, а С — замкнутое выпуклое множество. Это ограничение трактуется в обобщенном смысле — как система условий, которые накладываются на управляемые процессы в естественном и «быстром» времени (т.е. данное условие охватывает исходные траектории и управления, и такого же вида соотношение связывает некоторое управление и соответствующую траекторию в предельной системе, отвечающие каждому моменту приложения импульса)..

Задача оптимального управления дифференциальным включением с мерами рассматривалась в [137] при смешанных ограничениях конусного типа. Последние представляют собой вариант нестандартных смешанных ограничений и могут быть переписаны в виде (0.11). Однако, задача оптимизации в [137] ставилась в специальном классе позиционных импульсных управлений вида <1у (1,х) — векторных мер, определенных на [0,Т] х К" и непрерывных по х. Феномен позиционного импульсного управления на сегодняшний день малоизучен, а исследование задач позиционного импульсного управления представляет новое направление исследований..

Модели вида (0.10), (0.11) не встречались в известной нам литературе. В связи с этим, их изучение представляет чисто академический интерес. С другой стороны, ограничения вида (0.11) возникают как условия смены режимов в широком классе гибридных систем с управляемыми переключениями динамики. Для того чтобы пояснить это, вновь обратимся к соотношениям (0.6)-(0.8). Если представить скачки с помощью оператора сдвига не удается, их явное описание в (0.7) можно интерпретировать как смешанное ограничение х (г-), х (г))? 2 |ф|-п.в., где 2 := {(ж, у): у Е д (х,?), х Е и мера ¿-¡-л сосредоточена на {т}. При этом динамика определяется уравнением (0.10), где функция С отвечает за описание быстрых процессов, результаты которых мы интерпретируем как скачки траектории. В случае, когда характер быстрых движений не имеет содержательного смысла (скажем, как в логико-динамических моделях (М4)), можно положить С (ж) = I (единичная матрица), ¿-¡-¿-(Ь) — ~ т) сИ. Ясно, что допустимые управляющие параметры ст в конечном счете имеют вид ст = д (х{т—), ут) — х{т—), т.к. учет смешанного ограничения не оставляет иных вариантов скачка, кроме тех, что описываются условием (0.7)..

Очевидно, случаи (Мх) и (М3) укладываются в приведенное описание. Модель (М2) есть частный вариант системы (0.10), (0.11), когда мера дискретна и I = 0, а (¿-г, г? {—,+}, — скалярные неотрицательные непрерывные функции, обращающиеся в нуль только на соответствующих множествах 2{. Функции с требуемыми свойствами существуют. Классический результат X. Уитни утверждает, что для любого замкнутого множества найдется бесконечно гладкая функция, характеризующая его в указанном смысле. В (М4) переключения логической переменной можно понимать как скачки кусочно-постоянной траектории: х = fq (t, х) := f (t, x (t), q (t)), q = 0, q® = g (T, x (T-), q (r-), vT)..

Поэтому эта модель также охватывается соотношениями (0.10), (0.11)..

В дальнейшем условимся называть модели вида (0.10), (0.11) импульсными гибридными системами, сокращенно ИГС (термин принят из [124] и [116], эпитет «гибридные» подчеркивает наличие специфических смешанных ограничений (0.11)). Такая терминология наиболее точно отражает принятую в работе точку зрения, когда выделенные «события» (переключения динамики) в моделях гибридных систем трактуются как результат применения импульсного управления. На языке теории гибридных систем наша модель может быть охарактеризована как система с управляемыми переключениями. Отметим, что гибридные системы с автономными переключениями описывают многоэтапные процессы [135,136,190]. В случае конечного числа переключений многоэтапный процесс определяется простой конкатенацией движений, происходящих на отрезках функционирования каждой из непрерывных подсистем..

Предмет и объект исследования.

Объектом исследования являются задачи оптимального управления импульсными гибридными системами (ИГС), которые описываются дифференциальными уравнениями с мерами при ограничениях следующего вида:.

Q (t, x (t-)) = 0, Q (t, x (t)) = 0, $(t, x (t))< 0 ф-п.в..

Здесь х (-) — фазовая траектория импульсной системы, удовлетворяющая дифференциальному уравнению с мерами, dp, — скалярная неотрицательная мера Лебега-Стилтьеса (импульсное управление). Предмет исследования — необходимые условия оптимальности для задач оптимального управления ИГС и численные методы решения нелинейных задач оптимального импульсного управления с траекториями ограниченной вариации..

Цель работы.

Целью диссертационного исследования является доказательство принципа максимума для задач оптимального управления импульсными гибридными системами и построение вычислительных методов импульсного управления в некоторых классах задач с траекториями ограниченной вариации..

Методы исследования.

Исследование базируется на принципе максимума для классических задач оптимального управления [82] и его варианте для задач с фазовыми ограничениями [46], серии методов численного решения классических задач оптимального управления [93], методе разрывной замены времени [72], а также модифицированном преобразовании времени (адаптированном для задач оптимального управления импульсными гибридными системами). Метод разрывной замены времени сводит задачу импульсного управления к классической, а окончательные результаты получаются путем расшифровки в терминах исходной модели принципа максимума и алгоритмов улучшения в соответствующих преобразованных классических задачах..

Кроме того, в работе используются теория функции вещественного переменного и аппарат дифференциальных уравнений с мерами..

Научная новизна и полученные результаты.

Выделим основные положения, выносимые на защиту:.

1. Построено преобразование задачи оптимального управления импульсными гибридными системами в форме дифференциальных уравнений с мерами при смешанных ограничениях на меру и траекторию к эквивалентной классической задаче оптимального управления..

2. Доказан принцип максимума для задачи оптимального управления импульсной гибридной системой..

3. Разработаны численные алгоритмы поиска экстремалей в классе слабых и понтрягинских вариаций управления для нелинейных задач импульсного управления. Получено численное решение задач оптимального импульсного управления динамикой конкурирующих популяций и быстродействия в моделях движения манипуляторов с блокируемыми степенями свободы..

В работе предложена новая модификация метода разрывной замены времени, подходящая для задачи оптимального управления ИГС. Отметим, что другие реализации метода замены времени не применимы в этой задаче..

Полученный в работе принцип максимума является первым из известных автору результатов по необходимым условиям оптимальности первого порядка для задач оптимального импульсного управления со смешанными ограничениями на меру и траекторию..

Разработанные в диссертации процедуры численного решения нелинейных задач импульсного управления с траекториями ограниченной вариации при ограничении на полный импульс управляющего воздействия являются новыми..

Предложены новые формализации задач оптимального импульсного управления динамикой численностей конкурирующих популяций и быстродействия в двух моделях манипуляторов с блокируемой степенью свободы..

Теоретическая и практическая значимость.

Полученные в работе результаты по преобразованию задачи оптимального управления ИГС к классической могут применяться для разработки методов качественного исследования задач оптимального управления ИГС (например, для получения условий оптимальности, инвариантности и др.). Принцип максимума может применяться при решении задач оптимального управления ИГС. Практическое значение полученных результатов определяется широким спектром прикладных задач импульсного управления, которые описываются классом моделей ИГС, и возможностью их численного решения на базе разработанных методов..

Проблематика работы является составной частью исследований, выполнявшихся в ИДСТУ СО РАН по базовому проекту «Методы оптимального управления при структурных воздействиях и неопределённостях с приложением к техническим и социально-эколого-экономическим системам» (№ гос. регистрации 01.2.007 8 580) в рамках программы фундаментальных исследований СО РАН, 2007;2009, по проекту 111.24.1.3.10 «Методы и вычислительные технологии исследования задач управления с приложениями к социальным, экономическим, природным и техническим системам» (№ гос. регистрации 01.2.010 1 345), 2010, 2011 а также по проектам РФФИ 05−01−477, 08−01−156..

Апробация работы.

Результаты представлены на всероссийских и международных научных конференциях:.

1. IX школе-семинаре «Математическое моделирование и информационные технологии», Иркутск, 2007,.

2. VIII Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям, Новосибирск, 2007,.

3. Международном симпозиуме «Обобщенные решения в задачах управления» (GSCP'08), 2008, Улан-Удэ,.

4. The 8th Portuguese Conference on Automatic Control (CONTROLO'2008), UTAD — Vila Real, Portugal, 2008,.

5. X Всероссийской конференции молодых ученых по математическому моделированию, информационным технологиям и управлению, п. Ханх, Монголия, 2009,.

6. II Международной школе-семинаре «Нелинейный анализ и экстремальные задач», Иркутск, 2010,.

7. XIV и XV Байкальских международных школах-семинарах «Методы оптимизации и их приложения», Иркутск-Северобайкальск, 2008 и Иркутск-Листвянка, 2011,.

8. Российско-монгольской конференции молодых ученых по математическому моделированию, вычислительно-информационным технологиям и управлению, Иркутск, Россия — Ханх, Монголия, 2011,.

9. The 18th IFAC World Congress, Milan, Italy, August 28 — September 2, 2011,.

10. The 5th International Conference on Physics and Control (PhysCon'2011), Leon, Spain, September 5−8, 2011, а также на ежегодных конференциях «Ляпуновские чтения», Иркутск, 2008;2010. Результаты обсуждались на семинаре в Институте математики Университета г. Севилья (Испания) (май, 2010) и регулярно — на семинарах Института динамики систем и теории управления СО РАН..

Публикации.

Основные результаты диссертационной работы опубликованы в работах [21−28], [94,147−151]..

Структура работы.

Диссертационная работа состоит из введения, трех глав, разбитых на 17 разделов, заключения и списка литературы, включающего 198 наименований. Общий объем работы составляет 143 страницы, включая 29 рисунков..

1. Антипина H.B. Достаточные условия оптимальности импульсных процессов и их приложения: Дис. канд. физ.-мат. наук. — Иркутск, 2003. — 165 с..

2. Арутюнов A.B. Условия экстремума. Анормальные и вырожденные задачи. — М.: Факториал, 1997. — 256 с..

3. Арутюнов A.B., Карамзин Д. Ю., Перейра Ф. Принцип максимума для задач оптимального управления при ограниченных фазовых координатах в форме Р. В. Гамкрелидзе и его связь с другими условиями оптимальности // ДАН. — 2011. — Т. 436, № 6. — С. 738—742..

4. Батурин В. А., Урбанович Д. Е. Приближенные методы оптимального управления, основанные на принципе расширения. — Новосибирск: Наука, 1997. — 175 с..

5. Батурин В. А., Гончарова Е. В. Метод улучшения, основанный на приближенном представлении множества достижимости. Теорема о релаксации // Автоматика и телемеханика. —-1999. — № 11. — С. 19−29..

6. Батурин В. А., Гончарова Е. В. Метод улучшения, основанный на приближенном представлении множества достижимости и линеаризации // Автоматика и телемеханика. — 2002. — № 7. — С. 3−11..

7. Батурин В. А., Лемперт A.A. Метод сильного улучшения в задачах оптимального управления многоэтапными процессами // Тр. Междунар. конф. «Методы оптимизации и их приложения». — Иркутск, 2005. Т. 2. — С. 105−110..

8. Батурин В. А., Черемных C.B. Управление выбором параметров в алгоритмах слабого улучшения // Изв. РАН. Теория и системы управления. — 2006. № 2. — С. 54−60..

9. Батурин В. А., Малтугуева Н. С. Метод слабого улучшения первого порядка для задач оптимального управления логико-динамическими системами // Известия Иркутского гос. ун-та. Математика. 2009. — Т. 2, № 1. — С. 83−93..

10. Белышев Д. В., Гурман В. И. Интеллектуальные процедуры оптимального управления // Автоматика и телемеханика. — 2002. — № 5. С. 147−155..

11. Бортаковский A.C. Достаточные условия оптимальности управления детерминированными логико-динамическими системами // Информатика. Сер. Автоматизация проектирования. — 1992. — Вып. 2−3. С. 72−79..

12. Бортаковский A.C., Пантелеев A.B. Достаточные условия оптимальности управления непрерывно-дискретными системами // Автоматика и телемеханика. — 1987. — № 7..

13. Васильев О. В., Тятюшкин А. И. Об одном методе решения задач оптимального управления, основанном на принципе максимума // Журн. вычисл. математики и мат. физики. — 1981. — № 6. — С. 13 761 384..

14. Васильев О. В., Срочко В. А., Терлецкий В. А. Методы оптимизации и их приложения. — Новосибирск: Наука, 1990. — 148 с..

15. Васильев О. В. Лекции по методам оптимизации. — Иркутск: Изд-во Иркут. ун-та, 1994..

16. Васильев Ф. П. Численные методы решения экстремальных задач. — М.: Наука, 1980. — 520 с..

17. Васильев Ф. П. Методы решения экстремальных задач. — М.: Наука, 1981. 400 с..

18. Габелко К. Н. Последовательное улучшение многоэтапных процессов // Автоматика и телемеханика. — 1974. — № 12. — С. 72−80..

19. Галяев A.A. Оптимальное импульсное управление динамической системой в фазе удара // Автоматика и телемеханика. — 1996. — № 1. С. 75−88..

20. Гончарова Е. В., Старицын М. В. Задача улучшения управления для дискретно-непрерывных систем // Тез. докл. VIII Всерос. конф. молодых ученых по математическому моделированию и информационным технологиям. — Новосибирск, 2007. — С. 18..

21. Гончарова Е. В., Старицын М. В. Метод последовательных улучшений управления дискретно-непрерывными системами // Материалы IV Междунар. симп. «Обобщенные решения в задачах управления» (GSCP-08). Улан-Удэ, 2008. — С. 47−48..

22. Гончарова Е. В., Старицын М. В. Метод улучшения для дискретно-непрерывных систем // Тр. XIV Байкальской междунар. школы-семинара «Методы оптимизации и их приложения». — Иркутск-Северобайкальск, 2008. Т. 2. — С. 125−134..

23. Гончарова Е. В., Старицын М. В. Метод улучшения управления импульсными системами // Известия РАН. Теория и системы управления. 2010. — № 6. — С. 53−60..

24. Гончарова Е. В., Старицын М. В. Метод разрывной замены времени в задачах оптимального управления гибридными системами // Тез. докл. II Междунар. школы-семинара «Нелинейный анализ и экстремальные задачи». — Иркутск, 2010. — С. 21..

25. Гончарова Е. В., Старицын М. В. Градиентные методы улучшения для задач оптимального импульсного управления // Управление большими системами. — М.: ИПУ РАН, 2010. — Вып. 31. — С. 3548..

26. Гончарова Е. В., Старицын М. В. Метод разрывной замены времени в задачах оптимального управления импульсными гибридными системами // Известия РАН. Теория и системы управления. — 2011. № 3. — С. 41−51..

27. Гончарова Е. В., Старицын М. В. Задача оптимального импульсного управления с фазовыми и смешанными ограничениями // ДАН. — 2011. Т. 441, № 1. — С. 29−32..

28. Гурман В. И. Об оптимальных процессах особого управления // Автоматика и телемеханика. — 1965. — Т. 26, № 5..

29. Гурман В. И. Вырожденные задачи оптимального управления. — М.: Наука, 1977. 304 с..

30. Гурман В. И., Дыхта В. А., Колокольникова Г. А., Константинов Г. Н., Москаленко А. И., Никифорова И. А. Принцип расширения в задачах оптимального управления // Изв. АН СССР. Техн. кибернетика. — 1983. № 2. — С. 200−217..

31. Гурман В. И., Батурин В. А., Расина И. В. Приближенные методы оптимального управления. — Иркутск: Изд-во Иркут. гос. ун-та, 1983. 178 с..

32. Гурман В. И. Принцип расширения в задачах управления. — М.: Наука, 1985. 288 с..

33. Гурман В. И., Батурин В. А., Данилина Е. В. и др. Новые методы улучшения управляемых процессов. — Новосибирск: Наука, 1987..

34. Дыхта В. А. Вариационный принцип максимума и квадратичные условия оптимальности импульсных и особых режимов. — Иркутск: Изд-во ИГЭА, 1995. 186 с..

35. Дарьин А. Н., Малакаева А. Ю. Численные методы синтеза импульсных управлений для линейных систем // Известия РАН. Теория и системы управления. — 2008. — № 2. — С. 50−56..

36. Дыхта В. А., Самсонюк О. Н. Оптимальное импульсное управление с приложениями. — М.: ФИЗМАТЛИТ, 2000..

37. Дыхта В. А. Некоторые приложения неравенств Гамильтона-Якоби в оптимальном управлении // Известия Иркутского гос. унта. Сер. Математика. — 2009. Т. 15, вып. 1. — С. 405−426..

38. Емельянов С. В., Коровин С. К., Бобылев H.A., Булатов A.B. Гомо-топии экстремальных задач. — М.: Наука, 2001. — 350 с..

39. Завалищин С. Т., Сесекин А. Н. Импульсные процессы: модели и приложения. — М.: Наука, 1991. — 256 с..

40. Завалищин С. Т., Сесекин А. Н., Дрозденко С. Е. Динамические системы с импульсной структурой. — Средловск: Средне-Уральское книжное изд-во, 1983. — 112 с..

41. Зароднюк Т. С. Вычислительные технологии поиска глобального экстремума в задаче оптимального управления с параллелепипед-ными ограничениями: Дис. .канд. тех. наук: 05.13.01- ИДСТУ СО РАН. Иркутск, 2011. — 138 с..

42. Иоффе А. Д., Тихомиров В. М. Теория экстремальных задач. — М.: Наука, 1974. — 480 с..

43. Кларк Ф. Оптимизация и негладкий анализ: Пер. с англ. — М: Наука, 1988. 280 с..

44. Колокольникова Г. А. Вариационный принцип максимума для разрывных траекторий неограниченных, асимптотически линейных управляемых систем // Дифференциальные уравнения. — 1997. — Т. 33, № 12. С. 1631−1638..

45. Колокольникова Г. А. Импульсные режимы в нелинейных управляемых динамических системах и условия их оптимальности: Дис. канд. физ.-мат. наук. — Иркутск, 1985. — 157 с..

46. Крылов И. А., Черноусько Ф. Л. О методе последовательных приближений для решения задач оптимального управления // Журн. вычисл. математики и мат. физики. — 1962. — № 6. — С. 1132−1138..

47. Кротов В. Ф., Букреев В. З., Гурман В. И. Новые методы вариационного исчисления в динамике полета. — М: Машиностроение, 1969. — 228 с..

48. Кротов В. Ф., Гурман В. И. Методы и задачи оптимального управления. — М: Наука, 1973. — 446 с..

49. Кротов В. Ф. Вычислительные алгоритмы решения и оптимизации управляемых систем уравнений. I, II // Техн. кибернетика. — 1975. № 5. — С. 3−15- № 6. — С. 3−13..

50. Кротов В. Ф., Фельдман H.H. Итерационный метод решения экстремальных задач // Моделирование технико-экономических процессов. М.: МЭСИ, 1978. — С. 54−65..

51. Кротов В. Ф., Фельдман H.H. Итерационный метод решения задач оптимального управления // Техн. кибернетика. — 1983. № 2. -С. 160−168..

52. Крылов H.A., Черноусько Ф. Л. О методе последовательных приближений для решения задач оптимального управления // Журн. вычисл. математики и мат. физики. — 1962. — № 6. — С. 1132−1139..

53. Крылов H.A., Черноусько Ф. Л. Алгоритм метода последовательных приближений для задач оптимального управления // Журн. вычисл. математики и мат. физики. — 1972. — № 1. — С. 14−34..

54. Куржанский A.B., Осипов Ю. С. К управлению линейной системой обобщенными воздействиями // Дифференциальные уравнения. — 1969. Т. 5, № 8. — С. 1360−1370..

55. Куржанский А. Б. Оптимальные системы с импульсными управлениями // Дифференциальные игры и задачи управления. — Свердловск: УНЦ АН СССР, 1975. С. 131−156..

56. Лемперт A.A., Батурин В. А. Методы слабого улучшения в задаче оптимального управления на сети операторов // Тр. Междунар. конф. «Вычислительные и информационные технологии в науке и образовании». — Павлодар, 2006. — Т. 2..

57. Лоуден Д. Оптимальные траектории для космической навигации. — М.: Мир, 1966..

58. Любушин A.A. Модификации и исследование сходимости метода последовательных приближений для задач оптимального управления // Журн. вычисл. математики и мат. физики. — 1979. — № 6. С. 1414−1421..

59. Любушин A.A. О применении модификации метода последовательных приближений для решения задач оптимального управления // Журн. вычисл. математики и мат. физики. — 1982. — № 1. — С. 3035..

60. Любушин A.A., Черноусько Ф. Л. Метод последовательных приближений для расчета оптимального управления // Изв. АН СССР. Техн. кибернетика. 1983. — № 2. — С. 147−159..

61. Методы улучшения в вычислительном эксперименте. — Новосибирск: Наука, 1988. — 184 с..

62. Методы решения задач теории управления на основе принципа расширения. — Новосибирск: Наука, Сиб. отд-ние, 1990. — 180 с..

63. Миллер Б. М. Об одной задаче нелинейного импульсного управления // Автоматика и телемеханика. — 1976. — Т. 37, № 6. — С. 63−72..

64. Миллер Б. М. Задача нелинейного импульсного управления объектами, описываемыми дифференциальными уравнениями с мерой. I, II // Автоматика и телемеханика. — 1978. — Т. 39, № 1. — С. 7583- № 3. С. 34−42..

65. Миллер Б. М. Условия оптимальности в задаче управления системой, описываемой дифференциальным уравнением с мерой // Автоматика и телемеханика. — 1982. — № 6. — С. 60−72..

66. Миллер Б. М. Условия оптимальности в задачах обобщенного управления // Автоматика и телемеханика. — 1992. — № 5. — С. 50— 58..

67. Миллер Б. М. Метод разрывной замены времени в задачах управления дискретно-непрерывными системами // Автоматика и телемеханика. 1993. — № 12. — С. 3−32..

68. Миллер Б. М., Рубинович Е. Я. Оптимизация динамических систем с импульсными управлениями. — М.: Наука, 2005. — 429 с..

69. Моисеев H.H. Численные методы теории оптимального управления, использующие вариации в пространстве состояний // Кибернетика. 1966. — Т. 5, № 3. — С. 1−23..

70. Моисеев H.H. Элементы теории оптимальных систем. — М.: Наука, 1975. 488 с..

71. Натансон И. П. Теория функций вещественной переменной. — М.: Наука, 1974. 480 с..

72. Никифорова H.A. Квадратичные условия оптимальности импульсных режимов: Дис. канд. физ.-мат. наук. — Иркутск, 1990. — 154 с..

73. Орлов А. Г., Расина И. В. Сложные процессы и достаточные условия относительной оптимальности // Управляемые системы. — Новосибирск, 1979. — № 18. С. 39−46..

74. Орлов Ю. В. Теория оптимальных систем с обобщенными управлениями. — М.: Наука, 1988..

75. Полак Э. Численные методы оптимизации. Единый подход. — М.: Мир, 1974. 376 с..

76. Понтрягин J1.C., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. — М.: Наука, 1961. 384 с..

77. Пшеничный Б. М. Численные методы в экстремальных задачах. — М.: Наука, 1975. 320 с..

78. Рисе Ф., Сёкефальви-Надь Б. Лекции по функциональному анализу. М.: Мир, 1979. — 587 с..

79. Самсонюк О. Н. Квадратичные условия оптимальности для задач оптимального импульсного управления // Тр. XII Байкальской междунар. школы-семинара «Методы оптимизации и их приложения». Иркутск, 2001. — Т. 2. — С. 144−149..

80. Самсонюк О. Н. Достаточные условия оптимальности в задачах оптимального импульсного управления с промежуточными фазо-ограничениями // Известия Иркутского гос. ун-та. Сер. Математика. 2009. — Т. 2, № 1. — С. 333−337..

81. Cea Ж. Оптимизация. Теория и алгоритмы. — М.: Мир, 1973. — 244 с..

82. Семенов В. В. Динамическое программирование и синтез логико-динамических систем // Приборостроение. — 1984. — № 2..

83. Сесекин А. Н. О нелинейных дифференциальных уравнениях, содержащих произведения разрывных функций на обобщенные // Обобщенные функции и дифференциальные уравнения. — Свердловск: УНЦ АН СССР, 1985. С. 62−68..

84. Сесекин А. Н. Об оптимальном управлении линейной системой с ограниченным ресурсом // Нелинейные задачи в обобщенных функциях. Свердловск: УНЦ АН СССР, 1988. — С. 77−84..

85. Сесекин А. Н. О наилучшей траектории в интегральной воронке разрывных решений / / Обобщенные функции и дифференциальные уравнения. Свердловск: УрО АН СССР, 1992. — С. 78−84..

86. Сесекин А. Н. Импульсное расширение в задаче минимизации энергетического функционала // Автоматика и телемеханика. — 1992. — Т. 53, № 8. С. 53−62..

87. Срочко В. А. Итерационные методы решения задач оптимального управления. М.: ФИЗМАТЛИТ, 2000. — 160 с..

88. Тятюшкин А. И. Многометодные технологии оптимизации управляемых систем. — Новосибирск: Наука, 2006. — 343 с..

89. Филиппов А. Ф. Дифференциальные уравнения с разрывной правой частью. — М.: Наука, Гл. редакция физ.-мат. лит., 1985. — 224 с..

90. Формальский A.M. Движение антропоморфных механизмов. — М.: Наука, 1982. — 368 с..

91. Черноусько Ф. Л. Вычислительные и приближенные методы оптимального управления // Математический анализ. Итоги науки и техники. 1977. — Т. 14. — С. 101−166..

92. Черноусько Ф. Л., Болотник H.H., Градецкий В. Г. Манипуляцион-ные роботы: динамика, управление, оптимизация. — М.: Наука, 1989. 368 с..

93. Шилов Г. Е. Математический анализ. — М.: Наука, 1965..

94. Энеев Т. М. О применении градиентного метода в задачах теории оптимального управления // Космические исследования. — 1966. — Т. 4, вып. 5. С. 651−669..

95. Ahmed N.U. Necessary conditions of optimality for impulsive systems on Banach spaces // Nonlinear Anal. — 2002. — V. 51, № 3. — P. 409 424..

96. Ahmed N.U. Optimality conditions with state constraints for semilinear systems determined by operator valued measures // Nonlinear Anal. — 2009. V. 70, № 10. — P. 3522−3537..

97. Special issue on hybrid control systems j Ed. by P. Antsaklis, A. Nerode // IEEE Trans. Autom. Control. 1998. — V. 43, № 4. — P. 453−587..

98. Special issue on hybrid systems: Theory & Appl. / Ed. by P. Antsaklis // IEEE Procs. 2000. — 88 p..

99. Arkin R.C. Behavior Based Robotics. The MIT Press, 1998..

100. Arutyunov A., Jacimovic V., Pereira F. Second order necessary conditions for optimal impulsive control problems // European Control Conf. 2001. Porto (Portugal), 2001. — P. 2759−2763..

101. Arutyunov A., Karamzin D., Pereira F. A Nondegenerate Maximum Principle for the Impulsive Control Problem with State Constraints // SICOPT. 2005. — V. 43. — P. 1812−1843..

102. Arutyunov A., Dykhta V., Pereira F. Necessary conditions for impulsive nonlinear optimal control problems without a priori normality // J. of Optimization Theory and Applications. — 2005. — V. 124, № 1. — P. 5577..

103. Arutyunov A.V., Karamzin D.Yu., Pereira F.L. On Constrained Impulsive Control Problems // J. of Mathematical Sciences. — 2010. — V. 165, № 6. P. 654−688..

104. Aubin J.-P. Impulse differential equations and hybrid systems: A viability approach // Lecture Notes. — University of California at Berkeley, 2000..

105. Aubin J.-P., Lygeros J., Quincampoix M., Sastry S., Seube N. Impulse Differential Inclusions: A Viability Approach to Hybrid Systems // IEEE TAC. 2002. — № 47. — P. 2−20..

106. Azhmyakov V., Raisch J. A gradient-based approach to a class of hybrid optimal control problems // Proc. of the 2nd IFAC Conf. on Analysis and Design of Hybrid Systems. — Alghero, 2006. — P. 89−94..

107. Azhmyakov V. Optimal control of hybrid and switched systems // Proc. of the IX Intern. Chetaev Conf. «Analytical Mechanics, Stability and Control of Motion». Irkutsk, 2007. — V. 2. — P. 308−317..

108. Azhmyakov V., Attia Sid A., Raisch J. On the Maximum Principle for Impulsive Hybrid Systems // Lecture Notes in Computer Science (LNCS). Springer-Verlag, 2008. — V. 4981. — P. 30−42..

109. Baturin V.A., Goncharova E.V. An improvement method for a linear unbounded control problem // Proc. of the IFAC Workshop «Singular Solutions and Perturbations». — Bucharest (Romania), 2001. — P. 3841..

110. Baturin V.A., Goncharova E.V. An Algorithm for Impulsive Control Problems // Proc. of 10th IEEE Mediterranean Conf. on Control and Automation (MED'2002), Lisbon (Portugal), July, 9−12, 2002..

111. Baturin V.A., Goncharova E.V. An Algorithm for Optimal Impulsive Control Problems // Proc. of 15th IFAC World Congress, Barcelona (Spain), July, 21−26, 2002. Elsevier Science Ltd., 2002..

112. Baturin V.A., Nie Y.Y., Verkhozina I.O. The Technique of Improving High-order Impulse Modes in the Optimal Control Problem // Minimicro Systems. 2003. — V. 24, № 2. — P. 169−173..

113. Baturin V.A. First-order improvement method for the problems of optimal control of logic-dynamic systems // Nonlinear Analysis, Hybrid Systems and Applications (3). — 2006. V. 64, Issue 2. — P. 288−294..

114. Baturin V., Goncharova E., Maltugueva N. Algorithms for Optimal Control of Logic-Dynamic Systems // Proc. of the European Control Conf. (ECC'07). Kos (Greece), 2007..

115. Bentsman J., Miller B.M. Mechanical systems with unilateral constraints: Controlled singularities approach // Proc. of the 40th IEEE Conf. on Decision and Control (CDC'01). Orlando, Florida (USA), 2001. — P. 3692—3697..

116. Code W.J. Measure-Driven Impulsive Systems: Stabilization, Optimal Control and Applications: Ph.D. ThesisUniversity of British Columbia. — Vancouver, 2009..

117. Dal Maso G., Rampazzo F. On systems of ordinary differential equations with measures as controls // Differential Integral Equations. — 1991. — V. 4, № 4. P. 739−765..

118. Daryin A.N., Kurzhanski A.B., Seleznev A.V. A dynamic programming approach to the impulse control synthesis problem // Proc. Joint 44th IEEE CDC-ECC-2005. Seville, 2005. — P. 8215−8220..

119. Egerstedt M., Wardi Y., Axelsson H. Transition-time optimization for switched-mode dynamical systems // IEEE Transactions on Automatic Control. 2006. — № 51. — P. 110−115..

120. Filippova T.F. Set-valued solutions to impulsive differential inclusions // Math. Comput. Model. Dyn. Syst. — 2005. — V. 11, № 2. P. 149−158..

121. Filippova T.F. On the generalized solutions for uncertain systems with applications to optimal control and estimation problems // WSEAS Trans. Syst. 2005. — V. 4, № 5. — P. 481−486..

122. Filippova T.F. Trajectory tubes of nonlinear differential inclusions and state estimation problems j/ J. Concr. Appl. Math. — 2010. — V. 8, №. 3. P. 454−469..

123. Ferreira M.M.A., Fontes F.A.C., Vinter R.B. Nondegenerate Necessary Conditions for Nonconvex Optimal Control Problems with State Constraints //J. Math. Anal. Appl. 1999. — V. 233, № 1. — P. 116 129..

124. Goh B.S. The second variation for singular Bolza problem // SIAM J. Contr. 1966. — V. 4, № 2. — P. 309−325..

125. Goh B.S. Optimal singular control for multi-input linear systems //J. Math. Anal, and Appl. — 1967. V. 20, № 3. — P. 534−539..

126. Goncharova E., Ovseevich A., Staritsyn M. Control Improvement Problem for Discrete-Continuous Dynamic System // Intern. J. of Mathematics and Statistics (IJMS). — 2009. — V. 5, № A09. — P. 71−82..

127. Goncharova E., Staritsyn M. Optimal control of measure-driven impulse systems // Book of Abstracts of the 5th Intern. Conf. on Physics and Control (PhysCon 2011). Leon (Spain), 2011. — P. 81..

128. Goncharova E., Staritsyn M. Optimal Control of Impulsive Hybrid Systems // Proc. of the 18th IFAC World Congress. — Milan (Italy), 2011. — P. 10 255−10 260..

129. Goncharova E., Staritsyn M. Optimization of measure-driven hybrid systems // JOTA. — (Published online: 18 October 2011, doi:10.1007/sl0957−011−9944-xto appear in Vol. 153, № 1, April 2012)..

130. Grizzle Jesse W., Abba G., Plestan F. Asymptotically Stable Walking for Biped Robots: Analysis via Systems with Impulse Effects // IEEE TRANSACTIONS ON AUTOMATIC CONTROL. 2001. — V. 46, № 1..

131. Gurman V.I., Baturin V.A. Improvement of Control and Local Optimal Synhesis. Degenerate Problems // Материалы VII Конгресса ИФАК. — Киото (Япония), 1981..

132. Haddad W.M., Chellaboina V., Nersesov S.G. Hybrid Nonnegative and Compartmental Dynamical Systems // Mathematical Problems in Engineering. 2002. — V. 8, № 6. — P. 493−515..

133. Haddad W., Chellaboina V., Nersesov S. Impulsive and Hybrid Dynamical Systems: Stability, Dissipativity, and Control. — Princeton: Princeton University Press, 2006..

134. Hager W., Pardalos P. Optimal Control, Theory, Algorithms, and Applications. — Springer, 2001..

135. Miller B.M. The generalized solutions of nonlinear optimization problems with impulse control // SIAM J. Control Optim. — 1996. — V. 34. P. 1420−1440..

136. Miller B.M., Bentsman J. The Singularity Opening Approach To Control Of Mechanical Systems With Constraints // Proc. of 2nd IFAC Workshop on Lagrangian and Hamiltonian Methods for Nonlinear Control. Seville, 2003..

137. Miller B.M., Bentsman J. Optimal control problems in hybrid systems with active singularities // Nonlinear Anal. — 2006. — V. 65, № 5. — P. 999−1017..

138. Motta M., Rampazzo F. Space-time trajectories of nonlinear systems driven by ordinary and impulsive controls // Differential and Integral Equations. 1995. — V. 8, № 2. — P. 269−288..

139. Motta M., Rampazzo F. Nonlinear systems with unbounded controls and state constraints: a problem of proper extension // NoDEA. — 1996. — № 3. P. 191−216..

140. Motta M., Sartori C. Discontinuous solutions to unbounded differential inclusions under state constraints. Applications to optimal control problems // Set-Valued Analysis. 1999. — № 7. — P. 295−322..

141. Pereira F., Silva G., Vinter R. Necessary Conditions of Optimality for Impulsive Differential Inclusions // Proc. Conf. Decision and Control'98. Tampa, FL, 1998. — P. 16−18..

142. Pereira F.L. A maximum principle for impulsive control problems with state constraints // Comp. Appl. Math. 2000. — V. 19, № 2. — C. 137 155..

143. Pereira F., Silva G. Necessary Conditions of Optimality for Vector-Valued Impulsive Control Problems // Systems & Control Letters. — 2000. № 40. — P. 205−215..

144. Pereira F.L., Filippova T.F. On a solution concept to impulsive differential systems // Tools for mathematical modelling, Math. Res. (St. Petersburg). 2003. — № 9. — P. 350−355..

145. Pereira F.L., Silva G.N., Oliveira V. Invariance for impulsive control systems // Avtomatika i Telemekhanika. — 2008. — № 5. — P. 57−71..

146. Ortega J.M., Rheinboldt W.C. Iterative Solution of Nonlinear Equations in Several Variables. — N.Y.: Academic Press, 1970..

147. Rishel R. W. An extended Pontryagin principle for control systems whose control laws contain measures // J. Soc. Indust. Appl. Math. Ser. A Control. 1965. — № 3. — P. 191−205..

148. Samoilenko A.M., Perestyuk N.A. Impulsive Differential Equations. — Singapore: World Scientific, 1995..

149. Sanfelice R.G., Goebel R., Teel A.R., Hespanha J., Tiwari A. A Feedback Control Motivation for Generalized Solutions to Hybrid Systems // HSCC. 2006. — LNCS 3927. — P. 522−536..

150. Siljak D.D. Large-Scale Dynamic Systems. — Amsterdam: North-Holland, 1978..

151. Silva G.N., Vinter R.B. Measure Differential Inclusions // J. of Mathematical Analysis and Applications. — 1996. — № 202. — P. 727 746..

152. Silva G.N., Litvinchev I.S., Rojas-Medar M., Brandao A.J.V. State constraints in optimal impulsive controls // Comput. and Math. Appl. — 2000. V. 19, № 2. — P. 179−206..

153. Silva G.N., Vinter R.B. Necessary optimality conditions for optimal impulsive control problem j/ SIAM J. Contr. and Optim. — 1997. — V. 35, № 6. P. 1829−1846..

154. Sussman H.J. On the gap between deterministic and stochastic ordinary differential equations // The Annals of Probability. — 1978. — V. 6, № 1. P. 19−41..

155. Sussmann H.J. A maximum principle for hybrid optimal control problems // Proc. of 38th IEEE Conf. on Decision and Control. — Phoenix, 1999..

156. Tang S., Cheke R.A. State-dependent impulsive models of integrated pest management (IPM) strategies and their dynamic consequences //J. Math. Biol. 2005. — V. 50, № 3. — P. 257−292..

157. Van der Shaft A.J., Schumacher H. An Introduction to Hybrid Dynamical Systems. — London: Springer-Verlag, 2000..

158. Verriest E., Delmotte F., Egerstedt M. Control of epidemics by vaccination // Proc. of the American Control Conf. — Portland, 2005. — P. 985−990..

159. Vinter R.B., Pereira F.M.L. A maximum principle for optimal processes with discontinuous trajectories / / SI AM J. Control and Optim. — 1988. № 26. — P. 205−229..

160. Warga J. Optimal control of differential and functional equations. — N.Y.: Academic Press, 1972..

161. Yunt K., Glocker Ch. Trajectory Optimization of Hybrid Mechanical Systems Using SUMT // IEEE Proc. of Advanced Motion Control. — Istanbul, 2006. P. 665−671..

162. Yunt K. Impulsive optimal control of hybrid finite-dimensional lagrangian systems: Ph.D. thesisETH. — Zurich, 2008..

Показать весь текст
Заполнить форму текущей работой