Помощь в написании студенческих работ
Антистрессовый сервис

Методы улучшения в задаче оптимального управления на сети операторов

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Развитие методов, основанных на принципе расширения, началось с теоремы В.Ф. Кро-това, указывающей достаточные условия оптимальности. В этих условиях присутствует функция, получившая название функции Кротова (Кротова-Беллмана), которая определяется иеединствеиньш способом, что дает возможность создавать различные алгори тмы для решения задач оптимального управления. Первые такие алгоритмы описаны… Читать ещё >

Методы улучшения в задаче оптимального управления на сети операторов (реферат, курсовая, диплом, контрольная)

Содержание

  • 1. Многоэтапные процессы
    • 1. 1. Постановка задачи и достаточные условия оптимальности
    • 1. 2. Методы слабого улучшения
      • 1. 2. 1. Вывод алгоритмов
      • 1. 2. 2. Свойства алгоритмов
    • 1. 3. Методы енлыюго улучшения
      • 1. 3. 1. Вывод алгоритмов
      • 1. 3. 2. Свойства алгоритмов
    • 1. 4. Задача идентификации по серии экспериментов
  • 2. Оптимизация на сети операторов
    • 2. 1. Постановка задачи
    • 2. 2. Методы слабого улучшения
      • 2. 2. 1. Вывод алгоритмов
      • 2. 2. 2. Свойства алгоритмов
    • 2. 3. Методы сильного улучшения
      • 2. 3. 1. Вывод алгоритмов
      • 2. 3. 2. Свойства алгоритмов
  • 3. Программно-алгоритмическое обеспечение, тестовые примеры и задачи
    • 3. 1. Описание программного комплекса, но идентификации
    • 3. 2. Примеры и задачи. G
      • 3. 2. 1. Модельные примеры. G
      • 3. 2. 2. Задача идентификации коэффициентов по серии испытании в модели движения вертолета
      • 3. 2. 3. Задача нормирования сбросов загрязняющих веществ

В настоящее время существует немало алгоритмов, предназначенных для решении задач оптимального управления. Бурное развитие с середины шестидесятых годов прошлого столетия этого раздела математики связано с требованиями практической деятельности людей. Многие процессы, имеющие место в технических системах, и экономике, в управлении деятельностью человеческого сообщества, моделируются учеными как задачи оптимального управления.

Основополагающими результатами теории оптимального управления являются: принцип максимума Л. С. Понтрягина, метод динамического программирования Р. Беллмапа, достаточные условия оптимальности В. Ф. Кротова. На основе этих классических результатов созданы различные методы последовательных улучшений первого и второго порядка. Наиболее изученными оказались такие классы задач оптимального управления как линейные, билинейные, квадратичные задачи. Свойства перечисленных классов задач позволяют упростить многие операции, необходимые для поиска решения, что приводит к созданию эффективных алгоритмов улучшения. Сложнее обстоит дело, когда надо решать задачу оптимального управления нелинейной системой, характер нелинейности которой не известен заранее.

Алгоритмы последовательных улучшений, разработанные в предположении, что система и функционал имеют общин вид, как правило, содержат параметры, роль которых — регуляторы шага, обеспечивающие эффективное решение задачи улучшения. В результате, эффективность такого алгоритма в той пли иной степени (иногда в очень большой) зависит от выбора значений параметров. В то же время вопрос выбора наилучших значении параметров либо сводится к решению одномерной задачи минимизации (если она не трудоемка, то решение вопроса закрыто), либо часто не рассматривается, считается достаточным указать только область допустимых значений. Поэтому при практическом решении задачи оптимального управления достаточно хорошие значения параметров алгорнтма обычно находятся методом «проб и ошибок», отнимая у пользователя много вре.

Л1СШГ.

Таким образом, актуальной является проблема управления параметрами алгоритма, и частности, проблема автоматизации поиска наилучших значений параметров на каждой итерации.

Краткий обзор. Разнообразие задач оптимального управления, возникающих в практической деятельности людей, и различимо подходы к их решению обусловили создание разных групп методов (алгоритмов, вычислительных процедур). Одни из таких подходов заключается в распространении на задачи оптимального управления методов, основанных на необходимых условиях оптимальности.

Большую группу составляют методы градиентного типа |Брайсои, Хо Ю-Ши, 1972; Васильев О. В., 1994; Васильев О. В., Лргучинцев, 1999; Колли, 19G5- Кротов, Гурман, 1973; Поляк, 1974; Сеа, 1973; Федоренко, 1978; Шатровский, 1902; Энеев, 19CGJ. При наличии ограничений на управление и фазовые переменные в градиентных методах первого порядка возникают трудности, которые преодолеваются путем модификации алгоритмов. Некоторые модификации связаны с методом штрафных функций [Гермейер, 1971], друг ие — это методы спуска в пространстве управлений, представляющие собой аналоги методов конечномерной оптимизации: условного градиента, проекции градиента [Демьянов, Рубинов, 19G8- Федоренко, 1975], возможных направлений [Зойтендейк, 19G3- Гюрджиев, 1980|- сопряженных градиентов [Брайсоп, Хо Ю-Ши, 1972; Федоренко, 1978].

В отдельную группу можно выделить методы, основанные на применении разнообразных алгоритмов нелинейного программирования к конечномерным представлениям задач оптимального управления [Евтушенко, 1982; Моисеев, 1975; Мордухович, 1980; Пшеничный, Данилин, 1975].

Еще одну группу составляют метод вариаций в фазовом пространстве [Васильев Ф.П., 1980; Моисеев, 19G4, I960, 1975; Федор емко, 1978] и его разновидности: метод локальных вариаций |Крылов, Черноусько, 19GGЧерноусько, Баничук, 1973] и метод блуждающей трубки |Моисеев, 19в6].

Открытый Л. С. Понтрягиным принцип максимума широко используется для построении вычислительных методов решения задач оптимального управления [Аргучпнцеп, Васильев О. В., 199GВасильев О.В., 1991; Васильев О. В., Бельгюков, Терлецкип, 1991; Васильев О. В., Надежкпна, 199GВасильев О.В., Срочко В. А., Терлецкий, 1990; Васильев.

О.В., Тятюшкнн, 1981,1983; Васильсн Ф. П., 1980, 1981; Любушип, Черноуоько, 1983; .Моисеев, 1975; Срочко, 1989; Федореико, 1978; Чериоусько, Колмаиовскнй, 1977]. Эти работы наиболее полное отражение нашли в монограмме В. А. Срочко |Срочко, 2000]. Простейший алгоритм предложен к работе |Крылов, Чериоусько, 19G2J, он предусматривает последовательное интегрирование исходной и сопряженной систем и выбор управления ни условия максимума функции Понтряпша. Метод далеко не всегда сходится, однако известны его модификации, обладающие релаксационностыо и сходимостью [Крылов, Чериоусько, 1972; Любушип, 1979, 1982; Цирлин, Балакирев, Дудников, 197G|.

Для линейных и выпуклых: задач оптимального управления принцип максимума JI.С. Поптрягина является не только необходимым, по и достаточным условием оптимальности. Шитому во всех случаях, когда управляемые процессы можно с достаточной степенью точности моделировать (аппроксимировать) линейными уравнениями, целесообразно применять методы, ориентированные на решение задач оптимального управления для линейных систем [Габасов, Кириллова, 1973, 1981, 1983; Еремин, Астафьев, 197GОптимальное управление ., 1993) и методы линеаризации [Федореико, 1978].

В работах [Аэродинамика, 1968; Jacobson, 19G8J предложены методы, основанные на разложении до второго порядка включительно функции Беллмапа и левой части уравнения Беллмана. Для обеспечения близости соседних приближений предлагается применять процедуру не на всем отрезке [fo, U], а на последней его части [г, ti], при этом г выступает в алгоритме как регулятор.

Развитие методов, основанных на принципе расширения, началось с теоремы В.Ф. Кро-това, указывающей достаточные условия оптимальности. В этих условиях присутствует функция, получившая название функции Кротова (Кротова-Беллмана), которая определяется иеединствеиньш способом, что дает возможность создавать различные алгори тмы для решения задач оптимального управления. Первые такие алгоритмы описаны в работах |Кротов, 19G2−19G5, 1975; Кротов, Букреев, Гурман, 19G9- Кротов, Гурман, 1973]. В трудах В.II. Гурмана метод Кротова получил дальнейшее развитие и название «принципа расширения». В работах [Кротов, Фельдман, 1978, 1983] представлен алгоритм последовательных улучшений управления, основанный на достаточных условиях оптимальности. На каждой итерации этого алгоритма выполняется интегрирование сопряженной и линейной матричной систем н замыкание исходной системы синтезирующим управлением с липейно-квадратической аппроксимацией функции Кротова.

Следует отметить работы А. И. Москаленко по теоремам сравнения и динамических системах, которые дали толчок для разработки методов решения задач оптимального управления распределенным" системами |Москаленко, 1983].

В.И. Гурманом и его учениками были созданы алгоритмы последовательных улучшений первого и второго порядка [Батурин, Урбановпч, 1997; Гурман, 1997; Гурман, Батурин, Расина, 1983; Гурман, Расина, 1979; Новые методы ., 1987|, в которых используется тейлоровское представление с точностью до первого или второго порядка функции Кротона в окрестности текущего приближения. При этом может оказаться, что траектория следующего приближения удаляется от текущей в область, где липейно-квадратическое приближение функции Кротона «не работает», так что улучшение происходить не будет. Для преодоления этой трудности в алгоритмах применены специальные регуляторы близости: в |Гурмаи, Батурин, Расина, 1983] - а-1дитивный квадратичеекий функционал с регулируемым весом, в [Батурин, Урбановпч, 1997] строится вспомогательный функционал, состоящий из суммы исходного п квадратнческого функционалов, умноженных на весовые коэффициенты. Если требование близости накладывается на обе компоненты процесса — состояние и управление, то такой алгоритм называют алгоритмом слабого улучшения, если требование близости накладывается только на компоненту состояния, то это алгоритм сильного улучшения. Для алгоритмов сильного и слабого улучшения второго порядка доказаны свойства релаксацноппости и сходимости |Батурии, Урбановпч, 1997), они улучшают любую не оптимальную в локальном смысле программу управления, в том числе и экстремаль Поптрягина.

Среди методов, основанных па принципе расширения, можно выделить в отдельную группу методы, которые основаны на локальных аппроксимациях множества достижимости управляемой дифференциальной системы [Батурин, Гончарова, 1999; Гончарова, Гуркало, 2004; Гурман, Батурин, 1985; Гурман, Константинов, 1981; Константинов, 1983].

При практическом решении задач оптимального управления с помощью наиболее распространенных методов (принципа максимума Поп трягина, принципа оптимальности Белл-мана и модификаций классических методов) исследователи столкнулись с различными трудностями: отсутствие искомого оптимального режима в классе сравниваемых, множественность решений, отвечающих необходимым условиям, неприменимость известных достаточных условий. Задачи, в которых встречались подобные трудности, были выделены и отдельный класс задач оптимального управления, получивший название «вырожденные задачи». На основе принципа расширения создано немало эффективных методов для решения вырожденных задач оптимального управления (Гурман, 19G7, 1977; Гурман, Батурин, 1980, 1981; Гурман, Расина, 1979; Дыхта, 1991, 1991; Дыхта, Деренко, 199 iДыхта, Самсошок, 2000; Казаков, Кротов, 1987; Колоколышкова, 1992; Baturin, Vcrkliozina, 2003).

В алгоритмах сильного и слабого улучшения второго порядка, изложенных в работе |Батурин, Урбаиоиич, 1997], на каждой итерации необходимо интегрировать векторно-матричиую систему дифференциальных уравнений, зависящую от параметров, которые как раз и выполняют роль регуляторов близости (шага). Значения этих параметров задаются в самом начале работы алгоритма и определяют глубину улучшении функционала, а следовательно, и ход всего итерационного процесса. Изменение параметра влечет за собой переинтегрирование вспомогательной системы, а это самый трудоемкий процесс в этапах алгоритма. Удачный выбор значений параметров может существенно повысить эффективность работы всего алгоритма. Исследование проблемы поиска наилучших значений параметров алгоритма потребовало рассмотрения особого класса задач оптимального управления — задач оптимального управления с параметром. Схемы (алгоритмы) решения этих задач методами второго порядка предложены в [Батурин, Урбанович, 1997].

Многоэтапные процессы и более сложные описания объектов такие, как сети операторов, достаточно часто встречаются на практике. Например, химические технологии, управление качеством воды в бассейне реки, литейное производство, процессы роста растений. Управление такими процессами может быть как точечным, так и распределенным, но независимой переменной (по времени пли расстоянию), поэтому задачи управления и, в частности, оптимального управления важны при исследовании такого рода объектов.

Первые исследования многоэтапных процессов проводились в работах [Гурман, Орлов, 1973; Орлов, Расина, 19G9- Габелко, 1974]. Для обслуживания перехода между этапами здесь дополнительно вводилась дискретная функция Кротона.

Задача построения управления для нелинейных гибридных систем рассматривается в работах |Toiiilin, Lygeros, Sastry, 1998, 2000).

В работе [Гайшун, 2005] рассматриваются многошаговый процесс, динамика которого на каждом шаге описывается системой линейных дифференциальных уравнений. Показано, что ряд свойств всего процесса полностью определяется аналогичными свойствами каждого звена.

Цель работы — создать алгоритмы сильного и слабого улучшения черного и второго порядков для решения задачи оптимального’управления па сети операторов, рассмотреть задачу управления многоэтапным процессом как частный случай задачи оптимального управления па сети операторов и исследовать полученные новые алгоритмы на предмет их релаксациопности и сходимости.

Объект исследования — задача оптимального управления и алгоритмы последовательных улучшений для ее решения.

Структура работы. Работа состоит из трех глав, введения, заключения и списка литературы.

Первая глава посвящена исследованию задач управления для объектов с многоэтапной структурой. Здесь сформулированы и доказаны достаточные условия оптимальности типа Кротона, построены методы сильного и слабого улучшения 1 и 2 порядке"!, для методов 2 порядка доказаны свойства релаксациопности и сходимости, здесь же рассматривается задача параметрической идентификации по серии экспериментов, которую можно интерпретировать как многоэтапный процесс и для нее, соответственно, адаптируются предлагаемые методы.

Во второй главе рассматривается более общая задача: задача оптимального управления на сети операторов. Для данной постановки также сформулированы и доказаны достаточные условия оптимальности, построены методы сильного и слабого улучшения ] и 2 порядков, исследованы их свойства.

В третьей главе приводится описание комплекса программ, но идентификации. На серии тестовых задач проводятся вычислительные эксперименты. Также здесь приведены результаты решения практической задачи идентификации коэффициентов модели движения вертолета по серии экспериментов.

В заключении излагаются основные результаты диссертации.

Научная новизна. Все результаты, полученные в работе автором, являются новыми. К ним о тносятся новые алгоритмы, исследование их свойств, решение тестовых примеров.

Практическая ценность. Разработанные алгоритмы могут использоваться при решении различных прикладных задач (технических, экономических, природио-экопомичес-кнх и др.). Работоспособность и эффективность этих алгоритмов подтверждена рядом тестовых примеров.

Аппробация работы. Основные результаты работы докладывались и обсуждались на школе-семинаре молодых ученых «Математическое моделирование и информационные технологии: состояние и нерснектива» (Аршаи, 2001), па конференциях ПДСТУ СО РАН «Ляпуновские чтепия» (Пркутск, 2002, 2003), на Всероссийской конференции «Ппфоком-муиикациоиные и вычислительные технологии и системы» (г. Улан-Удэ — Байкал, 2003), па Всероссийской конференции «Математика, информатика, уиравление» (Пркутск, 2004), на Байкальской всероссийской конференции «Информационные и математические технологии» (Иркутск, 2001), на Международной конференции «ENTVIROMIS'2001» (Томск, 2001), на Меж-1ународной конференции «Вычислительные и информационные технологии в науке, технике и образовании» (Алматы, 2004), на XIII Байкальской международной школе-семинаре «Методы оптимизации и их приложения», (Иркутск, 2005), на Всероссийской с международным участием конференции «Информационные и математические технологии в науке, технике и образовании» (Северобайкальск, 2005), па VI Всероссийской конференции молодых ученых «Математическое моделирование и информационные технологии (Кемерово, 2005), па Международной конференции «Вычислительные и информационные технологии в науке, технике и образовании» (Павлодар, 200G).

Основное содержание диссертации опубликовано в работах [5−9,13,27,02−05].

Заключение

.

Б диссертационном работе получены следующие результаты:

1. Доказаны теоремы о достаточных условиях оптимальности для задач оптимального управления многоэтапными процессами и па сети операторов.

2. Дня многоэтапных процессов получены методы сильного и слабого улучшения второго иорядка. Исследовапы свойства релаксационности и сходимости.

3. Поставлена задача оптимального управления на сети операторов, выведены алгоритмы последовательных улучшений второго порядка. Исследованы свойства улучшаемое&tradeп сходимости.

1. Модифицирован комплекс программ, но параметрической идентификации «ПСИ» в версии удаленного доступа.

5. Решена задача параметрической идентификации модели вертолета Ка-32 маневра типа «горка» .

G. Для бассейна р. Селенга на математической модели качества воды решена задача нормирования сбросов загрязняющих веществ.

Показать весь текст

Список литературы

  1. В.А. Приближенные методы оптимального управления, основанные па принципе расширения / В. А. Батурин, Д. Е. Урбапович. Новосибирск: Наука. Спб. Предприятие РАН. 1997. — 175 с.
  2. В.А. Многоэтапные процессы и методы улучшения в задачах оптимального управления/ В. А. Батурин, А. А. Лемперт // Вычислительные технологии. 2003. — Т.8. — С. 103−108.
  3. В.А. Метод сильного улучшения в задачах оптимального управления многоэтапными процессами / В. А. Батурин, А. А. Лемперт // Труды XIII Байкальскоймеждународной школы-семниара «Методы оптимизации и их приложения Иркутск, 2005.-т. 2, С. 105−110.
  4. О.В. Методы оптимизации и их приложения. Ч. 2. Оптимальное управление / О. В. Васильев, В. А. Срочко, В. А. Терлецкий — отв. ред. докт. физ.-мат. паук А.II. Меренков. Новосибирск: Наука. Сиб. отд-иис, 1990. — 151 с.
  5. О.В. Об одном методе решения задач оптимального управления, основанном па принципе максимума / О. В. Васильев, А. И. Тятюшкип // Жури, вычисл. математики и мат. физики. 1981. — т. 21, G. — С. 137G-1384.
  6. Ф.П. Численные методы решения экстремальных задач / Ф. П. Васильев. -М.: Наука, 1980. 520 с.22j Васильев Ф. П. Методы решения экстремальных задач / Ф. П. Васильев. М.: Наука, 1981. — 400 с.
  7. И.В. Исследование некоторых задач математической теории систем для многошаговых процесов / II.В. Гайшун // Теория систем и общая теория управления. -2005. ."2. — С. 5−9.
  8. А.С. Разработка вычислительного сервера на основе комплекса программ по параметрической идентификации / А. С. Гачеико, А. А. Лемнерт, Д. Е. Урбапович //
  9. В.II. Метод кратных максимумов и условия относительной оптимальности вырожденных режимов // Автоматика и телемеханика. 19G7. — Л'8 11. — С. 38−45.
  10. В.II. Вырожденные задачи оптимального управления / В.II. Гурман. М.: Наука, 1977. — 304 с.32| Гурман В.II. Принцип расширения в задачах управления / В. И. Гурман. М.: Наука, 1997. — 288 с.
  11. В.И. О практических приложениях достаточных условии сильного относительного минимума / В. И. Гурман, II.В. Расина // Автоматика и телемеханика. -1979. № 10. — С. 12−18.
  12. В.Г. Метод возможных направлений для решения задачи оптимального управления с фазовыми ограничениями / В. Г. Гюрджиев. М., 1980. — 13 с. — Дсп. в ВИНИТИ 18.09.1980, Л» 4099−80 Деп.
  13. В.А. Вариационный принцип максимума и квадратичные условия оптимальности импульсных и особых режимов // Снб. матем. жури. 1991. — Т. 35, 1. — С. 70−82.
  14. II.II. Введение в теорию линейного и выпуклого программирования / II.II. Еремин, Н. Н. Астафьев. М.: Наука, 197G. — 191с.47| Зойтепденк Г. Методы возможных направлений / Г. Зойгендейк. М.: Пзд-во иностр. лит., 1903. — 170 с.
  15. Г. А. Исследование обобщенных решений задач оптимального управления с линейными неограниченными управлениями па основе кратных преобразований // Дифференциальные уравнения. 1992. — Т. 28, № 11. — С. 1919−1932.
  16. Г. Н. Нормирование воздействий на динамические системы / Г. Н. Константинов. Иркутск: Пзд-во Иркуг. ун-та, 1983. — 187 с.
  17. В.Ф. Вычислительные алгоритмы решения и оптимизации управляемых систем уравнений : (I, II) // Техн. кибернетика. 1975. 5. — С.3−15- № G.- С. 3−13.
  18. В.Ф. Новые методы вариационного исчисления в динамике полета / В. Ф. Кротов, В. З. Букреев, В. И. Гурман. М.: Машиностроение, 19G9. — 288 с.
  19. В.Ф. Методы и задачи оптимального управления / В. Ф. Кротов, В.II. Гурман.- М.: Наука, 1973. 448 с.
  20. В.Ф. Итерационный метод решения экстремальных задач / В. Ф. Кротов, И.II. Фельдман // Моделирование технико-экономических процессов. М.: МЭСИ, 1978.- С. 54-G5.
  21. А.А. Оптимизация сбросов загрязняющих веществ в бассейн реки при экологических ограничениях /А.А. Лемиерт, Д. Е. Урбапович // География и природные ресурсы. 2004. — специальный выпуск — с. 212−215.
  22. G8| Любупшп А. А. Метод последовательных приближений для расчета оптимального управления / А. А. Любупшп, Ф. Л. Черноусько ,// Изв. АН СССР. Техн. кибернетика. 1983. — 2. — С. 147−159.
  23. .М. Численные методы в экстремальных задачах / Б. М. Пшеничный, IO.M. Данилин. М.: Наука, 1975. — 320 с.
  24. Ф.Л. Вычислительные и приближенные методы оптимального управления / Ф. Л. Чериоусько. В. Б. Колмаповскнй // Математический анализ. Итоги науки и техники. 1977. — Т. 14. — С. 101−100.
Заполнить форму текущей работой