Помощь в написании студенческих работ
Антистрессовый сервис

Динамическое программирование. 
Оптимальное управление в технических системах

РефератПомощь в написанииУзнать стоимостьмоей работы

Тогда, в соответствии с принципом оптимальности, траектории на интервале должны начинаться из состояний, а (б), полученных в результате действия управления и и быть оптимальными относительно, а (б). Следовательно, по определению. Уравнение (2.34) носит название функционального уравнения динамического программирования и эффективно используется для построения вычислительных процедур. Для достаточно… Читать ещё >

Динамическое программирование. Оптимальное управление в технических системах (реферат, курсовая, диплом, контрольная)

Основу метода динамического программирования составляет сформулированный Р. Веллманом принцип оптимальности. Согласно этому принципу оптимальная стратегия обладает тем свойством, что каковы бы ни были начальное состояние и начальное решение, последующие решения должны быть оптимальными относительно состояния, полученного в результате первоначального решения.

Принцип оптимальности определяет не только свойства оптимальных траекторий, но и структуру метода их получения. Метод динамического программирования состоит в разделении общей задачи на последовательность более простых задач, в определении множества оптимальных решений для первой из них, формировании множества общих оптимальных решений для первой и второй задач, затем с помощью полученных решений — для третьей, второй и первой задач и т. д.

В зависимости от того, численный или аналитический подход используется для решения поставленной задачи оптимального управления, говорят о вычислительных процедурах динамического программирования или о решении уравнения Веллмана. Вычислительные процедуры используют функциональные уравнения динамического программирования. Рассмотрим аналитический подход к проблеме или непрерывный вариант метода динамического программирования.

Рассмотрим задачу минимизации критерия.

Динамическое программирование. Оптимальное управление в технических системах.

при ограничениях в виде уравнений связи, характеризующих динамику объекта управления, Динамическое программирование. Оптимальное управление в технических системах.

Для получения необходимых условий экстремума функционала (2.33) нужно иметь решение, справедливое для любых значений начальных условий и времени управления. Поэтому, считая а и нижний предел интегрирования С переменными при фиксированном tb введем функцию.

Динамическое программирование. Оптимальное управление в технических системах.

соответствующую минимуму (2.33). Интеграл времени [С, tj] разобьем на два интервала [С, С + б] и [С + 8, tj] и запишем.

Динамическое программирование. Оптимальное управление в технических системах.

Тогда, в соответствии с принципом оптимальности, траектории на интервале [С + б, tj] должны начинаться из состояний, а (б), полученных в результате действия управления и [С, С + б] и быть оптимальными относительно, а (б). Следовательно, по определению.

Динамическое программирование. Оптимальное управление в технических системах.

и последнее уравнение примет вид.

Динамическое программирование. Оптимальное управление в технических системах.

Уравнение (2.34) носит название функционального уравнения динамического программирования и эффективно используется для построения вычислительных процедур. Для достаточно малого интервала [С, С + б] справедливо приближенное выражение:

Динамическое программирование. Оптимальное управление в технических системах.

Тогда Динамическое программирование. Оптимальное управление в технических системах.

После разложения полученного выражения в ряд Тейлора относительно а, С по приращениям 8/(а, п (С)) и 8 получим.

Динамическое программирование. Оптимальное управление в технических системах.

С учетом этого выражения уравнение (2.34) примет вид.

Динамическое программирование. Оптимальное управление в технических системах.

Так как по определению оо (а, С) = min ш (а, С), a 8 — величина конечная, то обозначая и [С, С + 8] = и © = о и проводя простейшие преобразования, получаем уравнение Веллмана

Динамическое программирование. Оптимальное управление в технических системах.

или, поскольку в выражении (2.35) С не зависит от и,.

Динамическое программирование. Оптимальное управление в технических системах.

Уравнение (2.35) дает необходимые и достаточные условия экстремума. Оно эквивалентно двум уравнениям:

Динамическое программирование. Оптимальное управление в технических системах.

Уравнение (2.37) получено из (2.35) подстановкой в него оптимального решения, а уравнение (2.38) —дифференцированием по переменной и.

Связь динамического программирования с классическим вариационным исчислением и принципом максимума. Решим основную задачу классического вариационного исчисления, задачу Эйлера, используя уравнение Веллмана. Требуется найти минимум функционала.

Динамическое программирование. Оптимальное управление в технических системах.

при начальном условии x (t0) = х°. Сведем эту задачу к задаче минимизации (2.33). Обозначим и = х = /и подставим в уравнение (2.35), тогда.

Динамическое программирование. Оптимальное управление в технических системах.

Последнее эквивалентно, как и уравнение (2.35), двум уравнениям:

Динамическое программирование. Оптимальное управление в технических системах.

Вычислим частную производную (2.39) по х:

Динамическое программирование. Оптимальное управление в технических системах.

и полную производную (2.40) по С.

Динамическое программирование. Оптимальное управление в технических системах.

Раскрывая последнее слагаемое как.

Динамическое программирование. Оптимальное управление в технических системах.

после подстановки полученного результата в уравнение (2.43) и вычитания из уравнения (2.43) уравнения (2.42) получим уравнение Эйлера

Динамическое программирование. Оптимальное управление в технических системах.

Таким образом, можно рассматривать уравнение Эйлера как частный случай уравнения Веллмана. Кроме того, из уравнения Веллмана выводятся все другие уравнения и условия классического вариационного исчисления.

Рассмотрим процедуру получения условия Лежандра. Обозначим содержимое квадратных скобок в уравнение (2.39) в виде некоторой функции Ф (х), минимум которой необходимо отыскать,.

Динамическое программирование. Оптимальное управление в технических системах.

Для того чтобы функция Ф (х) обращалась в искомой точке в минимум, а не в максимум, ее вторая частная производная по х должна быть в этой точке не отрицательной. Дифференцируя Ф (х) дважды по х, получим Динамическое программирование. Оптимальное управление в технических системах.

Условие F& >0 и есть необходимое условие Лежандра.

Для установления связи динамического программирования с принципом максимума Понтрягина ограничимся одной из задач оптимального быстродействия. Пусть требуется перевести систему.

Динамическое программирование. Оптимальное управление в технических системах.

из состояния X;(t0) = хр в состояние x,(t1) = xp за наименьшее время. Разобьем интервал [t0, tx] на интервалы [t0, t] и [t, tj. Введем функцию.

Динамическое программирование. Оптимальное управление в технических системах.

Минимизация (tj — t0) соответствует максимизации со (х), поэтому функциональное уравнение динамического программирования будет иметь вид Динамическое программирование. Оптимальное управление в технических системах.

За время (t —10) система из состояния x (t0) перейдет в состояние x (t) — Так как интервал [t0, t] мал, воспользуемся разложением со (х (0) в ряд Тейлора в окрестности точки t0 по приращениям (t — t0)/,(x (t0), a (t0)), полученным из условия Тогда Динамическое программирование. Оптимальное управление в технических системах. Динамическое программирование. Оптимальное управление в технических системах.

и, подставляя сюда x,(t), получим.

Динамическое программирование. Оптимальное управление в технических системах.

Последнее условие выполняется вдоль оптимальной траектории для любого значения t0, поэтому заменим u[t0, t] на и и перепишем уравнение в виде.

Динамическое программирование. Оптимальное управление в технических системах.

или Динамическое программирование. Оптимальное управление в технических системах.

Сравним уравнение (2.44) с необходимым условием в форме прин;

5(0.

ципа максимума. Если — = ()/, и удовлетворяют уравнениям сопря;

дх,

женной системы, то связь уравнений Веллмана с принципом максимума установлена. Обозначим.

Динамическое программирование. Оптимальное управление в технических системах.

и вычислим.

Динамическое программирование. Оптимальное управление в технических системах.

Выполним преобразование.

Динамическое программирование. Оптимальное управление в технических системах.

Подставляя у, в уравнение (2.45), получим Динамическое программирование. Оптимальное управление в технических системах.

Уравнение (2.46) представляет собой уравнение импульсов в принципе максимума, a (f, [/) = Н (х, и, |/) является функцией Гамильтона. Таким образом, из уравнения Веллмана выведены необходимые условия принципа максимума.

Важно иметь в виду, что в отличие от принципа максимума при использовании уравнений Веллмана предполагается существование.

да> д2ы

частных производных —, ——, однако во многих практических зада;

дх дх2

чах это требование невыполнимо.

Уравнение Веллмана, таким образом, представляет собой нелинейное уравнение в частных производных. Оно имеет аналитическое решение лишь в самых простейших случаях. Наиболее удобным методом решения такого типа уравнений является метод характеристик. Однако этот метод сложен и трудоемок. Для приближенного решения можно в ряде случаев пользоваться методом неопределенных коэффициентов, аппроксимируя оо (х) = С0 + Срс + С^с2 + … и разрешая уравнения Веллмана относительно неизвестных значений Q.

Применимость этого метода ограничена возможностью аппроксимации со (х) полиномом. Лучше всего решать уравнение Веллмана с помощью компьютерных программ, используя функциональные уравнения, на основе которых строятся эффективные вычислительные процедуры динамического программирования.

Показать весь текст
Заполнить форму текущей работой