Программно-целевое планирование и управление предполагает использование системы самых разнообразных экономико-математических моделей, в том числе — формализованных в виде задач оптимального управления (Г.С.Поспелов, В. А. Йриков /I /, Г. С. Поспелов, В. Л. Вен, В. М. Солодов, В. В. Шафранский, А. Й. Эрлих /2 /). Процессу планирования и функционированию планируемых систем свойственна определенная инерция. Один из способов учета еевведение в математическую модель запаздывающих аргументов. Так, в экономике широко известны временные лаги, возникающие, в частности, при вводе мощностей Их принимают во внимание в процессе формирования программ отраслей производственной сферы /2, гл. У/. Другой важный класс задач с запаздываниями по времени возникает при реализации программ развития сложных технических систем в пятилетних планах. При этом динамика изменения количества изделий описывается уравнением / 2, стр. 122 /:
4. (D.
Здесь использованы следующие вектор-функции: WfeJ — количество изделий по номенклатуре элементов системы в году i является вектором фазовых переменныхRft) — закупаемые в году / изделия, которые играют роль управленийУЮ — вектор убыли изделий. При износе изделий, рассчитан х) Запаздывания, обусловленные продолжительностью строительства и связанные с ними линейные динамические задачи оптимального управления в функциональном пространстве, исследуются в / 8 /.
— s ных на срок безотказной службы г, они снимаются с эксплуатации. Это приводит к формализации вида: Ir/i). Afi-т).
Другими словами, в соотношении (I) присутствуют запаздывающие по времени управления.
Важной особенностью используемых при программно-целевом планировании и управлении математических моделей является их многомерность. Последнее обстоятельство связано с тем, что планируемые системы, как правило, состоят из большого числа элементов либо характеризуются значительным количеством параметровизмеряемых сотнями или даже тысячами / /.
Таким образом, при планировании развития сложных технических систем возникают оптимизационные динамические задачи, в которых, с одной стороны, велико число переменных, с другой стороны, эти переменные могут зависеть от запаздывающих по времени аргументов. Декомпозиция (разложение) подобных задач целесообразна с точки зрения более эффективного использования ресурсов ЭВМ и учета их специфики. Эта специфика, в частности, обусловлена блочной структурой задач, которая возникает ввиду иерархии. Важность процедур понижения размерности в реальных процессах планирования и управления подчеркивается в книге /.
Анализ подобных проблем программно-целевого планирования позволил выделить предмет исследования настоящей работы — двухуровневые многомерные задачи оптимального управления с запаздывающими аргументами (или с последействием). Следует отметить, что значение такого класса задач не ограничивается экономическими приложениями. Их исследование важно и для физики, техники, биологии, медицины. Соответствующие постановки могут быть основаны на тех, которые без предположения о блочности приводятся в книгах Х. Гурецкого / 9 /, В. Б. Колмановского, В. Р. Носова / ^ /, обзорах //.Г., Ша/ийад Я. /66/, 97?. Л/67/ Яе^оиг т. е., <�Жа/и&ид а. / и других работах.
В обширной библиографии по задачам с отклоняющимися аргументами крайне малая ее часть посвящена проблеме большой размерности. В ранних работах этого направления — до 60-х годов (см., например, А. Д. Мышкис / м /, А. М. Зверкин, Г. А, Каменский, С. Б. Норкин, Л. Э. Эльсгольц Н.Н.Красовский / м /) указанная проблема не изучалась (см. также А. Халанай //"$" /). Мощным аппаратом для исследования задач оптимального управления с запаздывающими аргументами явились необходимые условия оптимальности в форме принципа максимума Понтрягина / 76 / (системы с сосредоточенными параметрами и непрерывным временем — Г. Л.Ха-ратишвили /^^/j И. А. Ожиганова / ^ /, Р. Габасов, С. ВЛура-кова / /, Р. Габасов, Ф. М. Кириллова /, 77/.
СГ./60,70/ и др.- дискретные задачи — Фам Хыу Шак J и др.- системы с распределенными параметрами — Канте Кабине / ?4 /, Г. Л. Дегтярев, Т. К. Сиразетдинов I ?5 f % Т. С. Цуцунава /?6 /, С. С. Ахиев и др. /27 /). Обсуждение результатов опыта его применения можно найти в / zj-зо / р. Габасова, Ф. М. Кирилловой, / 5/ / Л. Э. Эльсгольца, С. Б. Норкина, /лг / Т. К. Сиразетдинова, статьях /65, 6 7−73 /. тем не менее, использование принципа максимума для получения численных решений некоторых задач оптимального управления с последействием приводило к двухточечным краевым задачам с опережающими и запаздывающими аргументами, которые, по мнению ряда авторов (Р.Беллман, К. Л. Кук /J5 /, tag MM., 4обиплл &./&/. /Z2/t Javavec W /73/ и др.)| чрезвычайно сложны. Альтернативные пути решения были предложены в /.
Большинство авторов рассматривали довольно частные постановки: например, ъ /6 7, 72 — ?б / - без ограничения на фазовые переменные. Чаще всего анализировались линейные дифференциально-разностные уравнения и квадратичные функционалы / 76−70 j, В нелинейных случаях, в основном, предлагались процедуры линеаризации / .
Однако, эффективность указанных методов резко падала при возрастании размерностей задач. Обратимся, например, к одному из наиболее распространенных приемов для решения задач оптимального управления с запаздываниями — методу редукции их к обычным /. В этом случае размерности вновь получаемых задач оказываются существенно выше, чем исходных. Поэтому для больших размерностей исходных задач указанный метод становится непригодным / 72, 73 /.
В 70-х годах начали появляться работы по задачам с отклоняющимися аргументами большой размерности. Разложение динамических систем с запаздываниями рассматривалось в /34, 76, j>4 д вычислительные алгоритмы для синтеза управления с обратной связью в многомерных системах с запаздывающими аргументами предлагались в /лг-л^ /. Отметим работу Ю. Е. Малашенко /, в которой для линейной дискретной задачи оптимального управления предлагалась декомпозиция по времени.(Постановка вопроса принадлежит Ю.П.Иванилову). Тем не менее, проблемы понижения размерности в задачах оптимального управления с запаздываниями все еще мало изученн.
Для решения многомерных задач в последнее время все шире используются различные декомпозиционные методыдостаточно полный их обзор приведен в монографии В. И. Цуркова / з /. Замечено, что вопросы понижения размерности для блочных задач оптимального управления исследованы в гораздо меньшей степени, чем для математического программирования / з /. Методов разложения двухуровневых задач оптимального управления с запаздываниями, тем более, не предлагалось.
Введение
же в математические модели запаздывающих аргументов может качественно изменить их свойства и поведение. Так, уже классическими являются примеры задержки сгорания топлива в камере жидкостного ракетного двигателя как причине неустойчивости горения /36 /, запаздывающая обратная связь является принципиальным звеном в системах автоматического регулирования (А.А.Красовский, Г. С. Поспелов В работе А. Н. Дюкалова и др. / при рассмотрении магистральных свойств оптимальных траекторий подчеркивается необходимость проведения дополнительных исследований в случае учета запаздываний. Поэтому «автоматический» перенос на задачи с последействием методов, ориентированных на обычные системы, недопустим. Таким образом, представляется актуальной разработка методов декомпозиции для задач с последействием.
Целью настоящей работы является обоснование возможности использования для решения блочно-сенарабельных задач оптимального управления со смешанными ограничениями и запаздывающими аргументами как в фазовых координатах, так и в управлениях универсального метода декомпозиции — путем введения агрегированных переменных, развитого В. И. Цурковым /. Исследуется также возможный подход к проблеме понижения размерности некоторого класса систем с запаздываниями, основанный на предложенном в /4 / методе редукции для линейно-квадратичных задач оптимального управления. Заметим, что схемы итеративного агрегирования, на которых базируется указанный метод, впервые применялись для специальных блочных задач линейного программирования В. Г. Медницким / 3J / и Й. А. Вателем, Ю. А. Флеровым j 39 /.
Метод декомпозиции путем введения агрегированных переменных, разработанный В. И. Дурковым /з-? /, основан на принципах двойственности для экстремальных задач. В настоящей работе также предполагаются выполненными условия, обеспечивающие справедливость теорем двойственности. Как и в /3−7 /, используется техника А.М.Тер-Крикорова сведения задач оптимального управления к задачам выпуклого программирования в банаховых пространствах /40, /" конкретизированная на случай запаздывающих аргументов. Следует заметить, что условия, гарантирующие выполнение соотношений двойственности для оптимизационных задач, могли бы быть взяты иными — принятыми, например, в работах Б.Ш.Мордухо-вича, А. М. Сасонкина f 4 г / для систем нейтрального типа или А. И. Дюкалова /43,44 / для обычных систем.
Везде далее предполагается управляемость всех рассматриваемых систем и существование оптимальных управлений. Соответствующие условия для запаздываний по состоянию можно найти в jfS, 4^ /, а для систем с запаздываниями и параболическими уравнениями — в / J6 /.
Содержательная часть настоящей работы состоит из трех глав и трех приложений.
В первой главе дается обоснование применения метода декомпозиции путем агрегирования переменных к решению блочно-сепарабельных задач оптимального управления с запаздываниями в фазовых координатах и управлениях. Рассматриваются задачи с непрерывным (§ I.I — 1.2) и дискретным (§ 1.3) временем. Исследование линейных (§ I.I) и выпуклых (§§ 1.2 — 1.3) задач проводится по традиционной для метода /з- / схеме. После введения агрегированных управлений как суммы переменных из разных блоков и фиксированных весов агрегирования решается координирующая задача Она получается в результате подстановки в исходную управляющих переменных, выраженных через макроуправления и веса агрегирования. Решив Л и сопряженную ей, формулируют и решают независимые блочные задачи. Функционалы последних формируются с помощью оптимальных значений двойственных переменных, соответствующих связывающим ограничениям агрегированной задачи. Из блочных и дезагрегированных решений выводится выражение для критерия оптимальности. Если значение этого выражения равно нулю, то дезагрегированное решение оптимально для исходной задачи (теоремы 1,3 §§ I.I — 1.3). В противном случае строятся новые веса агрегирования и осуществляется переход к следующей итерации. Если на верхнем уровне помимо решения пары сопряженных задач в агрегированных переменных проверяется критерий оптимальности и назначаются новые веса, а на нижнем — решаются независимые блочные задачи, то одна итерация метода декомпозиции представляется одним замкнутым циклом на рисунке I.
Блочные задачи.
Рис. I.
Сравним эту схему с соответствующей из работы М. Месаровича, Д. Мако, И. Такахары /стр.110/. Между ними имеется принципиальное отличие: в то время как в результате декомпозиции путем агрегирования решением исходной задачи оказывается дезагрегированное (верхнего уровня), стратегии координации в 14? J направлены на получение в качестве решений блочных. Существенно различна в этих подходах роль связывающих ограничений. Б j 4? f они подвергаются декомпозиции, при этом вводятся некие функции взаимодействия каждой подсистемы с остальными. В / 3-? / разложения связывающих ограничений не предпринимаются.
На протяжении всей первой главы настоящей работы сопряженные задачи выписываются с учетом результатов работ В теоремах 2, параграфов I. I — 1.3 устанавливается монотонность по функционалу итеративного процесса решения. При этом используются теоремы двойственности Куна-Таккера и теоремы о маргинальных значениях в параметрическом программировании. Их справедливость обеспечивается выполнением условий из работ А.М.Тер-Кри-корова / 40 / и Е. Г. Голынтейна Е.С.Левитина /. Поскольку результаты I 40 /по доказательству соотношений двойственности и справедливости принципа максимума Понтрягина в нормальной форме (без мер) относились к задачам оптимального управления со смешанными ограничениями без отклонений аргументов, в приложении I доказываются соответствующие теоремы для линейных и выпуклых задач в случав запаздываний. После необходимого теоретического обоснования применения метода декомпозиции для систем с запаздываниями (§§ I.I — 1.3) в заключительной части первой главы, § 1.4, конструкции и возможности подхода демонстрируются за ряде примеров. Первый из них интересен тем, что допускает аналитическое исследование всех построений метода разложения. Второй пример можно рассматривать как системную постановку оптимизации процессов в химико-технологических объектах из /SO /. В уравнения состояния как фазовые, так и управляющие переменные входят с запаздываниями по времени. Последний пример обладает некоторой спецификой, позволяющей свести его к решению последовательности систем линейных алгебраических уравнений с помощью конструкций из / 4 /. В § 1.4 исследуется эффективность применения методов редукции или агрегирования переменных в зависимости от значений параметров задачи (числа подсистем и количества значений запаздываний). Результаты сравниваются с соответствующими у В. И. Цуркова для систем без запаздываний. Устанавливается, что введение запаздывающих аргументов усложняет задачи настолько, что обойтись без их декомпозиции не представляется возможным.
Вторая глава посвящена исследованию разложения в управлении системами с распределенными параметрами и запаздываниями на примере систем, описываемых уравнениями в частных производных параболического типа. В § 2.1 метод декомпозиции применяется к задачам с распределенными управлениями типа рассмотренных '/laSaSa^n, Jeo в / ?0,00 / для одномерных систем. Решения начально-краевых блочных задач понимаются в слабом смысле /fi /. Известны начальные значения управлений и фазовых переменныхграничные условия — нулевые. Функционал представляет собой сумму интегралов для подсистем по пространственным областям при фиксированном конечном времени. Выводится критерий оптимальности дезагрегированного управления. Доказательство монотонной сходимости по функционалу итеративного процесса решения завершает § 2.1.
Многомерная задача оптимального управления с запаздываниями для систем с частными производными параболического типа и граничными управлениями исследуется в § 2.2. Она возникает при рассмотрении процесса нагрева J пластинок системой нагревателей в условиях ограниченных общих ресурсов на нагревание. Соответствующую модель для J = I можно найти в книге А. Г. Бутковского /. Там указывается на задержку при передаче тепла, обусловленную скоростью теплопереноса. В силу этого в модель процесса граничное управление входит с запаздывающим аргументом. Аналогичная блочная задача, но без отклонений, исследовалась В. И. Цурковым в /<�з-5 /. при условии одинаковых физических свойств пластин удалось провести редукцию исходной системы к системам меньших размерностей, причем в отличие от итеративной декомпозиции на основе агрегирования удается сведение к системам линейных алгебраических уравнений небольшой размерности. В § 2.2 устанавливается, что указанный подход применим и для систем с запаздываниями.
В третьей главе настоящей работы рассматриваются два конкретных примера использования метода декомпозиции путем агрегирования к оптимальному управлению линейными системами с запаздывающими управлениями и квадратичными функционалами, содержащими: интегральные (§ 3.1) и терминальные (§ 3.2) по фазовым переменным слагаемые. Следует отметить, что вторая задача возникает при аппроксимации конечным числом членов ряда Фурье решения задачи о нагреве систем пластинок с запаздывающим граничным управлением, как это предложено в книге А. И. Егорова /"$" «* / в отсутствии запаздываний. Проведение построений метода декомпозиции и подробное исследование аналитического вида получаемых промежуточных задач — агрегированной и блочных — положены в основу алгоритмов и реализующих их АЛГОЛ-программ.
Обсуждаются результаты численных экспериментов на ЭВМ БЭСМ-6 с транслятором АЛГОЛ-Дубна, в том числе — влияние на конечный результат исходных весов агрегирования. В § 3.1 выясняется, что непосредственное использование принципа максимума приводит к двухточечной краевой задаче с опережающими и запаздывающими аргументами, решение которой соряжено со значительными шрудностями. Задача же из § 3.2 сводится, если отказаться от ее декомпозиции, к системе линейных алгебраических уравнений большой размерности. Для рассматриваемых конкретных значений параметров решение последней в реальном времени невозможно ввиду ограниченной оперативной памяти ЭВМ. Блок-схемы программ приводятся: для § 3.1 — в приложении 2, для задачи из § 3.2 — в приложении 3.
Основные итоги работы подведены в заключении.
— У5.
Результаты настоящей работы докладывались и обсуждались на ХХУП, XXУШ научных конференциях МФТИ (Долгопрудный, 198I, 1982), совещании «Теория и практика использования методов агрегирования в планирований и управлении» (Казань, 1982 г.)" семинаре лаборатории организации и проектирования больших систем ВЦ АН СССР. Основные результаты диссертации опубликованы в статьях I 46 I.
Выражаю глубокую благодарность за научное руководство доктору физико-математических наук В. И. Дуркову и члену-корреспонденту АН СССР Г. С. Поспелову за постоянное внимание к работе.
Основные результаты настоящей работы следующие:
1. Доказана возможность применения итеративного метода декомпозиции на основании агрегирования переменных из разных блоков к блочно-сепарабельным задачам оптимального управления с запаздывающими аргументами в фазовых и управляющих переменных. При этом рассмотрены линейные и выпуклые задачи с непрерывным и дискретнцм временем, а также — системы с распределенными параметрами, описываемые уравнениями в частных производных параболического типа.
2. При обосновании метода разложения установлен критерий оптимальности промежуточных дезагрегированных решений, доказана локальная монотонность по функционалу итеративного процесса в простом и вырожденном случаях, из которой выводится сходимость итеративного процесса.
3. Для линейных систем, описываемых дифференциально-разностными уравнениями и квадратичными по фазовым переменным терминальными слагаемыми в функционале окончательное решение сводится к системам линейных алгебраических уравнений больших порядков. Установлена специфика этих систем и осуществлено сведение их к решению систем алгебраических уравнений небольших размерностей.
4. Рассмотрены иерархические задачи оптимального управления с распределенными параметрами и подсистемами, описываемыми параболическими уравнениями. Последние являются моделями оптимального нагрева тел, в которых учитывается инерция в передаче тепла. В зависимости от значений параметров исследована эффективность методов ее решения — либо с помощью итеративной декомпозиции, либо на основании методики понижения размерности в линейных системах алгебраических уравнений.
5. Обоснована эффективность использования метода декомпозиции путем агрегирования переменных для блочно-сепарабельных задач оптимального управления с запаздывающими аргументами.
6. На основании итеративного метода декомпозиции для задач оптимального управления с запаздываниями разработаны алгоритмы, которые реализованы в виде программ для ЭВМ. Их эффективность подтверждена конкретными примерами.
В настоящей работе исследовалась декомпозиция блочных задач оптимального управления с постоянными запаздываниями по времени. Полученные результаты могут быть обобщены и на случай распределенных или переменных / €s / запаздываний.
Подчеркнем также, что использование метода декомпозиции путем агрегирования управлений предполагается в сочетании с известными методами решения задач оптимального управления с запаздывающими аргументами. Эффективность этих методов только возрастет, если применять их не непосредственно к многомерным исходным задачам, а к более простым промежуточным (блочным или в агрегированных переменных).
ЗАКЛЮЧЕНИЕ
.