Диссертационная работа посвящена разработке оптимизационного подхода к решению задач проекгирования ускоряющих структур на основе накопленной информации об ускоряющих структурах с использованием распределенных вычислений на высокопроизводительном комплексе.
Задачи расчета и оптимизации динамики заряженных частиц рассматриваются особой областью физики, называемой физикой ускорителей или', на более общем уровне, физикой пучков [74,98,123,124,142]. В настоящее время ускорители заряженных частиц находят широкое применение, как при проведении фундаментальных исследований, в том числе для исследования фундаментальных свойств материи, так и для решения практических задач, например в различных технологических процессах, медицине, таможенном деле и т. д. [123]. Широкое применение получили линейные ускорители, использующие резонансные принципы ускорения, в частности, ускорители с трубками дрейфа, ускорители на бегущей волне, ускорители с пространственно-однородной квадруполь-ной фокусировкой (ПОКФ) [14,35,40]. Линейные ускорители часто используются в качестве инжекторов для ускорителей на большие энергии. Проектирование ускорителей невозможно без компьютерного моделирования и оптимизации динамики пучков заряженных частиц в электромагнитных полях. Этим вопросам посвящено большое количество работ [43,45,46,48,72,78,81,98]. Прежде всего, следует отметить работы Д. А. Овсянникова, С. Н. Андрианов, Ю. А. Свистунова, А. П. Дуркина, Б. И. Бондарева, А. Д. Овсянникова, В. П. Ильина, И. М. Капчинско-го, В. В. Владимирского, А. С. Рошаля, Э. С. Масунова, А. С. Чихачева, В. А. Тепляков, Н. С. Едаменко, С. М. Полозова, О. И. Дривотина [6,8,29, 52−54,58,59,72,73,76,82,82−86,88,90,98,100,108,109,114,119,140−144]. Математические результаты, полученные в работах этих и других авторов, составляют фундамент разнообразных методов, моделей и алгоритмов, применяемых при моделировании и оптимизации динамики пучков заряженных частиц в ускорителях.
Для создания ускоряющих структур, удовлетворяющих заданным конструктивным ограничениям и обладающих требуемыми характеристиками, необходимо проведение оптимизации динамики пучка заряженных частиц с использованием компьютерной модели проектируемой ускоряющей структуры. Конструктивные и физические параметры определяющие искомую структуру (управления) в дальнейшем будем называть допустимым управлением.
Проблемам оптимизации посвящено много работ различных авторов. Выделим, прежде всего, работы В. И. Зубова, Р. Калмана, Н. Н. Кра-совского, А. М. Летова, Л. С. Понтрягина [51,67,95]. Непосредственно к задачам управления пучками заряженных частиц в ускоряющих и фокусирующих структурах, эта тематика интенсивно разрабатывается в работах Д. А. Овсянникова, А. Д. Овсянникова, О. И. Дривотина, Е. Д. Котиной, И. Д. Рубцовой и др.
При проектировании ускорителей обычно ставится задача поиска конструктивных и физических параметров структуры (управлений), а также параметров входного пучка таких, чтобы параметры структуры и характеристики выходного пучка удовлетворяли требуемым ограничениям. Это достигается путем формулирования и решения оптимизационной задачи минимизации некоторого функционала. Обычно в физике пучков в качестве такого функционала рассматривается взвешенная сумма функционалов, учитывающих ограничения некоторым способом, например, методом штрафных функций.
Для минимизации функционалов применяются различные методы оптимизации, как численные, так и аналитические. Так. аналитические методы оптимизации в задачах управления пучками заряженных частиц предложены в работах Д. А. Овсянникова [85,86,88,90]. Эти методы позволяют эффективно решать задачи оптимизации динамики заряженных пучков в ускоряющих структурах. Однако, при практическом решении задач оптимизации, возникает ряд сложностей: построение минимизируемого функционала, в том числе выбор весовых константсуществование локальных минимумов, плато, оврагов приводит к остановке алгоритма в неудовлетворительной точкевыбор начального управления представляет собой сложную подзадачу, возникающую при организации оптимизационного алгоритма, так как от управления зависит длительность процесса поискабольшое число параметров при использовании многопараметрических методов во многих случаях делает практически невозможным процесс оптимизации с помощью численных методов оптимизации, не использующих аналитическое представление вариации функционала. Существует достаточно много разнообразных направленных методов, различных по скорое ги и точности, гарантирующих нахождение локального минимума с заданной точностью. Задача поиска глобального минимума в общем виде пока не решена. На данный момент существуют лишь методы, которые так или иначе пытаются обойти данную проблему. Не существует общей методики выбора минимизируемых функционалов и весовых коэффициентов, а также выбора начального управления. Подбор связки функционалов и начальных управлений решается на основе эвристических соображений и детального анализа предметной области. Также, зачастую, в качестве начального управления выбираются функции определенного вида или осуществляется случайный поиск.
На практике для учёта особенностей задач, требуется строить алгоритмы, имеющие большую вычислительную сложность, привлекающие различные методы оптимизации. Для реализации которых необходимо использовать распределенные вычисления, для организации которых необходима информационно-вычислительная система.
В связи с этим, актуальной является разработка методов для задачи поиска допустимого управления. В дальнейшем будет показано, что эту задачу можно рассматривать как оптимизационную.
В диссертации предлагается методика поиска допустимых управлений, основанная на интеллектуальных методах и использовании информации о ранее рассмотренных ускоряющих структурах. А именно: для построения начального управления предлагается методика на основе генетического алгоритма, учитывающая конструктивные ограничения. Дальнейшее решение задачи оптимизации ведется на основе накопленной информации о рассчитанных структурах и результатах поиска начального управления. При этом происходит выбор вариантов ускоряющих структур, удовлетворяющих расширенным ограничениям. Далее строится итерационный процесс, на этапах которого используются методы оптимизации. В результате также происходит пополнение информации.
Под информацией об ускоряющей структуре понимается описание её конструктивных и физических параметров (управлений), а также характеристик, которыми обладает структура при данном управлении. Большие объемы информации приводят нас к задачам обработки и анализа данных, для хранения которых предлагается использовать базу данных. Таким образом, в процессе реализации методики поиска начальных и допустимых управлений, необходимо производить множество различных ресурсоемких расчетов, таких как многократное вычисление динамики пучка при организации оптимизационного метода. Поэтому возникает необходимость использовать распределённые высокопроизводительные вычисления на кластере. В связи с этим, актуальным является создание информационной системы, позволяющей организовывать распределённые (параллельные) вычислительные процессы, с поддержкой механизмов обработки накопленной информации. Сложность функционирования системы накладывает дополнительное требование: необходимость автоматизации процессов, в том числе это связано с разнородностью используемых аппаратных и программных платформ.
Предложенные в работе методики и система — оптимизационные, используют высокопроизводительные вычисления для организации расчётов и обработки информации.
Предлагаемый подход был опробован при решении задач оптимизации продольного движения в структурах с пространственно однородной квадрупольной фокусировкой (ПОКФ). Ускоряющие структуры с ПОКФ в настоящее время находят широкое применение. Практически во всех современных линейных ускорителях на большие энергии в качестве начальной части используется секция с ПОКФ. Эта структура, предложенная в 1969 г. В. В. Владимирским, И. М. Капчинским и В. А. Тепляко-вым [57−59], способна эффективно группировать и ускорять интенсивный низкоэнергетический пучок ионов. Особенностью ускорителей с ПОКФ по сравнению с системамрт инжекции является большое количество ускоряющих периодов, требующих большого объема памяти и вычислительных ресурсов, что делает задачу их оптимизации достаточно сложной.
Возможность применения современных вычислительных средств при решении задач оптимизации динамики заряженных пучков позволяет также использовать многопараметрические методы оптимизации для задач оптимизации с большим количеством параметров. В частности была рассмотрена оптимизация продольного движения в ускоряющей структуре с ПОКФ. В линейной структуре частицы проходят канал ускорителя один раз, поэтому очень важно иметь как можно больше информации о полях, взаимодействии частиц, возможных отклонениях различных параметров системы. В диссертационной работе рассматривается методика посекционной оптимизации ускоряющей структуры, пригодная для оптимизации ускорителей с ПОКФ.
Методы исследования, рассмотренные в работе, опираются на современные методы вычислительной математики, системного анализа, интеллектуального анализа данных, информационного поиска, построения информационных систем, теории графов, математической теории управления и оптимизации, вычислительной математики, математического моделирования. При анализе вопросов программной реализации учитывались современные вычислительные технологии, например, объектно-ориентированного программирования, библиотеки передачи сообщений (MPIMessage Passing Interface) [66], высокооптимизированных многопоточных математических операций для научных, инженерных приложений, требующих наибольшей производительности (MKL — Math Kernel Library) [28], стандарт для распараллеливания программ на языках Open Multi-Processing (OpenMP) [70].
Для сопровождения процесса моделирования и оптимизации ускоряющей структуры, постоянно разрабатываются соответствующие программные пакеты [69,116,118,125,126,134], в которых применяются различные математические модели. Все они могут быть разделены на несколько классов, различающихся по быстродействию и потенциалу. Часть программных средств позволяет производить расчет динамики отдельных частиц пучка и требует пересчета динамики всего ускорителя, который осуществляется путём численного решения систем дифференциальных или интегро-дифференциальных уравнений [77,121]. Такой подход оправдан, если валено иметь как можно больше информации о каждой частице пучка, например, для учета взаимодействия частиц [48,83,87]. С другой стороны, очевидным недостатком такого метода является необходимость пересчитывать полностью траекторию каждой частицы или всего пучка в целом. Здесь особенно существенными становятся затраты на вычисления. Другая группа программных пакетов позволяет заранее рассчитать влияние оптики ускорителя на пучок частиц, а затем использовать полученное преобразование и при необходимости применять его повторно, чтобы отслеживать поведение частиц для большого числа оборотов [118,132,134]. К этой группе программ относится COSY Infinity [115.132], разрабатываемая в Мичиганском университете (Michigan State University).
Следует отметить, что в настоявшее время существует много программных комплексов моделирования и расчета динамики пучков заряженных частиц в ускорителях.
Наиболее известными зарубежными программами для расчёта ускорителя с ПОКФ, с применением которых были рассчитаны ускорители в разных странах мира, являются программы PARMTEQ, PAR MIL, А и PARMTRA (США). Важными особенностями указанных программ являются независимое решение уравнений для продольного и поперечного движения частиц и различные способы учёта внутреннего кулоновского поля пучка.
Конечно, ни один программный пакет в настоящее время не является представителем конкретного класса. Как правило, программы совмещают возможности использования различных подходов к расчету и оптимизации динамики пучков частиц. Чтобы быть уверенным в правильности производимых расчетов, необходимо сравнивать результаты с расчетами, произведенными в других программах. Результаты части расчетов, представленных в диссертации, проверялись другими кодами, такими как Lidos [131] и BDO RFQ [64].
При разработке программ одним из основных критериев является быстродействие: насколько эффективно можно получать результаты расчетов, чем приходится жертвовать для ускорения их получения или. напротив, как можно точнее рассчитать динамику, если время не является критическим фактором.
В целях повышения быстродействия работы системы, используются.
V. высокоэффективные алгоритмы расчета моделей и строятся распределенные алгоритмы оптимизации.
Распределенные вычисления являются, несомненно, важным разделом современной науки о вычислениях. Параллельные методы решения задач математической физики изучались в работах С. Н. Андрианова, Н. Н. Яненко, А. Н. Андрианова, И. Б. Задыхайло. К. Н. Ефимкина [4,5,7,65]. Основные области применения, а также основные достижения высокопроизводительных комплексов связаны с масштабными научными и инженерными задачами. Потребности таких наук, как ядерная физика, механика сплошных сред, классическая и квантовая электродинамика превосходят достигнутые вычислительные мощности. В настоящее время такие задачи базируются практически на всем спектре современных численных методов. Для их решения проводятся интенсивные исследования как в области создания математических моделей и алгоритмов, так и в области разработки новых параллельных вычислительных систем и усовершенствования существующих. Современные технологии решения больших вычислительных задач были разработаны В. П. Иванниковым с сотрудниками, А. Н. Андриановым, И. Б. Задыхайло, К. Н. Ефимки-ным [4,5], параллельные вычислительные технологии были представлены в работах [5,36−39,55,65,75,96]. Достижения современной вычислительной математики и прогресс в области технологий позволяют реализовывать сложные конструктивные решения больших задач.
Поэтому, при построении информационной системы, позволяющей организовывать предлагаемые методики с помощью высокопроизводительных вычислений, учитывались современные достижения в области распределенных вычислений. Стоит отметить, что обычно задачи моделирования пучков заряженных частиц являются сильно связанными, поэтому разные алгоритмы распараллеливания обладают разной эффективностью, а также необходимо учитывать сетевой закон Амдала [113].
Научная новизна работы состоит в следующих результатах: предложенный системный подход к задачам оптимизации динамики пучков заряженных частицразработанные методики поиска управлений на основе накопленных знаний для задач оптимизации динамики пучков заряженных частицна основе разработанных программных средств исследована задача оптимизации продольной динамики пучков заряженных частиц в ускорителе с пространственно однородной квадрупольной фокусировкой. Важное место в работе отводится построению распределенной информационно-вычислительной системы, позволяющей организовывать вычисления в задачах физики пучков.
Первая глава диссертационной работы — ввод но-постановочная, посвящена постановке задач, решения которых рассматриваются далее в работе: задача поиска допустимого управлениязадача поиска начального управлениязадача оптимизациизадача автоматизации процессов решения задач с использованием высокопроизводительного комплекса.
В работах А. Д. Овсянникова была предложена модель совместной оптимизации программного и возмущенных движений для решения задач оптимизации динамики пучков заряженных частиц.
В диссертации на примере данной задачи рассматривается системный подход к задачам проектирования ускоряющих и фокусирующих систем. Целью данного подхода является создание распределенной информационно-вычислительной системы, ориентированной на решение задач ускорительной физики.
Одной из основных оптимизационных задач, рассматриваемых в диссертации, является задача поиска допустимого управления. Под допустимым управлением будем понимать управление, удовлетворяющее конструктивным ограничениям, при которых выполняются ограничения на характеристики структуры и динамические характеристики пучка частиц.
Численные алгоритмы решения задач оптимального управления работают в предположении, что начальное управление уже известно. Во многих прикладных задачах чрезвычайно трудно найти управление, начиная с которого можно было бы запустить итерационный процесс, приводящий к результату, а, следовательно, вся мощность оптимизационных пакетов может оказаться невостребованной. В связи с этим рассматривается задача поиска начального управления, т. е. управления, удовлетворяющего расширенным ограничениям.
Следует отметить, что процесс оптимизации — достаточно сложная задача. Этот процесс сильно зависит от используемых методов оптимизации, требует вычисления различных динамических характеристик пучка и является ресурсоемким.
Это обуславливает необходимость использования распределённых вычислений и привлечения высокопроизводительных комплексов для решения подобных задач и создания распределенной информационно-вычислительной системы.
Организация таких вычислительных процессов, возникающих при решении задачи оптимизации, состоит из большого числа этапов и достаточно сложна, что связано с технологическими особенностями организации вычислительных процессов передачи и обработки информации.
Таким образом, возникает необходимость автоматизации этих процессов, а именно необходимо построить информационную систему, позволяющую обрабатывать большие объемы информации (организовывать ресурсоемкие вычислительные процессы) в автоматизированном режиме.
Все задачи, рассматриваемые в данной диссертационной работе, объединены общей темой — оптимизация и моделирование динамики пучков заряженных частиц с применением современных методов и технологий.
В Главе 2 приводятся методики решения задач, сформулированных в Главе 1. Приведенные методики могут с успехом использоваться для решения подобных задач, возникающих для других ускорителей, для расчета и оптимизации динамики частиц, специфичных для ускорителей в целом.
Предлагается подход к решению поставленной задачи, основанный на эвристическом алгоритме накопления знаний, что позволяет автоматизировать решение задачи с помощью интеллектуальных методов. Под знаниями будем понимать информацию, накопленную об объектах и этапах их формирования, а также об их взаимосвязях с поисковыми множествами. Накопленные знания хранятся в базе знаний, которые необходимо систематизировать и упорядочить, определить взаимосвязи между ними, поэтому необходим набор инструментов для работы с ними.
При построении метода поиска допустимого управления возникла задача кластеризации. На современном этапе кластеризация часто выступает первым шагом при анализе данных. Кластеризация — объединение в группы схожих объектов, является одной из фундаментальных задач в области анализа данных (Data Mining) [110]. Задача рассматривается в связи с необходимостью систематизировать накопленную информацию.
Разработан инструмент, позволяющий использовать вариационный подход к оптимртзации. Обычно, вычисление вариации интегрального функционала в явном виде является довольно сложным и трудоемким процессом. Кроме того, реализация вариационного метода в виде алгоритма подразумевает, что параллельно с расчетом системы обыкновенных дифференциальных уравнений, описывающих динамику, рассчитывается также решение сопряженной системы, которое необходимо для получения явного вида первой вариации [82,85,86,88]. Вид сопряженной системы может быть таким же сложным, как и вид исходной системы. В случае применения методов дифференциальной алгебры, вариация для определенного класса функционалов (достаточно широкого), может быть получена автоматически, лишь с незначительными усложнением исходного алгоритма расчета динамики.
Для оптимизации параметров ускоряющих структур рассматривались различные методы оптимизации [25−27,127,130,133,138]. При эвристическом выборе, неплохие результаты показали следующие методы: симплекс-метод Нелдера-Мида, метод скользящего допуска [138], модифицированный метод Ньютона [130,133]. Метод скользящего допуска хорошо подходит для поиска локального (а нередко и глобального) минимума гладких и негладких функций. В случае относительно простых гладких целевых функций он, как правило, менее эффективен, чем модифицированный метод Ньютона. Модифицированный метод Ньютона наиболее эффективен при минимизации гладких функций с начальными значениями параметров вблизи точки минимума.
Глава 3 посвящена проектированию информационной системы. Определяется трехуровневая архитектура программного комплекса и производится дальнейшая декомпозиция элементов системы. Проработаны внутренние механизмы взаимодействия элементов системы. Как уже упоминалось раннее, проектирование такого класса систем является сложной задачей в связи с гетерогенностью программно-аппаратной платформ и сложностью механизмов обработки информации. В связи с этим, в главе предлагается механизм виртуализации для функционирующих в системе моделей и методов, что позволяет разнести функциональные возможности на разные уровни. В частности, расчет производится на стороне кластера, обработка данных на стороне системы управления баз данных (СУБД) [44], а программа управления и работы с результатами на стороне пользователя.
Организация развертывания моделей и методов производится на основе механизма позднего связывания, что позволяет определять структуру данных и механизм взаимодействия на этапе выполнения.
В работе принята следующая иерархическая модель: клиент, распределительный сервер и вычислительный модуль. Вычислительный модуль, расположенный на нижнем уровне иерархии, организующий работу модели или метода на кластере. В рамках декомпозиции исходной задачи, кластер решает задачи самого нижнего уровня. Основное требование здесь — эффективность, т. е. задача нижнего уровня должна быть хорошо согласована с архитектурой кластера.
Компьютерная реализация соответствующих алгоритмов производилась в процессе работы над диссертационным исследованием в период с 2007 по 2010 годы с применением программных средств разработки MS Visual Studio, MS SQL Server, выбор которых обусловлен особенностями спроектированной архитектуры программного комплекса.
В четвертой главе рассмотрена модель совместной оптимизации программного и возмущенных движений (описывающая продольное движение заряженных частиц в ускорителе с ПОКФ), приведенная в работах Овсянникова А. Д. [82]. Стоит отметить, что данная модель позволяет рассматривать динамику в так называемых приведенных координатах, которые могут быть получены преобразованием из обычных временных координат. Модель зависит от двух управлений (интенсивности ускорения и синхронной фазы) и одного параметра к, что позволяет сформировать управления для различных конструктивных ограничений и входных параметров пучка (в частности одному к могут соответствовать различные типы частиц при вариациях остальных параметров).
Апробация работы. Основные теоретические и практические результаты диссертации докладывались на международных, всесоюзных и республиканских конференциях, симпозиумах и семинарах:
• IV Всероссийская научно-техническая конференция «Технологии Microsoft в теории и практике программирования» для студентов, аспирантов и молодых ученых Российской Федерации (Центральный федеральный округ), 2007 (МАИ). Секция Высокопроизводительные вычисления и нейроинформатика.
• Региональная научно-техническая конференция «Применение многопроцессорных суперкомпьютеров в исследованиях, наукоемких технологиях и учебной работе», 2007 (ИГТА).
• XV международная конференция «Beam Dynamics &- Optimization» (BDO-2008).
• Конференция «Процессы управления и устойчивость» Control Processes and Stability (CPS) — 2009.
• Семинар, посвященный знакомству с проектом Установки для Антипротонных и Ионных Исследований (FAIR) 2009.
• Конференция «Процессы управления и устойчивость» Control Processes and Stability (CPS) — 2010.
• XIV международная конференция «Beam Dynamics &- Optimization» (BDO 2010).
• Всероссийская конференция «Устойчивость и процессы управления» (ISCP) им. В. И. Зубова — 2010.
Апробация разработанной информационной системы проводилась студентами кафедры ТСУЭФА факультета ПМ-ПУ СПбГУ при разработке различных моделей моделирования динамики пучков. Результаты, представленные в диссертационной работе, используются в учебном процессе, а также при выполнении НИР по тематике диссертационной работы на факультете прикладной математики-процессов управления Санкт-Петербургского государственного университета.
Публикации. По теме диссертации опубликованы работы [15−19, 2124,33,139] из них в рецензируемых [18,139]. 4.
Заключение
.
В представленной диссертационной работе рассмотрены задачи моделирования, ускорения и формирования динамики пучков заряженных частиц с использованием высокопроизводительных вычислительных комплексов. Рассмотрен системный подход к решению проблем оптимизации динамики заряженных частиц, включающий методики выбора управления в задачах с ограничениях. Спроектирована архитектура распределенной информационно-вычислительной системы для решения задач мо-' делирования и оптимизации пучков заряженных частиц. Данная система обладает следующими свойствами: масштабируемость, модульность, гибкость. В системе предусмотрены средства удаленной разработки моделей и методов с возможностью их дальнейшей интеграции в систему.
На защиту выносятся следующие результаты:
• Распределенная информационно-вычислительная система, ориентированная на решение задач ускорительной физики с использованием высокопроизводительного комплекса;
• Методика автоматизированной оптимизации в задачах управления пучками на основе накопления информации;
• Подсистема принятия решений в задачах оптимизации;
• Методики поиска допустимого управления;
• Результаты применения разработанных программных средств в задачах оптимизации ускорителей с пространственно однородной квад-рупольной фокусировкой.