Адаптивные системы и информационная модель эмоций
Из теории оптимального управления известно, что недостаточно задать функционал или целевую функцию системы — на основе этого глобального критерия оптимальности должно быть получено еще и локальное правило («закон управления»), задающее в каждых конкретных условиях значение управляющего параметра как функцию этих условий. Именно закон управления позволяет — с учетом динамики системы и наложенных… Читать ещё >
Адаптивные системы и информационная модель эмоций (реферат, курсовая, диплом, контрольная)
Если в науках о природе центральным является понятие энергии, то в науках о человеке таким центральным понятием должно стать, по-видимому, понятие информации. С одной стороны, информация составляет сущность мира духовного и основанной на нем гуманитарной культуры; с другой, информация через понятие энтропии тесно связана с миром физическим и изучающими его точными науками. До сих пор попытки использовать информационный подход в гуманитарных науках были не очень удачными. Причина этого, на наш взгляд состоит в том, что теория информации сама еще не стала динамической теорией: она только связывает различные величины, но ничего не говорит о том, как они должны изменяться. Один из конструктивных подходов на этом пути сформулирован в работах Г. А. Голицина [Голицын и др., 1991], [Голицын и др., 1996] в виде принципа максимума взаимной информации между условиями среды и реакциями системы. Любая система должна так или иначе адаптироваться к окружающей среде — в противном случае она погибает. Для выживших систем важнейшим свойством должна быть способность к адаптации. Наиболее адекватной мерой такой адаптации является средняя взаимная информация между свойствами среды и реакциями системы. Таким образом, принцип максимума информации — это принцип максимума адаптации, выраженный в подходящей количественной форме.
На основе этого принципа удается вывести и объяснить многочисленные частные закономерности поведения адаптивных систем — биологических, технических, социальных. В данном докладе на базе принципа максимума рассматриваются некоторые вопросы развития информационной модели эмоций.
Из теории оптимального управления известно, что недостаточно задать функционал или целевую функцию системы — на основе этого глобального критерия оптимальности должно быть получено еще и локальное правило («закон управления»), задающее в каждых конкретных условиях значение управляющего параметра как функцию этих условий. Именно закон управления позволяет — с учетом динамики системы и наложенных на нее ограничений — реализовать оптимальное поведение, доставляющее экстремум функционалу. Эмоции в живых организмах и выполняют функцию такого локального критерия управления, подсказывая организму, что хорошо и что плохо в данных конкретных условиях. Однако непосредственное движение в каждой конкретной ситуации направляется локальным критерием — силой, которая является градиентом от потенциала по пространственным координатам. Эмоции для живого существа и являются своеобразными «психическими силами», направляющими его поведение. Пользуясь выражением известного физиолога П. К. Анохина [Анохин, 1964], можно сказать, что эмоция играет важную роль «пеленга», который помогает живому существу отличать полезное от вредного, подсказывает ему, движется ли он к цели или от цели. В первом случае эмоция положительна («удовольствие»), во втором — отрицательна («страдание»). Таким образом, удовольствие и страдание помогают живому существу достигать своих целей, и в этом заключается приспособительный смысл эмоций.
Таким образом, эмоции являются инструментом оптимального управления поведением, они играют роль обобщенных сил, направляющих субъекта к скорейшему достижению максимума его целевой функции L. Роль такой целевой функции при информационном подходе играет взаимная информация между реакциями субъекта и свойствами его окружения. В частности, это социальное окружение, другие субъекты. Если поведение субъекта направлено на максимизацию некоторой целевой функции L, то увеличение этой целевой функции должно сопровождаться положительными эмоциями, уменьшение — отрицательными. Поскольку L зависит от некоторых переменных хi, то эмоции вызываются изменениями этих переменных. В частности, такой переменной может быть и целевая функция другого субъекта. Поэтому выражение, определяющее величину и знак эмоции, может быть записано в следующем виде:
е = dLi/dt = dL/ dхi dхi /dt, (1).
где dL означает изменение L, обусловленное изменением переменной хi.
Для дальнейшего существенно, что мы будем рассматривать именно адаптивные системы, обладающие памятью и способные к обучению. Это означает, что коэффициенты регрессии cij, характеризующие силу связей между переменными системы, не являются постоянными, а складываются и могут меняться в процессе обучения, переучивания, адаптации. Коэффициент регрессии может быть определен как отношение приращений dxi/dxj, усредненное по m наблюдениям:
cij=1m(dxi/dxj)k/m, (2).
где m — объем опыта, хранящегося в памяти.
В детерминированной системе отношение dxi/dxj постоянно и коэффициент cij просто совпадает с этим отношением. Однако в общем случае это отношение — случайная величина, и только суммирование и усреднение могут выявить истинное значение cij .Статистик, как правило, вычисляет коэффициент регрессии, располагая всей выборкой наблюдений. Однако в реальных процессах обучения этот коэффициент складывается постепенно по мере поступления новых наблюдений. Таким же образом, в ходе обучения складываются и коэффициенты регрессии cij, характеризующие отношения двух субъектов друг к другу. Величина и знак коэффициента cij определяют отношение субъекта i к поведению другого субъекта j. Пусть в некотором акте взаимодействия субъект j воздействует на субъект i, так что целевая функция последнего за время dt меняется на величину Li. Собственная целевая функция субъекта j меняется при этом на величину Lj. Поскольку субъект всегда стремится увеличить собственную целевую функцию, то в свободном, (независимом) поведении изменение Lj всегда положительно. Изменение же Li является зависимым, принудительным и может быть как положительным, так и отрицательным. Оценка субъектом i субъекта j, характеризуемая коэффициентом cij регрессии Li no Lj, изменяется в этом акте взаимодействия со скоростью.
dcij/dt = (Li/Lj — cij)/m (3).
Отрицательный член cij появляется здесь из-за того, что память субъекта — неравновесная система, здесь существует не только приток информации (обучение), но и отток ее (забывание). Величина cij как раз и характеризует среднюю величину оттока.
Если знаки Li и Lj совпадают, то коэффициент связи возрастает. Если первоначально он был отрицательным, то в конце концов может стать положительным. Наоборот, если Li и Lj имеют разные знаки, то коэффициент связи с каждым взаимодействием уменьшается и в конце концов становится отрицательным, даже если первоначально был положительным. Так происходит обучение. Если cij положительно (т. е. интересы субъектов i и j в прошлом обычно совпадали), то субъект i оценивает субъекта j как союзника. В противном случае (cij отрицательно) субъект i рассматривает субъекта j как противника.
Все сказанное справедливо и для встречного отношения субъекта j к субъекту i, характеризуемого коэффициентом cji регрессии Lj по Li .Если субъект i каким-то образом воздействует на субъекта j, меняя его целевую функцию, то оценка cji субъектом j субъекта i изменяется со скоростью.
d cji/dt = (Lj/Li — cji)/m. (4).
эмоция поведение информационный адаптивный Обратим внимание на то, что скорости изменения, а значит и конечные значения cij и cji, в общем случае различны. В частности, мы хорошо знаем, насколько отношения между двумя субъектами могут быть несимметричными, насколько, например, их любовь или вражда могут отличаться по величине.
Известно, что знаки коэффициентов регрессии совпадают со знаком коэффициента корреляции, а значит совпадают и между собой. А произведение коэффициентов регрессии равно квадрату коэффициента корреляции rij:
cij cji = r2ij. (5).
Этот квадрат в свою очередь может рассматриваться как хорошая аппроксимация для средней взаимной информации между переменными Li и Lj. Тогда принцип максимума информации может быть записан в виде:
Iij = r2ij = cij cji = max. (6).
Согласно этому принципу в свободном поведении величина взаимной информации должна со временем возрастать, насколько это позволяют ограничения, наложенные на систему. Отсюда следует важное условие:
d Iij/dt = 2 rij drij /dt = cij d cji /dt + cji d cij /dt > 0 (7).
Оно показывает, что знак коэффициента корреляции и знак его скорости должны совпадать. Если rij положителен, то и скорость его изменения также положительна, т. е. коэффициент корреляции продолжает расти и дальше. Если же rij отрицателен, то и скорость изменения его отрицательна, т. е. коэффициент корреляции продолжает уменьшаться. Таким образом, нулевое значение rij неустойчиво: стоит rij отклониться от нуля и какую-либо сторону, как это отклонение начинает увеличиваться с возрастающей скоростью, пока не достигнет своего предельного возможного значения. Аналогичным образом ведут себя и коэффициенты регрессии.
С точки зрения принципа максимума информации эмоции функционально связаны с вероятностью. Способность эмоции влиять на вероятность, открывает путь к пониманию роли эмоций в обучении. То обстоятельство, что эмоция является мощным «подкрепляющим» фактором, хорошо известно и постоянно используется в практике обучения (например, при выработке условных рефлексов в нейрофизиологии). Известно, что любой навык вырабатывается быстрее, если правильная реакция на стимул подкрепляется наградой, а неправильная — наказанием. Но не всегда четко осознается тот факт, что сущностью награды и наказания являются именно положительная и, соответственно, отрицательная эмоции .
Согласно информационному подходу [Golitsyn and other, 1995], обучение — это изменение вероятностей , входящих в матрицу памяти. Скорость изменения вероятности пропорциональна коэффициенту внимания, играющему роль управляющего параметра Если эмоция, вызываемая ростом вероятности, положительна, то, согласно закону оптимального управления, значение управляющего параметра возрастает до максимума. А вместе с ним возрастает до максимума и скорость роста вероятности, т. е. скорость обучения. В обучении без учителя (самообучении) эмоция является основным фактором, определяющим скорость обучения. В обучении с учителем главным обучающим фактором становится принуждение, однако и здесь к нему добавляется эмоция, помогая или, наоборот; препятствуя принудительному процессу. С какого-то момента (преодоление порога) эмоция становится положительной, помогающей обучению и способна заменить принуждение.
В процессе обучения одни вероятности возрастают, другие, наоборот, уменьшаются [Голицын и др., 1996]. При этом вклад одних слагаемых в эмоцию может быть положительным, других — отрицательным. В общем случае, картина получается достаточно сложной. Упрощение может быть достигнуто, если описывать распределение вероятностей в параметрической форме, когда все вероятности зависят от немногих (двух-трех) параметров. Тогда величина эмоции может быть выражена через изменение этих параметров.
Поведение предполагает взаимодействие субъекта с объектами внешней среды с целью удовлетворения потребностей. При этом объекты среды служат источниками (или стоками) соответствующих свойств (воды, пищи, тепла, света и т. п.), удовлетворяющих потребность. Важнейшая функция эмоций — определять отношение субъекта к этим объектам. Оно может быть положительным или отрицательным, притяжением или отталкиванием. В результате взаимодействия потребность может менять величину и знак. Поэтому отношение к одному и тому же объекту может меняться на прямо противоположное. Многие потребности живых существ удовлетворяются в периодическом автоколебательном режиме: жажда, голод, холод и пр. При этом длительность положительного и отрицательного периодов редко бывает одинаковой. Это связано с тем, что вероятности, с которыми встречаются в среде объект-источник и его антагонист (сток), обычно неодинаковы. Типичным примером является рассматривание черно-белого изображения, содержащего одновременно белую вазу и два черных профиля, получаемых из конфигурации вазы: внимание поочередно переключается с белой вазы на черные профили и обратно. Если площади вазы и профилей приблизительно равны, то периоды контакта внимания с черным и белым также мало различаются. Но если мы возьмем предельный случай черно-белого изображения — черную точку на белом фоне, то здесь времена контакта с черным и белым будут заметно различны: внимание будет почти все время фиксировать черную точку и лишь изредка переключаться на белый фон. Это означает, что от черной точки субъект получает больше удовольствия, чем от белого фона. Иными словами: более редкий объект является одновременно и более притягательным, оценивается как более положительный. Этот вывод является общим и не зависит от того, какие свойства вещей мы рассматриваем, будут ли то черное и белое, теплое и холодное, влажное и сухое и т. п. Существует закономерная связь между положительной оценкой объекта и его редкостью.
Связь эмоций с редкостью — факт, хорошо подтверждаемый повседневным опытом: чем реже встречается вещь в нашем окружении, тем большее удовольствие — при прочих равных условиях — она доставляет нам при встрече. Это нашло отражение и в языке: сами слова «редкий», «исключительный», «уникальный» воспринимается нами как похвала, как положительная оценка предмета или явления. И наоборот, слова «обыкновенный», «банальный», «массовый», звучат как отрицательные оценки.
В заключении отметим, что подобно двум типам закономерностей — динамическим и статистическим (первые относятся к «микроскопическим» переменным, вторые — к «макроскопическим», усредненным) в эмоциях довольно ясно просматриваются эти же два типа:
- — динамические эмоции - удовольствие и страдание, связанные с отдельными конкретными стимулами и реакциями;
- — длительные устойчивые эмоциональные состояния («настроения», «функциональные состояния»), являющиеся усредненным ответом на «стационарную среду» — множество более или менее регулярно действующих и чередующихся стимулов.
Если эмоции связаны с динамикой поведения, с реакцией на отдельные конкретные стимулы, то эмоциональные состояния обусловлены главным образом статистическими закономерностями, имеют усредненный и, как следствие, более длительный и устойчивый характер. Примером эмоциональных состояний могут служить «настроения» (радость, печаль, тревога и т. п.). Разумеется, интересно и важно знать, как меняются эмоции при постоянном действии единственного стимула, когда его вероятность возрастает от нуля до единицы. Но на практике жизнь редко ставит столь чистый эксперимент. Чаще действует множество стимулов, сменяя друг друга более или менее случайным образом. Это более реалистическая модель. Для определения характеристик эмоциональных состояний в этом случае по-прежнему можно воспользоваться инфорационным подходом, оперирующим усредненными характеристиками стимулов и реакций — условной и безусловной энтропией, средней взаимной информацией и т. п. Необходимо научиться давать оценку и прогноз эмоциональных состояний на основе усредненных показателей. Общий принцип оценки по-прежнему должен быть основан на использовании целевой функции L: высокое значение L сопровождается положительным' эмоциональным фоном, низкое — отрицательным.
И, наконец, если мы рассматриваем адаптивную техническую систему, поведение которой подчиняется некоторому экстремальному принципу, то производные от целевой функции по соответствующим координатам можно рассматривать как обобщенные силы. Они выполняют в поведении и обучении такой системы те же функции, что и эмоции в поведении живого организма. В частности, если поведение нейросети подчинено требованию минимума суммарной квадратичной ошибки на выходе сети, то производные от такой целевой функции по синаптическим весам играют роль сил, меняющих (модифицирующих) эти весовые коэффициенты, т. е. обеспечивающих возможность самообучения сети. Как известно, именно на использовании этих производных (которые, правда, не называют силами) основано и правило обучения персептрона (дельта-правило), и правило Хебба в сетях Хопфилда и, наконец, известный метод обратного распространения ошибки.
Поэтому так важно, чтобы активационные функции нейронов были не ступенчатыми, кусочно-равномерными, а сглаженными, размытыми. Только в этом последнем случае в пространстве синаптических весов существует аналог эмоции — градиент целевой функции, указывающий правильное направление изменения весов. В случае равномерных или ступенчатых распределений такой локальный критерий отсутствует и сеть «не знает» в каком направлении следует модифицировать веса, чтобы достичь оптимума. Т. е. она не способна самообучаться на основе собственного внутреннего критерия, не включается процесс «сотворчества», собственной внутренней активности системы. Есть известное понятие — «паралич нейросети», когда нейрон выходит на плато своей активационной характеристики и дальнейшее самообучение становится невозможным.
- 1. [Анохин, 1964] Анохин П. К Эмоции.//Большая медицинская энциклопедия, т.35.-М.:Медгиз, 1964
- 2. [Голицын и др., 1991] Голицын Г. А., Петров В. М. Информацияповедение — творчество-М.:Наука, 1991
- 3. [Голицын и др., 1996] Г. А. Голицын, И. Б. Фоминых. Нейронные сети и экспертные системы: перспективы интеграции. Новости искусственного интеллекта, М, АИИ, № 4, 1996.
- 4. [Golitsyn and other, 1995] Golitsyn G. A., Petrov V. М. Information and Creation. — Basel: Birkhauser Verlag, 1995.