Помощь в написании студенческих работ
Антистрессовый сервис

Метод автоматического порождения гипотез

РефератПомощь в написанииУзнать стоимостьмоей работы

ДСМ-метод позволяет решать также задачи интеллектуального анализа социологических данных: порождение детерминант социального поведения (действий, установок, мнений), использование порожденных детерминант для создания типологии индивидуального поведения; формальное определение мнений и их прогнозирование, распознавание степени рациональности мнений. Интересным также является применение ДСМ-систем… Читать ещё >

Метод автоматического порождения гипотез (реферат, курсовая, диплом, контрольная)

Метод ДСМ был предложен в конце 1970;х гг. В. К. Финном[1][2]. Этот метод порождения гипотез реализует и формализует схему 1II1B. Название метода составляют инициалы английского философа, логика, историка и социолога Дж. С. Милля (Join Stuart MillJSM, ДСМ), чьи «методы здравомыслящего естествоиспытателя» частично формализованы в ДСМ-методе. Метод формализует схему правдоподобного и достоверного вывода, называемую ДСМ-рассуждением, и представляет собой удачный синтез процедур индукции, аналогии и абдукции. ДСМ-метод создан как механизм автоматизированного порождения гипотез (АНГ) в данной предметной области средствами так называемых квазиаксиоматических теорий (КАТ).

Способы установления причинно-следственных отношений, предложенные Дж. Миллем, основываются на идеях выявления сходства и различия в наблюдаемых ситуациях. Способность улавливать сходство и различие — фундаментальная особенность всего живого.

Перечислим основные принципы индукции, сформулированные Миллем.

1. Принцип единственного различия: если после введения какого-либо фактора появляется (или после удаления исчезает) известное явление, причем не вводится и не удаляется никакое другое обстоятельство, которое могло бы иметь влияние, то указанный фактор составляет причину явления. Этот принцип формализует следующая схема:

Метод автоматического порождения гипотез.

Здесь «—>» трактуется как появление D при наличии Л, В, С, а «^ч — как непоявление D при наличии В, С.

2. Принцип единственного сходства: если все обстоятельства явления, кроме одного, могут отсутствовать, не уничтожая этим явления, то это обстоятельство является причиной данного явления:

Метод автоматического порождения гипотез.

3. Принцип единственности остатка: если вычесть из какого-либо явления ту его часть, которая является следствием известных причин, то остаток есть следствие остальных причин: Метод автоматического порождения гипотез.

Метод автоматического порождения гипотез.

Перечисленные схемы справедливы, если в описании ситуации присутствует полное множество наблюдаемых фактов и явлений.

Рассмотрим основные механизмы работы метода ДСМ.

Обозначения: О — множество объектов; Р — множество свойств; F — множество возможных причин свойств Р объектов О; V множество истинностных оценок [+1,-1, ±0, т], где: +1 — эмпирическая истина; -1 — эмпирическая ложь; ±0 — эмпирическое противоречие; т — неизвестность.

Допустим, что в БФ имеются факты, которые мы запишем в виде табл. 10.7.

Таблица 10.7

Факты в блоке фаззификации.

Объект (О).

Свойства (Р)

Ходить.

Летать.

Плавать.

Человек Вася.

+1.

— 1.

±0.

Рыба.

— 1.

— 1.

+1.

Птица.

+1.

+1.

±0.

Змея.

— 1.

— 1.

±0.

Человек Петя.

т.

т.

т.

Из данных табл. 10.7 следует, что объект человек Вася обладает свойствами ходить и, возможно, плавать (±0). А свойством летать он не обладает. Объект птица обладает свойствами ходить и летать и, возможно, плавать. Про объект человек Петя ничего не известно (т). Иными словами, есть факты за и против того, что объект О, обладает свойством pr i = {человек Вася, рыба, птица, змея, человек Петя}, j = {.ходить, летать, плавать).

Таблица 10.9 задает функцию Н{: О х р —> V. Очевидно:

  • • объекты, для которых Н (0, P) = +1, являются положительными примерами;
  • • объекты, для которых Нх(0, Р) = -1, являются отрицательными примерами;
  • • объекты, для которых Нх(0, Р) = ±0, являются противоречивыми примерами;
  • • объекты, для которых Нх(0, Р) = т, являют неизвестность.

Наша задача состоит в доопределении данных из табл. 10.8 таким образом, чтобы в тех клетках, где стоит т, путем ДСМ-рассуждений в итоге появились значения, говорящие о наличии или отсутствии у объекта человек Петя определенных свойств, т. е. (+1, -1, ±0). При недостатке информации может оставаться т.

На первом шаге ДСМ-метода порождаются гипотезы о возможных причинах свойств объектов на основе правил первого рода. Затем, на втором шаге, используя эти гипотезы, по правилам второго рода исходная таблица достраивается. После этого процедура может повторяться, так как у нас появились новые данные. Предполагается, что у свойств могут быть как причины («+» причины), так и антипричины (причины отсутствия или «-» причины), абсолютно не зависящие от контекста. В методе осуществляется синтез трех процедур:

  • ИНДУКЦИЯ — ей соответствуют правила первого рода;
  • АНАЛОГИЯ — ей соответствуют правила второго рода;
  • АБДУКЦИЯ используется для проверки каузальной (причинной) полноты исходного набора данных. Если полученные выводы объясняют в некотором смысле данную группу фактов, то они принимаются.

Процесс ДСМ-рассуждения — итеративный, т. е. возможно многократное последовательное повторение процедур индукции и аналогии.

Формализуем идею первого шага ДСМ-метода.

Пусть: О = (0{} 02у Ок) — множество объектов; F= (f{yf2y …,/ц) —.

множество фрагментов объектов.

Допустим, известно, что:

О,? (/пЛ'Л); 02? (Jfyf&fv); 03? (/ц/з'/б'Л)' 04 ^ (/пЛ'Л'/и);

Фрагменты — не обязательно атомарные. Для нашего примера выделим следующие атомарные фрагменты: ноги (лапы), руки, плавники, глаза, крылья. Построим табл. 10.8, в которой укажем, какие из наших объектов какими фрагментами из множества F обладают (+) или (-).

Таблица 10.8

Доопределение данных таблицы 10.7.

Объект (О)

Своства (Р).

Ноги.

Руки.

Плавники.

Глаза.

Крылья.

Человек Вася.

;

;

Рыба.

;

;

;

Птица.

;

;

Змея.

;

;

;

;

Человек Петя.

;

;

Для выполнения первого и второго шагов ДСМ-метода сформулируем правила первого и второго рода для анализа и выдвижения гипотез типов Нх и #2.

Правила первого рода.

Правило 1.1. Фрагмент /; является возможной причиной наличия свойства рр если:

  • fj является общим фрагментом > 2 положительных примеров для р} И
  • • не входит ни в один отрицательный пример для ру

Правило 1.2. Фрагмент /, является возможной причиной отсутствия свойства ру если:

  • f j является общим фрагментом > 2 отрицательных примеров для р} И
  • fj не входит ни в один положительный пример для ру

Правило 1.3. Фрагмент/, является возможной причиной как наличия, так и отсутствия свойства ру если:

  • • / входит хотя бы в один положительный пример для р-} И
  • • / входит хотя бы в один отрицательный пример для Pj ИЛИ
  • • / входит хотя бы в один (±) пример для ру

Правило 1.4. Информация о фрагменте/ неопределенная (т), т. е. ничего не известно относительно причин свойства ру если:

  • • / не входит ни в какие > 2 положительных примеров для р} И
  • • / не входит ни в какие > 2 отрицательных примеров для pj ИЛИ
  • • / не входит ни в один (±) пример для ру

Правила второго рода.

Правило 2.1. Объект Оке О обладает свойством ру если:

  • Ок содержит хотя бы одну возможную причину наличия свойства р} И
  • Ок не содержит ни одной возможной причины отсутствия свойства pj ИЛИ
  • Ок не содержит ни одной (±) причины (наличия/отсутствия) свойства Pj.

Правило 2.2. Объект Оке О не обладает свойством ру если:

  • Ок содержит хотя бы одну возможную причину отсутствия свойства pj И
  • Ок не содержит ни одной возможной причины наличия свойства р} ИЛИ
  • Ок не содержит ни одной (±) причины (наличия/отсутствия) свойства ру

Правило 2.3. Объект Оке О может обладать или не обладать свойством Pj (±0), если:

  • Оке О содержит хотя бы одну возможную причину наличия И
  • Оке О содержит хотя бы одну возможную причину отсутствия свойства P j ИЛИ
  • Оке О содержит хотя бы одну (±) причину для р} ИЛИ
  • Оке О содержит хотя бы одну причину отсутствия ру

Правило 2.4. Неизвестно, обладает ли объект Оке О свойством ру если:

  • Оке О не содержит ни одной возможной причины наличия р} И
  • Оке О не содержит ни одной возможной причины отсутствия р} ИЛИ
  • Ок е О не содержит ни одной (±) причины (наличия/отсутствия) свойства Pj.

Таким образом, правила первого рода порождают:

  • • гипотезы о возможных причинах наличия свойств объектов;
  • • гипотезы о возможных причинах отсутствия свойств объектов;
  • • гипотезы о том, что некоторые фрагменты / являются причиной как наличия, так и отсутствия свойств;
  • • «пустые гипотезы» о том, что «об объекте Оке О ничего не известно».

Например, выясним, какие фрагменты наших объектов влекут (являются причиной), свойства ходить, т. е. нужно породить гипотезу о причинах наличия данного свойства. С этой целью проверим, есть ли в табл. 10.8 положительные примеры ((+) примеры) для свойства ходить. Да, есть. Это: Вася и птица, так как Н{(Вася, ходить) = +1 и Н^птица, ходить) = +1.

В табл. 10.8 посмотрим, какими общими фрагментами они обладают. Это — (ноги, глаза). Проверим, не обладают ли этими же фрагментами представители класса, не умеющих ходить, т. е. не являются ли ноги, глаза общими фрагментами отрицательных примеров ((-) примеров) для свойства ходить. Мы видим, что эти фрагменты оба не входят в (-) примеры (имеют глаза, но не имеют ног). Следовательно, согласно правилу 1.1 мы можем принять ноги, глаза в качестве причины свойства ходить.

В соответствии с правилами второго рода определим функцию Н2: F’x Р—> —> V, где V= [+1, -1, ±0, т] — множество истинностных[3] оценок:

  • Н‘2 = +, если фрагмент/у является возможной причиной наличия р-,
  • н2 = -, если фрагмент ft является возможной причиной отсутствия р-,
  • Н2 = ±, если фрагмент/у является возможной причиной как наличия, так и отсутствия р-,
  • Н2 = т, если о фрагментах /; и pj ничего не известно.

В результате получаем новую табл. 10.9 с гипотезами Я2.

Таблица 10.9

Развитие данных (гипотез) таблицы 10.9.

Возможные причины свойств (F)

Свойства (Р).

Ходить.

Летать.

Плавать.

Ноги.

+1.

±0.

±0.

Руки.

т.

т.

±0.

Плавники.

т.

т.

т.

Глаза.

+1.

±0.

±0.

Крылья.

т.

т.

±0.

Как видим, Н2 принимает в основном противоречивые и неопределенные значения из-за неестественно малого числа примеров. Тем не менее, используя матрицу гипотез о возможных причинах (наличия/отсутствия) свойств (//1), можно сформулировать гипотезы о наличии или отсутствии свойств Р у тех объектов из множества О, для которых изначально не было известно, обладают ли они этими свойствами, т. е. для тех объектов, для которых Н2(0, Р) = т. На втором этапе ДСМ-рассуждений выполняется порождение гипотез о наличии или отсутствии свойств Р у тех объектов из множества О, для которых это не было известно, т. е. осуществляется прогнозирование свойств. Так, в нашем примере в матрице Н2 вычислена причина свойства ходить. Это — ноги, глаза. У объекта Петя этот фрагмент есть. Значит, Н{ (Петя, ходить) =+. Для наличия свойства летать (+), примеров недостаточно. Антипричин тоже нет, так как фрагмент глаза, присущий примерам человек Вася, рыба, змея, входит и в (+) пример птица. Так, относительно свойства летать человек Петя не определен. Относительно свойства плавать есть (±) примеры. Их общим фрагментом являются глаза,

но они не входят в (-) примеры. Значит, глаза являются (±) причиной свойства плавать. И, но правилу второго рода получим, что Н{ (Петя, плавать) = ±0. Таким образом, сделан один шаг в ДСМ-рассуждениях. Осталась неопределенность свойства лететь. Условия каузальной (причинной) полноты не выполняются, т. е. следует пополнить БФ. Но про Петю мы теперь знаем, что он умеет ходить и, возможно, плавать. Таблица 10.10 дополняет новые знания.

Дополнение данных таблицы 10.9.

Таблица 10.10

Объект (О).

Свойства (Р).

Ходить.

Летать.

Плавать.

Человек Вася.

+1.

— 1.

±0.

Рыба.

— 1.

— 1.

+1.

Птица.

+1.

+1.

±0.

Змея.

— 1.

— 1.

±0.

Человек Петя.

+1.

т.

±0.

Приведем общую схему работы ДСМ-системы (рис. 10.44).

На практике применяется модификация метода, который называется простым ДСМ-методом с запретом на контрпримеры. Цель модификации — избежать порождения гипотез, заведомо противоречащих исходным фактам.

ДСМ-системы (как интеллектуальные системы) используются в качестве средства интеллектуального анализа данных (НАД). ДСМ-метод — как нестатистический метод анализа данных — позволяет учитывать индивидуальные особенности изучаемых объектов исследования, если их структура представлена настолько информативно, что используемых параметров достаточно для выявления сходства — условия порождения эффекта (т.е. причины изучаемого явления).

Второй важной особенностью ДСМ-метода является его способность порождать полезные гипотезы на малых массивах данных благодаря выявленному сходству объектов, характеризуемых существенными параметрами.

Третья особенность ДСМ-метода состоит в том, что он работает с открытыми массивами данных в БФ, распознавая необходимость расширения БФ, если таковая возникает в результате объяснения ее начального состояния, что соответствует интеллектуальной способности (способность находить объяснение и отвечать на вопрос «почему?» и абдуктивное объяснение результатов ИАД с помощью интеллектуальных КС (ИКС)).

Примерами предметных областей, для которых были созданы интеллектуальные системы типа ДСМ, являются фармакология, медицинская диагностика, социология, криминалистика и роботы с адаптивным поведением[4].

Схема алгоритма работы ДСМ-системы.

Рис. 10.44. Схема алгоритма работы ДСМ-системы1.

Первыми были разработаны ДСМ-системы для прогнозирования биологически активных химических соединений. Эти системы в качестве базы фактов имеют представление предиката X =>j У, где значением X является описание структуры химических соединений, а значениями У является информация о биологической активности соединения X. На этапе / по правилу индукции порождаются гипотезы типа «подструктура химического соединения является причиной наличия (отсутствия) биологической активности W». Таким образом порождается предикат V =>2 W> образующий фрагмент БЗ.

Для анализа данных о непрямых канцерогенах и хронической токсичности химических соединений и порождения соответствующих прогнозов потребовалось развитие ДСМ-метода на предметную область (представ-[5]

ление знаний, добавление вычислительных процедур в Решателе задач, введение числовых параметров). Настройка ДСМ-системы на предметную область состояла в учете метаболизма веществ в организме, вида животных (для прогноза канцерогенности), вводимой дозы вещества и количественной оценки биологической активности. Для прогнозирования токсичности и канцерогенности созданы специальные варианты ДСМ-системы[6].

Была создана экспериментальная версия ДСМ-системы, имитирующая биотрансформации (для некоторых типов реакций), с использованием БЗ для необходимых условий биотрансформации [2]. Посредством правила индукции порождались достаточные условия биотрансформации, а посредством правила аналогии строились гипотезы о метаболизируемости химических соединений, из которых специальная программа, использующая достаточные условия биотрансформации, порождала метаболиты, являющиеся гипотезами ДСМ-системы.

Другим классом задач, решаемых ДСМ-системами, являются задачи медицинской диагностики по клиническим данным. В ВИНИТИ РАН были созданы три версии ДСМ-систем для задач медицинской диагностики: для прогнозирования высокопатогенных типов вируса папилломы человека по цитологическим результатам исследования мазков; система диагностики двух заболеваний глаз: дегенеративного ретиношизеса и наследственных витреоретинальпых дистрофий; система для диагностики системной красной волчанки[8].

ДСМ-метод позволяет решать также задачи интеллектуального анализа социологических данных: порождение детерминант социального поведения (действий, установок, мнений), использование порожденных детерминант для создания типологии индивидуального поведения; формальное определение мнений и их прогнозирование, распознавание степени рациональности мнений. Интересным также является применение ДСМ-систем для интеллектуального анализа криминалистических данных, например, задач судебно-почерковедческой экспертизы[9]. Важным приложением ДСМ-метода является его использование для создания интеллектуальных роботов[10]. В рамках проекта «Адаптант-2005» был создан мобильный миниробот, реализующий динамическую версию ДСМ-метода в целях адаптации поведения (движения) для выбора соответствующей траектории посредством индуктивного поведения.

  • [1] Аншаков О. М. Указ, соч.; Блинова В. Г. [и др.]. Указ. соч.
  • [2] Финн В. К. Указ. соч.
  • [3] Одна из возможных характеристик высказывания с точки зрения соответствия егоописываемому фрагменту действительности (Ивин А. А., Никифоров А. Л. Словарь терминовлогики. М.: Туманит; ВЛАДОС, 1997).
  • [4] Блинова В. Г. [и др.]. Указ, соч.; Гусакова С. М. Указ, соч.; Харчевникова Н. В. [и др.]. Прогноз канцерогенности полициклических углеводородов с использованием автоматизированной системы, основанной на совмещении квантово-химических расчетов и логико-комбинаторного ДСМ-метода. Итоги и перспективы научных исследований по проблеме экологиичеловека и гигиены окружающей среды / под ред. Ю. А. Рахманина. М., 2002.
  • [5] Апшаков О. М. Указ. соч.
  • [6] 2 Блинова В. Г. [и др.]. Указ, соч.; Хариевникова Н. В. и др. Указ. соч.
  • [7] Финн В. К. Указ. соч.
  • [8] Там же.
  • [9] Гусакова С. М. Указ. соч.
  • [10] Добрынин Д. А., Карпов В. Э. Указ. соч.
Показать весь текст
Заполнить форму текущей работой