Помощь в написании студенческих работ
Антистрессовый сервис

Семантико-математическая модель понимания смысла технологических текстов для экспертных систем

РефератПомощь в написанииУзнать стоимостьмоей работы

Для указания семантических отношений между предложениями и построения фраз ОЕЯ используются логические отношения вершины отображают слона — члены предложения; дуги — синтагматические отношения между слонами в ниже падежей Филлмора (agent, сн, object) (и), «v» (или), «-» (не), а также отношение включения. Последнее отношение отображает смысловые структурно-классифицированные связи между объектами… Читать ещё >

Семантико-математическая модель понимания смысла технологических текстов для экспертных систем (реферат, курсовая, диплом, контрольная)

В экспертных системах синтеза ХТС производств органических продуктов необходима переработка огромного объема семантической, или смысловой, информации, которая представляет собой знания о ПО —технологии производства продуктов тонкого органического синтеза. Знания о ПО, необходимые для поиска оптимальных решений указанной задачи синтеза на ЭВМ, должны храниться в виде БЗ, содержащий лингвистические модели разнообразных технологических текстов производства органических продуктов.

Каждая такая модель представляет собой словесное структурно-классифицированное описание химического способа производства продуктов, всех ХТП и вспомогательных технологических операций (ТО), а также инженерно-аппаратурного оформления ХТП, структуры связей между аппаратами.

При автоматизированном поиске семантического решения НФЗ синтеза ХТС, которое представляет собой подробное словесное описание сгенерированной технологической схемы ХТС, диалог ЭВМ —человек предполагает «понимание» ЭВМ смысла знаний, извлекаемых с помощью ЛПР из технологических текстов. Эта «операция понимания» смысла текстов осуществима лишь при переводе знаний, отображенных в предложениях текстов, на некоторый язык внутреннего представления — (ЯВТ) в ЭВМ .

ЯВТ представляет собой семантико-математическую модель ОЕЯ, на котором описываются все технологические тексты.

Разработка сентиматико-математической модели ОЕЯ основана на следующих принципах .

  • 1. Принцип достаточной полноты, суть которого состоит в том, что ЯВТ должен включать необходимое и достаточное число базовых основных элементов, чтобы иметь возможность отображать смысл любых объектов химической технологии (аппаратов, продуктов, ХТП, ТО и др.), описываемых в технологических текстах.
  • 2. Пришит динамического расширения алфавита и грамматики ЯВТ, заключающийся в возможности ввода новых грамматических конструкций и элементов алфавита при описании тех объектов химической технологии, для которых существующими средствами языка это сделать невозможно.
  • 3,Пришит порождения, обеспечивающий создание новых семантически и синтаксически правильных предложений и фраз ОЕЯ, на базе грамматики ЯВТ.
  • 4. Принцип единственного представления на ЯВТ синтаксически разных предложений ОЕЯ, имеющих одинаковый смысл.

Предложена модель ЯВТ, которую можно формально представить в виде кортежа :

/. = ,.

где С —алфавит ОЕЯ, М — множество морфологических правил слов ОЕЯ, If—множество слов ОЕЯ, построенных с помощью морфологических правил из множества М, .V — семантика слов ОЕЯ, Р — множество синтаксических правил построения предложений ОЕЯ, А — множество аксиом, представляющих множество семантически и синтаксически априорно истинных предложений ОЕЯ, /*" — множество семантических правил генерации новых предложений ОЕЯ (или правил вывода), позволяющих расширять множество А.

Алфавит ОЕЯ (или множество С) включает в себя совокупность основ слов ОЕЯ и аффиксов (суффиксов и окончаний). Основа слова— это часть слова, обладающая семантикой и состоящая из приставки, корня и суффикса, либо из приставки и корня, либо из одного корня. Например, одной из основ слов ОЕЯ является «ВКЛЮЧ», где «В» —приставка, «КЛЮЧ» —корень.

Для образования разных слов ОЕЯ необходимо к основе слова грамматически правильно добавить аффиксы. Каждой основе слова соответствует свое множество аффиксов, позволяющее строить однокоренные слова, имеющие близкий смысл и принадлежащие разным частям речи: «НАГРЕВАГРЕТЬ—СОГРЕТЫЙ». Аналогично, из основ слов и аффиксов строятся различные словоформы — значимые отрезки речи, характеризующиеся относительной свободой перемещения и непроницаемостью, т. е, неспособностью включать внутрь себя какие-либо значимые отрезки речи. Например, слово-формами являются: «ПРОДУКТ-ПРОДУКТУ—ПРОДУКТОМ» и т. д. Формально алфавит ОЕЯ описывается словарем, в котором каждая основа слова и каждый аффикс однозначно определяются своим кодом, благодаря чему любое слово ОЕЯ, образованное из основы и аффикса, имеет уникальный код.

Множество Л, являющееся совокупностью морфологических правил построения слов ОЕЯ из основ и аффиксов, предлагается нами формально описывать системой лексико-морфологических функций (ЛМФ). Это однозначная грамматическая функция, которая по основе слова и грамматическому значению искомого слова определяет один из всего множества аффиксов и значением которой является словоформа ОЕЯ. Например, по основе «ПРОМЫВ» и морфологическому значению слова ОЕЯ (глагол, повелительное наклонение, активный залог) будет найден аффикс «АТЬ» (окончание) и определено словоформа «ПРОМЫВАТЬ».

Кроме рассмотренных ЛМФ, называемых прямыми, предложены и определены обратные ЛМФ, которые по окончанию слова вычисляют морфологическое значение слова и его основу.

Таким образом, ЛМФ позволяют реализовать принципы расширяемости и повреждаемости языка. Прямые ЛМФ порождают (генерируют) слова и словоформы, обратные ЛМФ дают возможность определять новые основы слов, а значит, расширять алфавит языка, следовательно, и ЯВТ.

Множество W— совокупность слов ОЕЯ, образованных с помощью морфологических правил, включающих два множества: W =, где В— множество базовых понятий в ПО, какими, к примеру, являются ПРОДУКТ, ОБОРУДОВАНИЕ, АППАРАТ, ХТП, СОСТОЯНИЕ, РЕЖИМ и т. д., а также все разнообразные химические и технологические объекты, определяемые этими понятиями. Например, к понятию «АППАРАТ» относятся «КРИСТАЛЛИЗАТОР», «РЕАКТОР», «ЭКСТРАКТОР» и т. д.

Множество Q составляют слова ОЕЯ, обозначающие атрибуты (свойства и характеристики) базовых понятий из В, какими, к примеру, являются: «ЦВЕТ», «ФАЗОВОЕ СОСТОЯНИЕ», «ПЛОТНОСТЬ», «УДЕЛЬНЫЙ ВЕС» и т. д.

Множество S раскрывает смысл слов из множества W и формально описывается в виде иерархической сети фреймов-прототипов, которые являются структурными моделями абстрактных стереотипов объектов химической технологии (понятий, операций, ситуаций).

Принципы разработки фреймов-прототипов для каждого из подмножеств В и Q разные. Смысл понятий из множества В определяется с помощью атрибутов и признаков, т. е. из слов множества Q, а смысл кажДПгО слава, принадлежащего множеству Q, — путем перечисления элементов класса, определяемых этим понятием; так, например^понятие «ЦВЕТ» задается как совокупность элементов: «БЕЛЫЙ», «КРАСНЫЙ» и т. Д Для построения синтаксически правильных предложений из слов множества W необходимо задать правила определения предлогов и окончаний на основе знаний синтаксиса, который устанавливает структуру разных типов предложений и роль каждого слова как члена предложения. Однако однозначное задание указанных правил, исходя только из синтаксиса, без учета семантики отношений между словами в предложении не всегда возможно. Например, для обстоятельства места, отвечающего на вопросы: где?, куда?, откуда?: (где?) «НА ПОВЕРХНОСТИ» —предложный падеж, (откуда?) «ИЗ ПРИЕМНИКА» — родительный падеж, (куда?) «В ОТВАЛ» — винительный падеж. В связи с этим для однозначного и формального описания подобных правил необходимо первоначально задать множество /*" —совокупность семантических правил (или правил вывода) в виде F = FIUF2, где F1 — множество семантических отношений между словами ОЕЯ в предложении — парадигматических и синтагматических.

В качестве синтагматических (контекстуальных) отношений выбрана паласная грамматика Филлмора, которая позволяет находить соответствие между словами в предложении и их семантическим представлением (16, 1е)]. Падежная грамматика Филлмора исходит из того, что основой каждого предложения является сказуемое, выраженное глаголом, а все другие члены — его аргументы. Все аргументы находятся к нему в определенном отношении и в соответствии с их функциональной ролью могут иметь 10 семантических падежей или отношений.

AGENTIV— «АГЕНТ» — одушевленный или неодушевленный субъект— исполнитель действия, выраженного глаголом, член предложения — подлежащее,.

OBJECT — «ОБЪЕКТ» — имя существительное, на которое распространяется действие или состояние, выражаемое глаголом.

DIST— «МЕСТОПОЛОЖЕНИЕ» — место действия или состояния, выражаемое глаголом.

DATIV— «ДАТИВ» — лицо, к которому имеет отношение действие или состояние, выражаемое глаголом.

INSTRUMENT— «ИНСТРУМЕНТ» —неодушевленная сила или предмет, с помощью которого совершается действие, выраженное глаголом, и т. д.

На показано дерево синтаксического подчинения (ДСП), иллюстрирующее различныетипы семантических отношений между словами ОЕЯ, не относящиеся к сказуемому, выраженному глаголом «выпали» в предложении «выпали желтые игольчатые кристаллы готового продукта».

Для указания семантических отношений между предложениями и построения фраз ОЕЯ используются логические отношения вершины отображают слона — члены предложения; дуги — синтагматические отношения между слонами в ниже падежей Филлмора (agent, сн, object) (и), «v» (или), «-» (не), а также отношение включения. Последнее отношение отображает смысловые структурно-классифицированные связи между объектами, описываемые в технологических текстах. Логические отношения используются для отображения сложносочиненных и сложноподчиненных предложений. Так, например, сложноподчиненное предложение ОЕЯ: «если цвет раствора-бурый, то прекратить дозирование» можно представить в виде логической структуры: 1 и 2 — безличные предложения: 1 — «цвет раствора — бурый*, 2-«прекратить дозирование*.

F2 — множество типов структур предложений ОЕЯ, которое формально описывается системой деревьев синтаксического подчинения (ДСП). ДСП — орграф, вершины которого отображают слова в предложении (либо коды слов ОЕЯ), а дуги — семантические отношения между ними, определяемые падежами Филлмора. Следовательно, каждое ДСП определяет не только синтаксис, но и семантику предложений ОЕЯ. Все вершины ДСП взвешены или пронумерованы. Нумерация вершин проводится следующим образом: № 1- вершина, соответствующая сказуемому в предложении, выраженному глаголом; все вершины, исходящие из вершины № 1, нумеруются слева направо. Аналогично нумеруются все оставшиеся вершины-потомки по отношению к порождающим их вершинам ДСП.

Построение ДСП позволяет реализовать принцип представления одной синтаксической структурой идентичные по смыслу, но синтаксически разные предложения ОЕЯ. На рис. 10.4 показано ДСП, отображающее синтаксическую и семантическую структуру трех предложений ОЕЯ: «в рубашку реактора включить горячую воду», «горячую воду включить в рубашку реактора», «включить горячую воду в рубашку реактора».

Теперь после построения ДСП можно однозначно задавать правила определения предлогов и окончаний, т. е. формализовать синтаксис ОЕЯ.

Множество Р—синтаксические правила построения предложений ОЕЯ, которое формализуется системой синтаксическо-морфологических цепей. Синтаксически-морфологическая цепь (СМЦ) — линейная структура, задающая порядок слов в предложении и их типы связей между собой: согласование, управление, примыкание, в которых одно слово главное, а другое —зависимое. Рассмотрим сущность синтаксических связей. Согласование — такая связь, при которой зависимое слово ставится в том же числе, роде, падеже, лице, что и основное слово; так в предложении «образовалась блестящая поверхность» 'зависимые слова «образовалась» и «блестящая» —3-го лица, женского рода, единственного числа, а слово «блестящая» стоит в именительном падеже, так же как и основное слово «поверхность».

Управление ~ такая связь, при которой зависимое слово ставится в том же падеже, какого требует основное слово.

Примыкание— такая связь, при которой зависимое слово связывается с основным только по смыслу. Примыкают неизменяемые слова в предложении: наречия, деепричастия, неопределенная форма глагола.

Каждая СМЦ состоит из последовательности пятисимвольных кодов, в котором каждый четырехбуквенный код включает признаки типов синтаксических связей, признак части речи, а для существительных—признаки числа, падежа (для основных слов и при управлении), для глаголов — признак наклонения, времени и для прошедшего и будущего времени —числа, лица, рода.

Соответствие между словом или кодом в СМЦ и ДСП задает цифра в пятисимвольном коде СМЦ, обозначающая номер вершины слова в ДСП.

Построение для каждого предложения отображающих его ДСП и СМЦ означает, что ЭВМ осуществила полный грамматический разбор предложения. Очевидно, что СМЦ и ДСП позволяют реализовать принцип порождаемости ЯВТ, поскольку позволяют генерировать новые семантически и синтаксически правильные предложения ОЕЯ.

Таким образом, рассмотренный ЯВТ формализует грамматику и алфавит ОЕЯ в области химической технологии производства органических веществ и позволяет ЭС определять смысл технологических текстов, без которых невозможно найти решение НФЗ синтеза ресурсосберегающих ХТС.

Показать весь текст
Заполнить форму текущей работой