Методики описания ПВ-отношений
Работу данной сети можно разделить на два этапа, а именно обучение сети и распознавание входной информации. Обучение выглядит как процесс, в ходе которого изменяются весовые коэффициенты, благодаря им работают нейронные сети. Один из способов изменения коэффициентов происходит следующим образом: коэффициенты остаются неизменными, если результат верный, уменьшаются в случае, если сеть не выдала… Читать ещё >
Методики описания ПВ-отношений (реферат, курсовая, диплом, контрольная)
В данной части были рассмотрены основные модели знаний, которые можно применять в семантическом анализе естественного языка. Их можно разбить на три классификации: логические модели, эвристические модели и нейронные сети.
Логическая модель Логическая модель является формальной теорией (системой), которая состоят из алфавита, который задает сущности реального мира, формулы-факты, формулы-аксиомы и правила вывода.
К логической модели, в свою очередь, можно отнести реляционные модели, предикативные и псевдофизическую логику.
ѕ Реляционная модель В реляционной модели данных (РМД) [7,8] знания представляются с помощью двумерных таблиц. В основе модели лежит понятие отношения (таблица), элементы отношений — кортежи (строка), элементы кортежа — атрибуты (столбец). Поиск в РМД представляется как выбор по определенным критериям и по группировке данных. Операции реляционной алгебры были созданы для обработки данных в отношениях, она оперирует отношениями, кортежами и атрибутами, после чего формируются новые отношения.
Для описаний операций был создан язык SQL, но использование специального языка затрудняет работу с семантическим поиском для пользователя, так как он не может формировать поисковый запрос на естественном языке. Также в модели невозможно описать объект, если он имеет сложную структуру. Чтобы устранить данный недостаток, был создан объектно-реляционный подход, который объединяет в себе объектно-ориентированный подход (ООП) и реляционный. Но модель не получила распространения, так как она чрезвычайно сложна.
ѕ Предикативная модель В предикатной модели используется логика предикатов и только те конструкции, которые могут поддаваться сложной формализации. Язык логики предикатов способен описывать понятия и связи между понятиями.
В качестве предикатов используются абстракции двух видов: объекты определенной предметной области (термы), а также поведение и свойства объектов и отношений (предикаты).
Эвристическая модель Эвристические модели описывают структуры знаний, занимается процессом поиска решения задачи. К ней можно отнести фреймовые модели с ООП, сетевые модели и семантические сети.
ѕ Фреймовая модель и ООП Фрейм — это модель абстрактного образа для описания сущностей объектов, явлений, и т. п., он создан для представления знаний в искусственном интеллекте. Фрейм имеет структуру, состоящий из полей: имя фрейма, множество слотов (состоят из имени слота и его значения) и множество процедур, которые связаны с фреймами или слотами. Процедуры могут быть двух типов: демоны и слуги. Демоны запускаются автоматически при обращении к определенному слоту фреймовой модели, слуги запускаются явно. 9,10].
Фреймы могут иметь иерархическую конструкцию, которая используется для описания сложный объектов и их поведения, так как в слотах фреймов могут использоваться ссылки на другие фреймы.
На основе фреймов был создан ООП, в качестве фрейма является объект, процедурой является метод, а с помощью подклассов обеспечивается иерархическая конструкция. Благодаря ООП, дополняется функция наследования классов, облегчающая создание новых классов из существующих.
К преимуществам модели можно отнести достаточно развитую абстракцию данных, а также программы и легкую вербализацию знаний. Но у модели также есть и недостатки, к которым относится трудность реализации вычислений в распределенной вычислительной системе и трудность модификации информационной структуры, следовательно, данную модель будет тяжело обучить новым знаниям.
ѕ Семантическая сеть Семантическая сеть имеет вид ориентированного графа и представляется как множество узлов и связями между ними. Связи могут быть любыми, например: временными, пространственными, атрибутными, причинно-следственными и т. п. В случае, если сеть нацелена на семантический анализ, то к каждому узлу присваивается определенное понятие, например: возраст, рост, расстояние и т. п. Можно задать шаблон какого-то определенного понятия, при помощи фрагмента сети. В шаблон будут входить связи между словами и их ограничения (в русском языке в качестве ограничений выступают падеж, род, число и т. д.), при этом ограничения между словами не только синтаксические, также они семантические [11].
Анализ языка в семантической сети представляется в виде процесса поиска фрагментов исходного текста на совпадения при помощи заранее подготовленных шаблонов. В случае, если новые связи подходят под уже имеющийся шаблон, то он формирует этот фрагмент и извлекает из него смысл.
Также семантические сети можно принимать для информационного поиска, тогда запрос будет иметь набор фактов, которые оформлены в виде семантической сети, а в узлах будут присутствовать переменные, какие-то неопределенные значения вместо конкретных. В итоге поиск ответа на какой-то запрос будет сводиться к поиску похожего графа запроса к подграфу в семантической базе знаний. В случае, если такой подграф будет найден, то из базы знаний можно будет извлечь значения переменных, которые находятся в графе запроса.
Нейронные сети Нейронная сеть [12−14] имеет вид последовательности нейронов, которые соединяются между собой с помощью синапсов. Нейронные сети помогают решать сложные задачи, для которых требуется аналитические вычисления.
Работу данной сети можно разделить на два этапа, а именно обучение сети и распознавание входной информации. Обучение выглядит как процесс, в ходе которого изменяются весовые коэффициенты, благодаря им работают нейронные сети. Один из способов изменения коэффициентов происходит следующим образом: коэффициенты остаются неизменными, если результат верный, уменьшаются в случае, если сеть не выдала правильный результат и коэффициенты увеличиваются, когда сеть не только ошиблась с ответом, но и отвергла верный.
Преимуществом нейронной сети является способность решать трудные задачи на примерах и адаптивность к изменению окружающей среды. Но также нейронные сети имеют свои недостатки, к ним можно отнести трудность реализации, т.к. требуется многоцикловая настройка элементов, а также связей между ними. Еще одним недостатком является возможность тупиковых ситуаций при обучении.
Обзор ПВ-исчислений Для разработки модели для описания ПВ-отношений между физическими объектами, система управления базой данных (СУБД) самым уместным способом является применение графовой модели БД (сетевой).
Данные, которые будут храниться в БД, будут использоваться для информационного поиска, осуществляющегося двумя способами. Первый способ — это с помощью правил, которые используются для получения информации и доказательства гипотез. К данному способу относятся псевдофизические логики и пространственно-временные исчисления, такие как: CDA, RCC, дельта-исчисления логический способ, интервалы и т. д.
Главным минусом таких систем является неспособность обработки запросов, которые описывают сложные структурированные данные.
Второй способ применяется в графовых (сетевых) БД — это поиск по шаблону, он удобен для сложных структурированных данных. В данном случае запрос трансформируется в графовую информационную структуру, а после происходит поиск подграфа, который будет совпадать с графом-запросом.
Но ни один из вариантов не подходит для решения поставленной нами задачи. Так как второй может опираться только на информацию с имеющейся в БД, а первый способ поиска способен получать из имеющийся в наличии новую информацию, то лучший вариант — это соединить два способа. Для получения новых связей (семантических), используются правила, далее они добавляются в БД, тем самым повышая релевантность, и производится обработка запроса по шаблону.
ОА-грамматика ОА-грамматика представляется как граф-трансформированная система, которая обрабатывает ОА-граф.
Трансформационная часть модели позволяет получить новую информацию о пространственно-временных отношениях, из информации, которая уже имеется путем применения правил преобразования ОА-графа.
Пространственно-временные исчисления и различные логики, являются одними из важных предпосылок в создании трансформационной части. Одним из таких является псевдофизическая логика, которая описана в [6] здесь приставка «псевдо» означает, что аппарат служит для описания, как определенный субъект может воспринимать физический мир, а не сама физическая действительность. Также предпосылками создания были интервальная алгебра Алена [15], дельта-исчисление [16], исчисление пересечения областей [17] и т. п. Идея, что новую информацию о пространстве-времени можно получать с помощью применения преобразующий правил и определенных порождающих из уже имеющихся, была позаимствована из пространственно-временных исчислений. В случае с АО-грамматикой, будут применяться правила преобразования семантической сети. В действительности, ОА-грамматика представляет из себя граф-трансформирующую систему, которая обрабатывает ОА-граф. В ОА-грамматике присутствует четыре главных компонента: OAG={A, L, P, G}, где A — алфавит атрибутов ИП; L — алфавит нагрузок ИП (в этот алфавит входят не только числа и строки, но и ссылки (индексы) на ИК); G — первоначальный ОА-граф; P — правила преобразования ОА-графа. 2].
С помощью нотации записываются правила преобразования ОА-графа. Данное правило состоит из двух частей, левой и правой, которые разделены друг с другом знаком «>». Слева находится шаблон ОА-графа, а справа ОА-граф, на который потом заменяется первоначальный шаблон. Данное правило выполняется в том случае, если шаблон из левой части будет совпадать с подграфом в БД. ОА-грамматика использует следующие обозначения:
a = l — обозначение IP, где a? A, l? L (A — это множество атрибутов, L — это множество нагрузок ИП);
Name{…} - это ИК, где между фигурных скобок записываются обозначения ИП, которые входят в ИК), Name — это имя, которое заменят индекс ИК;
{… a= NameIC{Ip1,Ip2…} …} - это ИП, здесь в нагрузке находится указатель на ИК, NameIC — это имя ИК, оно может и не указываться;
* - это конкатенация ИК;
' - удаление первой или последней ИП из IC;
F — выделение первой ИП в ИК;
L — выделение последней ИП в ИК;