Помощь в написании студенческих работ
Антистрессовый сервис

Обобщенная схема естественно-языковой системы

РефератПомощь в написанииУзнать стоимостьмоей работы

Под выразительной мощностью понимается возможность выразить разнообразные понятия, отношения, кванторы, процедуры и т. п. Естественность и выразительная мощность выходных высказываний в существующих системах различны. Например, высказывания могут фактически не синтезироваться, а выбираться из заранее заготовленного списка либо имеется шаблон ответа, в который подставляются некоторые слова… Читать ещё >

Обобщенная схема естественно-языковой системы (реферат, курсовая, диплом, контрольная)

Традиционные средства общения не позволяют обеспечить должного уровня взаимодействия конечных пользователей с создаваемыми системами. Чтобы быть полноправным участником общения, ЕЯ-система должна выполнять некоторые обязательные функции. К этим функциям относятся по крайней мере следующие: ведение диалога — определение его структуры и той роли, которую система и пользователь выполняют на текущем шаге диалога; понимание — преобразование поступающих от пользователя высказываний на ЕЯ в высказывания на языке внутреннего представления; обработка высказываний — формирование или определение заданий для решения задач или подзадач на данном шаге диалога; генерация — формирование выходных высказываний на ЕЯ. Приведенные функции имеют обобщенный характер. Поэтому необходимо подчеркнуть, что при реализации конкретных ЕЯ-систем суть этих функций может в значительной степени варьироваться.

В соответствии с выделенными функциями обобщенная схема ЕЯ-системы (рисунок 1.1) может быть представлена в виде трех компонентов: диалогового, компонента понимания высказываний, компонента генерации высказываний.

К основным задачам диалогового компонента относятся: ведение диалога, формирование или обработка перехватов инициативы.

Ведение диалога направлено на обеспечение целесообразных (т.е. способствующих достижению конечных целей пользователя) действий системы на текущем шаге диалога. В связи с тем что возможности существующих ЕЯ-систем не позволяют им самостоятельно формировать целесообразное поведение, в систему обычно вводится информация, определяющая общую и тематическую структуры диалога. По структуре и текущему состоянию диалога диалоговый компонент формирует (если инициатива принадлежит системе) или определяет (если инициатива принадлежит пользователю) задание, выполняемое системой на текущем шаге (например, генерация вопроса, понимание ответа и его обработка, генерация утверждения и т. п.).

Ведение диалога выполняется по одной из двух схем: диалог ведет пользователь, диалог ведет система. В первом случае инициатива в основном (за исключением сообщений об ошибках) находится у пользователя, а система только реагирует на его требования, определяя по виду требования тип задания. Разбиение задачи на подзадачи и распределение ролей осуществляет пользователь, т. е. для системы весь диалог сводится к выработке реакций на текущие высказывания пользователя.

Можно сказать, что в этом варианте работы функции диалогового компонента практически отсутствуют. Во втором случае инициатива в основном принадлежит системе. Она ведет диалог в соответствии с имеющимися у нее представлениями о структуре диалога (т.е. о разбиении задач на подзадачи и о том, кто из участников, когда и какую подзадачу решает) и о способе обмена высказываниями.

Если роли участников неизменны, однозначны и предопределены заранее, то структуру диалога называют жесткой. В простейшем случае такая структура диалога сводится к двум взаимосвязанным высказываниям участников (вопрос — ответ) с указанием участника, владеющего инициативой. Развитием жесткой структуры является альтернативная структура, которая задает множество возможных (но ранее предписанных) направлений течения диалога. Выбор одного из возможных направлений осуществляет пассивный участник. Если роли участников общения распределяются в ходе общения, то структуру диалога называют гибкой. Гибкие структуры подразделяются по степени свободы выбора момента перехвата (предопределенные моменты, произвольные моменты) и способу перехвата (предопределенный способ перехвата, произвольный способ).

Вторая задача диалогового компонента связана с тем, что реакции одного участника могут не соответствовать ожиданиям другого. В зависимости от того, кто осуществляет перехват инициативы, система либо формирует перехват, либо обрабатывает его. Формирование происходит в тех случаях, когда система определяет, что текущая ситуация не соответствует ситуации, предусмотренной структурой диалога. Если же перехват инициативы осуществляет пользователь, то задача системы — обработать его, т. е. распознать наличие перехвата инициативы, определить новую тему (цель), на которую перешел пользователь, и выбрать структуру диалога, соответствующую новой теме.

Компонент понимания высказываний предназначен для выделения смысла входного высказывания и выражения этого смысла на внутреннем языке системы. Под смыслом высказывания обычно понимается вся та семантико-прагматическая информация, которую пользователь хотел передать системе. Внутреннее представление смысла должно содержать по крайней мере следующую информацию: сущности предметной области, вовлекаемые в зону рассмотрения данным высказыванием; свойства и отношения, приписанные этим сущностям; коммуникативные намерения говорящего, выраженные в данном высказывании. Выявление смысла высказывания в общем случае требует его рассмотрения в контексте всего диалога.

Традиционно задача понимания высказываний подразделяется на два этапа: анализ и интерпретацию. На этапе анализа выделяются описания сущностей и отношения между ними. Анализ обычно выполняется отдельным блоком-анализатором, служащим ядром компонента понимания. Анализаторы, разрабатываемые для ЕЯ-систем, различаются по ряду параметров. Основные из них: тип анализируемых предложений; выделяемые описания сущностей; глубина проникновения в смысл; используемые для анализа средства. Возможные значения этих параметров приведены в таблице. При рассмотрении данной таблицы следует учитывать, что тот или иной параметр в случае конкретного анализатора может принимать одно или несколько из указанных в таблице значений.

Интерпретация заключается в отображении входного высказывания на знания системы. Основными задачами данного этапа являются: буквальная интерпретация высказывания в контексте диалога; интерпретация высказывания на намерения говорящего.

Буквальная интерпретация состоит в учете контекста диалога, идентификации образов тех сущностей области интерпретации, которые имел в виду говорящий. В качестве области интерпретации могут использоваться: предметная область; область языка общения (если высказывание пользователя касается языка общения); область системы (если пользователь интересуется возможностями и состояниями системы; интерпретация на эту область особенно важна при возникновении «непонимания» между пользователем и системой); область пользователя (если высказывание содержит сведения о знаниях или намерениях пользователя); область дискурса (если в высказывании содержатся ссылки на предыдущие или последующие высказывания).

Основные параметры ЕЯ-системы.

Параметр

Возможные значения.

Типы анализируемых предложений.

Повествовательные, вопросительные, отрицательные, полные, неполные, простые, сложные, распространенные, нераспространенные и др.

Выделяемые описания сущностей.

Понятия.

Конкретные (индивидуальные), абстрактные, метапонятия.

Отношения.

Предикаты.

Вспомогательные, предикаты-состояния, предикаты-действия, функциональные и др.

Кванторы.

Отсутствие кванторов, кванторы существования всеобщности, отрицания.

Модальности.

Отсутствие модальностей, объективная и субъективная.

Пресуппозиции.

Отсутствие пресуппозиций, экзистенциональные, семантические, прагматические.

Глубина проникновения в смысл.

Множество ключевых слов, имя события и описания участников события (их роли и характеристики), сценарий с отсылками к связанным подсценариям, пространственно-временное или причинное представление ситуации.

Используемые средства.

Морфологический, синтаксический, семантический, прагматический анализ.

Вторая задача интерпретации состоит в том, чтобы, применяя имеющиеся у системы методы вывода, определить, как обрабатываемое высказывание соотносится с целями и планами участников общения. Строго говоря, данная задача решается совместно диалоговым компонентом и компонентом понимания высказываний.

Как отмечалось, одной из функций диалогового компонента является определение отношения входного высказывания к текущей цели. При выполнении этой функции текущая цель (т.е. ее описание в форме внутреннего представления) передается компоненту понимания, который пытается интерпретировать на нее входное высказывание. Решение данной задачи в общем случае представляет собой чрезвычайно сложную проблему. Пока даже не ясен механизм (модель) формирования текущих целей диалоговым компонентом. Положение усугубляется тем, что одно и то же высказывание может использоваться для достижения целей, относящихся к различным областям.

Компонент генерации высказываний решает в соответствии с результатами, полученными остальными компонентами системы, две основные задачи: генерация смысла, т. е. определение типа и смысла выходного высказывания системы во внутреннем представлении; синтез высказывания, т. е. преобразование смысла в высказывание на естественном языке. Первая из указанных задач является сложной и малоизученной. Тип высказывания зависит от состояния системы и результатов, полученных предыдущими компонентами. Так, если система должна генерировать ответ на вопрос, то необходимо определить по состоянию системы, будет ответ прямой или косвенный. Прямой ответ (т.е. по существу заданного вопроса) может быть дан только в том случае, если обработка вопроса завершилась успешно. Если в процессе обработки вопроса возникают какие-то затруднения, то более уместным будет косвенный ответ, раскрывающий суть возникших затруднений и объясняющий невозможность прямого ответа.

В общем случае при решении задачи формирования смысла выходного высказывания необходимо учитывать прагматический аспект, т. е. цели участников общения. Однако в большинстве существующих систем данная задача решается с помощью достаточно простых подходов.

В промышленных системах общения генерация смысла обычно заключается в редактировании значений атрибутов и (или) выборе шаблона ответа. В экспериментальных системах для выражения смысла генерируется полное семантическое представление, включающее одно или несколько связанных событий (понятий) с одним или несколькими исполнителями на каждую роль.

Вторая задача компонента генерации высказываний состоит в синтезе естественно-языкового выражения, соответствующего внутреннему представлению выходного высказывания. Данная задача подразделяется на этапы семантического, синтаксического и морфологического синтеза. Сложность синтеза определяется требованиями естественности и выразительной мощности выходных высказываний. Под естественностью обычно понимается степень близости к естественному языку, т. е. наличие таких свойств, как синонимия и омонимия слов и словосочетаний, свободный порядок слов и т. п.

Под выразительной мощностью понимается возможность выразить разнообразные понятия, отношения, кванторы, процедуры и т. п. Естественность и выразительная мощность выходных высказываний в существующих системах различны. Например, высказывания могут фактически не синтезироваться, а выбираться из заранее заготовленного списка либо имеется шаблон ответа, в который подставляются некоторые слова, представляющие собой значения искомых атрибутов; при этом часто используется морфологический синтез. Большая естественность достигается, если выходное высказывание формируется из семантического представления события (или понятия) с применением морфологии, синтаксиса (для определения порядка и формы слов) и семантики (для выбора лексем и обеспечения семантической сочетаемости слов в синтезируемом высказывании).

Для понимания принципов построения ЕЯ-систем важен также вопрос об используемых в системе знаниях, поскольку именно знания, представленные в различных формах, являются той базой, на которой осуществляется решение рассмотренных выше задач.

Знания ЕЯ-систем можно классифицировать по различным основаниям. Будем придерживаться следующей классификации (рисунок 1.2). На верхнем уровне выделяются: собственно знания; способ представления знаний.

Знания ЕЯ-систем.

Рисунок 1.2 Знания ЕЯ-систем Собственно знания классифицируются по областям и по видам знаний. Наиболее существенными с точки зрения процесса ЕЯ-общения являются следующие области знаний: предметная область; область языка; область системы; область пользователя; область диалога (дискурса). Разнообразие областей определяет множество возможных интерпретаций входных высказываний.

К основным видам знаний относятся факты (фактические знания) и операционные знания. Факты представляют собой возможные знания о сущностях, составляющих некоторую область знаний. Операционные знания — это информация о способах изменения фактических знаний. Иначе говоря, эти знания задают процедуры преобразования. Часто для их обозначения используется термин «процедурные знания», однако следует иметь в виду, что операционные знания могут быть представлены как в процедурной, так и в декларативной форме.

Способ представления знаний включает два аспекта: способ организации знаний и модель представления. Способы организации знаний различаются по уровням представления и уровням детальности. По уровням представления выделяют знания нулевого уровня (конкретные и абстрактные знания) и знания более высоких уровней (метазнания). Первый уровень составляют знания о том, как в системе представлены знания нулевого уровня. Число уровней представления может быть продолжено. Разделение знаний по уровням представления обеспечивает возможность гибкой настройки и адаптации ЕЯ-системы. Организация знаний по уровням детальности позволяет рассматривать знания с различной степенью подробности. Количество уровней детальности зависит от специфики решаемых задач, количества знаний и способа их представления. Обычно выделяется не менее трех уровней, отражающих общую организацию знаний, логическую и физическую организацию частных структур знаний.

Введение

нескольких уровней детальности обеспечивает дополнительную гибкость системы, т.к. изолирует изменения одного уровня от других. Модели представления знаний обычно подразделяются на логические и эвристические.

Показать весь текст
Заполнить форму текущей работой