Настройка естественно-языковых систем
Возможности приобретения знаний в гибких ЕЯ-системах основаны на использовании различных способов представления проблемно-независимых и проблемно-ориентированных знаний. Предполагается, что знания ЕЯ-системы могут быть разделены на проблемно-независимые, используемые в любом из возможных приложений, и проблемно-ориентированные, определяемые спецификой конкретных приложений. Проблемно-независимые… Читать ещё >
Настройка естественно-языковых систем (реферат, курсовая, диплом, контрольная)
Гибкость ЕЯ-систем. Ограниченность предметной области имеет принципиальное значение, поскольку позволяет наложить вполне «естественные» для каждой из проблемных областей ограничения на лексику, синтаксис, семантику и прагматику языка общения. Это дает возможность рассматривать процесс ЕЯ-общения не во всем многообразии и сложности, а в более узкой (и, следовательно, более простой) постановке. Вместе с тем, чтобы обеспечить общение относительно различных проблемных областей, каждая из которых характеризуется собственными, отличающимися от других областей ограничениями, а также проблемных областей, изменяющихся во времени, ЕЯ-система должна допускать возможность модификации своих знаний, зависящих от специфики предметной области, в которой функционирует система.
Процесс извлечения знаний из некоторого источника и передачи их ЕЯ-системе называют приобретением знаний. В качестве источника знаний может выступать как человек, так и текст, в котором содержатся сведения о предметной области. Если знания ЕЯ-системы не могут приобретаться без участия ее разработчиков (или программистов), то такие системы называются жесткими. Очевидно, что жесткие ЕЯ-системы не удовлетворяют требованиям конечных пользователей к средствам общения.
Гибкие ЕЯ-системы допускают возможность приобретения знаний без привлечения программистов или разработчиков. Степень гибкости ЕЯ-системы определяется по крайней мере следующими факторами: составом (номенклатурой) приобретаемых знаний; пределами, в которых допускается модификация знаний; инициатором процесса приобретения знаний (пользователь или система); требованиями к уровню профессиональной подготовки лиц, участвующих в процессе приобретения знаний.
Возможности приобретения знаний в гибких ЕЯ-системах основаны на использовании различных способов представления проблемно-независимых и проблемно-ориентированных знаний. Предполагается, что знания ЕЯ-системы могут быть разделены на проблемно-независимые, используемые в любом из возможных приложений, и проблемно-ориентированные, определяемые спецификой конкретных приложений. Проблемно-независимые знания вводятся в ЕЯ-систему при ее разработке. Большая их часть представляется процедурно (т.е. в виде программ). Поэтому они не могут модифицироваться без участия программистов или разработчиков системы. Проблемно-ориентированные знания представляются декларативно (т.е. в виде фреймов, семантических сетей, выражений на языке исчисления предикатов, продукций и т. д.). Наиболее важное общее свойство декларативных представлений состоит в том, что механизм интерпретации декларативных знаний (т.е. программы ЕЯ-системы) не зависит от содержания этих знаний. Поэтому модификация декларативно представленных проблемно-ориентированных знаний может осуществляться без участия программистов или разработчиков системы.
Таким образом, состав приобретаемых знаний, а также пределы, в которых допускается модификация знаний, в каждой ЕЯ-системе зависят от масштабов использования в ней декларативно представленных знаний. Следует отметить, что применение декларативных представлений ведет в общем случае к ухудшению временных и объемных характеристик ЕЯ-системы. Поэтому при разработке конкретных ЕЯ-систем, особенно ориентированных на промышленное или коммерческое использование, часто приходится идти на компромиссы, т. е. искусственно «уменьшать» гибкость (за счет сокращения состава декларативно представленных знаний) для получения приемлемых технических характеристик.
Различаются два основных способа приобретения знаний: настройка и адаптация. Настройка обычно выполняется при первоначальном развертывании ЕЯ-системы на конкретном объекте эксплуатации и значительных изменениях предметной области, относительно которой ведется общение. Как правило, настройка ЕЯ-системы осуществляется в отсроченном режиме. Состав и объем приобретаемых в процессе настройки знаний, а также требования к уровню профессиональной подготовки персонала, выполняющего настройку, зависят от особенностей конкретной ЕЯ-системы. Адаптация заключается в оперативном приобретении знаний ЕЯ-системой в процессе решения задач пользователя. Инициатором адаптации обычно является система. При этом поскольку адаптация выполняется в процессе взаимодействия с пользователем, то никаких специальных требований к его знаниям не предъявляется.
В существующих ЕЯ-системах предусматривается настройка по различным параметрам (видам проблемно-ориентированных знаний). К основным из них относятся: знания о языке общения и сущностях предметной области; знания о пользователе, решаемых им задачах и структуре диалога, направленного на решение этих задач; знания об особенностях прикладной системы, взаимодействие с которой поддерживается ЕЯ-системой. Большинство ЕЯ-систем имеет определенную прикладную ориентацию (общение с базой данных, диалоговое решение задач, обработка связного текста). Это позволяет исключить необходимость настройки по некоторым из параметров и улучшить временные и объемные характеристики системы. Так, общение с базой данных (БД) характеризуется относительной устойчивостью решаемых пользователями задач. Поэтому в большинстве ЕЯ-систем для общения с БД предусматривается настройка по первому и третьему параметрам. Для систем обработки связных текстов характерна жесткая «привязка» к средствам хранения информации, поэтому системы данного класса допускают настройку по первому и (в значительной степени) по второму параметрам. Системы диалогового решения задач в принципе должны иметь возможность настраиваться по всем трем указанным параметрам. Однако в настоящее время большинство из них ориентируется на заранее определенные средства решения задач (в частности, на экспертные системы). Поэтому настройка систем диалогового решения задач, как правило, допускается по первому и второму параметрам.
В зависимости от требований, предъявляемых к уровню профессиональной подготовки лиц, осуществляющих настройку, системы ЕЯ-общения могут быть подразделены на классы:
- 1) системы, для создания которых требуется знание лингвистики;
- 2) системы, настраиваемые администратором базы данных;
- 3) системы, настраиваемые специалистом в прикладной предметной области (прикладным специалистом) или непосредственно конечным пользователем. Системы, составляющие последний класс, получили название «переносимых».
Необходимость знания лингвистики для настройки системы характерна для ранних ЕЯ-систем. Настройка подавляющего большинства современных ЕЯ-систем может выполняться администратором базы данных или прикладным специалистом (т.е. людьми, от которых не требуется знание лингвистики). Типичным примером ЕЯ-системы, настройка которой осуществляется администратором БД, может служить система INTELLECT. Эта система осуществляет поиск из одного файла БД по запросам пользователя на английском языке. Настройка системы заключается в фиксации положения (или изменении) ее словаря. Словарь содержит слова двух типов: функциональные, они поставляются вместе с системой, и слова, которые вводятся в процессе настройки или адаптации. К функциональным словам относятся: что, когда, в, все, какие, сколько, напечатать и т. д. Сематика этих слов заранее известна системе и не может изменяться при использовании системы в любом из приложений. Слова второго типа отражают специфику конкретной предметной области, содержащейся в файле БД. К ним относятся и слова типа служащий, фамилия, город, зарплата и т. п. Эти слова, а также их синонимы определяются администратором БД и с помощью специального языка вводятся в систему. Поскольку администратор базы данных не может заранее предусмотреть всех слов, соответствующих значениям атрибутов, то они записываются в словарь в процессе адаптации системы в результате уточняющих поддиалогов, инсценируемых системой.
Примером переносимых систем могут служить такие, как АИСТ, TEAM или IRUS. В отличие от системы INTELLECT они обеспечивают ЕЯ-общение не с одним, а с несколькими связанными файлами БД. При этом настройка допускается не только на язык общения и сущности предметной области, но и на логическую структуру БД и тип СУБД (в рамках заданного класса СУБД).
Переносимость налагает на разработчиков ЕЯ-системы достаточно жесткие ограничения, которые в полном объеме в существующих системах пока не выполняются. Во-первых, используемый синтаксис должен задаваться общей грамматикой ЕЯ, а не проблемно-ориентированным множеством правил. Это позволяет исключить из процесса настройки модификацию грамматики языка общения. Во-вторых, поскольку семантика языка общения не может зависеть от некоторого проблемно-ориентированного синтаксиса, выбранного для упрощения семантического анализа, то должен быть разработан общий механизм приобретения и присоединения семантики к широкому множеству синтаксических конструкций. В-третьих, лексика языка общения (словарь) также должна пополняться в процессе настройки. При этом вся необходимая информация специфицируется в терминах, ориентированных на пользователя или прикладного специалиста. И, наконец, в-четвертых, доступ к БД должен предусматривать возможность использования приобретаемых в процессе настройки знаний для перевода того, что было сказано в запросе пользователя, в запрос, соответствующий логической структуре БД. При этом от пользователя и процесса анализа скрыто, присутствует требуемая пользователем информация явно или выводится из информации, имеющейся в БД.
Как правило, в переносимых ЕЯ-системах процесс настройки рассматривается как отдельная задача, которая может решаться либо средствами самой ЕЯ-системы (АИСТ, TEAM), либо с помощью специальной, дополнительной ЕЯ-системы. Последнее имеет место в системе IRUS, для настройки которой применяется специальная ЕЯ-система IRACQ. Блок настройки позволяет «переложить» инициативу и значительную часть ответственности за процесс настройки с лица, производящего настройку (пользователя или прикладного специалиста), на систему. При этом пользователь или прикладной специалист избавляются от заботы о полноте и непротиворечивости вводимой в систему информации, а также от необходимости знания особенностей используемых в настраиваемой ЕЯ-системе способов представления проблемно-ориентированных знаний.
Адаптация ЕЯ-систем. Основу процесса адаптации составляет оперативное приобретение знаний, недостающих ЕЯ-системе для обеспечения эффективного удовлетворения информационных потребностей конечного пользователя в конкретных ситуациях общения. Необходимость адаптации ЕЯ-систем обусловлена тем, что при настройке системы, как правило, не удается предусмотреть все будущие изменения предметной области.
По сравнению с настройкой адаптация является более сложным процессом, т.к. оперативный (т.е. в процессе решения задач пользователя) характер ее выполнения требует в общем случае многоаспектной интерпретации высказываний пользователя (т.е. интерпретации на несколько областей знаний системы). В настоящее время данная задача еще не имеет общего решения, которое может быть рекомендовано для практического применения. В связи с этим возможности адаптации действующих ЕЯ-систем, как правило, весьма ограничены. В большинстве существующих ЕЯ-систем предусматривается адаптация к терминологии, используемой в высказываниях пользователя. Следует также отметить возросший в последнее время интерес к адаптации ЕЯ-систем к уровню квалификации пользователя и решаемых им задач.
Рассмотрим адаптацию к терминологии пользователя. Обычно она выполняется в процессе уточняющего поддиалога, инициируемого системой при обнаружении в высказывании пользователя неизвестных ей слов. При этом система использует заранее заготовленный сценарий уточняющего поддиалога. Приведем три типовых сценария, получивших наиболее широкое распространение в современных ЕЯ-системах. Согласно первому сценарию пользователь «приравнивает» новый термин (или фразу) к структурам, уже известным системе. Например: Кто преподает дискретную математику? — Слово преподает — неизвестно. — Преподает означает то же, что и ведет занятия. — Дискретную математику преподает доцент Петров.
В соответствии со вторым сценарием система с помощью последовательности простых вопросов предлагает пользователю выработать необходимое определение, в результате чего она получает как синтаксическую, так и семантическую информацию о новом термине. Фактически в данном случае управление передается блоку приобретения знаний, используемому при настройке ЕЯ-системы.
Третий сценарий основан на предположении, что неизвестный термин представляет собой значение, имеющееся в базе данных. Такое предположение оправдано, если ЕЯ-система сопряжена с большой, быстро изменяющейся БД. В этом случае нецелесообразно включать в словарь все значения БД, а смысл неизвестного слова может рассматриваться как имя ее поля (атрибута), чьим значением служит данное слово. Примером системы, использующей этот сценарий (вместе с первым из рассмотренных сценариев), может служить ЕЯ-система INTELLECT. Приведем пример уточняющего диалога, построенного на основе данной стратегии. В примере действия пользователя обозначаются через П, а системы — С.
П. Сообщите Ф.И.О. бухгалтеров, зарегистрированных в службе занятости в г. Иванове.
С. Слово «Иванове» системе неизвестно.
Если вы предполагаете найти это слово в базе данных, нажмите клавишу «Возврат». В противном случае исправьте его написание или введите синоним.
П. (нажимает клавишу «Возврат»).
С. В каком поле оно должно появиться?
П. Город.
С: Напечатать фамилии всех, зарегистрированных в город — Иванове и должность — бухгалтер?
Число записей в отчете = 86: Иванов И. И., Петров П. П. и т. д.
В заключение отметим, что для действующих ЕЯ-систем характерно использование не какого-либо одного, а сразу нескольких из рассмотренных сценариев. Поэтому при обнаружении незнакомого термина система предоставляет пользователю возможность выбора одного из имеющихся у нее сценариев (см. предыдущий пример).