Помощь в написании студенческих работ
Антистрессовый сервис

Автоматизированное формирование лингвистических баз знаний: Интеграционный подход

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Тексты предметной области отражают сегодняшний срез языковой реальности. Однако для получения адекватной информации необходимо использовать большие (представительные) выборки текстов, которые сложно формировать и поддерживать в актуальном состоянии. Обычно ЛБЗ сформированная на основе выборки текстов успешно может быть использована на текстах из этой выборки или очень близких к ним… Читать ещё >

Автоматизированное формирование лингвистических баз знаний: Интеграционный подход (реферат, курсовая, диплом, контрольная)

Содержание

  • ГЛАВА 1. ОБЗОР МЕТОДОВ И ТЕХНОЛОГИЙ ФОРМИРОВАНИЯ ЛБЗ
  • Раздел
    • 1. 1. Жизненный цикл ЛБЗ
  • Раздел
    • 1. 2. Процесс формирования ЛБЗ
  • Раздел
    • 1. 3. Классификация методов автоматизированного формирования ЛБЗ
  • Раздел
    • 1. 4. Обзор методов формирования ЛБЗ
      • 1. 4. 1. Лексический уровень./
      • 1. 4. 2. Синтаксический уровень
      • 1. 4. 3. Семантический уровень
      • 1. 4. 4. Энциклопедический уровень
  • Раздел
    • 1. 5. Особенности ЛБЗ, их формирования и использования
      • 1. 5. 1. Особенности лингвистической информации и процесса ее формирования
      • 1. 5. 2. Особенности ЛБЗ как информационного ресурса
      • 1. 5. 3. Основные требования к моделям ЛБЗ и процесса ее формирования
      • 1. 5. 4. Особенности системы автоматизированного формирования ЛБЗ (САФЛБЗ)
  • Раздел
    • 1. 6. Основы модели формирования ЛБЗ
      • 1. 6. 1. Логический подход
      • 1. 6. 2. Нечеткая математика
      • 1. 6. 3. Нейронные сети
      • 1. 6. 4. Статистические подходы
      • 1. 6. 5. Сети Петри
      • 1. 6. 6. Фреймы и объектный подход
  • ГЛАВА 2. МЕТАМОДЕЛЬ ЛБЗ
  • Раздел
    • 2. 1. Выбор базовых технологий и подходов для построения МЕТ AMO ДЕЛИ
  • Раздел
    • 2. 2. Описание МЕТАМОДЕЛИ
      • 2. 2. 1. Введение
      • 2. 2. 2. Обзор МЕТАМОДЕЛИ
      • 2. 2. 3. Соглашения по именованию и обозначения
      • 2. 2. 4. Стереотипы
      • 2. 2. 5. Именованные значения
      • 2. 2. 6. Ограничения и правила построения моделей
  • ГЛАВА 3. КОРРЕКЦИЯ СЛОВАРЕЙ N-ГРАММ
  • Раздел
    • 3. 1. Основные понятия
  • Раздел
    • 3. 2. Методы пополнения словаря биграмм
      • 3. 2. 1. Пополнение парадигмы
      • 3. 2. 2. Трансформации
      • 3. 2. 3. Кластеризация
  • Раздел
    • 3. 3. Коррекция словаря биграмм общеупотребительной лексики американского английского языка
      • 3. 3. 1. Виды неполноты парадигмы в словаре биграмм американского английского
      • 3. 3. 2. Пополнение парадигмы глаголов
      • 3. 3. 3. Пополнение парадигмы существительных
      • 3. 3. 4. Пополнение диграммами с числительными
      • 3. 3. 5. Пополнение биграммами с местоимениями
      • 3. 3. 6. Другие возможности коррекции словаря биграмм
  • Раздел
    • 3. 4. Применение методов пополнения словаря ы-грамм
      • 3. 4. 1. Обобщение сформулированных правил для коррекции словарей п-грамм
      • 3. 4. 2. Оценка качества коррекции словаря п-грамм
  • ГЛАВА 4. ФОРМИРОВАНИЕ ГРАММАТИЧЕСКОГО СЛОВАРЯ РУССКОГО ЯЗЫКА
  • Раздел
    • 4. 1. Преобразование грамматического словаря русского языка
      • 4. 1. 1. Морфологическая модель и принципы ее реализации
      • 4. 1. 2. Программный комплекс формирования словаря
  • Раздел
    • 4. 2. Автоматизированное пополнение словаря
      • 4. 2. 1. Проблемы пополнения словаря и пути их решения
      • 4. 2. 2. Метод автоматизированного пополнения словаря
  • ГЛАВА 5. МОДЕЛЬ ТЕЗАУРУСА ДЛЯ АВТОМАТИЗИРОВАННОГО ФОРМИРОВАНИЯ Раздел
    • 5. 1. Введение
  • Раздел
    • 5. 2. Модели тезаурусов
      • 5. 2. 1. Граф понятий
      • 5. 2. 2. Граф понятий и лексем
  • Раздел
    • 5. 3. Модель тезауруса на основе лингвистической модели «Смысл — Текст»
  • Раздел
    • 5. 4. Математическая модель тезауруса
      • 5. 4. 1. Теоретико-множественные операции над тезаурусами
      • 5. 4. 2. Некоторые метрики
      • 5. 4. 3. Отображение явлений синонимии и омонимии на модель тезауруса
      • 5. 4. 4. Подход к разрешению омонимии
  • ГЛАВА 6. СИСТЕМА АВТОМАТИЗИРОВАННОГО ФОРМИРОВАНИЯ ЛБЗ
  • Раздел
    • 6. 1. Базовые технологии
  • Раздел
    • 6. 2. Архитектура

В настоящее время все больше текстов (книг, энциклопедий, документов) и иной информации создаваемой человеком переносится на электронные носители и число пользователей, заинтересованных в этой информации, постоянно растет. Возможность электронного представления и обработки текстовой информации стала новым фактором, стимулирующим рост ее количества и темпов создания. Уже на 1994 год в одних только Соединенных Штатах Америки с помощью компьютеров ежедневно формировалось более 2,7 миллиардов страниц текста [1]. В нашей стране, несмотря на явное отставание в области применения информационных технологий, в последние годы наблюдается значительное расширение сфер применения компьютерной обработки информации. Например, электронные документы уже стали средством общения граждан и государственных служб и в нашей стране: налоговые декларации за 1998 год принимались в электронном виде, практически все государственные службы принимают обращения граждан по электронной почте.

В связи с вышесказанным, очевидна необходимость систем, обрабатывающих естественный язык (ЕЯ-систем). Такие системы применяются практически во всех областях человеческой деятельности, и решают широкий спектр задач, начиная от поддержки набора текстов, до обработки запросов и генерации текстов и речи на естественном языке (ЕЯ).

На сегодняшний день известно множество областей успешного применения ЕЯсистем, среди которых наиболее развитыми являются:

• распознавание и генерация текста и речи;

• информационный поиск и управление документооборотом.

Общепризнанным фактом является то, что для достижения приемлемого для большинства задач качества ЕЯ-обработки необходимы специальные информационные массивы, содержащие информацию о языке.

Так, например, практически ни одна система распознавания речи не обходится без информации о статистических свойствах различных слов и их сочетаний в текстах. Более сложные системы применяют элементы синтаксического анализа, который практически неосуществим без наличия синтаксических и морфологических описаний языка.

В современных информационно-поисковых системах (ИПС) интенсивно используется информация о ЕЯ. Такие лингвистические понятия, как морфологический анализатор и словарь1 синонимов (тезаурус) прочно вошли в практику и используются практически во всех современным ИПС.

Основной проблемой создания информационного обеспечения ЕЯ-систем на сегодняшний день является сложность ЕЯ и невозможность полной его формализации. В отличие от формальных языков, которые могут быть полностью и точно описаны (т.е. указано множество возможных конструкций языка и правил их интерпретации), для естественного языка это сделать пока не представляется возможным. ЕЯ является отражением деятельности и внутреннего мира человека, вследствие чего представляет собой неформальную, открытую и постоянно изменяющуюся систему [2]. В связи с невозможностью построения компактной модели ЕЯ, обеспечивающей требуемый уровень качества обработки, часто нужны описания большого количества правил и отдельных языковых явлений.

Практика последних лет показала, что подходы к ЕЯ-обработке, основанные на поверхностной информации о языке, например, статистической, способны обеспечить лишь ограниченный уровень качества обработки (количества правильно распознанных слов, найденных релевантных документов и т. п.). Для повышения качества обработки требуется применение более сложной и лингвистически содержательной информации. Так, применение в системах распознавания речи статистических методов о совместной встречаемости словоформ в тексте позволяет обеспечить до 70−90% правильно распознанных словоформ. Применение же более сложных методов, таких, как локальный синтаксический анализ позволяют улучшить эти результаты до 95% и более.

Ввиду необходимости удовлетворять современным высоким требованиям к качеству ЕЯ-обработки, сложность и объем информационных массивов ЕЯ-систем обычно настолько велики, что для них адекватным является название «база знаний», пришедшее из искусственного интеллекта. Эти базы знаний содержат информацию о языке, поэтому за ними укрепилось название «лингвистических», т. е. «языковедческих». Таким образом в компьютерной лингвистике закрепился

1 Под термином «словарь» в данной работе понимается компьютерный словарь, если явно не оговорено иное. термин «лингвистическая база знаний» (ЛБЗ), который означает совокупность информации о ЕЯ, используемой ЕЯ-системой при ее работе.

В зависимости от решаемых задач, ЛБЗ ЕЯ-системы может включать различные словари, отличающиеся друг от друга глубиной проникновения в структуру описываемого языка и характером содержащейся информации.

Можно выделить несколько уровней глубины проникновения в структуру языка. Поверхностный уровень содержит информацию о «нелингвистических» свойствах языка. Примером компоненты этого уровня может служить частотный словарь орфограмм (последовательностей букв языка), применяемый в текстовых процессорах, для проверки правописания. При проверке, осуществляемой таким образом, ошибка фиксируется при наличии в лексеме не встречающихся или малочастотных орфограмм. Так, например орфограмма «ннн» не встречается в русском языке (за исключение аббревиатур), а ее появление является верным признаком распространенной опечатки. Компоненты лексического уровня содержат информацию об особенностях отдельных слов языка, например их морфологических свойствах или частотности. На синтаксическом уровне представлены знания о правилах связывания лексем в более сложные синтаксические конструкции — словосочетания, предложения, информация о синтаксических свойствах лексем (например, каждой лексеме может быть приписан некоторый синтаксический класс и указаны правила сочетания представителей этих классов в предложении). Семантический уровень содержит информацию о связях понятий проблемной области. Энциклопедический уровень содержит информацию о проблемной области, которая, вообще говоря, уже не относится к лингвистике, однако используется при глубинной обработке текстов, например, при извлечении информации из них [3,4].

Следует отметить, что распределение словарных компонентов по уровням является условным. Так, например, в лексических биграммах содержится информация не только о формах слов, но и о статистических характеристиках их сочетаемости. Поэтому эти словари можно отнести, как к лексическому, так и к синтаксическому уровню.

Поверхностный уровень Словари орфограмм

Лексический уровень Словари словоформ

Частотные словари словоформ

Словари основ и неизменяемых слов

Словари лексических п-грамм

Синтаксический уровень Грамматические словари

Частотно-грамматические словари

Словари грамматических п-грамм

Синтаксические правила

Словари моделей управления

Семантический уровень Словари семантических моделей управления

Тезаурусы

Энциклопедический уровень Проблемно-ориентированные базы знаний

Толковые словари

Таблица 1. Структура ЛБЗ

Формирование ЛБЗ представляет собой процесс сбора лингвистической информации, представления ее в виде, пригодном для автоматической обработки и поддержание этой информации в актуальном состоянии. Сбор лингвистической информации осуществляется на основе источников, которые могут быть классифицированы следующим образом:

• Люди2:

• эксперты-лингвисты;

• рядовые носители языка (в том числе и эксперты в предметной области).

• Тексты:

• описания языка, созданные специалистами;

2 Получение информации от экспертов-лингвистов и рядовых носителей языка может вестись как в непосредственном диалоге с ЭВМ (on-line), так и в пакетном режиме (off-line), когда некоторой программной системой обрабатываются протоколы интервью.

• тексты предметной области.

• Существующие ЛБЗ.

Использование всех этих источников необходимо, поскольку ни один из них не дает полной информации о языке:

• Хотя результаты лингвистических исследований обладают высокой степенью достоверности, они не покрывают весь спектр языковых явлений, которые необходимо описать в ЛБЗ, поскольку осмысление и описание новых языковых объектов и явлений неизбежно отстает от развития языка. Важным фактором, который также надо учитывать при использовании этих источников, является их субъективность, обусловленная, в частности, влиянием на позицию эксперта-лингвиста принадлежности его к той или иной лингвистической школе.

• В отличие от экспертов-лингвистов, рядовые носители языка непредвзяты в своей оценке языковых явлений. Но при этом, даже у экспертов в предметной области хорошее знание терминологии может сочетаться с недостаточной лингвистической компетентностью. Рядовой носитель языка зачастую не может правильно (с лингвистической точки зрения) описать, атрибутировать и классифицировать языковые феномены. В связи с этим следует отметить необходимость участия инженера знаний в процессе получения информации от рядовых носителей языка. Инженер знаний здесь выполняет ту же роль, что и при формировании баз знаний для экспертных систем.

• Строгость лингвистических описаний языка зачастую недостаточна для непосредственной формализации. Даже словарь Зализняка [5], который считается одним из наиболее формальных описаний русской морфологии, все же ориентирован на читателя-человека. К описаниям языка также относятся все замечания, сделанные выше относительно информации, полученной от экспертов-лингвистов, поскольку эти описания представляют собой одну из форм воплощения этой информации.

• Тексты предметной области отражают сегодняшний срез языковой реальности. Однако для получения адекватной информации необходимо использовать большие (представительные) выборки текстов, которые сложно формировать и поддерживать в актуальном состоянии. Обычно ЛБЗ сформированная на основе выборки текстов успешно может быть использована на текстах из этой выборки или очень близких к ним по лингвистическим особенностямнапример, тексты того же автора на ту же тему. Хорошим примером может служить эксперимент, проведенный с системой распознавания речи [6,7]. На текстах, публиковавшихся в течении нескольких лет в Уолл-Стрит Джорнал, было произведено обучение распознающей системы (составлены словари п-грамм). После такого обучения система распознавания достаточно хорошо распознавала тесты из Уолл-Стрит Джорнал (даже выпусков, не вошедших в тренировочный корпус). Однако при распознавании тестов из других источников было продемонстрировано существенно более низкое качество распознавания.

• Существующие ЛБЗ создавались в различных концептуальных и технических контекстах. Несовместимость обычно обнаруживается практически на любом уровне: от базовой лингвистической модели до кодировки символов.

Проблему формирования ЛБЗ обостряют также следующие моменты:

• Большой объем и сложность ЛБЗ.

• Значительная часть компонентов ЛБЗ, наиболее сложных и трудоемких для формирования, эффективно может быть использована только для подъязыка достаточно узкой проблемной области.

В силу указанных причин критической проблемой в области ЕЯ-обработки является проблема формирования лингвистических баз знаний (ЛБЗ). Как отметил академик Ершов в эпиграфе к книге [8], посвященной проблемам построения Машинного фонда русского языка — совокупности ЛБЗ, централизованно поддерживаемой и пополняемой в государственном масштабе, «Любой прогресс в области построения моделей и алгоритмов останется академическим упражнением, если не будет решена наиважнейшая задача создания Машинного фонда русского языка». К сожалению, в связи с общей тяжелой экономической ситуацией, создание Машинного фонда русского языка так и не было завершено. В результате, на сегодняшний день ситуация практически не изменилась.

Проблема формирования ЛБЗ является частью глобальной проблемы передачи человеческих знаний вычислительным машинам, решению которой посвящена область, называемая инженерией знаний. I

В силу необходимости привлечения экспертов, формирование ЛБЗ не может быть полностью автоматическим. Поэтому, ввиду объема и сложности ЛБЗ актуальной является проблема автоматизированного формирования. Под автоматизированным формированием ЛБЗ понимается совместная работа экспертов, инженеров знаний и вычислительных машин по формированию ЛБЗ.

Следует отметить, что формирование ЛБЗ является специальным видом ЕЯ-обработки.

Для каждого из указанных выше видов источников нужны свои специфичные способы извлечения лингвистической информации. В зависимости от особенностей используемых источников и формируемой ЛБЗ применяются различные методы обработки исходных данных, эвристики извлечения информации и их комбинации, а процесс формирования ЛБЗ является процессом достаточно сложным, трудоемким, насыщенным экспериментами. На сегодняшний день интеграция различных методов и технологических приемов становится необходимым условием успешного решения задачи автоматизированного формирования ЛБЗ.

При этом дают наибольший эффект и представляют наибольшую трудность для применения методы основывающиеся на различных, часто далеких друг от друга подходах. Так, например, комбинация статистических методов и методов локального синтаксического анализа позволяет обеспечить точность обработки свыше 94% в системах распознавания речи.

Такое сочетание открывает новые технологические возможности по сопровождению ЕЯ-систем. Если в системе используется только статистическая информация, то для отслеживания изменений в ЕЯ, приходилось бы довольно часто собирать и поддерживать представительные корпусы текстов для обновления статистики. Если используется только синтаксическая информация, то она отражает более фундаментальные закономерности и поэтому изменяется реже. Однако и изменение такой информации представляет собой более сложный процесс, требующий привлечения специалистов. Совместное использование двух видов информации может позволить увеличить интервалы между пересмотрами ЛБЗ профессиональными лингвистами, поскольку изменения в языке будут отражаться в более легко извлекаемой статистической информации. С другой стороны снижаются расходы на подготовку и сбор статистической информации, поскольку наиболее сложная информация, точность которой критична и для сбора требуется большой объем тренировочного корпуса текстов, представлена в синтаксических компонентах ЛБЗ.

Аналогичные тенденции, однако, гораздо более ярко выраженные, наблюдаются и в области автоматизированного формирования ЛБЗ. На сегодняшний день интеграция различных методов становится необходимым условием успешного решения этой задачи.

Следующие трудности интеграции различных методов обработки являются наиболее существенными:

• Отсутствие целостных подходов к интеграции различных методов, соответствующих лингвистических и математических моделей.

• Реализация различных методов формирования ЛБЗ ведется на базе различных информационных технологий, часто без опоры на стандарты, что существенно затрудняет их интеграцию.

Целью настоящей работы является обобщение опыта интеграции различных методов автоматизированного формирования некоторых компонентов ЛБЗ (тезауруса, грамматического словаря и словаря n-грамм) в целостный подход, создание моделей, на базе которых могут быть интегрированы различные методы, и описание принципов компьютерной реализации системы автоматизированного формирования ЛБЗ.

Предлагаемый подход предполагает:

1. Построение метамодели ЛБЗ (МЕТАМОДЕЛИ), то есть унифицированного средства представления структуры ЛБЗ и процесса ее формирования.

2. Создание системы автоматизированного формирования ЛБЗ (САФЛБЗ), реализующей МЕТАМОДЕЛБ.

При наличии такой МЕТАМОДЕЛИ и САФЛБЗ интеграция осуществляется следующим образом:

1. Структура формируемой ЛБЗ отображается на МЕТАМОДЕЛБ.

2. Алгоритмы формирования ЛБЗ отображаются на МЕТАМОДЕЛБ.

3. Реализации алгоритмов формирования ЛБЗ интегрируются в САФЛБЗ.

Текст диссертации включает введение, шесть глав, заключение, список литературы и приложения.

Результаты работы использованы при выполнении НИР по теме «Программно-информационное обеспечение обработки текста в интегрированных информационных системах» (подпрограмма «Информатизация России» — шифр проекта 037.01.178.23, Гос. per. № 01.9.80 3 341).

Практическая значимость данной работы подтверждается результатами экспериментов с системой распознавания речи, разрабатывавшейся в рамках договора о сотрудничестве между факультетом вычислительной математики и кибернетики МГУ им. М. В. Ломоносова и американской компанией Accent, Inc. в 1995;1996 гг. (за счет применения методов, описанных в третьей главе диссертации, было зафиксировано устойчивое повышение надежности распознавания на 1−2% при исходном уровне в 93−94%), а также эксплуатацией прототипов системы автоматизированного формирования ЛБЗ при построении специализированного информационно-поискового тезауруса.

Созданная метамодель может применяться для унифицированного представления различных методов обработки лингвистической информации.

Показать весь текст

Список литературы

  1. Church K.W., Rau L.F. Commercial Applications of Natural Language Processing // Communications of the ACM, November 1995/Vol.38, No. l 1, pp. 71−79.
  2. М.Г. Программно-информационное обеспечение адаптивных систем общения с ЭВМ на естественном языке Дисс.. докт. физ-мат. наук, -МГУ, 1990.
  3. И.П., Мацкевич А. Г. Методы поиска похожих объектов и событий на основе признаков и связей // Тр. Международного семинара ДИАЛОГ'99 по компьютерной лингвистике и ее приложениям Таруса, 1999 — С. 164−171.
  4. Г., Танев X. Компьютеризированное извлечение значения слов с помощью анализа связного текста// Тр. Международного семинара ДИАЛОГ'99 по компьютерной лингвистике и ее приложениям Таруса, 1999 — С. 360−365.
  5. А.А. «Грамматический словарь русского языка» М.: Русский язык, 1977.
  6. М.Г., Волкова И. А., Пильщиков В. Н. и др. Лингвистический процессор в системе распознавания устной речи // Тр. Международного семинара ДИАЛОГ'96 по компьютерной лингвистике и ее приложениям М., 1996 -С. 149−150.
  7. Malkovsky М. NL-Processor in a Speech Recognition System // On-line Conference «Speech Synthesis and Analysis» 1997 — http://www.ksu.ru/science/fccl/index.html
  8. Машинный фонд русского языка: идеи и суждения (Под ред. Ю.Н. Караулова) -М.: «Наука», 1986.
  9. Kukolich L., Lippmann R. LNKnet User’s Guide, MIT Lincoln Laboratory, May, 1999.
  10. Ronald A. Cole, Joseph Mariani, Hans Uszkoreit, et al (editors). Survey of the State of the Art in Human Language Technology, 1995. (ftp://speech.cse.ogi.edu/pub/docs/ HLT/).
  11. Petheroudakis J. MORPHOGEN automatic generator of morphological information for base form reduction. Technical report, Executive Communication Systems ECS, Provo, Utah, 1991.
  12. H.B. Автоматизированное формирование проблемно-ориентированных баз знаний в системах общения с ЭВМ на естественном языке Дисс. канд. физ-мат. наук. — МГУ, 1989.
  13. Тезаурус информационно-поисковый одноязычный: Правила разработки, структура, состав и форма представления, ГОСТ 7.25−80.
  14. Н.В. Разрешение многозначности терминов в процессе автоматического индексирования// Тр. Международного семинара ДИАЛОГ'96 по компьютерной лингвистике и ее приложениям М., 1996 — С. 142−146.
  15. С. Cardie, S. Mardis Proposal for a Framework for the High-Precision Identification of Linguistic Relationships, Cornell CS Technical Report TR97−1653,1997.
  16. H. Chen, T. Yim, D. Fye, B. Schatz Automatic Thesaurus Generation for Electronic Community System // Journal of the American Society for Information Science, Vol. 46, April 1995 (Number 3), pp. 175−193.
  17. Jing Yufeng, Croft W. Bruce, An Association Thesaurus for Information Retrieval, Technical Report UMASS-CS-94−17 (IR-47), University of Massachusette, 1994.
  18. Q. Yuan, I. Chang IT Thesaurus Construction the Methodology and Observations — IASTED International Conference on Software Engineering, 1997. (http://pride-i2.poly.edu/~qmyz/papers/iasted/iaspap.html)
  19. B. J. Dorr, D. Jones, Automatic Extraction of Semantic Classes from Syntactic Information in Online Resources, UMIACS-TR-95−65, January 1996.
  20. B. Levin English Verb Classes and Alternations: A Preliminary Investigation The University of Chicago Press, 1993.
  21. M. Hearst Automatic Acquisition of Hyponyms from Large Text Corpora, Proceedings of the 14th International Conference on Computational Linguistics, 1992, pp. 539−545.
  22. WordNet a Lexical Database for English, Cognitive Science Laboratory, Princeton University, 221 Nassau St. Princeton, NJ 8 542 (http://www.cogsci.princeton.edu/~wn/w3wn.html)
  23. И.П., Козеренко Е. Б. Поиск языковых универсалий для лингвистического моделирования на расширенных семантических сетях // Тр. Международного семинара ДИАЛОГ'99 по компьютерной лингвистике и ее приложениям Таруса, 1999 — С. 157−163.
  24. Retrieval Ware 6.0 System Administrator’s Guide, Excalibur Technologies Corporation, 1997.
  25. М.Г. Диалог с системой искусственного интеллекта М: МГУ, 1985.
  26. К.В., Леонтьев В. В. Распределенные объектные технологии в информационных системах // СУБД, № 5−6, 1997 (http://www.osp.ru/dbms/1997/0506/52.htm).
  27. А.В. Методологический базис открытых систем // Открытые системы, № 4, 1996 (http://www.osp.ru/os/1996/04/48.htm).
  28. Логический подход к искусственному интеллекту. От модальной логики к логике баз данных /Пер. с франц. Гаврилова Г. П., Пермякова П. П., Ивановой А. А. под ред. Гаврилова Г. П. М.: «Мир», 1998.
  29. L.A. Zadeh Fuzzy Set // Information and control, 1965, No.8, pp. 338−353.
  30. L.A. Zadeh Outline of new approach to the analysis of complex systems and decision process // IEEE Transactions on SMC, 1973, Vol.3, No. 1, pp. 28−44.
  31. К. Хоггер Введение в логическое программирование /Пер. с англ. М.: «Мир», 1988.
  32. T.P. Martin, J.F. Baldwin, B.W. Pilsworth The implementation of FPROLOG A fuzzy Prolog interpreter // Fuzzy Sets and Systems, 1987, № 23, pp.119−129.
  33. Прикладные нечеткие системы: Пер. с япон./ К. Асаи, Д. Ватада, С. Иван и др.- под редакцией Т. Тэрано, К. Асаи, М. Сугэно М.: «Мир», 1993.
  34. W. Royce Software Project Management: A Unified Framework Addison-Wesley, 1998.
  35. А. Горбань, Д. Россиев Нейронные сети на персональном компьютере -Новосибирск: «Наука», 1996.
  36. А. Зельцер PolyAnalyst решает задачи интеллектуального анализа данных // Computer Weekly, № 46, 1996.
  37. Н. Nomura, I. Hayashi, N. Wakami A Learning Method of Fuzzy Inference Rules by Descent Method // Proceeding IEEE International Conference on Fuzzy Systems, San Diego, 1992, pp. 203−210.
  38. W. Pedrycz, H.C. Card Linguistic Interpretation of Self-Organizing Maps, Proceedings IEEE International Conference on Fuzzy Systems, San Diego, 1992, pp. 371−378.
  39. H.B. Berenji A Reinforcement Learning-Based Architecture for Fuzzy Logic Control // Int. J. Aproximate Reasoning, 1992, pp. 267−292.
  40. Р.Г. Пиотровский Текст, машина, человек JI.: «Наука», 1975.
  41. .В. Исследование грамматики числовыми методами /Отв. ред. А.А.Зализняк- АН СССР Ин-т рус.яз. М.: Наука, 1990.
  42. М. Брой Информатика. Основополагающее введение- в 4-х ч. Ч. З /Пер. с нем. -М.: Диалог-МИФИ, 1996.
  43. High-level Petri Nets Concepts, Definitions and Graphical Notation / Committee Draft ISO/IEC 15 909, ver. 3.4, 1997.
  44. Marvin Minsky A Framework for Representing Knowledge // Massachusetts Institute of Technology, Artificial Intelligence, Memo No. 306, 1974.
  45. С.А. Инструментальная среда для разработки лингвистических процессоров. Дисс.. канд. физ-мат. наук. — Москва, 1997.
  46. Буч Г. Объектно-ориентированный анализ и проектирование с примерами приложений на С++, 2-е изд. / Пер. с англ. М: «Издательство Бином», СПб: «Невский диалект», 1998.
  47. Ivar Jacobson Object-Oriented Software Engineering: A Use Case Driven Approach Addison-Wesley Publishing Company, 1993, ISBN 0−201−54 435−0
  48. J. Rumbaugh, et al. Object-Oriented Modeling and Design Prentice Hall, 1991.
  49. OMG Unified Modeling Language Specification, Version 1.3, June 1999.
  50. Д., МакГоуэн К. Методология структурного анализа и проектирования: Пер. с англ. М.: 1993.
  51. Initial UML Submission to AD RFP-1 //OMG document ad/97−01−12
  52. Интернет-сайт компании MicroGOLD производителя WithClass'99: www.microgold.com.
  53. E.E., Качалова K.H. Практическая грамматика английскогоязыка М.: ВНЕШТОРГИЗДАТ, 1953.
  54. В.Н. Язык плэнер М.: Наука, 1983.
  55. Страуструп Бьярн Язык программирования С++. Вторая редакция Киев: Диасофт, 1993.
  56. М.Г., Волкова И. А. Анализатор системы TULIPS-2. Морфологический компонент. // Вестник МГУ, сер. 15, 1981, N 1. С. 70 -76.
  57. М.Г., Субботин A.B. Построение лингвистических баз знаний для прикладных систем обработки текста и речи // Программа научной конференции Ломоносовские чтения'97 с. 81.
  58. И.А. Опыт теории лингвистических моделей «Смысл-Текст». Семантика, синтаксис М.: «Наука», 1974.
  59. Robert Orfail, Dan Hakrey, Jeri Edwards The Essential Distributed Objects Survival Guide John Wiley&Sons, Inc., 1996.
  60. D. Flanagan Java in a Nutshell. A Desktop Quick Reference O’Reilly, 1997.
  61. A. Pope The CORBA Reference Guide: Understanding the Common Object Request Broker Architecture Addison-Wesley, 1998.
  62. CORBA/HOP 2.3.1 Specification // OMG document formal/99−10−07.
  63. CORBA Services complete book // OMG document formal/98−12−09.
  64. CORBAFacilities Architecture Specification // OMG document formal/98−07−10.
  65. F. E. Redmond III DCOM: Microsoft Distributed Component Object Model IDG Books Worldwide, 1997.
  66. D. Chappell Understanding ActiveX and OLE Microsoft Corporation, 1996.
  67. J. Edwards, «3-Tier Client/Server At Work» — John Wiley&Sons Inc., 1997.
  68. The Workflow Reference Model // Workflow Management Coalition document WFMC-TC-1003, 19-Jan-95, ver. 1.1 (http:// www.aiim.org/wfmc/standards/docs/ tc003vll. pdf).
  69. OMG BODTF RFP#2 Submission Workflow Management Facility, Draft Revised Submission, May, 1998 // OMG document bom/98−05−04.
  70. Thomas J. Mowbray, Ron Zahavi The Essential CORBA: Systems Integration Using Distributed Objects John Wiley & Sons, Inc., 1995.
Заполнить форму текущей работой