Помощь в написании студенческих работ
Антистрессовый сервис

Методы и алгоритмы автоматического реферирования текста на основе анализа функциональных отношений

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Исследования в области автоматической обработки текстов в Европе и США привлекают внимание крупнейших частных фирм и государственных организаций самого высокого уровня. Существует большое количество систем, разработанных, в основном, специалистами университетских центров и используемых ими для своих нужд. В этих системах предлагаются нетрадиционные решения (отличные от статистических методов… Читать ещё >

Методы и алгоритмы автоматического реферирования текста на основе анализа функциональных отношений (реферат, курсовая, диплом, контрольная)

Содержание

  • ГЛАВА 1. СОВРЕМЕНННОЕ СОСТОЯНИЕ ПРОБЛЕМЫ АВТОМАТИЧЕСКОГО РЕФЕРИРОВАНИЯ ТЕКСТА И ПУТИ ЕЕ РЕШЕНИЯ
    • 1. 1. Особенности задачи автоматического реферирования текста
    • 1. 2. Обзор методов автоматического реферирования текста
    • 1. 3. Современные системы автоматического реферирования текста
    • 1. 4. Основные проблемы формализации структуры текста
    • 1. 5. Постановка задачи исследования диссертационной работы
    • 1. 6. Выводы по главе
  • ГЛАВА 2. РАЗРАБОТКА МЕТОДА ФОРМАЛИЗОВАННОГО ОПИСАНИЯ СТРУКТУРЫ ТЕКСТА
    • 2. 1. Подход к описанию структуры текста на основе теории риторической структуры текста
    • 2. 2. Разработка критерия корректности структуры текста
    • 2. 3. Особенности представления структуры текста
    • 2. 4. Построение математического описания структуры текста
    • 2. 5. Выводы по главе
  • ГЛАВА 3. РАЗРАБОТКА АЛГОРИТМА АВТОМАТИЧЕСКОГО РЕФЕРИРОВАНИЯ ТЕКСТА
    • 3. 1. Обобщенный алгоритм автоматического реферирования текста
    • 3. 2. Разработка алгоритма определения функциональных отношений
    • 3. 3. Разработка алгоритма построения структуры текста
    • 3. 4. Разработка алгоритма получения аннотации
    • 3. 5. Выводы по главе
  • ГЛАВА 4. ПОСТРОЕНИЕ СИСТЕМЫ И ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ АЛГОРИТМА АВТОМАТИЧЕСКОГО РЕФЕРИРОВАНИЯ ТЕКСТА
    • 4. 1. Общая концепция организации системы автоматического реферирования текста
    • 4. 2. Программная реализация системы автоматического реферирования текста 90 4.3 Проверка функциональной работоспособности алгоритма автоматического реферирования текста
    • 4. 4. Оценка эффективности алгоритма автоматического реферирования текста
    • 4. 5. Выводы по главе 4
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ЛИТЕРАТУРЫ
  • ПРИЛОЖЕНИЯ
  • Приложение 1. Список функциональных отношений
  • Приложение 2. Примеры текстов и рефератов

Приложение 3. Программная реализация системы автоматического реферирования текста 144

Приложение 4. Результаты оценки эффективности алгоритма автоматического реферирования текста

Электронная информация играет все большую роль во всех сферах жизни современного общества. В последние годы объем научно-технической текстовой информации в электронном виде возрос настолько, что возникает угроза обесценивания этой информации в связи с трудностями поиска необходимых сведений среди множества доступных текстов. Развитие информационных ресурсов Интернет многократно усугубило проблему информационной перегрузки. В этой ситуации особенно актуальными становятся методы автоматизации реферирования текстовой информации, то есть методы получения сжатого представления текстовых документов — рефератов (аннотаций).

Постановка проблемы автоматического реферирования текста и соответственно попытки ее решения с использованием различных подходов предпринимались многими исследователями. История применения вычислительной техники для реферирования насчитывает уже более 50 лет и связана с именами таких исследователей, как Г. П. Лун [108], В. Е. Берзон [6, 7], И. П. Севбо [72, 73], Э. Ф. Скороходько [76, 77], Д. Г. Лахути [38−42], Р. Г. Пиотровский [62, 63] и др. За эти годы выработаны многочисленные подходы к решению данной проблемы, которые достаточно четко подразделяются на два направления:

• автоматическое реферирование, основанное на экстрагировании из первичных документов с помощью определенных формальных признаков «наиболее информативных» фраз (фрагментов), совокупность которых образует некоторый экстракт;

• автоматическое реферирование, основанное на выделении из текстов с помощью специальных информационных языков наиболее существенной информации и порождении новых текстов (рефератов), содержательно обобщающих первичные документы.

В России исследования в области автоматического реферирования в настоящее время, главным образом, ведутся в. рамках первого направления с использованием статистических методов, смысл которых заключается в отборе предложений с наибольшим весом, который рассчитывается на основе частоты появления слова в тексте или месторасположения предложения, для включения их в реферат. В настоящее время известны только две системы, позволяющие получать аннотации на русском языке: TextAnalyst и встроенная функция в пакете Microsoft Office — Autosummarize. Обе эти системы относятся к классу систем, использующих различные варианты статистических методов. Согласно исследованиям в области компьютерной лингвистики [101, 102] текст, по своей природе, нелинеен, и его структура определяется особенностями внутренней организации единиц текста и закономерностями взаимосвязи этих единиц в рамках текста как цельного сообщения. Как показала практика, различные статистические методы недостаточно эффективны, так как они интерпретируют текст в виде набора линейно упорядоченных слов, словосочетаний и предложений, игнорируя при этом лингвистическую взаимосвязанность естественного языка, что приводит к потере значимой информации.

Исследования в области автоматической обработки текстов в Европе и США привлекают внимание крупнейших частных фирм и государственных организаций самого высокого уровня. Существует большое количество систем, разработанных, в основном, специалистами университетских центров и используемых ими для своих нужд. В этих системах предлагаются нетрадиционные решения (отличные от статистических методов), основанные на построении лексических цепочек, концептуальных графов, а также эффективных формализмов описания структуры текста. Однако все эти методы ориентированы на учет особенностей конкретных языков, в основном, английского языка и не могут быть непосредственно применены для автоматического реферирования текстов на русском языке. Кроме того, большинство разработок носят коммерческий характер, в связи с чем принцип их работы авторами не раскрывается.

Таким образом, актуальным является создание новых эффективных методов и алгоритмов, учитывающих нелинейную и иерархическую природу текста и позволяющих получать сжатое представление текстовых документов на русском языке.

Целью диссертации является разработка новых эффективных методов и алгоритмов, учитывающих нелинейную и иерархическую природу текста, для автоматизации реферирования научно-технических текстов на русском языке.

Задачи исследования. Для достижения поставленной цели необходимо решить следующие задачи:

• Провести анализ современных подходов и методов, применяющихся при решении задачи автоматического реферирования текста.

• Разработать метод формализованного описания структуры научно-технического текста на русском языке, позволяющий автоматизировать процесс реферирования.

• Разработать алгоритм определения функциональных отношений между фрагментами текста.

• Разработать алгоритм построения структуры на основе множества функциональных отношений между фрагментами текста.

• Реализовать систему автоматического реферирования текста на основе разработанных алгоритмов и провести оценку эффективности разработанных методов и алгоритмов.

Методы исследования. Теоретической и методологической основой работы послужили: теория риторической структуры (ТРС), теория предикатов, компьютерная лингвистика, метод экспертных оценок и современные технологии программирования.

Научные положения, выносимые на защиту.

• Метод формализованного описания структуры научно-технического текста на русском языке.

• Алгоритм определения функциональных отношений между фрагментами текста на основе анализа ключевых фраз.

• Алгоритм построения структуры текста на основе множества функциональных отношений между фрагментами текста.

Научная новизна.

• Метод формализованного описания структуры текста, основанный на использовании ТРС, отличается учетом нелинейной и иерархической природы текста, что позволяет повысить качество автоматического реферирования научно-технического текста на русском языке. Метод формализованного описания включает в себя определение критерия корректности структур текста, определение характеристик структуры текста и ограничений на корректные структуры текста.

• Алгоритм определения, функциональных отношений между фрагментами текста отличается использованием разработанного узкоспециализированного словаря ключевых фраз русского языка и процедурами анализа отношений внутри них, что позволяет уменьшить избыточность информационного обеспечения систем автоматического реферирования за счет отказа от использования словарей и баз знаний общего назначения.

• Алгоритм построения структуры текста на основе множества функциональных отношений между фрагментами текста отличается учетом неоднозначности отношений внутри ключевых фраз русского языка посредством генерации альтернативных множеств вариантов корректных структур текста с помощью разработанных правил вывода и выбора предпочтительной альтернативы по критерию совокупной метрики, что позволяет автоматизировать процесс получения релевантной структуры текста.

Практическая ценность работы заключается в следующем:

• разработанное алгоритмическое и программное обеспечение позволяет строить системы автоматического реферирования научно-технического текста для русского языка, учитывающие нелинейную и иерархическую природу текста, что позволяет повысить качество получаемых аннотаций;

• реализована система автоматического реферирования научно-технического текста для русского языка на основе разработанного алгоритма, не требующая избыточного информационного обеспечения за счет отказа от использования обширных словарей и баз знаний общего назначения.

Внедрение и реализация результатов. Достоверность научных положений, результатов и выводов подтверждается корректным использованием математического аппарата, результатами вычислительных экспериментов по разработанным методам, алгоритмам и программам, обсуждением полученных результатов на научных конференциях, а также результатами использования и внедрения.

Полученные научные результаты внедрены и используются в Информационно-логистическом центре при Северо-Западном заочном техническом университете, в ЗАО «Абсолют» г. Санкт-Петербург, о чём имеются соответствующие акты.

Апробация работы Основные положения диссертационной работы докладывались и обсуждались на следующих конференциях:

• XII международная конференция «Современное образование: содержание, технологии, качество, Россия, Санкт-Петербург, июнь 2006 г.

• XI международная научно-практическая конференция «Системный анализ в проектировании и управлении» Россия, Санкт-Петербург, июнь 2007 г.

• XII международная конференция «Системный анализ в проектировании и управлении» Россия, Санкт-Петербург, июнь 2008 г.

• XI международная конференция по мягким вычислениям и измерениям (8СМ'2008) Россия, Санкт-Петербург, июнь 2008 г.

• 62-я международная научно-техническая конференция «Системный анализ, управление и обработка информации» Россия, Санкт-Петербург, апрель 2009 г.

• ХШ международная научно-практическая конференция «Системный анализ в проектировании и управлении» Россия, Санкт-Петербург, июнь 2009 г.

Публикации. Основные теоретические и практические результаты диссертации опубликованы в 10 статьях и докладах, среди которых 2 публикации в изданиях, рекомендованных ВАК, одна статья в других изданиях и 7 докладов на международных научно-технических конференциях.

В первой главе рассматриваются основные подходы к автоматическому реферированию текста. Дается обзор существующих методов автоматического реферирования, анализируются преимущества и недостатки существующих систем. Обосновываются и конкретизируются цель и задачи исследования.

Вторая глава посвящена разработке метода формализованного описания структуры текста, на базе которого будут разработаны алгоритмы автоматического реферирования текста.

Третья глава посвящена разработке алгоритмов, необходимых для автоматического реферирования научно-технического текста на русском языке на основе разработанного метода.

В четвертой главе рассматривается система автоматического реферирования текста, построенная на основе разработанных алгоритмов, и проводится оценка эффективности разработанного метода и алгоритмов.

4.5. Выводы по главе 4.

1. Проведенные экспериментальные исследования показали, что качество аннотаций, полученных на основе разработанного метода, в среднем на 20% выше по сравнению с аннотациями, полученными с помощью традиционных методов, реализованных в системе TextAnalyst и встроенной функции пакета Microsoft Office — Autosummarize.

2. Разработанное программное обеспечение для автоматического реферирования текста имеет открытую архитектуру, реализованную с использованием объектно-ориентированного подхода, что позволяет легко встраивать новые подсистемы с целью расширения имеющейся функциональности.

ЗАКЛЮЧЕНИЕ

.

1. Выполнен анализ современных подходов к автоматическому реферированию текстов. Установлено, что для текстов на русском языке практически реализуемыми являются методы, основанные на подходе экстракции. Анализ существующих исследований в области компьютерной лингвистики показал, что текст нелинеен по своей природе и представляет собой иерархическую структуру с определенными видами связей между фрагментами текста, несущих значимую информацию, которую можно использовать для экстрагирования.

2. Предложен метод формализованного описания структуры научно-технического текста на русском языке, который отличается учетом нелинейности и иерархической природы текста, что позволяет повысить качество автоматического реферирования научно-технического текста на русском языке. Разработан критерий корректности структуры текста, выполнены формализация характеристик и ограничений на корректные структуры, которые являются расширением формализации основных положений ТРС. Они определяют условия объединения фрагментов текста, позволяют минимизировать набор необходимых параметров, достаточных для полного описания структуры текста, и существенно уменьшить избыточность порождаемых альтернативных структур текста соответственно.

3. Разработан алгоритм определения функциональных отношений между фрагментами текста на основе анализа ключевых фраз русского языка, который отличается использованием узкоспециализированного словаря ключевых фраз русского языка и анализом отношений внутри них, что позволяет уменьшить избыточность информационного обеспечения систем автоматического реферирования за счет отказа от использования словарей и баз знаний общего назначения.

4. Разработан алгоритм построения структуры текста на основе множества функциональных отношений между фрагментами текста, который отличается учетом неоднозначности отношений внутри ключевых фраз русского языка, генерацией альтернативных множеств вариантов корректных структур текста и выбора предпочтительной альтернативы по критерию совокупной метрики, что позволяет автоматизировать процесс получения релевантной структуры текста.

5. Проведена экспериментальная проверка предложенных алгоритмов и метода, реализованных в разработанной программной системе автоматического реферирования текста. Проведенные исследования показали, что качество аннотаций, полученных с помощью разработанного метода, в среднем на 20% выше по сравнению с аннотациями, полученными с помощью традиционных методов, реализованных в системе TextAnalyst и встроенной функции пакета Microsoft Office ~ Autosummarize.

Показать весь текст

Список литературы

  1. , Ф.Т. Методы обработки интервальных экспертных оценок Текст. / Ф. Т. Алексеров, В. Бауман, В. И. Вольский // Автоматика и телемеханика. 1984. — № 3. — С. 127−133.
  2. , P.M. Автоматическое реферирование документов с извлечением информативных предложений Текст. / P.M. Алыгулиев // Вычислительные технологии. 2007. — Т. 12, № 5. — С. 5—15.
  3. , Ю.А. Дискретная математика и математическая логика Текст.: монография / Ю. А. Аляев, С. Ф. Тюрин. М.: Финансы и статистика, 2006. — 368 с.
  4. Белоногов, Г. Г. Компьютерная лингвистика и перспективные информационные технологии Текст.: монография / Г. Г. Белоногов, Ю. П. Калинин, A.A. Хорошилов. — М.: Русский мир, 2004. — 246 с.
  5. , В.Е. Об одном подходе к проблеме автоматического реферирования и автоматического свертывания индексируемых текстов Текст. /В.Е. Берзон //ЯШ. Сер. 2.- 1971.- № 10.-С. 16−21.
  6. , В.Е. Синтаксические сверхфразовые связи и их инженерно—лингвистическое моделирование Текст.: монография / В. Е. Берзон, Э. М. Добрускина. — Кишинев: Штиинца. 1986. — 168 с.
  7. , С.Д. Математико-статистические методы экспертных оценок Текст.: монография / С. Д. Бешелев, Ф. Г. Гурвич. М.: Статистика, 1980.-263 с.
  8. , Д.И. Проблемы свёртывания научной информации Текст.: монография / Д. И. Блюменау. JL: Наука, 1982. — 166 с.
  9. , H.H. Когнитивная семантика Текст.: монография / H.H. Болдырев. Тамбов: Изд-во Тамб. ун-та, 2001. — 123 С.
  10. , Е.И. Структурирование и извлечение знаний, представленных в научных текстах Текст. / Е. И. Большакова, Н. В. Баева, Н. Э Васильева // Труды 9 -ой Национальной конф. по искусственному интеллекту. — М.: Физматлит, 2004. С. 45 — 51.
  11. , Е.И. Лексико-синтаксические шаблоны в задачах автоматической обработки текстов Текст. / Е. И. Большакова, Н. В. Баева, Н. Э. Васильева //Труды межд. конф. Диалог 2007. — М.: Издательский центр РГГУ, 2007. С. 70−75.
  12. Браславский, П. И eXtragon экспериментальная система для автоматического реферирования веб-документов Текст. / П. И. Браславский, И. С. Колычев //Труды РОМИП 2005. СПб, 2005. — С. 40−53.
  13. , П.И. Автоматическое реферирование веб-документов с учетом запроса Текст. / П. И. Браславский, И. С. Колычев // Интернет-математика 2005. М.: Яндекс, 2005. — С. 485−501.
  14. Буч,.Г Объектно-ориентированный анализ и проектирование Текст.: монография / Г. Буч.- Изд-во Вильяме, 2008. 560 с.
  15. Гаврилова, Т. А Базы знаний интеллектуальных систем Текст.: монография / Т. А. Гаврилова, В. Г. Хорошевский. СПб.: Питер, 2000. — 384 с.
  16. , P.C. Методы автоматизированного фрагментирова-ния текста, отражающиеся на характеристике внутреннего состава фрагментов Текст. / P.C. Гиляревский, С. И. Гиндин // Семиотика и информатика. М.: ВИНИТИ, 1977. Т.9. — С.35−84.
  17. , A.B. Формальные грамматики и языки Текст.: монография / А. В. Гладкий. М.: Наука, — 1973. — 368 с.
  18. , В.Г., Метод согласования кластеризованных ранжировок Текст. / В. Г. Горский, А. И. Орлов, A.A. Гриценко // Автоматика и телемеханика. 2000. № 3. С. 59−167.
  19. , М.В. Эффективный алгоритм формирования контекстно-зависимых аннотаций Текст. / М. В. Губин, А. И. Меркулов //Труды межд. конф. Диалог 2005. М.: Наука, 2005. — С. 116−120.
  20. Гуц, A.K. Математическая логика и теория алгоритмов Текст.: монография / А. К. Гуц Омск: Изд-во Наследие. Диалог-Сибирь, 2003. -108 с.
  21. , Т.А. ван Стратегии понимания связного текста Текст. / Т.А. ван Дейк, В. Кинч // Новое в зарубежнойлингвистике. М.: Прогресс, 1988.-Вып. 23.-С. 153−211.
  22. , Т.А. ван Язык. Познание. Коммуникация Текст.: монография / Т.А. ван Дейк, под ред. В. И. Герасимова. М.: Прогресс, 1989. — 310 с.
  23. , O.A. Функциональные стили русского языка и их влияние на задачу автоматического реферирования текстов / O.A. Емашова, М. Г. Мальковский // Труды межд. конф. Диалог 2007. -(http://www.dialog21 .ru/dialog2007/ materials/html/25.htm).
  24. , И.В. Лингвистические аспекты кросс-языкового реферирования: синтез текстов под управлением предметных онтологий Текст. И. В. Ефименко // Труды 10-ой конф. по искусственному интеллекту.- М.: Физматлит, 2006, Т 1. — С. 81−87.
  25. Заболеева-Зотова, A.B. Лингвистическое обеспечение автоматизированных систем Текст.: монография / A.B. Заболеева-Зотова, В.А. Кама-ев. М.: Высшая школа, 2008. — 245с.
  26. , A.B. Автоматическое построение табличного реферата группы текстов одной тематики/ А. В. Зубов.// Материалы конференции «Диа-лог-2005». (http://www.dialog-l.ru/Archive/2005/Zubov%20A/ZubovA.htm).
  27. , A.B. Информационные технологии в лингвистике Текст.: монография / А. В. Зубов. М.: Академия, 2004. — 208 с.
  28. , В.И. Математическая логика и теория алгоритмов Текст.: монография / В. И. Игошин. -М.: Академия, 2008. 448 с.
  29. , В.И. О типах дискурса Текст. / В. И. Карасик // Языковая личность: институциональный и персональный дискурс: Сб. науч. тр. Волгоград: Перемена, 2000. С. 5−20.
  30. , A.A. Когнитивные исследования по дискурсу Текст. / A.A. Кибрик // Вопросы языкознания 1994. -№ 5. — С. 126−139.
  31. , Р.Д. Принятие решений при многих критериях: предпочтения и замещения Текст.: монография / Р. Д. Кини, Х.Райфа. М.: Радио и связь, 1981.-560 с.
  32. , С.К. Математическая логика Текст.: монография / С. К. Клини. М.: Мир, 1973. — 480 с.
  33. , О.С. Исследования по машинному переводу Текст.: монография / О. С. Кулагина. М.: Наука, 1979. — 320 с.
  34. , О.И. Теория и методы принятия решений Текст.: монография / О. И. Ларичев М.: Логос, 2006. — 392 с.
  35. , К. Применение ЦМЬ и шаблонов проектирования Текст./: монография / К. Ларман. Изд. дом «Вильяме», 2006. — 620 с.
  36. , Д.Г. Формализованное реферирование с использованием словесных клише (маркеров) Текст. / Д. Г. Лахути, Д. И. Блюменау, Н. И. Гендина // НТИ. Сер.2. 1981. № 2. — С. 16−20.
  37. , Д. Г. Вопросы отладки и оценки дескрипторных поисковых систем Текст. / Д. Г. Лахути // Семантические проблемы информатики. -М., 1971.-С. 6−37.
  38. , Д. Г. Средства и процедура концептуальной интерпретации входных сообщений на естественном языке систем Текст. /Д .Г. Лахути, В. Ш. Рубашкин // Известия АН СССР: Техническая кибернетика. 1987. -№ 2. — С. 49−59.
  39. , Д. Г. Автоматизированные документально-фактографические информационные системы Текст. / Д .Г. Лахути // Итоги науки и техники. Сер. Информатика. 1988.-Т. 12.-С. 56−79.
  40. Лахути, Д. Г Экстрагирование как один из подходов к автоматизации реферирования Текст. / Д. Г. Лахути, Д. И. Блюменау, И. С. Добронравов // Теория и практика механизации библ. и информ.-библиогр. процессов.-Л., 1982.-С 108- 128.
  41. , В.П. О методах автоматического реферироваиия (США 1958−1974 гг.) Текст. / В. П. Леонов // Научно-техническая информация, сер.2.- 1975.-№ 6.- С. 16−20.
  42. , Б.Г. Экспертная информация: методы получения и анализа Текст. :учеб. пособие для вузов / Б. Г. Литвак. М.: Радио и связь, 1982. — 350 с.
  43. , А. О. Описание структуры дискурса в рамках теории риторической структуры Текст. / А. О. Литвиненко //Труды Межд. семинара Диалог 2001 по компьютерной лингвистике и ее приложениям. Аксаково, 2001. Т.1. — С. 159−168.
  44. , Н. В. Обработка потока новостей на основе больших лингвистических ресурсов Текст. / Н. В. Лукашевич, Б. В. Добров, C.B. Штернов // Интернет-математика 2005. Автоматическая обработка веб-данных. М.: — 2005. — С. 461−484.
  45. Лукашевич, Н. В Представление знаний в системе автоматической обработки текстов Текст. / Н. В. Лукашевич, А. Д. Салий // НТИ. Сер.2. -1997.-N3.-С. 15−23.
  46. , М.Л. Основы теории дискурса Текст.: монография / М. Л. Макаров. М.: Гнозис, 2003. — 280 с.
  47. , С. Совершенный код Текст.: монография / С. Макконнелл. Издательство: Питер Русская редакция, 2007. — 896 с.
  48. Мак Кьюин, К. Дискурсивные стратегии для синтеза текста на естественном языке Текст./ К. Мак Кьюин // Новое в зарубежной лингвистике. -М.: 1989. — Вып. XXIV. — С. 311- 356.
  49. , А.Н. Алгоритмы и рекурсивные функции Текст.: монография / А. Н. Мальцев М.: Наука, 1986. — 366 с.
  50. , Ю.Н. Проблемы машинного перевода Текст.монография / Ю. Н. Марчук. М.: Наука, 1983. — 231 с.
  51. , Ю.Н. Компьютерная лингвистика Текст.:Учеб.пособие / Ю. Н. Марчук, ACT, Восток-Запад, 2007. 226 с.
  52. Мельчук, И. А Опыт теории лингвистических моделей «Смысл-Текст». Семантика, синтаксис Текст. / И. А. Мельчук. М.:Наука, 1999. -314 с.
  53. , Э. Введение в математическую логику Текст.: монография / Э. Мендельсон. М.: Наука, 1971. — 322 с.
  54. Михаилян, А Некоторые методы автоматического анализа естественного языка, используемые в промышленных продуктах / А. Михаэлян. -2001. (http://www.citforum.ru/programming/digest/avtestlang.shtml).
  55. , Л.Л. Компьютерная лингвистика и машинный перевод Текст.: Метод. пособие / Л. Л. Нелюбин. М.: ВЦП, 1991. — 151 с.
  56. , А.И. Современная прикладная статистика Текст. / А. И. Орлов // Заводская лаборатория. 1998. Т. 64. — № 3. — С.52−60.
  57. , JI.A. Организация экспертизы и анализ экспертной информации Текст.?монография/ Л. А. Панкова, А. М. Петровский, М.В. Шнец-дерман. М.: Наука, 1984. — 120 с.
  58. , H.A. Проблемы автоматизации индексирования и реферирования Текст. / H.A. Пащенко, JI.B. Кнорина, Т. В. Молчанова // Итоги науки и техники. Сер. Информатика. -М.: ВИНИТИ, 1983. Т.7. — С. 7−164.
  59. , Р.Г. Текст, машина, человек Текст.: монография / Р. Г. Пиотровский. JL: Наука, 1975. — 327с.
  60. , Р.Г. Инженерная лингвистика и теория язы-каТекст.монография / Р. Г. Пиотровский. JL: Наука, 1979. — 112 С.
  61. , Э.В. Общение с ЭВМ на естественном языке Текст.: монография/ Э. В. Попов. М.: Наука, 1982. — 360 с.
  62. , М.Ю. Визуализация семантической структуры и реферирование текстов на естественном языке / М. Ю. Попов, A.B. Заболеева-Зотова, С. А. Фоменков. (http://www.dialog-21.ru/Archive/2003/Popov.htm).
  63. , Д.А. Из истории искусственного интеллекта: история искусственного интеллекта до середины 80-х годов Текст. / Д.А.Поспелов// Новости искусственного интеллекта Вып. 4, 1994 — С. 70 — 90.
  64. , Д.А. Логико-лингвистические модели в системах управления Текст. монография./ Д. А. Поспелов. М., 1981.- 232 с.
  65. , А.Б. Состояние развития систем естественноязыкового общения Текст. / А. Б. Преображенский //Сб. Искусственный интеллект. М.:Радио и связь, 1990. — Т.1. — С.32−64.
  66. , А.Г. Об одном способе определения весовых коэффициентов частных критериев при построении аддитивного интегрального показателя Текст. / А. Г. Раев //Автоматика и телемеханика. 1984. — № 5. — С.162−165.
  67. , Н.В. Дискурс как высшая единица коммуникативного акта./ Н. В. Рождественская (www.zsu.zp.ua/herald/articles/1955.pdf).
  68. , A.C. Методы системного анализа: Многокритериальная и нечеткая оптимизация, моделирование и экспертные оценки Текст.: Учеб. пособие / А. С. Рыков. М.: Экономика, 1999. — 216 с.
  69. , И.П. Структура связного текста и автоматизация реферирования Текст.монография / И. П. Севбо М.: Наука, 1969. — 135 с.
  70. , И.П. Сквозной анализ как шаг к структурированию текстовых знаний Текст. / И. П. Севбо. // НТИ. Сер. 2. 1989. — № 2. — С. 26−32.
  71. Селезнев, К. Е Обработка текстов на естественном языке / К. Е. Селезнев // Открытые системы. 2003. — № 12.-(http://www.osp.ru/os/2003/12/183 694).
  72. , Э.Ф. Семантические связи в лексике и текстах Текст. / Э. Ф. Скороходько // Вопросы информационной теории и практики. -М.: — 1977. -№ 23. -С. 42−45.
  73. , Э.Ф. Семантические сети и автоматическая обработка текста Текст.: монография / Э. Ф. Скороходько. Киев: Наукова думка, 1983.-219с.
  74. , И. В. Инженерно-лингвистические принципы, методы и алгоритмы автоматической переработки текста Текст.: монография / И. В. Совпель. Минск: Вышэйш. шк., 1991. — 236 с.
  75. Д. Динамические библиотечно-информационные системы Текст.: монография / Д. Солтон М.: Мир, 1979. — 557 с.
  76. , B.C. Система автоматического реферирования методом симметричного реферирования Текст. / B.C. Ступин // Компьютерная лингвистика и интеллектуальные технологии. Труды межд. конференции «Диалог 2004» М.: Наука, 2004. — С. 579−591.
  77. , С.А. Системы автоматического реферирования текста Текст. / О. Ю. Сабинин, С. А. Тревгода // Приборы и системы. Управление, контроль, диагностика.- 2008. Вып.1. — С.23−26.
  78. , С.А. Автоматизация обработки научно-технической информации Текст. / С. А. Тревгода // Приборы и системы. Управление, контроль, диагностика. 2009.-Вып.7. — С. 24−27.
  79. , С.А. Технология автоматического реферирования технического текста Текст. / О. Ю. Сабинин, С. А. Тревгода // Известия СПбГЭТУ «ЛЭТИ». 2008.- № 7. -С. 25−34.
  80. , С.А. Программное обеспечение систем дистанционного управления Текст. / C.B. Лукашевич, С. А. Тревгода // Материалы XII межд. конференции «Современное образование: содержание, технологии, качество». Спб.: Изд-во СПбГЭТУ «ЛЭТИ», 2006.-С.25−27.
  81. Хан, У Системы автоматического реферирования // У. Хан, И. Мани // Открытые системы. (http://www.osp.ru/os/2000/12/067.htm).
  82. Хорстманн, К.С. Java 2. Тонкости программирования Текст.: монография / К. С. Хорстманн, Г. Корнелл. Изд-во «Вильяме», — 2007.-1168 с.
  83. Шилдт, Г Java: методики программирования Шилдта Текст.: монография/ Г. Шилдт. -Изд-во «Вильяме», 2008.- 512 с.
  84. , А. Принципы объектно-ориентированной разработки программ Текст.: монография /А. Элиенс. Изд-во «Вильяме», — 2008. — 496с.
  85. , Д. Система безопасности Java. Руководство разработчи-каТекст.: монография / Д. Яворски, Пол Дж. Перроун. Изд-во «Вильяме», 2001. — 528 с.
  86. , В.А. Симметричное реферирование: теоретические основы и методика Текст. / В. А. Яцко // НТИ. Сер. 2. 2002. — № 5. — С. 18−28.
  87. Barzilay, М. Using lexical chains for text summarization. Текст. / M. Barzilay, R. Elhadad // In Proceedings of the ACL/EACL-97 Workshop on Intelligent Scalable Text Summarization. Madrid, Spain, 1997. — C. 10−17.
  88. Grimes, J.E. The Thread of Discourse. Текст. / J.E. Grimes // The Hauge, Paris: Moution. 1975. — 346 c.
  89. Grosz, B.J. Attention, intentions, and structure of discourse Текст. / B.J. Grosz, C.L. Sidner // Computational Linguistics. 1986 — № 12 — C. 203−226.
  90. Iatsko, V. Linguistic Aspects of Summarization. Текст. / V. Iatslco // In Philologie im Netz. Вып. 18. — 2001. — С. 33−46. (http://www.fu-berlin.de/phin/phin 18/p 18t3 .htm).
  91. Inderjeet, M. Automatic summarization (Natural Language Processing) Текст. / M. Inderjeet John Benjamins Publishing Company, 2001. -285 c.
  92. Inderjeet, M. Advances in automatic text summarization Текст. / M. Inderjeet, M. T. Maybury The MIT Press, 1999. — 434 c.
  93. Haliday, A.K. Cohesion in English. Текст. / A.K. Haliday, R. Hasan // England, Londin: Longman. 1976. — 221 c.
  94. Hobbs, J.R. Summaries from structure Текст. / J.R. Hobbs // In Working Notes of the Dagstuhl Seminar on Summarizing Text for Intelligent Communication Dagstuhl, Germany. — 1993. — C. 13−17.
  95. Hobbs, J.R. On the relation between informational and intentional perspectives on discourse Текст. / J.R. Hobbs // Computational and Conversational Discourse. Burning Issues An Interdisciplinary Account — Heidelberg, Germany. — 1996. — C. 139−157.
  96. Hovy, E.H. Planning coherent multisententional text Текст. / E.H. Hovy // In Proceedings of the 26th Annual Meeting of the Association for Computational Linguistics Buffalo, New-York. — 1988. — C. 163−169.
  97. Kupiec, T. A trainable document summarizer. Текст. / Т. Kupiec, J. Pedersen, F. Chen // In Proceedings of the 18th ACM/SIGIR Annual Conference on Research and Development in Information Retrieval, Seattle, WA, 1995. C. 68−73.
  98. Luhn, H.P. The automatic creation of literature abstracts. Текст. H.P. Luhn // IBM Journal of Research and Development Вып. 2. — 1958. — С. 159 165.
  99. Mann, W.C. Rhetorical structure theoiy: Toward a functional theory of text organization Текст. / W.C. Mann, S.A. Thompson // Text № 8(3). -1988. -C. 243−281.
  100. Marcu, D. Discourse trees are good indicators of importance in text Текст. / D. Marcu // Advances in automatic text summarization Cambridge, The MIT Press. — 1999. — C. 123 — 136.
  101. Nomoto, T. The diversity-based approach to open-domain text summarization. Текст. / Т. Nomoto, Y. Matsumoto // In Information Processing & Management, 39, 2003. C. 363−389.
  102. Polanyi, L. The linguistic structure of discourse. Текст. L. Polanyi // Technical report CSLI-96−200, Center for study of language and information. -Stanford, CA. 1996. — 45 c.
  103. Rijsbergen, C. J. Information retrieval. Текст. / С. J. Rijsbergen. -Butterworths, London. 1979. — 325c.
  104. Segal, E.M. The role of interclausal connectives in narrative structuring. Текст. E.M. Segal // Discourse processes. 1991. — C. 27−54.
Заполнить форму текущей работой