Помощь в написании студенческих работ
Антистрессовый сервис

Диалоговые алгоритмы поиска и навигации в автоматизированной системе текстового документооборота металлургического предприятия

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Согласно многочисленным исследованиям, более 50 процентов пользователей заканчивают сеанс работы с поисковой системой на первой же странице, просматривая обычно 10−20 ссылок. При этом, как правило, лишь 2−3 ссылки содержат действительно полезную для пользователя информацию. Можно предположить, что значительная доля этих пользователей уходят с сайта неудовлетворенными результатами поиска… Читать ещё >

Диалоговые алгоритмы поиска и навигации в автоматизированной системе текстового документооборота металлургического предприятия (реферат, курсовая, диплом, контрольная)

Содержание

  • ГЛАВА 1. ПОЛНОТЕКСТОВЫЙ ДОКУМЕНТООБОРОТ НА ПРОМЫШЛЕННОМ ПРЕДПРИЯТИИ МЕТАЛЛУРГИЧЕСКОГО КОМПЛЕКСА И ПРОБЛЕМЫ СОЗДАНИЯ ЭФФЕКТИВНЫХ ПОИСКОВЫХ МАШИН
    • 1. 1. Характеристика полнотекстового документооборота на металлургическом предприятии
    • 1. 2. Архитектура систем документооборота и роль поисковой составляющей
    • 1. 3. Основные принципы работы поисковых систем
      • 1. 3. 1. Поисковые системы и базы данных
      • 1. 3. 2. Поиск информации и поиск данных
      • 1. 3. 3. Классические информационно-поисковые системы
      • 1. 3. 4. Критерии релевантности и пертинентности
      • 1. 3. 5. Оценка эффективности поиска
    • 1. 4. Проблемы и пути развития ИПС
      • 1. 4. 1. Лингвистические проблемы организации ИПС
      • 1. 4. 2. Направления развития ИПС
    • 1. 5. Методы преобразования запросов
      • 1. 5. 1. Расширение запросов (добавление ключевых слов)
      • 1. 5. 2. Обратная связь как средство повышения релевантности
    • 1. 6. Поведение пользователей
    • 1. 7. Представление результатов поиска
    • 1. 8. Сортировка результатов поиска
      • 1. 8. 1. Определение релевантности по рейтингу
      • 1. 8. 2. Другие подходы к сортировке
      • 1. 8. 3. Группировка по лексическому значению
    • 1. 9. Интерактивные методы преобразования запросов
      • 1. 9. 1. Фокусировка запроса
      • 1. 9. 2. Расширение полноты поиска
      • 1. 9. 3. Лексические онтологии
    • 1. 10. Поиск по контексту
    • 1. 11. Интерфейсные (визуальные) модели взаимодействия пользователей с ИПС. 51 1.11.1. Тематические сети TopNet
      • 1. 11. 2. Самоорганизующиеся тематические карты TopSOM
    • 1. 12. Патентный поиск
      • 1. 12. 1. Традиционный поиск патентной информации
      • 1. 12. 2. Поиск патентной информации в сети Интернет
    • 1. 13. Выводы
  • ГЛАВА 2. ДИАЛОГОВЫЕ МЕТОДЫ ФОКУСИРОВКИ И РАСШИРЕНИЯ ПОИСКА В СИСТЕМАХ ДОКУМЕНТООБОРОТА НА ПРЕДПРИЯТИИ МЕТАЛЛУРГИЧЕСКОГО КОМПЛЕКСА
    • 2. 1. Лингвистические технологии, основанные на лексическом значении
    • 2. 2. Сортировка результатов поиска
    • 2. 3. Интерактивные методы преобразования запросов
      • 2. 3. 1. Фокусировка запроса
      • 2. 3. 2. Расширение
      • 2. 3. 3. Переформулирование
      • 2. 3. 4. Лексические онтологии
    • 2. 4. Формальная постановка задачи
      • 2. 4. 1. Задача поиска в терминах множеств
      • 2. 4. 2. Задача поиска как задача принятия решений
      • 2. 4. 3. Диалоговый алгоритм решения задачи поиска
    • 2. 5. Реализация ИПС в системе документооборота металлургического предприятия
      • 2. 5. 1. Преимущества над традиционными поисковыми системами
      • 2. 5. 2. Алгоритмы работы с интерфейсным (диалоговым) блоком
      • 2. 5. 3. Структура программного обеспечения
      • 2. 5. 4. Настройки ИПС
    • 2. 6. Выводы
  • ГЛАВА 3. НАВИГАЦИЯ В ПРЕДЕЛАХ ЛЕКСИЧЕСКОЙ ОНТОЛОГИИ С УЧЕТОМ ЧАСТОТНЫХ ФАКТОРОВ В ЗАДАЧАХ ПАТЕНТНОГО ПОИСКА
    • 3. 1. Проект WordNet
    • 3. 2. Использование онтологий для переформулирования и вербализации запросов в поисковых системах
    • 3. 3. Частотные факторы
      • 3. 3. 1. Частотная функция узла
      • 3. 3. 2. Вес поддерева
      • 3. 3. 3. Число подчиненных частотных узлов
    • 3. 4. Способы визуализации частотных факторов
    • 3. 5. Обсуждение результатов
    • 3. 6. Выводы
  • ГЛАВА 4. ОЦЕНКА ЭФФЕКТИВНОСТИ ПРЕДЛОЖЕННЫХ ПОДХОДОВ
    • 4. 1. Целесообразность применения новых поисковых технологий в системах документооборота
    • 4. 2. Эффективность систем документооборота
    • 4. 3. Эффект от повышения качества патентного поиска
    • 4. 4. Влияние новых возможностей поиска на рекламу в сети Интернет
    • 4. 5. Выводы

Последнее десятилетие ознаменовано феноменальным прогрессом в области телекоммуникаций, информатики, вычислительной техники, что в свою очередь вызвало бурный рост объемов информации, хранящейся в электронном виде. При этом, если крупные массивы структурированных данных накапливаются уже десятилетия, то только сейчас объем текстовых электронных документов многократно превзошел объемы данных.

В настоящий момент большая часть документов на современном металлургическом предприятии, а также в других областях деятельности хранится именно в электронном виде. На предприятиях наиболее широко распространены следующие типы электронных документов: договора, письма, предложения, приказы, конструкторская документация, различные технологические инструкции, бухгалтерские документы.

Месячный оборот текстовых документов крупного металлургического предприятия может составлять десятки тысяч документов. Основные категории документов, это:

— нормативно-правовая база;

— организационно-распорядительные документы;

— внутренний документооборот;

— взаимодействие с контрагентами.

Документы хранятся в электронном виде как в различных информационных системах (справочные системы, системы автоматизации документооборота и проектирования), так и в виде отдельных файлов. При этом следует отметить, что, как и в информационных системах, так и в средствах поиска файлов, как правило, присутствует только поиск по ключевым словам, зачастую даже без учета морфологии.

Очень остро стоит вопрос поиска по полнотекстовой ганструкторско-технологической документации в проектных организациях металлургической отрасли, например, таких как ОАО «Гипромез». Переход на новую систему стандартизации в связи со вступлением в ВТО ставит вопрос о кросс-лингвистическом поиске и создании двуязычной терминологической системы, обладающей современными средствами поиска и навигации.

Прогресс в области телекоммуникаций, снижение стоимости передачи и хранения данных вызвали бурный рост сети Интернет и объемов информации в ней, а также сделали возможным организацию удаленного доступа к различным библиотечным ресурсам, таким как собственно электронные библиотеки, различные подборки статей, базы знаний и т. д.

Такой рост объема информации, происходящий одновременно с ростом информационных потребностей пользователей и общей тенденцией к понижению требований к их квалификации в области организации поискового процесса, ставит старую проблему эффективного информационного поиска остро как никогда ранее.

Еще одной областью применения полнотекстовых поисковых машин является патентный поиск. Сейчас в Интернет доступен поиск по крупнейшим базам данных патентов России, США, Европы. Однако современные системы предоставляют поиск только по ключевым словам, то есть для того, чтобы убедиться в новизне своей идеи автор вынужден перебирать различные варианты описания патента, самостоятельно подбирая синонимы, комбинируя ключевые слова. Это нелегко проделать даже для родного языка, поиск же на других языках становится еще более затруднительным.

Необходимо отметить, что, несмотря на непрерывно идущие исследования в области совершенствования поисковых технологий (о чем косвенно может свидетельствовать постоянное появление новых поисковых машин (ПМ) в сети Интернет), нельзя сказать, что поставленная проблема близка к своему решению.

Согласно многочисленным исследованиям, более 50 процентов пользователей заканчивают сеанс работы с поисковой системой на первой же странице, просматривая обычно 10−20 ссылок. При этом, как правило, лишь 2−3 ссылки содержат действительно полезную для пользователя информацию. Можно предположить, что значительная доля этих пользователей уходят с сайта неудовлетворенными результатами поиска. Неэффективный поиск в Интернет приводит к огромным расходам на лишний трафик, который несут как пользователи (в лице предприятий, которые оплачивают использование Интернет в рабочих целях), так и владельцы сайтов, на оборудование которых создается непроизводительная нагрузка такими пользователями. По различным оценкам 50−70% навигационного трафика в Интернет приходится на просмотр ошибочно найденных страниц.

Эта проблема порождает другую. Доход многих информационных ресурсов зависит от эффективности демонстрируемой на их страницах рекламы, таким образом, реклама, продемонстрированная не тому пользователю, означает убытки или дополнительные расходы рекламодателя.

Одной из причин, не позволяющих изменить эту ситуацию, является то, что большинство исследований и способов совершенствования ПМ сфокусировано на развитии традиционных (разработанных еще до современного уровня развития вычислительной техники и проникновения ее во все сферы деятельности) способов индексации текстов и ранжирования результатов поиска.

Итак, в настоящий момент для поисковых машин очевидны следующие области применения:

— поиск в Интернет;

— поиск в системах документооборота предприятий;

— патентный поиск;

— поиск в хранилищах текстовой информации (новости, научные ресурсы).

Таким образом, актуальность работы обуславливается огромным количеством доступной информации и отсутствием адекватных инструментов ее структурирования, поиска и навигации. К настоящему моменту накоплен достаточный объем знаний в области компьютерной лингвистики, поисковых технологий, разработки поисковых машин, построения пользовательских интерфейсов, кроме того, производительность современной вычислительной техники многократно превосходит ту, которая была в момент начала разработки большинства имеющихся поисковых систем. Это позволяет приступить к созданию поисковых систем, основанных на качественно новых принципах, в частности на интерактивном взаимодействии с пользователями через удобные интерфейсы.

Цель работы заключается в исследовании различных диалоговых (интерфейсных) механизмов поиска, основанных на изменении поисковых запросов, разработка и апробация диалоговых моделей фокусировки и расширения поиска в системах документооборота металлургических предприятий, а также исследование возможностей применения частотных зависимостей для помощи пользователям в формулировании запросов при патентном поиске.

Для достижения поставленных целей были решены следующие задачи:

— проанализированы имеющиеся подходы к организации интерфейса поисковых систем, выявлены их узкие места и направления развития;

— предложены диалоговые решения для повышения эффективности поиска, основанные на методах фокусировки, расширения и переформулирования запроса;

— предложены диалоговые решения для повышения эффективности поиска, основанные на частотных моделях;

— предложена формальная постановка задач расширения и фокусировки поиска, создано программное обеспечение для их решения;

— проведена оценка эффективности предложенных методов разрешения многозначности, фокусировки поиска, навигации по онтологиям при использовании в системах документооборота металлургических предприятий, патентного поиска, сети Интернет.

Научная новизна работы заключается в:

— формальной постановке задачи расширения и фокусировки поиска в интерфейсном модуле поисковой машины, основанной на использовании лексического значения;

— интерфейсной модели поисковой машины, основанной на технологиях разрешения многозначности;

— подтверждении возможности и эффективности применения частотных показателей при работе с лексическими онтологиями;

— математическом описании различных частотных факторов для использования в пользовательском интерфейсе.

Практическая ценность работы заключается в следующем:

— выполнена формальная постановка задачи построения пользовательского интерфейса, основанного на технологиях разрешения многозначности, и разработке диалогового алгоритма фокусировки и расширения запроса;

— создана математическая модель частотных факторов при навигации по онтологической системе, которая позволяет строить пользовательские интерфейсы для различных сфер применения;

— использование результатов исследования при построении информационно-поисковой составляющей систем полнотекстового документооборота промышленного предприятия в металлургическом комплексе, должно привести к сокращению потерь и экономии оборотных средств;

— разработаны новые интерфейсных принципы с использованием лексических онтологии, которые позволяют строить более эффективные системы патентного поиска.

— использование новых интерфейсных моделей при создании информационно-поисковых систем в Интернет, имеет потенциал сокращения общего объема передаваемой информации на 10%;

— использование разрешения многозначности может повысить отдачу от рекламы при размещении платных ссылок в результатах поиска в сети Интернет в 2−3 раза за счет лучшей фокусировки.

Методы исследования.

При выполнении работы использовались методы:

— алгоритмического моделирования;

— структурного программирования;

— реляционная модель построения баз данных;

— метод частотного анализа текстов;

— метод частотного анализа запросов к поисковым системам;

— методы семантического анализа текстов, основанные на разрешении лексической многозначности;

— методы системного анализа и принятия решений.

Результаты работы были практически реализованы в виде программных прототипов пользовательских интерфейсов. Методы организации интерфейса к лексической онтологии на частотных принципах приняты к внедрению в учебном процессе МИСиС для обучения по курсу «Лингвистические основы информатики».

Работа производилась по следующим направлениям специальности 05.13.01:

— теоретико-множественный и теоретико-информационный анализ сложных систем;

— методы и алгоритмы интеллектуальной поддержки при принятии управленческих решений;

— визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации.

Апробация работы. Результаты работы докладывались на следующих научных конференциях:

— Международный семинар Диалог'2002, Протвино, 6−11 июня 2002 г.;

— Когнитивное моделирование в лингвистике'2002, п. Дивноморское, сентябрь.

2002 г.;

— International Workshop Speech and Computer (SPECOM'2003), Москва, 27−29 октября 2003 г.;

— Международный семинар Диалог'2003, Протвино, 11−16 июня 2003 г.

Работа выполнялась при частичной поддержке Российского Фонда Фундаментальных Исследований (грант РФФИ № 05−07−90 939, «Система онтологического типа для поиска и обработки текстовой информации»).

Результаты работы приняты к внедрению и использованию при создании информационно-аналитических систем разработки ЗАО «Сфера».

Теоретические вопросы диссертации освещаются в следующих научных публикациях:

Поляков В.Н., Бодров Д. А., Точин А. В. Интерактивные методы фокусировки и Расширения поиска в интеллектуальной поисковой машине // Компьютерная лингвистика и интеллектуальные технологии: Тр. Международного семинара Диалог'2002. (Протвино, 6−11 июня 2002 г.): В 2 т. / Под ред. А. С. Нариньяни.— М.: Наука, 2002. Т. 2: Прикладные проблемы. Стр. 438−449.

Бодров Д. А., Поляков В. Н. Проблемы создания эффективных поисковых машин (обзорная статья) // Обработка текста и когнитивные технологии: Сборник (Вып. 7) / Под ред. Соловьева В. Д. — Казань: 2002. Стр. 8−55.

Поляков В. Н., Бодров Д. А. Навигация в пределах лексической онтологии с учетом частотных факторов // Компьютерная лингвистика и интеллектуальные технологии: Тр. Международного семинара Диалог'2003. (Протвино, 11−16 июня 2003 г.) / Под ред. И. М. Кобозевой, Н. И. Лауфер, В. П. Селегея. — М.: Наука, 2003. Стр. 554−568.

Bodrov D. A., Polyakov V. N. Frequency Factors For Navigation through Lexical Ontology// Proceedings of the International Workshop Speech and Computer (SPECOM'2003), Moscow,.

Russia, October 2003. — M: 2003. Стр. 77−87.

Бодров Д. А., Кожитов С. J1., Поляков В. Н. Автоматизация текстового оборота на металлургическом предприятии и новые поисковые технологии // Перспективные технологии и оборудование для материаловедения и наноэлектроники: Материалы семинара / Под ред. проф. Л. В. Кожитова, проф. В. К. Карпасюка. — М.: МГИУ, 2006 — 741 с.

Бодров Д. А., Кожитов С. Л., Поляков В. Н. Задачи интерактивной обработки поисковых запросов в теоретико-множественной постановке. // Известия Саратовского университета. Новая серия. Серия «Математика. Механика. Информатика» — Саратов: 2007. Том 7. Выпуск 1. Стр. 78−83.

Структура диссертации. Работа состоит из введения, четырех глав, заключения, списка литературы.

4.5. Выводы.

В данной главе показано, почему предложенные технологии поиска направлены в первую очередь на использование в информационных системах промышленных предприятий, и сделаны оценки эффективности предложенных методов повышения качества поиска и их влияние на следующие области:

— системы электронного документооборота металлургических предприятий;

— системы патентного поиска;

— системы контекстной рекламы в сети Интернет;

— непроизводительный трафик в сети Интернет.

В главе предложена методика оценки эффективности систем документооборота на металлургическом предприятии.

В области патентного обозначены основные риски предприятия из-за отсутствия качественного патентного поиска и факторы влияния эффективности поиска на хозяйственную деятельность предприятия.

Для обоснования применимости предложенных механизмов в сети Интернет предложена методика вычисления повышения пертинентности результатов поиска и сделана ее численная оценка.

На основе полученной оценки повышения качества поиска произведен анализ ее влияния на эффективность баннерной рекламы на поисковых системах и общий объем трафика в сети Интернет.

ЗАКЛЮЧЕНИЕ

настоящей работе произведено исследование методов повышения качества поисковой составляющей в системах документооборота в металлургии и в системах патентного поиска.

В ходе выполнения работы выяснилось, что большинство опубликованных исследований ориентированы на развитие традиционных подходов к созданию ИПС, в то же время исследования, направленные на использование механизмов разрешения многозначности или построения интерактивных поисковых систем практически отсутствуют. Кроме того, большинство исследований направлено на поиск путей повышения качества автоматического поиска, хотя в случаях нечеткого формулирования поисковых запросов целесообразнее использовать интерактивные методы уточнения запроса.

Данная работа, в свою очередь, была направлена на исследование различных диалоговых (интерфейсных) методов повышения качества поиска, основанных на интерактивном изменении и уточнении поисковых запросов, а также проведена апробация диалоговых моделей фокусировки, расширения поиска и моделей частотного интерфейса формулирования запросов с использованием онтологии.

Созданные в результате работы модели позволили убедиться в правильности сделанных предположений о применимости интерактивного взаимодействия с пользователями для повышения качества поиска в системах документооборота металлургических предприятий. Созданное приложение-прототип продемонстрировало применимость онтологий в совокупности с частотными оценками для формулирования поисковых запросов при патентном поиске.

Проделанная работа привела к следующим результатам и выводам:

1. Выполнена формальная постановка задачи повышения качества поиска путем переформулирования запросов. Формализация охватывает следующие способы фокусировки запроса: тематические кластеры, словосочетания, вопросы, коммуникативные кластеры, и следующие способы расширения полноты поиска: словообразовательная парадигма, синонимы, аббревиатуры и онтологии. Введены формальные критерии качества поиска на основе понятий пертинентности и мощности множества результатов.

2. На основе выполненной формальной постановки задачи поиска предложен алгоритм построения диалоговой поисковой системы, использующей технологии разрешения многозначности.

3. Разработана реляционная модель данных, позволяющая описывать структуру текстов с целью улучшения возможности поиска, и прототип поисковой системы, в пользовательском интерфейсе которой были использованы механизмы разрешения многозначности.

4. Разработаны общие требования к частотным функциям, используемым в частотном интерфейсе. Разработано несколько частотных функций, проанализированы отношения между ними. Разработан метод оценки перспективности навигации по древовидной структуре на основе веса поддерева. Введены несколько вариантов таких методов и проанализированы их относительные преимущества и недостатки.

5. Проведено исследование возможностей использования частотных факторов в организации диалога информационной системы с пользователем для облегчения использования сложных механизмов поиска. Сформулированы подходы, позволяющие организовать частотно-зависимый онтологический интерфейс для различных категорий и информационных потребностей пользователей. Разработано специализированное приложение-прототип для оценки возможностей применения различных частотных факторов и способов их визуализации, с помощью которого опробованы различные способы визуализации частотных факторов, проанализированы их относительные преимущества и недостатки.

6. Сделан вывод о наибольшей эффективности предлагаемых механизмов при применении их в информационных системах промышленных предприятий (в том числе металлургических), а также в системах патентного поиска, т. е. при использовании специалистами в предметной области (хорошо владеющих специальной лексикой).

7. Результаты исследований применяются в проекте Интеллектуальной поисковой машины, в учебном процессе МИСиС по курсу «Лингвистические основы информатики», могут быть применены в системах документооборота металлургического предприятия, в системах патентного поиска, а также других информационных системах.

Показать весь текст

Список литературы

  1. ММК вводит электронные средства документооборота— http://www.meta!-trade.ru/news/2005/03/30/news22218.html, 31.03.2005.
  2. Новосибирский металлургический завод внедрил электронный документооборот — http://www.upscalesoft.ru/pages/press/news/301 006.html, 10.11.2006.
  3. Система электронного документооборота Нестор: архитектура — http://www.memsys.ru/info.php?id=87,23.02.2006.
  4. В. Этот многообразный мир документооборота.— http://www.mdi.ru/library/analit/etotmnogmir.html, 23.02.2006.
  5. Функциональная архитектура системы корпоративного электронного документооборота — http://www.fact400.ru/funcarc.htm, 23.02.2006.
  6. Системы электронного управления документами: обзор, классификация и оценка возврата от внедрения — http://www.mdi.ru/library/analit/sysel.html, 23.02.2006.
  7. Van Rijsbergen, С. J. Information Retrieval, 2nd edition— Dept. of Computer Science, University of Glasgow, 1979
  8. Г. Ю., Романенко А. Г., Самойлюк О. Ф. Информационные системы: Учебное пособие / Под общ. ред. К. И. Курбакова— М.: Издательство Российской экономической академии, 1998.
  9. В. А. Попытка создать инструментарий для экспериментов с Z39.50 — http://www.z.nw.ru, 20.08.2002.
  10. В.Н. Интеллектуальная поисковая машина. Концептуальный проект. // Труды Казанской школы по компьютерной и когнитивной лингвистике. TEL-2000. Вып. 5. Казань. 17−20 октября. 2000 г. — Казань. Изд-во Сэлэт, 2000. Стр. 87−119.
  11. Ed Greengrass. Information Retrieval: A Survey— cite-seer.nj.nec.com/greengrass00information.html, 10.05.2002
  12. GudivadaV. N. Information search on World Wide Web // Computer Weekly. 1997. № 35.
  13. Jansen В., Pooch U. A Review of Web Searching Studies and a Framework for Future
  14. Research. // Journal of the American Society of Information Science. 2001. V. 52. № 3.
  15. Jansen В., Spink A., Saracevic T. Real Life, Real Users, and Real Needs: A Study and Analysis of User Queries on the Web // Information Processing and Management. 2000. V. 36. № 2.
  16. Lee U., Liu Z., and Cho J. Automatic identification of user goals in web search. Technical report // UCLA Computer Science. 2004.
  17. Lee U., Liu Z., and Cho J. Analysis of User Web Traffic with a Focus on Search Activities — http://citeseer.ist.psu.edu/724 934.html, 01.09.2006
  18. Rose D. E. and Levinson D. Understanding user goals in web search // Proceedings of WWW 2004, New York, USA, May 17−22,2004 — 2004.
  19. Brin S., Page L. The Anatomy of a Large-Scale Hypertextual (Web) Search Engine. // Computer Networks and ISDN Systems. 1998. V. 30. № 1−7.
  20. Brin S. and oth. The PageRank Citation Ranking: Bringing Order to the Web. Technical report / Stanford University. — 1998.
  21. Finkelstein L. et al. Placing Search in Context: The Concept Revisited // In Proceedings of the Tenth International World Wide Web Conference, 2001.
  22. В. H. Новости и тенденции поисковых технологий (Функциональные возможности ПС) — http://www.ricn.ru/neiron/material/489/, 14.10.2002.
  23. Визуализация информационных массивов — http://research.metric.ru/visual.asp, 10.10.2002.
  24. Ю.Н. Основы компьютерной лингвистики. Москва, 2000.
  25. В.Н., Павлов О. А. Частотный метод выявления устойчивых словосочетаний // Труды Казанской школы по компьютерной и когнитивной лингвистике. TEL-2001. Вып. 6. Казань. 22−28 октября. 2001 г. Казань. 2001.
  26. Т., Бегг К., Страчан А. Базы данных: проектирование, реализация и сопровождение. Теория и практика, 2-е изд.: Пер. с англ.: Уч. пос. — М.: Издательский дом «Вильяме», 2000.
  27. А. С. Методы системного анализа: Многокритериальная и нечеткая оптимизация, моделирование и экспертные оценки. — М.: НПО «Издательство „Экономика“», 1999.
  28. Herrera-Viedma Е. Modeling the retrieval process for an information retrieval system using an ordinal fuzzy linguistic approach // Journal of the American Society of Information Science. 2001. V. 52. № 6, pp. 11−26.
  29. Giacomo Piccinelli, Marco Casassa Mont. A Type 2 Fuzzy Set Based Model for Adaptive Information Retrieval — citeseer.ist.psu.edu/piccinelli98type.html, 20.12.2005.
  30. Padmini Srinivasan, Miguel E. Ruiz, Donald H. Kraft, Jianhua Chen. Vocabulary mining for information retrieval: rough sets and fuzzy sets. // Information Processing and Management. 2001. V. 37, № 1.
  31. George A. Miller. The Magical Number Seven, Plus or Minus Two: Some Limits on Our Capacity for Processing Information // The Psychological Review. 1956. V. 63, pp. 81−97.
  32. Hick W.E. On the rate of gain information // Quarterly Journal of Experimental Psychology. 1959. V. 4. № 1.
  33. Miller, George A., Richard Beckwith, Christiane Fellbaum, Derek Gross and Katherine J. Miller. Introduction to WordNet: an on-line lexical database. // International Journal of Lexicography 3 (4), 1990, pp. 235−244.
  34. Brezeale, Darin. The Organization of Internet Web Pages Using WordNet and Self-Organizing Maps. Masters thesis, University of Texas at Arlington, August 1999.
  35. Chakravarthy, A. S. and К. B. Haase. NetSerf: using semantic knowledge to find Internet information. In: Proceedings of the 18th Annual ACM SIGIR Conference on Research and Development in Information Retrieval, Seattle, 1995.
  36. Martin, Philippe. Using the WordNet Concept Catalog and a Relation Hierarchy for Knowledge Acquisition In: Proceedings of Peirce'95,4th International Workshop on Peirce, University of California, Santa Cruz, August 1995.
  37. T. Andreasen, J. Fischer Nilsson, & H. Erdman Thomsen: Ontology-based Querying, in H.L. Larsem et al. (eds.) Flexible Query Answering Systems, Flexible Query Answering Systems, Recent Advances, Physica-Verlag, Springer, 2000. pp. 15−26.
  38. Gonzalo, Julio, Felisa Verdejo, Irina Chugur and Juan Cigarran. Indexing with Word-Net synsets can improve text retrieval. In: Proceedings of the COLING/ACL Workshop on Usage of WordNet in Natural Language Processing Systems, Montreal, 1998.
  39. Mandala, Rila, Tokunaga Takenobu and Tanaka Hozumi. The use of WordNet in information retrieval. In: Proceedings of the COLING/ACL Workshop on Usage of WordNet in Natural Language Processing Systems, Montreal, 1998.
  40. Mihalcea, Rada and Dan I. Moldovan. extended WordNet: progress report. In: Proceedings of the NAACL 2001 Workshop on WordNet and Other Lexical Resources, Pittsburgh, June 2001.
  41. Mihalcea, Rada and Dan I. Moldovan. A WordNet-Based Interface to Internet Search Engines In: Proceedings of FLAIRS-98, May 1998, Sanibel Island, FL
  42. Ontology Usage and Application. //Applied Semantics. Technical Whitepapers. 2003.
  43. Richardson, R. and Alan F. Smeaton. Using WordNet in a Knowledge-Based Approach to Information Retrieval. Working paper CA-0395, School of Computer Applications, Dublin City University, Dublin, 1995.
  44. Vorhees, Ellen M. Using WordNet for text retrieval. In: Fellbaum, Christiane, ed.,
  45. WordNet: An Electronic Lexical Database, MIT Press, May 1998.
  46. Karov, Yael and Shimon Edelman. Learning similarity-based word sense disambiguation from sparse data. In: Proceedings of the 4th Workshop on Very Large Corpora, Copenhagen, 1996.
  47. Kwong, Oi Yee. Word sense disambiguation with an integrated lexical resource. In: Proceedings of the NAACL 2001 Workshop on WordNet and Other Lexical Resources, Pittsburgh, June 2001.
  48. Li, Xiaobin, Stan Szpakowicz and Stan Matwin. A WordNet-based algorithm for word sense disambiguation. In: Proceedings of the 14th International Joint Conference on Artificial Intelligence, Montreal, 1995, pp. 1368−1374.
  49. Lin, Dekang. Using syntactic dependency as local context to resolve word sense ambiguity. In: Proceedings of the 35th Annual Meeting of the Association for Computational Linguistics, Madrid, 1997.
  50. Mihalcea, Rada and Dan I. Moldovan. Word sense disambiguation based on semantic density. In: Proceedings of the COLING/ACL Workshop on Usage of WordNet in Natural Language Processing Systems, Montreal, 1998.
  51. Nastase, Vivi and Stan Szpakowicz. Word sense disambiguation in Roget’s thesaurus using WordNet. In: Proceedings of the NAACL 2001 Workshop on WordNet and Other Lexical Resources, Pittsburgh, June 2001.
  52. Ng, Hwee Tou. Exemplar-based word sense disambiguation: some recent improvements. In: Proceedings of the 2nd Conference on Empirical Methods in NLP (EMNLP-2), Providence, August 1997.
  53. Wiebe, Janyce, J. Maples, L. Duan and Rebecca Bruce. Experience in WordNet sense tagging in the Wall Street Journal. In: Proceedings of the ACL SIGLEX Workshop on Tagging Text with Lexical Semantics: Why, What and How? Washington, April 1997.
  54. А. В. и др. Новые технологии для понятийных сетей, создаваемых в рамках МНТП «Вакцины нового поколения и диагностические системы будущего» — http://www.elbib.ru/index.phtml?page=elbib/rus/journal/2003/part6/ZATGS, 01.04.2006
  55. Elena Garcia and Miguel-Angel Sicilia. User Interface Tactics in Ontology-Based Information Seeking. // PsychNology Journal, 2003 V. 1, № 3,242 255
  56. Fensel, D.- Decker, S.- Erdmann, M.- Studer, R. Proceedings of the 11th Banff Knowledge Acquisition for Knowledge-Based System Workshop (KAW98), Banff, Kanada, April 1998.
  57. B.H., Бодров Д. А., Точин A.B. Интерактивные методы фокусировки и расширения поиска в интеллектуальной поисковой машине. Труды Международного семинара Диалог'2002. Протвино, 6−11 июня 2002 г. с. 438−449.
  58. , G. К. 1945. The Meaning-Frequency Relationship of Words // Journal of General Psychology 33:251−256.
  59. . Электронный документооборот— http://www.usa.ru/documentl.html, 09.01.2006.
  60. Д. В. Окупаемость внедрения электронного документооборота — возможно ли ее рассчитать? — http://delo-press.ru/documents-basis/elektronic.html, 09.01.2006.
  61. Преимущества использования электронного документооборота — http://www.naumen.ru/go/products/naudoc/advantages, 09.01.2006.
  62. Расчет эффективности владения— http://www.intalev.ru/index.php?id=987, 09.01.2006.
  63. Чикагский бизнесмен раскатывает «Северсталь». Компанию обвинили в нарушении авторских прав // Коммерсантъ. — 2005. — 20 авг.
  64. В. За кражу чужой идеи придется заплатить 195 тысяч гривен! — http://www.pr.azov.net/archiv/2004/N8/sud.htm, 09.01.2006.
  65. Что такое CTR баннера — http://www.antula.nVbanner-ctr.htm, 25.02.2006.80. http://www.yandex.ru/last20.html, 27.06.2000.
  66. Евгений Морозов, Трафик 2001,02. // Мир Internet #3 (66) март 2002.
Заполнить форму текущей работой