Помощь в написании студенческих работ
Антистрессовый сервис

Разработка программы автоматизированной классификации информационных сообщений СМИ по заданным тематикам

ДипломнаяПомощь в написанииУзнать стоимостьмоей работы

Возможным путем решения проблемы является создание технико-информационных средств описания смысла имеющихся текстов с возможностью дальнейшего осмысленного поиска в массиве текстовой информации. Причем большие и постоянно увеличивающиеся объемы текстовой информации требуют, чтобы такие средства работали в автоматическом режиме. При современном уровне развития информационных технологий… Читать ещё >

Разработка программы автоматизированной классификации информационных сообщений СМИ по заданным тематикам (реферат, курсовая, диплом, контрольная)

Содержание

  • ЗАДАНИЕ НА ВЫПУСКНУЮ КВАЛИФИКАЦИОННУЮ РАБОТУ
  • ОТЗЫВ РУКОВОДИТЕЛЯ
  • РЕЦЕНЗИЯ
  • ПЕРЕЧЕНЬ ПРИНЯТЫХ СОКРАЩЕНИЙ
  • ВВЕДЕНИЕ
  • 1. АНАЛИЗ СИСТЕМы
  • КЛАССИФИКАЦИИ ИНФОРМАЦИИ
    • 1. 1. Система классификации информации
    • 1. 2. Схема организационной структуры управления информационных и аналитических технологий аппарата администрации Тверской области
      • 1. 2. 1. Описание автоматизируемых функций и схемы функциональной структуры АИС «Классификатор»
      • 1. 2. 2. Описание постановки задачи
  • 2. ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ
    • 2. 1. Перечень входных данных
    • 2. 2. Перечень выходных данных и документов
    • 2. 3. Описание информационного обеспечения АИС «Классификатор»
      • 2. 3. 1. Описание структуры входных информационных сообщений и выходных данных и документов
      • 2. 3. 2. Структура информационной части сообщения СМИ
      • 2. 3. 3. Основные требования, предъявляемые к подготовке сообщений СМИ в части орфографии
    • 2. 4. Описание организации информационной базы
    • 2. 5. Математическое обеспечение
      • 2. 5. 1. Математическая постановка задачи классификации информационных сообщений СМИ
      • 2. 5. 2. Описание метода нечеткого поиска
      • 2. 5. 3. Описание запросов
      • 2. 5. 4. Описание схемы работы системы
    • 2. 6. Техническое обеспечение АИС «классификатор»
      • 2. 6. 1. Описание комплекса технических средств
      • 2. 6. 2. Инструкция по эксплуатации
  • 3. ТЕХНИКО-ЭКОНОМИЧЕСКОЕ ОБОСНОВАНИЕ ПРОЕКТА
    • 3. 1. Теоретические основы расчетов
    • 3. 2. Расчет экономической эффективности
  • ЗАКЛЮЧЕНИЕ
  • Приложение 1. Структура входных и выходных документов
  • Приложение 2. Текст программы

ВВЕДЕНИЕ

При современном уровне развития информационных технологий использование компьютера для хранения любых видов информации становится единственным способом, предоставляющим широчайшие возможности по управлению информацией.

В настоящее время идет постоянный и быстрый рост объемов информации. Значительную часть этой информации составляют текстовые данные. В связи с этим встает проблема создания средств доступа к текстовой информации.

Технически существует возможность доступа к значительной части имеющихся текстов, но практически доступна лишь малая часть. Это связано с несовершенством средств доступа. Современные средства поиска, каталогизации, описания текстов не удовлетворяют нарастающим потребностям пользователей. Требуется их развитие в направлении повышения эффективности поиска информации и упрощения взаимодействия с пользователем.

Возможным путем решения проблемы является создание технико-информационных средств описания смысла имеющихся текстов с возможностью дальнейшего осмысленного поиска в массиве текстовой информации. Причем большие и постоянно увеличивающиеся объемы текстовой информации требуют, чтобы такие средства работали в автоматическом режиме.

Наиболее важным направлением автоматизации деятельности предприятий является использование современных информационных технологий для хранения, систематизации и эффективной обработки информации, поступающей из различных источников, а также использования этой информации в целях выработки рекомендаций для принятия управленческих решений.

Проблема использования большого объема накопленных данных является ключевой во многих организациях. Проблема работы с большим количеством информации имеет два аспекта:

• Автоматический сбор информации;

• Автоматический разбор поступившей информации по данной тематике, проведенный на основе анализа текста документа.

В связи с этим, во-первых, появляется задача загрузки информации в систему. Процесс загрузки заключается в занесении данных с носителя информации в хранилище данных. Поставляющие информацию оперативные системы далеко не всегда обладают достаточным уровнем качества данных, поэтому процесс загрузки этих данных в хранилище не ограничивается простым копированием, а включает в себя очистку, согласование и контроль качества. Хранилища данных загружают и постоянно обновляют огромные объемы данных из различных источников, поэтому вероятность попадания в них «грязных данных» весьма высока. Поэтому появляется проблема поиска и выборки необходимой информации из больших массивов текстовых данных.

Эффективность поиска в большом информационном массиве существенно повысится, если его разбить на части по некоторому критерию, связанному с целями поиска. Следовательно, во-вторых, появляется проблема классификации сообщений. Для решения задачи анализа текстовой информации и последующего автоматического распределения ее по требуемым тематикам необходимо в первую очередь сформировать рубрикатор, то есть задать список рубрик и словарь, наиболее точно характеризующие исследуемую область знаний. Классификация документов позволяет сузить область поиска и не только увеличить его скорость, но и значительно повысить точность результатов. Поэтому технологии автоматической классификации документов отводится важное место в системах управления электронным документооборотом.

Суть задачи классификации состоит в автоматическом распределении поступающих в систему документов в зависимости от их типа и содержания по рубрикам.

В настоящее время в структуре областной исполнительной власти ответственность за поддержание информационного тонуса в регионе возложена на управление информационных и аналитических технологий аппарата администрации Тверской области (УИАТ ТО), одной из задач которого является создание условий для удовлетворения информационных потребностей органов власти, населения.

Показать весь текст

Список литературы

  1. ГОСТ 2.105−95. ЕСКД. Общие требования к текстовым документам.
  2. ГОСТ Р50.1.028−2001. Методология функционального моделирования.
  3. ГОСТ 28 195–89. Оценка качества программных средств.
  4. ГОСТ 19.102−77.ЕСПД. Стадии разработки.
  5. ГОСТ 19.402−78.ЕСПД. Описание программы.
  6. ГОСТ 12.1.005−88 Общие санитарно-гигиенические требования к воздуху в рабочей зоне.
  7. ГОСТ 19.701−90 Схемы алгоритмов, программ, данных и систем.
  8. ГОСТ 34.201−89 Информационная технология. Виды, комплектность и обозначение документов при создании автоматизированных систем.
  9. ГОСТ 34.602−89 Информационная технология. Техническое задание на создание автоматизированной системы.
  10. СанПиН 2.2.2/2.4.1340−03 Гигиенические требования к персональным электронно-вычислительным машинам и организации работы.
  11. Р.2.2.2006−05 Гигиенические критерии оценки условий труда по показателям вредности и опасности окружающей среды, тяжести и напряженности трудового процесса.
  12. СанПиН 2.2.548−96 Общие санитарно-гигиенические требования к воздуху в рабочей зоне.
  13. А.В., Андрейчикова О. Н. Интеллектуальные информационные системы: Учебник. — М.: Финансы и статистика, 2004. — 424 с.: ил.
  14. Базы данных в Delphi 7. Самоучитель/ В. Понамарев. — СПб.: Питер, 2003. — 224 с.: ил.
  15. А.И., Башмаков И. А. Интеллектуальные информационные технологии: Учеб. пособие. — М.: Изд-во МГТУ им. Н. Э. Баумана, 2005. — 304 с.: ил.
  16. Бобровский С.И. Delphi 7. Учебный курс.- СПб.: Питер, 2003. — 736с.
  17. С.В., Клевцов А. Л. Программирование в среде Delphi 7. — Харьков: Фолио, 2003. — 528с.
  18. В.Э., Хомоненко А. Д. Работа с базами данных в Delphi / В. — 2-е изд. — СПб.: БХВ — Петербург, 2002. — 624с.: ил.
  19. В.В. Системы искусственного интеллекта: Учеб. пособие для вузов. — М.: Изд-во МГТУ им. Н. Э. Баумана, 2001. — 352 с.: ил.
  20. С.М. Проектирование баз данных: Учебник. — М.: Финансы и статистика, 1988. — 216с.
  21. Дубнов П.Ю. Access 2000: Программирование баз данных. — М.: ДМК, 2000. — 272с.: ил.
  22. В. Базы данных в Delphi 7: Самоучитель. — М. и др.: Питер, 2003. — 224с.: ил.
  23. Средства защиты в машиностроении: Расчет и проектирование: Справочник/С.В. Белов, А. Ф. Козьяков, О. Ф. Партолин и др.; Под ред. С. В. Белова. — М.: Машиностроение, 1989. — 368 с.: ил.
  24. Типовые нормы времени на программирование задач для ЭВМ. — М.: Экономика, 1989.
  25. http://google.ru/com/str.zip
  26. http://google.ru//narod.ru/Hem/infon.zip
Заполнить форму текущей работой