Помощь в написании студенческих работ
Антистрессовый сервис

Модели управления процессом продаж на рынке недвижимости с помощью нечетких запросов к массивам текстовой информации

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Методы исследования. Выполненные исследования базируются на использовании методов математического моделирования, теории принятия решений, теории графов, методов оптимизации, вычислительной лингвистики, теории синтаксического анализа, нечёткой логики, теории реляционных баз данных, численных методов и программирования. Общей методологической основой является системный подход. Достоверность научных… Читать ещё >

Модели управления процессом продаж на рынке недвижимости с помощью нечетких запросов к массивам текстовой информации (реферат, курсовая, диплом, контрольная)

Содержание

  • ГЛАВА 1. АНАЛИЗ ОСНОВНЫХ ЗАДАЧ И ПРИНЦИПОВ РАБОТЫ СППР РИЭЛТОРСКОГО ПРЕДПРИЯТИЯ
    • 1. 1. Предпосылки возникновения и актуальность задачи автоматизации риэлторской деятельности
    • 1. 2. Анализ потребностей в автоматизированной обработке информации для риэлторской фирмы
      • 1. 2. 1. Основные понятия и свойства рынка объектов недвижимости
      • 1. 2. 2. Методы оценивания объектов недвижимости
    • 1. 3. Обзор информационных систем предприятий
      • 1. 3. 1. Основные типы систем
      • 1. 3. 2. Основные принципы работы СППР риэлторского предприятия
    • 1. 4. Методы анализа текстовой информации
      • 1. 4. 1. Обработка русскоязычных неформализованных текстов
      • 1. 4. 2. Выделение слов и предложений
      • 1. 4. 3. Анализ отдельных слов русского языка
      • 1. 4. 4. Синтаксический анализ
      • 1. 4. 5. Практические задачи обработки текстов
    • 1. 5. Цели и задачи исследования
  • ГЛАВА 2. РАЗРАБОТКА МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ФУНКЦИОНИРОВАНИЯ СППР РИЭЛТОРСКОГО ПРЕДПРИЯТИЯ
    • 2. 1. Модель представления результатов анализа отдельных элементов текста
    • 2. 2. Математическая модель синтаксической структуры предложения
    • 2. 3. Представления данных в виде семантической сети
    • 2. 4. Синтез фрагментов семантической сети
    • 2. 5. Математическая модель извлечения данных
    • 2. 6. Математическая модель запросов с нечёткими условиями
    • 2. 7. Оценивание объектов недвижимости на основе метода сравнения продаж

Актуальность темы

Бурное развитие рынка недвижимости повлекло за собой резкое увеличение количества компаний, предоставляющих риэлторские услуги, что привело к обострению конкурентной борьбы и повышению требований по уровню, скорости, удобству и качеству обслуживания клиентов. Взаимодействие с каждым конкретным клиентом состоит из двух этапов: во-первых, поиск актуального предложения рынка недвижимости, его рассмотрение и совместное обсуждение, и, во-вторых, оформление всех юридических документов в случае осуществления сделки. Эффективность работы всего предприятия зависит от качества выполнения первого этапа, успешное проведение которого требует многократной обработки всего массива актуальных предложений рынка, а при оценивании объектов недвижимости — ещё и анализа текущего состояния рынка, сложившейся сегментированности рынка и установившихся цен в каждом сегменте.

Существенное увеличение скорости и качества выполнения всех перечисленных действий требует разработки и внедрения системы поддержки принятия решений (СППР), предоставляющей возможности анализа информации о текущем состоянии рынка недвижимости. Важным ^ требованием к СППР является необходимость анализировать данные, представленные в виде неформализованных текстов, поступающих из различных специализированных средств массовой информации.

Таким образом, актуальность диссертационной работы определяется необходимостью разработки математических и алгоритмических моделей функционирования СППР риэлторского предприятия, а также разработку программной архитектуры, пригодной для практической реализации системы.

Цель и задачи исследования

Целью диссертационной работы является разработка обобщённых математических моделей и принципов функционирования СППР сотрудников риэлторского предприятия, являющейся одним из звеньев в процессе принятия маркетинговых решений фирмы.

Для достижения указанной цели в работе решались следующие основные задачи:

— анализ методов обработки неформализованных текстов, оценивания объектов недвижимости и сегментирования рынка недвижимости;

— разработка модели автоматизированного извлечения структурированной информации об актуальных предложениях рынка недвижимости из неформализованных текстовых документов;

— разработка модели поиска предложений на рынке недвижимости, удовлетворяющих заданным нечётким условиям;

— разработка математической модели оценивания. объектов недвижимости на основе метода продаж и содержимого базы данных СППР;

— разработка математической модели задания и автоматизированного сегментирования рынка недвижимости.

Методы исследования. Выполненные исследования базируются на использовании методов математического моделирования, теории принятия решений, теории графов, методов оптимизации, вычислительной лингвистики, теории синтаксического анализа, нечёткой логики, теории реляционных баз данных, численных методов и программирования. Общей методологической основой является системный подход.

Научная новизна заключается в следующих результатах:

— разработана модель автоматизированного анализа текстовых документов, позволяющая извлекать структурированную информацию об актуальных предложениях рынка недвижимости из неформализованных текстов, применимая в других предметных областях;

— разработана модель задания и выполнения запросов, позволяющих указывать нечёткие условия поиска информации;

— задача поиска предложений рынка недвижимости сформулирована как задача оптимизации;

— разработана модель оценивания объектов недвижимости на основе метода сравнения продаж и содержимого базы данных СППР, позволяющая учитывать сегментацию рынка;

— разработана математическая модель задания и автоматизированной сегментации рынка недвижимости, основанная на кластеризации журнала запросов и позволяющая формулировать описания сегментов в общеупотребительных терминах.

Достоверность научных результатов. Научные положения, теоретические выводы и практические рекомендации обоснованы корректным использованием математического аппарата, подтверждены вычислительными экспериментами на ЭВМ и оценкой работы созданного экспериментального программного обеспечения.

Практическая ценность. Практическая ценность работы непосредственно следует из поставленных задач исследования работы и заключается в следующих результатах:

— разработано экспериментальное программное обеспечения анализа текстовых документов и автоматизированного извлечения структурированной информации об актуальных предложениях на рынке недвижимости;

— предложен способ реализации модуля выполнения запросов, содержащих нечёткие условия, к реляционной базе данных;

— разработана программная архитектура и основные принципы построения СППР риэлторского предприятия.

Реализация результатов работы. Предложенная программная ' архитектура средств извлечения данных из неформализованных текстовых русскоязычных документов принята за основу при разработке средств 6 наполнения информационного хранилища информационно-аналитической системы (ИАС) НЕВОД®- 4.0, разрабатываемой ЗАО НЛП «РЕЛЭКС». Произведено наполнение экспериментальной базы данных, позволяющей провести оценку полученных математических моделей.

Созданное экспериментальное программное обеспечение апробировано в ООО «ЮПИКС. Недвижимость», и в данный момент ведётся обсуждение дополнительных требований (стоимость разработки системы, дизайн, пользовательский интерфейс и т. п.) к СППР риэлторского предприятия.

Полученные результаты диссертации используются в учебном процессе факультета прикладной математики, информатики и механики Воронежского госуниверситета при чтении следующих курсов: «Управление рисками», «Принятие решений» и «Методы представления знаний» .

На защиту выносятся:

— модель автоматизированного извлечения структурированной информации об актуальных предложениях рынка недвижимости из неформализованных тестовых документов, применимая в других предметных областях;

— модель задания и выполнения запросов с нечёткими условиями;

— формализация задачи поиска наиболее интересных для клиента предложений рынка недвижимости;

— модель оценивания объектов недвижимости на основе метода сравнения продаж и содержимого базы данных СППР;

— модель задания и автоматизированной сегментации рынка недвижимости, основанная на кластеризации журнала запросов.

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на следующих конференциях и совещаниях:

1. «Проблемы компьютерной лингвистики», г. Воронеж, май 1718,2002.

2. 10-ая Международная конференция «Математика. Компьютер. Образование», г. Пущино, январь 2003.

3. 3-я региональная конференция «Информатика: проблемы, методологии, технологии г. Воронеж, февраль 12−13,2003.

4. 4-я региональная конференция «Информатика: проблемы, методологии, технологии г. Воронеж, февраль 3−4, 2004.

5. Международная конференция «Образование, наука, производство и управление в XXI веке», г. Старый Оскол, октябрь 20−22, 2004.

Публикации. Основные результаты диссертации опубликованы в 13 печатных работах, из них 10 работ выполнено самостоятельно. Личный вклад автора в работах, опубликованных в соавторстве, состоит в следующем: в [36] автором предложен подход к визуализации семантических сетей данныхв [46] автором разработана программная архитектура комплекса, а также подсистемы анализа текстов и подсистемы выполнения запросовв [4] автор обосновал возможность использования технологий автоматизированного анализа текстов для обработки резюме сотрудников.

Структура и объём работы. Материал диссертации изложен на 170 страницах машинописного текста. Диссертация состоит из введения, четырех глав, выводов, списка литературы и приложений, содержит 21 рисунок, и 13 таблиц. Библиография включает 87 наименований.

Основные выводы и результаты работы.

В соответствии с поставленной целью основные результаты диссертационной работы заключаются в следующем:

1. Разработаны математическая и алгоритмическая модели автоматизированного анализа текста, позволяющие извлекать структурированные данные из тестовых документов. Результаты извлечения данных представляются в виде фрагментов семантической сети.

2. Разработано экспериментальное программное обеспечения анализа текстовых документов и автоматизированного извлечения структурированной информации об актуальных предложениях на рынке недвижимости.

3. Разработаны модели задания и выполнения структурированных запросов, позволяющих указывать нечёткие условия на значения отдельных параметров.

4. Разработана алгоритмическая модель выполнения запросов с нечёткими условиями, позволяющая использовать реляционные СУБД для хранения содержимого базы данных СППР риэлторского предприятия.

5. Разработана математическая модель оценивания объектов недвижимости, действующая на основе метода сравнения продаж. Отличительной чертой модели является возможность учёта заданной сегментации рынка.

6. Разработана математическая модель для представления сегментации рынка и проведения автоматизированной сегментации на основе журнала выполненных запросов к базе данных СППР. Отличительно чертой модели является описание каждого сегмента рынка в общеупотребительных терминах.

7. Разработана программная архитектура СППР риэлторского предприятия.

Показать весь текст

Список литературы

  1. А.Н. Экономика недвижимости / А. Н. Асаул, В. Н. Старинский, Е. И. Рыбнов, А. Ф. Клюев. М.-СПБ.: СПБГАСУ, 2000. — 184 с.
  2. Ахо А. Компиляторы. Принципы, технологии, инструменты / А. Ахо, Р. Сети, Д. Ульман .- Вильяме, 2003 .- 768 с.
  3. Н.С. Численные методы / Н. С. Бахвалов, Н. П. Жидков, Г. М. Кобельков.- М.:Наука, 1978
  4. А. Системы принятия решений и Хранилища Данных /Бирюков А. // Системы управления базами данных .- 1997.-№ 04
  5. Н.Г. Справочник по недвижимости / Н. Г. Волоченков .- М.: ИНФРА-М, 1996.-423 с.
  6. Д. Строки, деревья и последовательности в алгоритмах. Информатика и вычислительная биология / Д. Гасфилд .- СПБ.: Невский диалект, БХВ-Петербург, 2003 .- 656 с.
  7. C.B. Оценка доходной недвижимости / C.B. Грибовский .СПБ.: ПИТЕР, 2001. 334 с.
  8. В.А. Экономика недвижимости / В. А. Горемыкин М.: ИКЦ «Маркетинг», 2002.- 804 с.
  9. К. Введение в системы баз данных / К. Дж. Дейт Вильяме, 2001 1072 с.
  10. Н. Устройство и назначение хранилищ данных /Дубова Н. // Открытые системы 1998 .- № 04
  11. А.Е. Тематический анализ текста с выявлением сверхфразовой структуры /А.Е. Ермаков //Информационные технологии. 2000. -N11.
  12. А.Е. Синтаксический разбор в системах статистического анализа текста/ А. Е. Ермаков, В. В. Плешко // Информационные технологии.- 20 027.
  13. A.A. Грамматический словарь русского языка. Словоизменение /A.A. Зализняк.- 3-е изд.- М., 1987.
  14. Е. Основные концепции и подходы при создании контекстночпоисковых систем на основе реляционных баз данных (http://www.citforum.ru/database/articles/search sys. shtml).
  15. Искусственный интеллект: В 3-х кн. Кн. 2. Модели и методы: Справочник / Под ред. В. Н. Захарова, В. Ф. Хорошевского. М.: Радио и связь, 1990. -368с.
  16. П. Загрузка и согласование данных при построении хранилищ данных/П.Кириллов, И. Шабаев //Открытые системы.-2000.- № 11.
  17. Ф. Основы маркетинга / Ф. Котлер, Г. Армстронг, Дж. Сондерс. -М.: Вильяме, 1999.- 1151 с.
  18. Л. И. Словарь морфем русского языка /Л.И. Кузнецова, Т. Ф. Ефремова. М.: Русский язык, 1986. — 1136 с.
  19. . Ж.Ж. Менеджмент, ориентированный на рынок / Ж. Ж. Ламбен. -СПБ.: ПИТЕР, 2004. 794 с.
  20. Д.Г. Автоматический анализ естественноязыковых текстов / Д. Г. Лахути // НТИ. Серия 2.- 2003 .- № 11, с. 18−25
  21. В. Создание систем поддержки принятия решений на основе хранилищ данных / В. Львов // Системы управления базами данных .- 1997 .- № 03.
  22. . Н.К. Маркетинговые исследования (практическое руководство) / Н. К. Малхорта. М.: Вильяме, 2003. — 957 с.
  23. А. Некоторые методы автоматического анализа естественного языка, используемые в промышленных продуктах (http://www.olap.ru/basic/some methods. asp).
  24. Ф.А. Дискретная математика для программистов /Ф.А. Новиков .- СПб: Питер, 2000.29.0бработка знаний: технологии анализа и поиска текстовой информации.-(http://www.olap.ru/basic/knoweledge.ru).
  25. Ф.И. Введение в системный анализ /Ф.И.Перегудов, Ф. П. Тарасенко .- М.: Высшая школа, 1989. 367 с.
  26. Д. Введение в экспертные системы /Д. Питер .- Addison-Wessly, 2002.
  27. Р.Г. Инженерная лингвистика и теория языка/ Р. Г. Пиотровский .- Л.: Наука, 1979.- 112 с.
  28. Р.Г. Математическая лингвистика /Р.Г. Пиотровский .- М.: Высшая школа, 1977. 383 с.
  29. И.В. Как работают поисковые системы.-(http://www.dialog-21.ru/direction fulltext. asp?dir id=15 539).
  30. К.Е. Программные средства визуализации графов /К.Е. Селезнёв // Труды молодых учёных ВГУ: Сб. науч. тр Воронеж, 2000 .- С. 75−76.
  31. К.Е. Визуализация семантической сети /К.Е.Селезнёв, В. Л. Борисов // Открытые системы .- 2001 .-№ 11 .- С. 55−58.
  32. К.Е. Сравнение сложных объектов / К. Е. Селезнёв // Сборник трудов молодых учёных ВГУ: Сб. науч.тр. Воронеж, 2002 .- С. 24−28.
  33. К.Е. Разрешение конфликтов при работе самообучающихся систем /К.Е. Селезнёв // Теория конфликтов и её применения: Сб. науч. тр
  34. ВГТА .- Воронеж, 2002 .- С. 133−136.
  35. К.Е. Построение моделей механических конструкций на основе анализа их текстового описания /К.Е. Селезнёв //Сборник трудов: Сб. нач. тр.- ВГУ .- Воронеж, 2002 .- С. 138−146.
  36. К.Е. Построение моделей механических конструкций на основе анализа их текстового описания. / К. Е. Селезнёв // Проблемы компьютерной лингвистики, Воронеж, 17−18 мая 2002 г.: Тез. Докл .-Воронеж, 2002 .- С.111−114.
  37. К.Е. Синтаксический анализ предложений русского языка /К.Е.Селезнёв //Человек. Компьютер. Образование, Пущино, январь 2003 г.: Тез. Докл. Пущино, 2003 С.396−396.
  38. К.Е. Синтез семантических сетей на основе анализа текстовойинформации /К.Е.Селезнёв //Информационные технологии в науке ивобразовании-2003, Воронеж, 12−13 февраля 2003 г.: Тез. Докл. -Воронеж, 2003 .- С. 145−147.
  39. К.Е. Обработка текстов на естественном языке /К.Е.Селезнёв // Открытые системы.- 2003 № 12 .- С. 48−53.
  40. К.Е. Извлечение информации из частично формализованных текстов /К.Е.Селезнёв //Информационные технологии в науке и образовании-2004, Воронеж, 3−4 февраля 2004 г.: Тез. Докл. -Воронеж, 2004 .- С. 243−244.
  41. К.Е. Системы извлечения данных из неформализованных текстовых документов/ К. Е. Селезнёв // НТИ. Серия 1.- 2004 .- № 8 .- С. 3537.
  42. К.Е. Архитектура и механизмы единого программного комплекса «Продажи недвижимости» / К. Е. Селезнёв, Д. А. Богданов // Образование, наука, производство и управление в XXI веке: сб науч. тр СТИМИСиС .- Старый Оскол, 2004 .- 8 С.
  43. Л.Л. Недвижимость: маркетинг, оценка / Л. А. Сивкова М.: ЮБП, 1996−176 с.
  44. Э.Ф. Практическая бизнес-статистика / Э. Ф. Сигел М.: Вильяме, 2002.-1051 с.
  45. А.В. Морфологические модули на сайте www.aot.ru. .-(http://www.aot.ru/docs/SOKIRKO/Dialog2004.htm).
  46. Хан У. Системы автоматического реферирования / У. Хан, И. Мани //Открытые системы .- 2000 .- № 12.
  47. Э. Искусственный Интеллект/ Э. Хант .- М.:Мир, 1978.
  48. В.Г. Сделки с недвижимостью / В. Г. Шабалин .- М.: ФИЛИНЪ, 1997.-376 с.
  49. Ю.И. Начала компьютерной лингвистики /Ю.И. Шемакин .- М.: Изд-во МГОУ, А/О «Росвузнаука», 1992 114 с.
  50. Р. Обработка концептуальной информации /Р. Шенк .- М., 1980.
  51. Н.А. Экономика недвижимости / Н. А. Щербакова .- Ростов-на-дону «Феникс», 2002. 317 с.
  52. С.В. Введение в дискретную математику /С.В. Яблонский— М.: Наука, 1986.
  53. Aha D. W. Instance-based learning algorithms / D. W. Aha, D.F. Kibler, M.K. Albert,// Machine Learning, 6 (1), c. 37−66.
  54. Ballard B., Jones M. Computational Linguistics Encyclopedia of Artificial Intelligence/ B. Ballard В., M. Jones .- Vol.1. Ed. Shapiro Stuart .- C. New York e.a.: John Willey and Sons .- c. 133−151.
  55. Banzhaf W. GENETIC PROGRAMMING. An Introduction / W. Banzhaf, P. Nordin, R.E. Keller, F.D. Francone F.D.- San Francisco: Morgan Kaufmann Publishers, Inc., 1998.
  56. Burstein J. Towards Using Text Summarization for Essay-Based Feedback / J. Burstein, D. Marcu // Le 7e Conference Annuelle sur Le Traitement Automatique des Langues Naturelles TALN'2000 .- Lausanne, Switzerland, October 2000
  57. Califf M.E. Relational Learning of pattern-match rules for information extraction /M.E.Califf, R.J.Mooney //Proceedings of the Sixteenth National Conference on Artificial Intelligence (AAAI-99), Orlando, FL .- 1999 pp. 328−334.
  58. Chelba C. A structured language model /C. Chelba //Appared In euroSpeech 2001, Vol.1 ,.- 2001 .- pp. 717−720.
  59. Covington M. A. A Dependency parser for variable-word-order languages /M.A. Covington, H.U. Brown (ed.) // Computer Assisted Analysis and Modelling on the IBM 3090 .- Cambridge, MA: MIT Press.
  60. Debusmann R. An introduction to dependency grammar /R.Debusmann .Hausarbeit, 2000.
  61. Jurafsky D. Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition /D. Jurafsky, J.H. Martin Prentice-Hall, ISBN: 0−13−95 069−6, 2000.
  62. Henderson J. Estimating a Probabilistic Grammar Using a Neural Network /J. Henderson // Proceedings of the 1st workshop on Robust Methods in Analysis of Natural Language Data (ROMAND 2000), Lausanne, Switzerland, 2000.
  63. Holland J. Adaptation in natural and artificial systems/ J. Holland .- Cambridge: MIT Press, MA, 1992.
  64. Keller B. Learning stochastic context-free grammars from corpora using a genetic algorithm/B. Keller, R. Lutz // Proceedings of ICANNGA97, 1997.
  65. Kuznetsov I.P., Matskevich A.P., System for extracting semantic information from natural language text.-(http://www.dialog-21.ru/archive article. asp?param=7616&v=2002&vol=6078).
  66. Lafferty J. Grammatical trigrams: a probabilistic model for link grammar /J. Lafferty, D. Sleator, D. Temperly // Proceedings of the AAAI Fall Symposium on Probabilistic Approaches to Natural Language. Cambridge, MA, 1992.
  67. Lane P. Incremental syntactic parsing of natural language corpora with simple synchrony networks /P. Lane, J. Henerson // IEEE Transactions on Knowledge and Data Engineering, 13(2), 2001.
  68. Linguistic Theory and Computer Applications. /Edited by P. Whitelock, M.M.Wood, H.L.Somers, RJohnson, P.Bennett.- Manchester: Academic Press, 1987. 329 p.
  69. Marcu D. To build text summaries of high quality, nuclearity is not sufficient /D.Marcu // The Working Notes of the the AAAI-98 Spring Symposium on Intelligent Text Summarization, pages 1−8, Stanford, CA, March 1998.
  70. Magerman D. Statistical Decision-Tree models for Parsing / D. Magerman // Proceedings, ACL Conference, 1995.
  71. Magerman D. Parsing as statistical pattern recognition / D. Magerman // IBM Technical Report No 19 443, 1995.
  72. Magerman D. Natural language parsing as statistical pattern recognition: doctoral dissertation/ D. Magerman .- 1994.
  73. Manning C. Foundations of Statistical Language processing / C. Manning, H. Schutze .- The MIT Press, Cambridge, MA: 1999.
  74. Mooney R. Machine Learning / R. Mooney //To appear in Oxford Handbook of computational linguistics .- Oxford University Press.
  75. Nahm U. Mining soft-matching rules from textual data/U.Nahm, R. Mooney // Proceedings of 17th International Joint Conference on Artificial Intelligence, Seattle, WA, 2001 .- pp. 979−984.
  76. Nahm U. A mutually beneficial integration of data mining and information extraction /U. Nahm, R. Mooney //Proceedings of 17th National Conference on Artificial Intelligence, Austin, TX, 2001 pp. 627−632.
  77. Nahm U. Mining soft-matching rules from textual data /U.Nahm, R. Mooney // Proceedings of 17th Joint Conference on artificial Intelligence, Seattle, WA, 2001.- pp. 979−984.
  78. Nahm U. Text mining with information extraction: mining prediction rules from unstructured text /U.Nahm, R. Mooney // Proceedings of the AAAI 2002 Spring Symposium on Mining Answers from Texts and Knowledge Bases, Stanford, CA, 2002 .- pp. 60−67.
  79. Thompson C.A. Active learning for natural language parsing and information extraction /C.A. Thompson, M.E. Califf, R.J. Mooney// Proceedings of the Sixteenth International Machine Learning Conference (ICML-99), Bled, Slovenia, 1999 pp. 406−414.
Заполнить форму текущей работой