Методы построения и использования компьютерных словарей сочетаемости для синтаксических анализаторов русскоязычных текстов
Диссертация
Работа выполнялась на кафедре алгоритмических языков факультета ВМК МГУ в рамках Госбюджетных НИР по приоритетному направлению «Программное и математическое обеспечение эффективного решения актуальных задач на современных вычислительных системах», проводимых под руководством профессора, д.ф.-м.н. М. Г. Мальковского и подразумевающих, в числе прочего, создание системы автоматического… Читать ещё >
Список литературы
- Розенталь Д.Э. Управление в русском языке. М.: Книга, 1981. — 304 с.
- Словарь сочетаемости слов русского языка. Под ред. П. Н. Денисова, В. В. Морковкина. 2-е изд., испр. — М.: Рус. яз., 1983. — 688 с.
- Miller G.A. WordNet: A Lexical Database for English // CACM. 38(11). 1995. -P. 39−41.
- Мальковский М.Г., Грацианова Т. Ю., Полякова И. Н. Прикладное программное обеспечение: системы автоматической обработки текстов. М.: МАКС Пресс, 2000. 52 с.
- Bolshakov I.A., Gelbukh A. Computational Linguistics. Models, Resources, Applications. Mexico: IPN, 2004. 186 c.
- A., Ferrucci D. Lally. UIMA: an architectural approach to unstructured information processing in the corporate research environment // Natural Language Engineering. № 3−4. 2004. P. 327−348.
- Мальковский М.Г., Старостин A.C. Модель синтаксиса в системе морфо-синтаксического анализа «TREETON» // Труды международной конференции Диалог'2006. М.: изд-во РГГУ, 2006. С. 481−492.
- Мельчук И.А. Опыт теории лингвистических моделей «СМЫСЛ ТЕКСТ». М.: Школа «Языки русской культуры», 1999. 346 с.
- Chomsky N. Syntactic Structures. Paris: Mouton, 1957. 117 p.
- Мальковский М.Г., Старостин A.C. Система Treeton: Анализ под управлением штрафной функции // Программные продукты и системы. № 1. Тверь, 2009. С. 33−35.
- Зализняк A.A. Грамматический словарь русского языка. Словоизменение. М.: Рус. яз., 1980. 880 с.
- Апресян Ю.Д. Идеи и методы современной структурной лингвистики (краткий очерк). М.: Просвещение, 1966. 305 с.
- Арефьев Н.В. Оценка достоверности синтаксических связей // Сб. научных трудов по материалам международной научно-практической конференции
- Перспективные инновации в науке, образовании, производстве и транспорте '2009″, т.2. Одесса: Черноморье, 2009. С. 94−97.
- Ивин A.A., Никифоров A.JI. Словарь по логике. М.: Туманит, изд. центр ВЛАДОС, 1997. 384 с.
- Гладкий A.B. Синтаксические структуры естественного языка в автоматизированных системах общения. М.: Наука, 1985. 144 с.
- Иорданская Л.Н. Синтаксическая омонимия в русском языке (с точки зрения автоматического анализа и синтеза) // Научно-техническая информация. 5. 1967.-С. 9−17.
- Апресян Ю. Д, Богуславский И. М., Иомдин Л. Л., Лазурский A.B., Перцов Н. В., Санников В. З., Цинман Л. Л. Лингвистическое обеспечение системы ЭТАП-2. М.: Наука, 1989. 296 с.
- Иомдин Л.Л., Сизов В. Г., Цинман Л. Л. Использование эмпирических весов при синтаксическом анализе // Труды международной конференции «Обработка текста и когнитивные технологии». Т. 6. Казань: Отечество, 2001. С. 64−72.
- Сизов В.Г., Петроченков В. В. Использование статистической информации оконкурирующих синтаксических связях в синтаксическом анализаторе ЭТАП-3для получения наиболее вероятной синтаксической структуры фразы //
- Сборник трудов 33-ой Конференции молодых ученых и специалистов ИППИ
- РАН. Геленджик, 18−26 сентября 2010 г. М.: ИППИ, 2010. С. 299−305.149
- Мельчук И.А. Русский язык в модели «Смысл Текст». Москва-Вена: Школа «Языки русской культуры», Венский славистический альманах, 1995. -682 с.
- Жолковский А.К., Мельчук И. А. О семантическом синтезе // Проблемы кибернетики. 19. 1967. С. 177−238
- Сизов В.Г., Цинман JI.JI. Лингвистический процессор ЭТАП: дескрипторное соответствие и обработка метафор // Труды Международного семинара по компьютерной лингвистике и ее приложениям (Диалог'2000). Т. 2. Протвино, 2000. С. 366−369.
- Крейдлин Л.Г. Учет дескрипторных весов в синтаксическом анализаторе системы ЭТАП-3 // Сборник трудов 34-ой Конференции молодых ученых и специалистов ИППИ РАН «Информационные технологии и системы (ИТиС'11)». Геленджик, 2011. С. 380−384.
- Дяченко П., Фролова Т. Извлечение информации о сочетаемости лексем из аннотированного корпуса текстов // Информационные технологии и системы (ИТиС'08): сборник трудов конференции. М.: ИППИ РАН, 2008. С. 206−210.
- Фролова Т. Интерпретация и практическое применение текстовых данных о сочетаемости лексем (на материале прилагательных) // Информационные технологии и системы (ИТиС'09): сборник трудов конференции. М.: ИППИ РАН, 2009.-С. 210−214.
- Апресян Ю. Д., Богуславский И. М., Иомдин Б. J1. и др. Синтаксически и семантически аннотированный корпус русского языка: современное состояние и перспективы // Национальный корпус русского языка: 2003−2005. М.: Индрик, 2005.-С. 193−214.
- Петроченков В. В. Статистическое разрешение лексической неоднозначности в системе ЭТАП-3 PDF. (http://itas2011.iitp.ru/pdf/1 569 463 719.pdf)
- Большаков И.А. КроссЛексика большой электронный словарь сочетаний и смысловых связей русских слов // Материалы ежегодной Международной конференции «Диалог 2009» (Бекасово, 27−31 мая 2009 г.). Т. 8(15). М.: РГГУ, 2009. — С. 45−50.
- Мельчук И.А., Жолковский А. К. и др. Толково-комбинаторный словарь современного русского языка. Опыты семантико-синтаксического описания русской лексики. Вена: Wiener Slavistischer Almanach, 1984. 992 с.
- Ляшевская О. Н., Шаров С. А. Частотный словарь современного русского языка (на материалах Национального корпуса русского языка). М.: Азбуковник, 2009. 1112 с.
- Сокирко A.B., Толдова С. Ю. Сравнение эффективности двух методик снятия лексической и морфологической неоднозначности для русского языка HTML. (http://www.aot.ru/docs/RusCorporaHMM.htm)
- Carson Т. Schutze. РР attachment and argumenthood // Carson Т. Schutze, Jennifer В. Ganger, and Kevin Broihier, editors. Papers on Language Processing and Acquisition. 1995. P. 95−152.
- Marilyn Ford, Joan Bresnan, Ronald M. Kaplan. A competence-based theory of syntactic closure // Joan Bresnan editor. The Mental Representation of Grammatical Relations. Cambridge, MA: MIT Press. 1982. P. 727−796.
- Yorick Wilks, Xiuming Huang, Dan Fass. Syntax, preference and right attachment // Proceedings of the 9th International Joint Conference on Artificial Intelligence (IJCAI 85). Los Angeles, CA. 1985. P. 779−784.
- Kathleen Dahlgren, Joyce McDowell. Using commonsense knowledge to disambiguate prepositional phrase modifiers // Proceedings of the 6th Conference on Artificial. Philadelphia, PA. 1986. P. 589−593.
- Graeme Hirst. Semantic Interpretation and the Resolution of Ambiguity. Cambridge: Cambridge University Press, 1987. 267 p.
- Karen Jensen, Jean-Louis Binot. Disambiguating prepositional phrase attachments by using on-line dictionary definitions // Computational Linguistics. 13(3−4). 1987.-P. 251−260.
- Mitchell P. Marcus, Beatrice Santorini, Mary Ann Marcinkiewicz. Building a large annotated corpus of English: the Penntreebank // Computational Linguistics. 19(2). 1993.-P. 313−330.
- Adwait Ratnaparkhi, Jeff Reynar, Salim Roukos. A Maximum Entropy Model for Prepositional Phrase Attachment // Proceedings of the Human Language Technology Workshop. Plalnsboro, N.J.: ARPA. P. 250−255.
- Michael Collins, James Brooks. Prepositional Phrase Attachment through a Backed-Off Model // Proceedings of the 3rd Annual Workshop on Very Large Corpora. Cambridge, MA. 1995. P. 27−38.
- Jiri Stetina, Makoto Nagao. Corpus Based PP Attachment Ambiguity Resolution with a Semantic Dictionary // Proceedings of the 5th Annual Workshop on Very Large Corpora. HongKong. 1997. P. 66−80.
- Donald Hindle, Mats Rooth. Structural Ambiguity and Lexical Relations. // Computational Linguistics. 19(1). 1993.-P. 103−120.
- Sinclair J. P., Hanks G., Fox R., Moon P. Stock, et al. Collins COBUILD English Language Dictionary. London and Glasgow: Collins, 1987. 1728 p.
- Christopher D. Manning, Hinrich Schutze. Foundations of Statistical Natural Language Processing. Cambridge, Massachusetts: MIT Press, 1999. 680 p.
- Adwait Ratnaparkhi. Statistical models for unsupervised prepositional phrase attachment // COLING '98 Proceedings of the 17th international conference on Computational linguistics. T. 2. Stroudsburg, PA, USA, 1998. P. 1079−1085.
- Мальковский М.Г., Арефьев Н. В. «Сочетаемостные ограничения в системе автоматического синтаксического анализа» // Программные продукты и системы. № 1. Тверь, 2012. С.28−31.
- Иорданская Л.Н., Мельчук И. А. Смысл и сочетаемость в словаре. М.: Языки славянских культур, 2007. 672 с.
- Bruce Eckel. Thinking in Java (4th Edition). Upper Saddle River, N. J.: Prentice Hall Ptr, 2006. 1463 p.
- Национальный корпус русского языка HTML. (http://www.ruscorpora.ru)153
- Gerlof Bouma. Normalized (Pointwise) Mutual Information in Collocation Extraction // From Form to Meaning: Processing Texts Automatically, Proceedings of the Biennial GSCL Conference 2009. Tubingen: Gunter Narr Verlag. P. 31−40.
- Перцов Н.В., Старостин С. А. О синтаксическом процессоре, работающем на ограниченном объеме лингвистических средств // Труды международной конференции Диалог'1999. Т.2. Таруса. С. 224−230.
- Арефьев Н.В. Использование онтологии для оценки семантической корректности синтаксической структуры // Сб. тезисов лучших дипломных работ 2008 года. М.: Изд-во факультета ВМиК МГУ им. М. В. Ломоносова, 2008.-С. 91−92.
- Ожегов С.И., Шведова Н. Ю. Толковый словарь русского языка: 80 000 слов и фразеологических выражений. М.: Азъ, 1993. 955 с.
- ЛюгерД.Ф. Искусственный интеллект: стратегии и методы решения сложных проблем, 4-е издание. М.: Издательский дом «Вильяме», 2003. 864 с.
- Bullinaria J.A., Levy J.P. Extracting Semantic Representations from Word Cooccurrence Statistics: A Computational Study // Behavior Research Methods, 39. 2007.-P. 510−526.
- Firth J.R. A synopsis of linguistic theory 1930−1955 // Studies in Linguistic Analysis. Oxford: Philological Society. 1957. P. 1−32.
- Мальковский М.Г., Абрамов В. Г., Субботин A.B. Об автоматизированном формировании лингвистических баз знаний // Труды Международного семинара Диалог'98 по компьютерной лингвистике и ее приложениям. Т.2. Казань, 1998.-С. 831−836.