Помощь в написании студенческих работ
Антистрессовый сервис

Проблемы неоднозначности синтаксического анализа

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Наиболее значимым итогом проведенной работы можно считать создание научного описания синтаксической неоднозначности, объяснения его природы, систематизации различных аспектов данного явления. В ходе исследования удалось выявить зависимость степени выявляемое&tradeсинтаксической неоднозначности от применяемого метода синтаксического анализа предложенияв связи с этим были рассмотрены интуитивные… Читать ещё >

Проблемы неоднозначности синтаксического анализа (реферат, курсовая, диплом, контрольная)

Содержание

  • ГЛАВА 1. Метод синтаксического анализа и синтаксическая неоднозначность
    • 1. 1. Общий обзор языковых неоднозначностей
    • 1. 2. Интуитивные методы анализа предложения
    • 1. 3. Начало формального этапа
    • 1. 4. Структурный подход к анализу предложения
    • 1. 5. Современные синтаксические теории
    • 1. 6. Использование неоднозначных структур в современной исследовательской практике
    • 1. 7. Эволюция проблемы синтаксической неоднозначности
  • ГЛАВА 2. Анализ причин, вызывающих неоднозначность синтаксического анализа
    • 2. 1. Вводные замечания
    • 2. 2. Лексическая многозначность
    • 2. 3. Валентная вариативность
    • 2. 4. Однородность
    • 2. 5. Сопутствующие причины возникновения синтаксической неоднозначности
    • 2. 6. Природа языка и причины неоднозначности. fs ГЛЛВЛ 3. Анализ неоднозначных синтаксических конструкций русского языка
    • 3. 1. Обзор исследований синтаксической неоднозначности на материале русского языка
    • 3. 2. Термины и понятия, введенные для анализа неоднозначных конструкций
    • 3. 3. Распределение ролей в неоднозначных конструкциях
    • 3. 4. Одноместные конкуренции
    • 3. 5. Двухместные конкуренции
    • 3. 6. Многоместные конкуренции
    • 3. 7. Однородные конкуренции
    • 3. 8. Окказиональная неоднозначность
    • 3. 9. Особенности неоднозначных синтаксических конструкций русского языка
  • ГЛАВА 4. Способы уменьшения уровня синтаксической неоднозначности и ее полного снятия
    • 4. 1. Некоторые предварителгшые замечания
    • 4. 2. Понятие «разрешение синтаксической неоднозначности»
    • 4. 3. Лексические способы уменьшения уровня синтаксической неоднозначности
    • 4. 4. Конфигурационшле способы
    • 4. 5. Квантитативные способы
    • 4. 6. Просодические способы
    • 4. 7. Коммуникативно-стилистические способы
    • 4. 8. Психолингвистические способы
    • 4. 9. Контекстные способы
    • 4. 10. Генеративные способы
    • 4. 11. Интегральное описание языка

Исследователь, изучающий естественный язык, в своей работе непременно сталкивается с неоднозначностью синтаксического анализа. Так, по наблюдению И. Л. Мельчука, в научно-технических текстах неоднозначность встречается в большинстве фраз, а одно предложение в первой статье Конституции США допускает 16 различных синтаксических структур [Мельчук, 1999, с. 32].

Полный формальный синтаксический анализ естественно-языковых текстов приводит к большой неоднозначности. Несмотря на существующий научный интерес к методам автоматического синтаксического анализа, степень научной разработанности проблемы неоднозначности синтаксических структур представляется недостаточной. Синтаксическая омонимия упоминается почти в во всех работах, посвященных описанию различных аспектов синтаксиса (см., например, [Nakhimovsky, Leed, 1987; Carnie, 2002; Adger, 20 031]). Существует большое количество формально-грамматических описаний, регистрирующих синтаксическую неоднозначность, а также прикладных разработок, в которых неоднозначность учитывается при оценке качества действия систем автоматической обработки текста. Однако работ, посвященных системному исследованию проблем неоднозначности синтаксического анализа, практически не существует, а подходы отраженные в имеющихся грамматиках и лингвистических продуктах, отчасти выглядят как несопоставимые. Основная научная проблема, побудившая автора взяться за написание настоящей диссертации, состоит в отсутствии адекватного научного аппарата, с помощью которого можно было бы систематически исследовать и объяснить неоднозначности, возникающие при синтаксическом анализе естественно-языковых текстов.

Итак, актуальность исследования определяется необходимостью выработки единого подхода к проблемам неоднозначности синтаксического анализа, который мог бы стать базой для исследования причин неоднозначности, типов синтаксической омонимии и способов уменьшения ее уровня, а также обобщения существующих ныне и не всегда совместимых друг с другом способов анализа неоднозначных конструкций.

Научная новизна работы состоит в установлении взаимосвязей между различными аспектами неоднозначности синтаксического анализа, а также в выявлении определенного рода закономерностей при оценке неоднозначных конструкций с помощью коэффициента раннего распознавания. Проведенное исследование также устраняет пробелы в теории и практике автоматического синтаксического анализа, связанные с явлением синтаксической неоднозначности.

Цслыо настоящего исследования является системное описание различных аспектов проблемы неоднозначности синтаксического анализа (причин и свойств неоднозначных конструкций, а также способов дизамбигуации).

Эта цель предполагает решение конкретных задач:

• рассмотреть основные методы синтаксического анализа предложения и выявить существующие интерпретации синтаксической омонимии в рамках этих методов;

• описать природу причин, вызывающих синтаксическую неоднозначность;

• провести классификацию и исследование свойств потенциально возможных неоднозначных сочетаний русского языка;

• рассмотреть проблему дизамбигуации и разработать типологию способов, позволяющих уменьшить уровень синтаксической неоднозначности.

Теоретическая значимость работы заключается в системном анализе различных аспектов проблемы неоднозначности синтаксического анализа и обобщении знаний о синтаксической омонимии (с точки зрения причин ее возникновения, определения ее типов и методов разрешения), а также системном описании случаев синтаксической неоднозначности в русском языке.

Практическая значимость исследования состоит в выявлении закономерностей возникновения неоднозначных конструкций с учетом различных аспектов проблемы неоднозначности синтаксического анализа, оценки неоднозначных конструкций с помощью коэффициента раннего распознавания Дж. Хокинса и разработке метода разрешения синтаксической неоднозначности с помощью теории связывания.

Практическое применение результатов исследования в решении прикладных лингвистических задач может повысить эффективность действующих систем автоматического анализа, способствовать совершенствованию существующих и созданию новых лингвистических продуктов.

Автор выражает глубокую признательность д.ф.н., проф. Л. С. Герду и к.ф.н. О. Л. Митрофановой за постоянную поддержку исследования, а также д.ф.н, проф. Я. Г. Тестельцу и к.ф.н. И. В. Азаровой за ряд ценных наблюдений и замечаний, использованных в данной работе. * *.

Структура диссертации.

В композиционном плане диссертационное исследование состоит из введения, четырех глав, заключения и списка литературы.

Заключение

.

Данная работа посвящена комплексному описанию синтаксической неоднозначности в русском языке — лингвистического явления, с которым сталкивается практически каждый исследователь, использующий формальные методы при анализе естественноязыкового материала.

Наиболее значимым итогом проведенной работы можно считать создание научного описания синтаксической неоднозначности, объяснения его природы, систематизации различных аспектов данного явления. В ходе исследования удалось выявить зависимость степени выявляемое&tradeсинтаксической неоднозначности от применяемого метода синтаксического анализа предложенияв связи с этим были рассмотрены интуитивные методы анализа предложения (логико-синтаксический и психолого-синтаксический), формально-синтаксические методы, структурный подход к анализу предложения и современные синтаксические теории формального и функционального направлений.

Мы осуществили системное изучение причин синтаксической омонимии и показали, что эти причины могут быть вызваны гетерогенными языковыми явлениями.

В процессе решения исследовательских проблем был проведен анализ неоднозначных синтаксических конструкций русского языка и выявлены базовые типы распределения ролей элементов в омонимичных конструкциях, описаны различные типы конкуренций (одноместная, двухместная, многоместная и однородная), рассмотрены свойства конкуренций и выяснено, при сочетании каких элементов они могут возникать.

В поиске путей устранения омонимии на уровне текста мы исследовали понятие разрешения синтаксической неоднозначности и разработали типологию возможных способов разрешения синтаксической неоднозначности в зависимости от информации, которая исполЕ>зуется при анализе конкурирующих структур. Указанная типология охватывает лексические, конфигурационные, квантитативные, просодические, исихолингвистические и другие способы разрешения синтаксической неоднозначности. Также нами был предложен способ, позволяющий формально разрешать неоднозначность в некоторых типах предложений средствами одного из модулей современной генеративной грамматики — теории связывания.

Данное исследование, охватывающее различные аспекты проблемы синтаксической неоднозначности, в целом носит теоретический характер, однако его результаты имеют значение для эмпирического лингвистического анализа и могут найти практическое применение в системах, осуществляющих автоматическую обработку текста.

Основные положения диссертации и результаты исследования обсуждались на XXIX и XXX межвузовских научно-методических конференциях преподавателей и аспирантов филологического факультета СПбГУ (13−18 марта 2000 г. и 1−17 марта 2001 г.), а также на XXXII международной филологической конференции СПбГУ (11−14 марта 2003 г.), изложены в пяти публикациях.

Показать весь текст

Список литературы

  1. Н. Д. Синтаксис. // Общее языкознание: Внутренняя структура языка. М., 1972, С. 254—342.
  2. Ю. Д. Идеи и методы современной структурной лингвистики (краткий очерк). М., 1966.
  3. Ю.Д. Об одном правиле сложения лексических значений // Проблемы структурной лингвистики 1971. М., 1972.
  4. Ю. Д. Избранные труды. Т. 1. Лексическая семантика: Синонимические средства языка. М., 1995.
  5. Ахо, А., Ульман, Дж. Теория Синтаксического анализа, перевода и компиляции. М., 1978.
  6. Ш. Общая лингвистика и вопросы французского языка. М., 1955.
  7. Дж. Краткая история генеративной грамматики / Современная американская лингвистика: фундаментальные направления. М. 2002.
  8. , В. А. Современный русский язык. Синтаксис. М., 1977.
  9. , В. А., Шмелева Т. В. Деривационная парадигма предложения. // Вестник МГУ, сер. «Филология», 1981, № 2, с. 50.
  10. Ю.Беивенист, Э. Уровни лингвистического анализа. // Бенвенист, Э. Общая лингвистика. М., 1974.
  11. И. М. Сфера действия лексических единиц. М., 1996.
  12. Ф. И. Историческая грамматика русского языка. М., 1959.
  13. В. Д. Моделирование синтаксиса естественного языка. / Прикладное языкознание. СПб, 1996.
  14. Л. О нестандартных стратегиях приписывания падежа. // Вопросы языкознания, № 2, 1994. С. 43—74.
  15. , Т. Программа, понимающая естественный язык. М., 1976. ш 16. Виноград, Т. Работа с естественными языками. // Современныйкомпьютер. М. 1986. С. 90—107.
  16. П.Виноградов В. В. Из истории изучения русского синтаксиса. М., 1958.
  17. В. В. Избранные труды. Исследования по русской грамматике. М., 1975.
  18. Гак В.Г. К проблеме семантической синтагматики // Проблемы структурной лингвистики 1971. М., 1972.
  19. Гак В. Г. Сопоставительная лексикология. М., 1977.
  20. , А. В. Формальные грамматики и языки. М., 1973.
  21. , А. В. Синтаксические структуры естественного языка в автоматизированных системах общения. М., 1985.
  22. Г. Введение в дескриптивную лингвистику. М., 1959.
  23. И. Б. Стилистика русского языка. М., 1997.
  24. Г. Логика и речевое общение // Новое в зарубежной лингвистике. Вып. 16. Лингвистическая прагматика. М., 1985.
  25. И. Б. Системный анализ предложения. М., 1977.
  26. Ф. А. Зависимые слова и группы слов при однородных существительных с точки зрения автоматического синтаксического анализа// Научно-техническая информация, 1966(a), № 7, С. 42—45.
  27. Ф. А. Синтаксическая омонимия (к постановке вопроса). // Машинный перевод и прикладная лингвистика, выи. 9, 1966(6), С. 38—43.
  28. Ф. А. Синтаксическая омонимия в русском языке с точки зрения автоматического анализа: Автореф. дис: канд. филол. наук. М., 1966(b)
  29. Ф. А. Частота появления основных видов синтаксической омонимии в русских текстах// Научно-техническая информация, щ 1966(г),№ 12, С. 55—59.
  30. Л. Л. Грамматический словарь русского языка. Словоизменение. М., 1977.32.3олотова Г. Л. Очерк функционального синтаксиса русского языка. М., 1973.
  31. ЗЗ.Золотова Г. А. Синтаксический словарь. Репертуар элементарных единиц русского синтаксиса. М. 2001.
  32. JI. Н. Свойства правильной синтаксической структуры и алгоритм ее обнаружения // Проблемы кибернетики, вып. 11, 1964, 215−245.
  33. Jl. Н. Синтаксическая омонимия в русском языке. // Научно-техническая информация, сср. 2, № 5, 1967, С. 9—17.
  34. К. И. Современные формальные теории синтаксиса: сопоставление трактовок грамматической анафоры / Современная американская лингвистика: фундаментальные направления. М. 2002.
  35. К. И., Тестелец Я. Г. Исследование синтаксических ограничений в генеративной грамматике / Современная американская лингвистика: фундаментальные направления. М. 2002.
  36. С. Д., О Грамматической категории // Вестник ЛГУ, 1948, сер. 2.
  37. С. Д., Типология языка и речевое мышление. М., 1971.
  38. И. И., Поэтический синтаксис. М., 1986.
  39. М.В., Неоднозначность и пути ее разрешения в хельсинкском аннотированном корпусе «ХАНКО» // Труды международной конференции «Корпусная лингвистика-2004». СПб, 2004. С. 165—175.
  40. А. В., К описанию синтаксической неоднозначности в японском (на примере частицы НО) // Московский лингвистический журнал, Т. 5, № 2, 2001. С. 85—98.
  41. С., Эттингер Л. Синтаксическая структура фраз и синтаксическаянеоднозначность в английском языке. / Автоматический перевод., ред. О. С. Кулагина и И. А. Мельчук. М., 1971, С. 121−181.
  42. Е., Основные структуры языка. / Курилович Е., Очерки по лингвистике. М., 1962.
  43. , Ю. К. Введение в формальный язык лингвистики. М., 1983.
  44. Лингвистическое обеспечение системы ЭТАП-2 / Ю. Д. Апресян, И. М. Богуславский, Л. Л. Иомдин и др. М., 1989.
  45. Т. П. Основы синтаксиса современного русского языка. М., 1958.
  46. , И. А. Опыт теории лингвистических моделей «Смысл←УГекст». М., 1999.
  47. А. М. Структура предложений и их модели. Л., 1968.
  48. М. И. Общяя парадигматика в морфологии СПб, 1995.
  49. М. И. Моделирование языка. / Прикладное языкознание. СПб, 1996. С. 100—112.
  50. Е. В. О способах представления синтаксической структуры предложения. // Вопросы языкознания, № 2, 1964. С. 99—113.
  51. М. П. Очерк синтаксиса русского языка. М., Пг., 1923.
  52. А. М. Русский синтаксис в научном освещении. М., 1956 (переизд. 2001).
  53. А. М. Как вести занятия по спнтакспчу и стилистике в школе взрослых // Пешковский А. М. Избранные труды. М., 1959.
  54. А. М. Существует ли в русском языке сочинение и подчинение предложений. // Пешковский А. М. Избранные труды. М., 1959.
  55. Прикладное языкознание. СПб, 1996. j* 58. Потебня, А. А. Из записок по русской грамматике. Т. 1—2. Харьков, 1889.
  56. , И. П. Методология и методика лингвистических исследований (методы синхронного изучения языка). Воронеж, 1976.
  57. Д.Э. Практическая стилистика русского языка. М., 1977.
  58. , И. П. Графическое представление синтаксических структур и стилистическая диагностика. Киев, 1981.
  59. Секерина, 1997,/ Современная американская лингвистика: фундаментальные направления. М. 2002.
  60. , О. Б. Порядок слов в русском языке. М. 2003.
  61. Современный русский язык. Синтаксис: проблемы и методы исследования. / В. И. Чернов, Т. В. Шмелев. М., 1987.
  62. . В. Оптимизационные методы исследования языка. М., 1976.
  63. Тарланов, 3. К. Методы и принципы лингвистического анализа. Петрозаводск, 1995.
  64. , JT., Основы структурного синтаксиса. М., 1988.
  65. , Я. Г. Введение в общий синтаксис. М., 2001.
  66. , А. Может ли машина мыслить? М., 1960. (Turing A.M. Computing machinary and intelligence / Mind, 59, 1950, p.433—460).
  67. A.A. Лексическое значение. Принцип семиологического описания лексики. М., 1986.
  68. , С. Я. О Синтаксическом анализе. / Доклады третьей всесоюзной конференции по созданию машинного фонда русского языка. М., 1990.
  69. С. Я. Синонимия и осмысленность текстов. // Синонимия в языке и речи. (Доклады конференции 15−17 декабря 1969 г.). Новосибирск, 1970, стр.36—50.
  70. С. Я. Формальные грамматики. Л., 1984.
  71. Хомский I I. Синтаксические структуры // Новое в лингвистике. Вып. II. М., 1962 (Chomsky N. Syntactic Structures. The Hague, 1957).
  72. Г. С. Алгоритм для упрощенного синтаксического анализа. // Проблемы кибернетики, 1971, вып. 24, с. 227—242
  73. А. Л. Синтаксис русского языка. М., 2001.
  74. Л. Д. Типы «невыраженных валентностей» // Семиотика и информатика. Сборник научных статей. Вып. 36. М., 1998. с. 167−17 678.1Церба JI. В. Языковая система и речевая деятельность. Д., 1974.
  75. Adger, David, Core Syntax: A Minimalist Approach. Oxford, 2003.
  76. Antal, Laszlo. The Role of Transformations in the Analysis of Syntactic Ambiguity // Word, 1989, 40, 3, Dec, 349−367
  77. Bailyn, John, A configurational approach to Russian «free» word order/ Ph.D. Dissertation, Cornell University, 1995.
  78. Bod, Laurens, Enriching Linguistics with Statistics. Performance Models of Natural Language. Diss. Amsterdam, 1995.
  79. Brill, Eric and Resnik, Philip, A rule-based approach to prepositionM phrase attachment disambiguation. // Proc. of 15th International Conference on Computational Linguistics, Kyoto, Japan, 1994, p. 1198−1204.
  80. Carnie, Andrew. Syntax. Oxford, 2002.
  81. Chiang, TungHui and Su, Keh-Yih. Statistical Models for Deep-structure Disambiguation. // Proceedings of the 4th Workshop on Very Large Corpora, 1996, p. 113—124.
  82. Channell, Joanna. Vague Language. Oxford, 1994.
  83. Chomsky, Noam, Conditions on Transformations / A Festschrift for Morris Halle, ed. Anderson, Kiparski, 1973.
  84. Chomsky, Noam, Lectures on Government and Binding, Dorgrecht, 1981.
  85. Chomsky, Noam, The Minimalist Program. Cambridge, 1995.
  86. Chomsky, Noam, Language and Mind. Cambridge, 2000.
  87. Clifton, Charles, Jr- Ferreira, Fernanda. Ambiguity in Context // Language and Cognitive Processes, 1989, 4, 3−4, 77−103.
  88. Collins, Michacl and Brooks, James. Prepositional phrase attachmentthrough a backcd-off model. // Proc. of the 3rd Workshop on Very Large Corpora, 27−38, Boston, 1995.
  89. Gibson, Edward- Schutze, Carson T- Salomon, Ariel. The Relationship between the Frequency and the Processing Complexity of Linguistic Structure // Journal of Psycholinguistic Research, 1996, 25, 1, Jan, 59−92.
  90. Haegeman, Liliane, Introduction to Government and Binding Theory. Oxford UK, Cambridge USA, 1994.
  91. IIalliday Mickle. An introduction to functional grammar. London, 1985. p971 lankamer, Jorge, Unacceptable Ambiguity. // Linguistic Inquiry, Vol. 4, # 1, 1973, p. 17−68.
  92. Hawkins John. A performance Theory of order and constituency. Cambridge, 1994.
  93. Hawkins, John. A parsing theory of word order universals. // Linguistic Inquiry, Vol. 21, #2, 1990.
  94. Kay, Paul and Fillmor, Charles. Grammatical Constructions and Linguistic Generalizations: the What’s Xdoing Y? Construction. Berkeley, 1996.
  95. Liebermann, Philip. The biology and evolution of language. Cambridge, * 1984.ф. 104. Manning, Christopher D- Schutze, Hinrich. Foundations of Statistical
  96. Natural Language Processing. Cambridge, 1999.
  97. Nakhimovsky, Alexander and Leed, Richard. Advanced Russian. Columbus, 1987.
  98. Newmeyer, Frederic, Grammatical theory. Chicago, 1983.
  99. Newmeyer, Frederic, Linguistic Theory in America, Orlando, 1986.
  100. Nicol, Janet. What Can Prosody Tell a Parser? // Journal of Psycholinguistic Research, 1996, 25, 2, Mar, 179−192
  101. Pearlmutter, Neal- MacDonald, Maryellen. Individual Differences and Probabilistic Constraints in Syntactic Ambiguity Resolution // Journal of Memory and Language, 1995, 34, 4, Aug, 521−542.
  102. Petkevic, Vladimir. Rule-Based Part-of-Speech and Morphological Disambiguation of the Czech National Corpus // Труды международной конференции «Корпусная лингвистика-2004». СПб, 2004. С. 271—285.
  103. Pickering, Martin, Traxler, Matthew and Crocker, Matthew. Ambiguity resolution in Sentence Processing: Evidence against Frequency-Based Accounts // Journal of Memory and Language, 43, 2000, 447—475.
  104. Quirk, Randolph et al. A Comprehensive Grammar English Language. Longman, 1985
  105. Radford, Andrew. Syntactic theory and the structure of English. Cambridge, 1997(a).
  106. Radford, Andrew. Syntax: A Minimalist Introduction. Cambridge, 1997(b).
  107. Sag, Ivan- Wasow, Thomas. Syntactic Theory: A Formal Introduction. Stanford, 1999.
  108. Shuttleworth, Mark. New Perspectives on Old Problems: A Ilallidayan Approach to Copulative Constructions in Russian // Leeds Working Papersч in Linguistics and Phonetics, 1999, 7, 188−205.
  109. Spivcy, Michael- Tanenhaus, Michael. Syntactic Ambiguity Resolution in Discourse: Modeling the Effects of Referential Context and Lexical Frequency // Journal of Experimental Psychology: Learning, Memory, and Cognition, 1998,24, 6, Nov, 1521−1543
  110. Stranakova, Marketa. Ambiguity of Prepositional Groups and the Possibility of its Automatic Processing. Summary of Doctoral Thesis. Prague, 2001.
  111. Sturt, Patrick- Scheepers, Christoph- Pickering, Martin. Syntactic Ambiguity Resolution after Initial Misanalysis: The Role of Recency. Journal of Memory and Language, 2002, 46, 2, Feb, 371−390
  112. Tanenhaus, Michael- Carlson, Greg- Trueswell, John. The Role of Thematic Structures in Interpretation and Parsing // Language and Cognitive Processes, 1989,4, 3−4, 211−234.
  113. Trueswell, John. The Role of Lexical Frequency in Syntactic Ambiguity Resolution // Journal of Memory and Language, 1996, 35, 4, Aug, 566−585
  114. Trueswell, John- Tanenhaus, Michael. Tense, Temporal Context and Syntactic Ambiguity Resolution // Language and Cognitive Processes, 1991, 6, 4, Nov, 303−338
  115. Ullmann, Stephen. Semantics. N.Y., 1962.
  116. Wcinreich, Uriel. Exploration in Semantic theory. / Sebeok, T. (ed). Current Trends in Linguistics. The Hague, 1966.1. Словари и энциклопедии
  117. ЛЭС — Лингвистический энциклопедический словарь. М., 1990.
  118. РГ — Русская грамматика. М., 1980.
  119. СЭС — Стилистический энциклопедический словарь русского языка. М., 2003.
Заполнить форму текущей работой