Помощь в написании студенческих работ
Антистрессовый сервис

Категория определенности-неопределенности как проблема перевода: На материале русского и английского языков

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

С нашей точки зрения, наиболее реалистичен второй способ. Следует сделать оговорку о том, что тип систем перевода, рассматриваемый в данной работе, не строит семантическое представление всего текста, но проводит его морфологический анализ (полная атрибуция словоформы в тексте) и синтаксический анализ (в частности, система умеет вычленять именные группы и определять их синтаксическую вершину… Читать ещё >

Категория определенности-неопределенности как проблема перевода: На материале русского и английского языков (реферат, курсовая, диплом, контрольная)

Содержание

  • Глава 1. Проблема перехода от скрытой категории определенности-неопределенности (КОН) к ее грамматическому выражению в языке с артиклями
    • 1. Определенность-неопределенность как грамматическая и как скрытая функционально-семантическая категория
    • 2. Используемая терминология
    • 3. Проблема перевода значений скрытой категории одного языка в граммемы соответствующей грамматической категории другого языка
      • 3. 1. Разные подходы к определению перевода
      • 3. 2. Типы расхождений между исходным текстом и текстом перевода
      • 3. 3. Проблема перевода скрытых категорий одного языка в граммемы другого для систем автоматического перевода
      • 3. 4. О проблемах организации словаря
    • 4. Специфика перевода научно-технической литературы
  • Выводы
  • Глава 2. Контексты реализации значений функционально-семантической КОН в русском языке и грамматической КОН в английском языке
    • 1. Методологические подходы к решению проблемы адекватной интерпретации «скрытой» КОН в русском языке при переводе на английский
  • §-2.Факторы, позволяющие локально фиксировать значения ФСКОН для русского языка
    • 2. 1. Прямые лексические показатели
    • 2. 2. Косвенные семантико- синтаксические показатели
    • 2. 3. Актуальное членение предложения как косвенный показатель КОН
    • 2. 4. Косвенные грамматические показатели
    • 2. 5. Косвенные лексические показатели
    • 2. 6. Механизмы формального описания факторов локального фиксирования значения ФСКОН для русского языка
    • 3. Поддающиеся формализации факторы выбора артикля в английском языке
    • 3. 1. Употребления, обеспечиваемые словарем (или грамматической характеристикой лексемы в словаре)
    • 3. 2. Формализуемые употребления нулевого артикля
    • 3. 3. Формализуемые употребления определенного артикля
    • 3. 4. Формализуемые употребления неопределенного артикля
  • Выводы
    • Глава 3. Статистический анализ поведения КОН в исследуемом тексте
    • 1. 0. методике проведения анализа исследуемых текстов
    • 2. Анализ детерминации предметной лексики в научном тексте
    • 2. 1. Словарь текстовых операторов
      • 2. 1. 1. Семантические классы текстовых операторов
      • 2. 1. 2. Примеры численных соотношений по отдельным текстовым операторам
      • 2. 2. Анализ заголовков
    • 3. Статистический анализ контекстов, влияющих на выбор детерминатора именной группы в английском тексте
    • 4. Правила предпочтения выбора артикля на основе статистических данных
      • 4. 1. Система правил
      • 4. 2. Трудности и противоречия, связанные с анализируемыми контекстами
    • 5. Эксперимент по проверке адекватности полученной системы правил
  • Выводы

Исследования категории определенности-неопределенности (КОН) как в морфологическом, так и функционально-семантическом аспекте, поднимают широкий пласт теоретических проблем, связанных с референцией, семантикой артиклей в артиклевых языках, типами соответствия одноименных артиклей в разных артиклевых языках (например, каковы семантические различия между определенным артиклем во французском и в английском языке), а также типами соответствия между проявлениями скрытой категории определенности-неопределенности в безартиклевых языках и ее грамматическими показателями (детерминаторами) в артиклевых. Именно этот последний аспект будет находиться в фокусе внимания данной работы. В качестве исследуемой пары языков были выбраны русский (исходный язык, безартиклевый) и английский (язык перевода, артиклевый).

Кроме теоретического аспекта (изучение поведения КОН на всех уровнях описания языка: фонетическом, морфологическом, синтаксическом, семантическом, логическом, прагматическом), в исследованиях такого рода существует еще и прикладной аспект. Он связан с поиском алгоритма осуществления грамматически (и, по возможности, семантически) адекватного перевода с безартиклевого языка на артиклевый в системах автоматического (машинного) перевода, а также с построением правил употребления артикля в процессе обучения артиклевому языку как иностранному людей, для которых родным является безартиклевый язык. Тестирование существующих систем машинного перевода показывает, что результат расстановки артиклей в тексте нельзя признать удовлетворительным, что делает решение данной задачи важным и актуальным. В нашем исследовании мы в первую очередь сосредоточимся именно на прикладном аспекте.

В рамках теоретических исследований, посвященных КОН, и шире, проблемам референции, накоплен богатый материал для сопоставительного анализа, имеющего прикладную ориентацию. В связи с этим возникает вопрос, нельзя ли при помощи довольно простых с лингвистической точки зрения, механизмов повысить качество перевода уже существующих систем автоматического перевода, не перерабатывая радикально их идеологию. Возможно несколько способов улучшить результат:

1) Дополнить синтез блоком, обеспечивающим отслеживание тождественных референтов по всему тексту.

2) Дополнить словарь системы специально разработанным множеством помет, помогающим выставить правильное значение категории определенности-неопределенности в тексте перевода, а также построить систему правил продукции вида «Если X, то У», основанную, с одной стороны, на всех теоретических описаниях поведения категории как в языке исходного текста, так и в языке перевода, а с другой, на статистической регулярности ее выражения при именных лексемах в тексте.

С нашей точки зрения, наиболее реалистичен второй способ. Следует сделать оговорку о том, что тип систем перевода, рассматриваемый в данной работе, не строит семантическое представление всего текста, но проводит его морфологический анализ (полная атрибуция словоформы в тексте) и синтаксический анализ (в частности, система умеет вычленять именные группы и определять их синтаксическую вершину). Некоторые семантические сведения предусмотрены в структуре словарной статьи словаря системы, который является одним из важнейших ее компонентов. Однако речь идет не только об улучшении перевода, выполняемого машиной, но и об облегчении процесса порождения текста на иностранном языке человеком. Поскольку наивная картина мира носителей артиклевого и безартиклевого языка по-разному фиксирует в языке определенность-неопределенность, то, по всей видимости, нельзя говорить о полном постижении смысла этой категории в иностранном языке. Поэтому заранее согласившись с тем, что ошибки при расстановке артиклей неизбежны, мы ставим перед собой в данном исследовании задачу выяснить вопрос о том, возможно ли руководствоваться некоторыми статистическими характеристиками при переводе текста с русского языка на английский с целью повышения качества перевода и насколько высокой будет цена неизбежных при этом ошибок. В качестве подъязыка, который предположительно обслуживается системой автоматического перевода, выбран подъязык научных текстов (или, немного шире, подъязык научно-деловой прозы). Материалом исследования послужили русский текст и перевод на английский язык книги А. Е. Кибрика «Методика полевых исследований» ([Кибрик 1972] и [Kibrik 1977]). Исследовалась детерминация в первую очередь предметной (тематической) лексики (т.е. лексики, формирующей смысловое пространство данного текста), а также общенаучной лексики (являющейся своего рода логической предикатной сеткой, «цементирующей» текст). При обработке данных использовалось лингвистическое программное обеспечение (конкордансы, компьютерные словари), созданное компаниями ABBYY Software House, МедиаЛингва, Информатик, New Media Generation, Polyglossum. Для тестирования систем машинного перевода (Socrat версии 2.0 и Stylus версии 2.5.1), данные которого приводятся в разделе «Приложение 4» использовались тексты научно-популярных статей по компьютерной тематике. Для выявления контекстов употребления артиклей в английском языке использовались авторитетные грамматики и словари английского языка, список которых приводится в соответствующем разделе Библиографии.

Практическое применение результатов данного исследования может осуществляться в трех направлениях:

1) Улучшение качества перевода, выполняемого существующими системами машинного перевода.

2) Оптимизация правил употребления артикля при обучении английскому языку как иностранному.

3) Улучшение качества текста, порождаемого человеком на английском языке как иностранном (например, при написании научной статьи на английском языке).

Значительная часть данного исследования была выполнена в рамках проекта типологического описания языков компании ABBYY Software House.

Выводы.

1. Как показывает анализ материала, в научном тексте выделяется особенный функциональный пласт лексики, называемый нами «текстовыми операторами». Основные их свойства можно сформулировать следующим образом: 1) они устанавливают отношения между элементами предметной области текста- 2) по умолчанию они не могут являться темой, «основным персонажем» научного текста- 3) некоторые группы текстовых операторов в подавляющем большинстве случаев имеют какое-либо одно значение КОН.

2. Последнее свойство текстовых операторов можно использовать для улучшения результатов автоматического перевода. Это возможно следующим образом: при лексеме, являющейся текстовым оператором, в словаре хранится информация о семантическом классе, к которому она принадлежит (почти все классы имеют определение, согласно которому в них могут добавляться новые лексемы)23- о том, какое «Вероятностное значение категории определенности» ему соответствует, а также для.

23 Поэтому в конце каждого из списков, приводимых в разделе 2.1.1 параграфа 2 главы 3 предполагается «многоточие», означающее возможность пополнения класса. данного конкретного слова численное значение вероятности появления при ней соответствующего артикля,.

3. Анализ описания артикля в грамматиках английского языка, а также употребление артиклей в текстах позволяет выявить такие контексты, которые с наибольшей (по сравнению с другими) вероятностью приводят к появлению того или иного артикля.

4. Описанные в главе 2 контексты, в которых значение КОН определяется более или менее однозначно, а также вероятностные значения, посчитанные для некоторых из этих контекстов, позволяют смоделировать алгоритм расстановки артиклей в тексте.

5. Как и в любой теории, основывающейся на вероятностных предположениях, в построенном алгоритме возможны некоторые огрубления и игнорирование каких-либо закономерностей языка, а также некоторые контексты могут вступать в противоречие. Однако, возвращаясь к промышленным системам автоматического перевода, данный алгоритм представляется мне более эффективным, чем существующие в этих системах, что и показывает пример использования системы правил.

6. Если все знания о поведении ФСКОН в русском языке помыслить себе как оконное стекло, то реальные знания о ней, освещенные на сегодняшний день в литературе, могут выглядеть как небольшой мазок кистью. Но тем не менее даже такой объем информации позволяет сформулировать правила приписывания значений КОН, приводящие к повышению результатов перевода.

7. Даже при скептическом отношении к идее автоматического перевода вообще и его применении к множеству научных текстов в частности нельзя не признавать практическую полезность существующих в настоящее время коммерческих систем с их достаточно простым программным обеспечением. Небольшой дополнительный блок, радикально не меняющий лингвистическую идеологию программ, контуры которого намечены в данном исследовании, может привести к ощутимому улучшению результатов их работы.

Заключение

.

Проделанное исследование позволяет сделать следующие выводы:

1. При переводе с русского языка на английский основная сложность состоит в том, что КОН в русском языке является «скрытой», а в английском — грамматической. В связи с этим для осуществления адекватного перевода необходимо учитывать как факторы, позволяющие локально фиксировать признаки КОН для русского языка, так и факторы выбора артикля в английском языке.

2. Если правила употребления артикля в английском языкеобласть научных исследований с большой историей, то изучение влияния различных языковых параметров на тип детерминации именной группы в русском языке — область, еще ожидающая глубокого, фундаментального и последовательного описания. Поэтому на данном этапе закономерности, наиболее четко и ясно описывающие тип РС ИГ базируются на свойствах лексических классов слов. Нам представляется, что «лексически ориентированное» направление таких исследований может дать еще много практически применимых результатов.

3. Проблема интерпретации русской «скрытой» КОН при переводе на английский язык также актуальны и для практического приложения теории перевода — машинного перевода. Понятно, что сколько-нибудь полное и адекватное решение указанной проблемы требует разработки модели поддержания референции в дискурсе. В теоретическом плане подобная задача в принципе решаема. Но применение такой модели в системах автоматического перевода на данной стадии их развития практически нереально. Более того, проблема правильной расстановки артиклей практически никак не решается в современных промышленных системах АП. В связи с этим мы разработали правила расстановки артиклей, базирующиеся только на тех факторах, действие которых может быть отслежено в рамках отдельно взятого предложения. Характеристики, используемые в алгоритме, носят вероятностный характер. Хотя это и предполагает заранее возможность постановки неправильного артикля в определенном проценте случаев, но по крайней мере, снижает процент ошибок по сравнению с фактически произвольной расстановкой артиклей в нынешних коммерческих системах автоматического (машинного) перевода. Более того, даже если алгоритм не учитывает всего множества факторов, определяющих значение ФСКОН в русском языке и КОН в английском языке, становится понятно, какую информацию учесть нельзя, а какую можно, но при выполнении дополнительных условий. Если диагностика ошибки понятна и предсказуема, ее легче устранить, чем в случае большого количества произвольных разнородных ошибок.

4. Исследование поведения категории определнности-неопределенности в текстах научного подъязыка показало одну яркую тенденцию в развитии этого жанра. Научные тексты, создаваемые на английском языке, а также переводимые на него, все больше и больше отдаляются от того, что мы собственно привыкли считать английским языком (будь то British English или American English). Применение «вероятностного подхода» к проблеме расстановки артикля стало возможно именно потому, что сейчас в процессе развития находится практически новый язык. Это в некотором роде «искусственный» язык, создаваемый на базе английского, но функционирующий по своим законам и правилам (которые, в частности, касаются и расстановки артиклей).

5. В научном тексте выделяется особенный функциональный пласт лексики, называемый нами «текстовыми операторами». Одно из примечательных их свойств состоит в том, что некоторые группы текстовых операторов в подавляющем большинстве случаев имеют какое-либо одно значение КОН. Это сделало возможным ввести понятие «Вероятностного значения КОН», используемого при описании текстовых операторов, а также при построении алгоритма расстановки артиклей. Следует отметить, что особенности поведения тех или иных групп текстовых операторов могут быть использованы не только в системах МП, но и в бумажных словарях, предназначенных в помощь человеку, создающему текст на иностранном языке,.

6. Если говорить о возможных перспективах в исследовании данного вопроса, то исследование интересно было бы продолжить в нескольких направлениях. Первое направление — совершенствование словарного обеспечения систем АП. Разнообразные данные (как описанные в литературе, так и исследуемые в работе) показали, что есть два пласта лексики, которые в словаре могут быть снабжены пометой, помогающей при расстановке артиклей в тексте на английском языкес одной стороны, это глаголы различных семантических классов, накладывающие ограничения на значения КОН своих актантов, а с другой, — это именные лексемы, для которых в работе использовался термин «текстовый оператор». Второе направление — это проверка «вероятностных» правил на других, наиболее актуальных для современных систем автоматического перевода подъязыках (например, юридические тексты, тексты деловой прозы).

7. Среди теоретических проблем особенный интерес представляет изучение влияния синтаксических, коммуникативных и дискурсивных характеристик высказывания на тип детерминации ИГ и поиск возможностей их алгоритмической реализации. Они представляют собой второй (после лексических характеристик), более высокий по сложности уровень взаимодействия с ФСКОН в русском языке.

Показать весь текст

Список литературы

  1. Апресян 1974 Апресян Ю. Д. Лексическая семантика M., 1974
  2. Апресян 1986 Апресян Ю. Д. Интегральное описание языка и толковыйсловарь // Вопросы языкознания № 2, M., 1986, с. 57−70
  3. Апресян 1989 Апресян Ю. Д. и др. Лингвистическое обеспечение системы ЭТАП-2. М., 1989
  4. Апресян 1995 Апресян Ю. Д. Лексическая семантика., М. 1995
  5. Арутюнова 1976а Арутюнова Н. Д. Референция имени и структурапредложения. // Вопросы языкознания № 2 с.24−35
  6. Арутюнова 19 766 Арутюнова Н. Д. Предложение и его смысл. М., 1976
  7. Арутюнова 1977 Арутюнова Н. Д. Номинация и текст // Языковая номинация, 1. М., 1977
  8. Арутюнова 1998 Арутюнова Н. Д. Язык и мир человека. М., 1998 Бархударов 1975-Бархударов Л. С. Язык и перевод. М., 1975 Беллерт 1978 — Беллерт И. Об одном условии связности текста // Новое в зарубежной лингвистике, Вып. 8, М., 1978, с. 172−207.
  9. Бреус 1998 Бреус Е. В. Основы теории и практики перевода с русского языка на английский. М., 1998
  10. Ванников 1984 Ванников Ю. В. Типы научных и технических текстов и их лингвистические особенности. М., 1984
  11. Гуревич 1983 Гуревич В. В. О семантике неопределенности // Филологические науки № 1, 1983, с. 54−60
  12. Каушанская 1963 Каушанская В. Л., Ковнер Р. Л., Кожевникова О. Н., Прокофьева Е. В., Райнес З. М., Сквирская С. Е., Цырлина Ф. Я. A Grammar of the English Language (под ред. Ильиша Б.А.), Л., 1963
  13. Качалова 1995 Качалова К. Н., Израилевич Е. Е. Практическая грамматика английского языка. М., 1995
  14. Керо Хервилья 1999 Керо Хервилья Энрике Федерико. Сопоставительное изучение категории определенности / неопределенности в русском и испанском языках. Автореф. диссертации на соискание ученой степени кандидата филологических наук. М., 1999
  15. Кибрик 1997 Кибрик A.A., Плунгян В. А. Функционализм // Фундаментальные направления современной американской лингвистики. Сборник обзоров. М., 1997, с. 276−340
  16. Кобозева 1989 Кобозева И. М. О семантической трактовке кумулятивного отрицания в русском языке. // Проблемы структурной лингвистики 1984. М., 1989, с. 80−94.
  17. Кронгауз 1984 Кронгауз М. А. Тип референции именных групп с местоимениям все, всякий и каждый II Семиотика и информатика, Вып. 23 М., 1984, с. 107−123
  18. Крылов 1997 Крылов С. А. Детерминация имени в русском языке: теоретические проблемы // Семиотика и информатика, Вып. 35, М.1997, с. 244 271.
  19. Кулагина 1979 Кулагина О. С. Исследования по машинному переводу, М. 1979 Лингвистический энциклопедический словарь. М., 1990
  20. Маккьюин 1989 Маккьюин К. Дискурсивные стратегии для синтеза текста на естественном языке // Новое в зарубежной лингвистике, вып. 24 М., 1989, с. 311 -356
  21. Мельчук 1995 Мельчук И. А. Русский язык в модели «Смысл Текст» с. 3−17, М., 1995
  22. Николаева 1979 Николаева Т. М. Акцентно-просодические средства выражения категории определенности-неопределенности // Категория определенности-неопределенности в славянских и балканских языках М. 1979, с. 119−174
  23. Падучева 1974 Падучева Е. В. О семантике синтаксиса: материалы ктрансформационной грамматике русского языка. М., 1974
  24. Падучева 1985 Падучева Е. В. Высказывание и его соотнесенность сдействительностью (референциальные аспекты семантики местоимений). М., 1985
  25. Рахилина 1998 Рахилина Е. В. Когнитивная семантика: история, персоналии, идеи, результаты. // Семиотика и информатика. Вып.36, М. 1998, с.274−323 Ревзин 1964 — Ревзин И. И., Розенцвейг В. Ю. Основы общего и машинного перевода. М., 1964
  26. Ревзин 1973 Ревзин И. И. Некоторые средства выражения противопоставления по определенности в современном русском языке. // Проблемы грамматического моделирования. М., 1973, с. 121−137
  27. Рябцева 1996 Рябцева Н. К. Теоретическое и лексикографическое описание научного изложения: межъязыковой аспект. М. 1996
  28. Селегей 1999 Селегей В. П. Электронные словари и компьютерная лексикография // Труды Международного семинара Диалог'99, Том 2, Таруса 1999
  29. Селезнев 1985 Селезнев М. Г. Функционирование механизмов определеннойреференции в процессе синтеза текста. // Автореф. диссертации на соисканиеученой степени кандидата филологических наук. М., 1985
  30. Селиверстова 1964 Селиверстова О. Н. Опыт семантического анализа словтипа все и типа кто-нибудь // Вопросы языкознания № 4,1964, с. 80−90
  31. Серль 1986 Серль Дж.Р. Что такое речевой акт? // Новое в зарубежнойлингвистике, вып.17. М., 1986, с. 151−169
  32. Слокум 1989 Слокум Дж. Обзор разработок по машинному переводу: история вопроса, современное состояние и перспективы развития. // Новое в зарубежной лингвистике, вып.24. М&bdquo- 1989, с. 357−406
  33. Сосинский 1990 Сосинский А. Б. Машинный перевод препарированных математических текстов. //Сб. статей под ред. В. П. Маслова «Проектирование интеллектуальных систем (экспертные системы и системы МП)», М., 1990. С.59−87
  34. Сосинский 1994 Сосинский А. Б. Как написать математическую статью по-английски, Минск, 1994. 136 с.
  35. Талми 1999 Талми Л. Отношение грамматики к познанию. // Вестник МГУ, серия филология, №№ 1 (с. 91−115), 4 (с. 76−104), 6 (с. 88−121), М. 1999
  36. Толдова 1994 Толдова С. Ю. Структура дискурса и механизм фокусирования как важные факторы выбора номинации объекта в тексте. // Автореф, диссертации на соискание ученой степени кандидата филологических наук. М., 1994
  37. Федоров 1983 Федоров A.B. Основы общей теории перевода. М., 1983 Федорова 1994 — Федорова О. В. Типология средств интродукции референта. Автореф. диссертации на соискание ученой степени кандидата филологических наук. М., 1985
  38. Шаляпина 1988 Шаляпина З. М. Текст как объект автоматического перевода. М., 1988
  39. Шмелев 1996 Шмелев А. Д. Референциальные механизмы русского языка. Тампере 1996.
  40. Штеллинг 1996 Штеллинг Д. А. Грамматическая семантика английского языка. Фактор человека в языке М., 1996
  41. Baker 1989 Baker С. English Syntax, Cambridge 1989, с. 141−147
  42. Blokh 1994- Blokh M.Y. A course in theoretical English grammar M., 1994
  43. Christophersen 1939 Christophersen Paul, The Articles. A study of the theory anduse in English. Copenhagen, Munksgaard, London, Milford 1939
  44. Collins 1994 Collins Cobuild English Grammar, HarperCollins Publishers, London1994
  45. Kramsky 1972 Kramsky J. The article and the concept of definiteness in language. The Hague, Paris, 1972
  46. Sorensen 1959 Sorensen Holger Steen. The function of the Definite
  47. Article in Modern English. // English Studies, 40,1959
  48. Thomson 1986 Thomson A.J., Martinet A.V. A practical English grammar, Oxford University Press 1986
  49. Wierzbicka 1999 Wierzbicka A. A semantic basis for linguistic typology. II В сб. Типология и теория языка. От описания к объяснению. М., 1999 с.26−35 Словари
  50. Апресян 1994 Апресян Ю. Д., Медникова Э. М., Петрова А. В. и др. Новый большой англо-русский словарь. М., 1994
  51. Гальперин 1972 Гальперин И. Р. Большой англо-русский словарь. М., 1972
  52. Мюллер 1978 Мюллер В. К. Англо-русский словарь, М., 1978
  53. Денисов 1978 Денисов П. Н., Морковкин В. В., Сафьян Ю. А. Комплексныйчастотный словарь русской научной и технической лексики. М., 1978
  54. Webster’s New World Dictionary, New York 1982
  55. BBC English Dictionary, London 1993
Заполнить форму текущей работой