Помощь в написании студенческих работ
Антистрессовый сервис

Обзор систем машинного перевода

РефератПомощь в написанииУзнать стоимостьмоей работы

Для перевода система строит полное синтаксическое дерево исходного текста. Для его построения она использует отдельно заданные правила для каждого языка. Причем Compreno способна правильно обрабатывать анафоры, эллипсис и другие трудно поддающиеся обработке языковые конструкции. При переводе учитываются связи между словами в этом дереве, возможное положение этих слов вUSH (Universal Sematic… Читать ещё >

Обзор систем машинного перевода (реферат, курсовая, диплом, контрольная)

Машинный перевод представляет собой процесс связанного перевода текстов, осуществляемый посредством словарной поддержки, компьютерной программой с одного естественного языка на другой. Словарная поддержка — это комплекс последовательных, технических процедур, направленных на автоматическое распознавание переводимых единиц и соотнесение их с нормативными требованиями.

Различают следующие основные цели использования машинного перевода :

  • · Быстрое ознакомление с интересующей информацией — машинный перевод позволяет получить в общих чертах информацию о содержании статьи, книги, научной работы и т. д.
  • · Возможность коммуникаций — машинный перевод дает возможность связаться с любым человеком из любой точки мира.
  • · Упрощение работы переводчика — используя машинный перевод, переводчик может значительно ускорить перевод текста.

В настоящее время различают три вида систем машинного перевода :

  • · Системы на основе грамматических правил (Rule-Based Machine Translation, RBMT).
  • · Статистические системы (Statistical Machine Translation, SMT).
  • · Гибридные системы.

Системы на основе грамматических правил производят анализ текста, который используется в процессе перевода. Перевод производится на основе встроенных словарей для данной языковой пары, а так же грамматик, охватывающих семантические, морфологические, синтаксические закономерности обоих языков. На основе всех этих данных исходный текст последовательно, предложение за предложением, преобразуется в текст на требуемом языке. Основной принцип работы таких систем — связь структур исходного и конечного текстов.

Несомненно, преимуществами систем на основе грамматических правил являются грамматическая и синтаксическая точность, стабильность результата, возможность настройки на специфическую предметную область. К недостаткам систем на основе грамматических правил относят необходимость создания, поддержки и обновления лингвистических баз данных, трудоемкость создания такой системы, а так же ее высокая стоимость.

Статистические системы при своей работе используют статистический анализ. В систему загружается двуязычный корпус текстов (содержащий большое количество текста на исходном языке и его «ручной» перевод на требуемый язык), после чего система анализирует статистику межъязыковых соответствий, синтаксических конструкций и т. д. Система является самообучаемой — при выборе варианта перевода она опирается на полученную ранее статистику. Чем больше словарь внутри языковой пары и чем точнее он составлен, тем лучше результат статистического машинного перевода. С каждым новым переведенным текстом улучшается качество последующих переводов. Статистические системы отличаются быстротой настройки и легкостью добавления новых направлений перевода. Среди недостатков наиболее значительными являются наличие многочисленных грамматических ошибок и нестабильность перевода.

Гибридные системы сочетают в себе подходы, описанные выше. Ожидается, что гибридные системы машинного перевода позволят объединить все преимущества, которыми обладают статистические системы и системы, основанные на правилах.

Крупнейшие системы машинного перевода, работающие с русским языком Три крупнейшие системы машинного перевода, работающие с русским языком— Abbyy Compreno, Google Translate и Яндекс.Перевод. Каждая из этих систем продолжает активно развиваться, совершенствуясь и улучшая качество перевода.

AbbyyCompreno

Abbyy Compreno — технология, разработанная российской компанией «Abbyy», а также одноименная система, созданная ей же.

Для перевода система строит полное синтаксическое дерево исходного текста. Для его построения она использует отдельно заданные правила для каждого языка. Причем Compreno способна правильно обрабатывать анафоры, эллипсис и другие трудно поддающиеся обработке языковые конструкции. При переводе учитываются связи между словами в этом дереве, возможное положение этих слов вUSH (Universal Sematic Hierarchy — иерархии универсальных семантических значений и отношений между ними) а также статистика взаимоотношений между словами. Основным недостатком данной системы является её закрытость, отсутствие данных о полномасштабных тестированиях данной системы, что делает невозможным оценку качества производимого ей машинного перевода.

Google Translate

Google Translate — система, в настоящий момент разрабатываемая компанией Google. Первоначально разрабатывалась Franz Josef Och. Построена на статистическом методе перевода. Для обучения системы первоначально использовались параллельные корпуса текстов ООН, представленные на шести официальных языках ООН.

Данная система не осуществляет прямой перевод для языковых пар, в которые не входит английский язык. То есть, при переводе, например, с русского языка на французский, сначала будет осуществлен перевод с русского на английский язык, апосле этого — с английского на французский. Более того, для некоторых языков таких шагов больше. Например, тексты на белорусском языке вначале переводятся на русский, после этого на английский и только потом превращаются в текст на конечном языке. Это значительно снижает точность перевода и делает систему абсолютно непригодной для перевода ряда текстов.

Яндекс.Перевод Яндекс. Перевод представляет собой сервис автоматического перевода слов, фраз, целых текстов, а так же веб-страниц. Как и Google Translate, Яндекс. Перевод использует статистический перевод. Яндекс. Перевод состоит из двух частей — модели перевода и модели языка. Модель перевода занимается построением графа, содержащего все возможные варианты перевода предложения. Модель языка выбирает лучший вариант перевода с точки зрения оптимальной сочетаемости слов в естественном языке. Хотя список доступных для перевода языков у Яндекс. Перевода значительно меньше, чем у Google Translate, перевод осуществляется напрямую, без использования промежуточных звеньев.

Показать весь текст
Заполнить форму текущей работой