Помощь в написании студенческих работ
Антистрессовый сервис

Современные интерфейсы компьютерной лингвистики

РефератПомощь в написанииУзнать стоимостьмоей работы

Первые эксперименты по машинному переводу, подтвердившие принципиальную возможность его реализации, были проведены в 1954 г. в Джорджтаунском университете (г. Вашингтон, США). Вскоре после этого в промышленно развитых странах мира были начаты исследования и разработки, направленные на создание систем машинного перевода (систем МП). И хотя с тех пор прошло полстолетия, проблема машинного перевода… Читать ещё >

Современные интерфейсы компьютерной лингвистики (реферат, курсовая, диплом, контрольная)

Первые эксперименты по машинному переводу, подтвердившие принципиальную возможность его реализации, были проведены в 1954 г. в Джорджтаунском университете (г. Вашингтон, США). Вскоре после этого в промышленно развитых странах мира были начаты исследования и разработки, направленные на создание систем машинного перевода (систем МП). И хотя с тех пор прошло полстолетия, проблема машинного перевода все еще не решена на должном уровне. Она оказалась значительно сложнее, чем это представляли себе пионеры и энтузиасты МП конца пятидесятых — начала шестидесятых годов прошлого века.

Описание интерфейсов компьютерной лингвистики

Из достижений компьютерной лингвистики следует выделить, прежде всего, систему под названием RETRANS. Первая промышленная версия этой системы была разработана в 1993 году и стала использоваться в ряде государственных учреждений России, Франции, США и Англии. После этого было создано еще несколько версий системы. До 1998 г. все они были предназначены для работы в среде операционной системы MS DOS, а в 1998;2000 г. г. были адаптированы для операционных систем Windows 9x/NT и различных вариантов UNIX (Linux, Solaris и др.).

В 2001 г. тем же авторским коллективом была разработана новая версия системы фразеологического машинного перевода RETRANS. Эта версия реализована в нескольких модификациях:

  • 1. Система, работающая в среде текстового процессора MS Word-2000.
  • 2. Система, работающая в среде Web-браузера MS Internet Explorer.
  • 3. Система, работающая с любыми Windows-приложениями, способными копировать текст в «Буфер Обмена» (Clipboard).

Первая модификация системы обладает тем достоинством, что человек, имеющий опыт работы с редактором типа Word, может с помощью этой. При этом он может пользоваться всеми возможностями редактора Word.

Вторая модификация системы может служить эффективным средством общения с системой Internet для лиц, знающих русский язык, но не знающих английского, или, наоборот, знающих английский язык, но не знающих русского. Она может также использоваться для перевода любых документов, представленных в виде Web-страниц (например, электронной версии Британской Энциклопедии). При этом во всех случаях сохраняется внешний вид переведенной страницы.

Третья модификация системы может быть полезна при работе с простыми программами типа MS Notepad, MS Wordpad, MS Paint и им подобными, а также при обработке различных электронных форм.

В случае необходимости, на одной ЭВМ могут устанавливаться несколько модификаций системы RETRANS одновременно. При этом ядро процедурных средств и словарные средства системы будут представлены только в одном экземпляре.

Основные политематические машинные словари системы Retrans (русско-английский и англо-русский) включают в свой состав терминологию по естественным и техническим наукам, экономике, бизнесу, политике, законодательству и военному делу.

Кроме основных политематических машинных словарей в состав системы RETRANS входят двенадцать дополнительных тематических словарей, включающих лексику родственных тематик. Эти словари содержат словарные статьи только тех слов и словосочетаний из политематических словарей, которые в рамках каждой тематической группы имеют приоритетные переводные эквиваленты, отличные от приоритетных переводных эквивалентов основных словарей. В дополнительных тематических словарях лексические единицы (слова и словосочетания) могут иметь не более двух переводных эквивалентов (в политематическом словаре их может быть до пяти).

Средства автоматизированного пополнения и настройки машинных словарей, созданные на начальных этапах разработки системы RETRANS, сыграли большую роль в ее дальнейшем развитии. Но опыт практической эксплуатации этой системы выявил необходимость введения некоторых изменений в структуру словарей. Наряду с основными политематическими и дополнительными тематическими словарями системы были введены еще и дополнительные словари пользователей. При этом имелось в виду, что при переводе текстов с одного языка на другой одновременно используются три словаря: основной политематический словарь, один из дополнительных тематических словарей и один из словарей пользователей.

Словарь пользователя (СП) служит для тонкой настройки системы машинного перевода, выполняемой самим пользователем при переводе текстов по конкретной тематике. Кроме того, СП дает возможность использовать при переводе ранее накопленные словарные массивы. В отличие от основного политематического словаря и дополнительных тематических словарей, содержимое которых может изменяться только разработчиками системы машинного перевода, словарь пользователя может создаваться и изменяться пользователем по своему усмотрению.

По структуре словарных статей словарь пользователя аналогичен основному политематическому и дополнительным тематическим словарям, но он отличается от них количеством возможных вариантов перевода, указываемых для входных наименований понятий. Здесь для каждого входного наименования понятия может указываться только один вариант перевода. Отличается словарь пользователя также и способом его хранения в файле. Это связано с необходимостью оперативного изменения содержимого словаря, и тем, что его объем значительно меньше, чем объем словарей других типов. компьютерный лингвистика интерфейс гипертекст Каждая запись СП описывает наименование одного понятия исходного языка, которое может иметь длину от одного до 17-тислов. Его переводной эквивалент также может иметь длину от одного до 17-ти слов. Словарь может включать до 65 тысяч словарных статей.

Пользователь системы RETRANS может создавать практически неограниченное количество своих словарей по различным тематикам, но в процессе перевода конкретного текста используется только один словарь. При необходимости, можно объединить несколько словарей в один словарь.

Показать весь текст
Заполнить форму текущей работой