Помощь в написании студенческих работ
Антистрессовый сервис

Задачи и методы их решения, общие для корпусной лингвистики, машинного перевода и компьютерной лексикографии

РефератПомощь в написанииУзнать стоимостьмоей работы

Прежде чем перейти к направлениям компьютерной двуязычной лексикографии, следует ввести группу понятий, относящихся скорее к области корпусной лингвистики и машинного перевода, которые в дальнейшем будут использоваться при описании различных словарей. Переводным эквивалентом называют перевод, приписываемый лексеме входного языка, или пару «слово входного языка + слово выходного языка», которые… Читать ещё >

Задачи и методы их решения, общие для корпусной лингвистики, машинного перевода и компьютерной лексикографии (реферат, курсовая, диплом, контрольная)

Прежде чем перейти к направлениям компьютерной двуязычной лексикографии, следует ввести группу понятий, относящихся скорее к области корпусной лингвистики и машинного перевода, которые в дальнейшем будут использоваться при описании различных словарей.

Двуязычный словарь предполагает описание лексики двух языков: входного языка — языка, с которого производится перевод, и выходного — языка перевода. Слово-заголовок статьи по отношению к статье обычно называют заголовочным. Если в словаре приводятся словосочетания, то в них выделяется опорное слово — слово, под которым это словосочетание приводится в словаре.

Переводным эквивалентом называют перевод, приписываемый лексеме входного языка, или пару «слово входного языка + слово выходного языка», которые являются переводами друг друга.

Для машинного создания словарей или в качестве вспомогательного материала используются параллельные и сопоставимые корпусы текстов. Параллельный корпус — многоязычный корпус, который состоит из текстов на одном языке и их переводов на другой (другие) язык (языки). Сопоставимый (comparable) корпус — набор текстов одной и той же тематической области, на двух или нескольких языках. Для удобства как машинного, так и ручного использования параллельных корпусов производится выравнивание — установление соответствия фрагментов исходного текста (слов, предложений) фрагментам перевода, выполняемое вручную или автоматически.

Лексикографы и лингвисты часто используют специальные инструменты для работы с корпусами — корпус-менеджеры. Для исследования удобен режим построения конкорданса — автоматическое извлечение набора контекстов для заданного явления (слово / словосочетание / грамматическая форма и др.).

Показать весь текст
Заполнить форму текущей работой