Моделирование уровней языка
Синхронное моделирование систем языка древних текстов предусматривает построение различных моделей на уровне морфологии, лексики. Такие модели могут быть как собственно морфологическими, ареально-типологическими, функционально-семантическими, так и хронологически-статистическими, описательными, формальными. При этом надо различать исследования, направленные, с одной стороны, на построение системы… Читать ещё >
Моделирование уровней языка (реферат, курсовая, диплом, контрольная)
Уровни языка — некоторые фрагменты языка, подсистемы обшей языковой системы, каждая из которых характеризуется совокупностью относительно однородных единиц и набором правил, регулирующих их использование и группировку в различные классы и подклассы.
Моделирование звуковой формы языка. Звуковая форма существования языка является основной и исходной для любого естественного языка. Это определяет особую роль фонетических исследований в прикладной лингвистике. Можно говорить об основных направлениях в изучении звуковой формы языковых единиц, к которым относятся:
анализ акустических характеристик речевого сигнала — для создания систем передачи речи по каналам связи, для разработки процедур автоматического распознавания и синтеза речи, для улучшения методики восстановления речи и слуха у больных с соответствующими нарушениями;
анализ артикуляторных характеристик процессов речепроизводства — для выявления механизмов управления произносительными органами со стороны соответствующих центров коры головного мозга, что облегчает понимание процессов, характеризующих высшую нервную деятельность человека. Такое понимание имеет и практическое значение при лечении больных, страдающих различными формами нарушения речи. Многие исследователи считают сведения о механизмах речеобразования очень важными для построения систем автоматического распознавания и синтеза речи;
3)исследование процессов восприятия речевых сообщений слуховой системой человека, важное как для оценки значимости акустических свойств этих сообщений, так и для построения модели слуховой обработки речевого сигнала. Такого рода исследования чрезвычайно важны для специалистов и в области записи и передачи речевых сообщений, и в области автоматического распознаванияи синтеза речи.
Все перечисленные направления в изучении свойств речевого сигнала имеют огромное значение при обучении родному или неродному языку. Значительное место в этой проблеме занимают выработка орфоэпических навыков, устранение диалектных и просторечных явлений, а также постановка так называемого сценического произношения.
Моделирование синтаксической структуры языка. Синтаксический анализ предложения — необходимый этап автоматической обработки текста или речи при решении различного рода задач в прикладной лингвистике. Целью синтаксического анализа является распознавание синтаксической структуры предложения или отдельных его частей. К основным проблемам моделирования синтаксиса в прикладной лингвистике относятся представление синтаксических структур естественного языка и разработка оптимальных методов (алгоритмов) синтаксического анализа, ориентированных на то или иное представление синтаксической структуры.
В настоящее время широко используются три основных способа представления синтаксической структуры предложения, а именно представление ее как: 1) структуры составляющих (дерева непосредственно составляющих); 2) структуры зависимостей (дерева зависимостей); 3) структуры, совмещающей свойства структур зависимостей и составляющих (ориентированной структуры составляющих).
Моделирование семантики. При моделировании семантики предложения прежде всего возникает вопрос о том, что считать смыслом предложения. Однозначного ответа на него в настоящее время не существует. Однако большинство исследователей сходится на том, что смысл предложения представляет собой сложное, многоаспектное образование. В содержании предложения сложнейшим образом сфокусированы характеристики экстралингвистической действительности, ее отражения в сознании человека в виде концептуальных структур, коммуникативных установок участников общения, а также особенности самого языка. При моделировании семантики предложения каждый из названных аспектов может получить статус исходного или даже единственного, если прочие аспекты по каким-либо соображениям не рассматриваются. В зависимости от того, какой исходный аспект кладется в основу моделирования семантики предложения, возможны, в принципе, четыре подхода: онтологоцентрический, концептоцентрический, синтактикоцентрический, антропоцентрический. В рамках каждого из них существует некоторая система воззрений, разработанных с различной степенью детальности. Поэтому важно выявить фундаментальные принципы и постулаты, которыми можно руководствоваться, строя теорию с преимущественной ориентацией на какой-нибудь один аспект.
Моделирование статистических параметров языка. На фоне непреходящего интереса лингвистов к технике обработки данных в настоящее время на первый план выдвигается вопрос о месте и роли статистического метода в лингвистике и особенностях его применения к решению конкретных задач. Не теряет актуальности и попытка разобраться в том, на что может претендовать статистический метод и на что он претендовать не может.
В статистическом методе — универсальном методе познания действительности — оптимально отражены взаимоотношения между субъектом и объектом исследования, объектом и методом, объектом и знанием о нем. Позиция исследователя при этом характеризуется объективностью, беспристрастностью, а его интерес к объекту диктуется прежде всего практическими, прикладными целями, например задачей автоматического индексирования текста, его дешифровки или атрибуции.
В результате взаимодействия исследователя с объектом рождается статистическое знание, обладающее свойствами, вытекающими из позиции и интереса исследователя (объективность, прагматичность), а также объекта исследования (системность, стохастичность, симптоматичность, многомерность, конкретность, количественность) и метода исследования (строгость, приближенность, верифицируемость). Обращает на себя внимание тот факт, что метод взаимодействует не только с объектом, но и добытым знанием, отсюда свойство верифицируемости знания.
Моделирование уровня текста. К актуальным проблемам моделирования уровневой структуры языка, прежде всего уровня текста, относится компьютерная обработка древних рукописей и подготовка их к последующему изданию, что имеет большое историко-культурное значение. Немало рукописей на восточных, германских, романских, славянских языках дошли до нас из глубины веков. Изучением древних рукописей занимаются специалисты самых разных профессий: филологи, историки, этнографы, географы, экономисты, социологи. С точки зрения лингвистов, целью подлинно научной истории языка является строгое объективное воссоздание системы языка текстов.
Синхронное моделирование систем языка древних текстов предусматривает построение различных моделей на уровне морфологии, лексики. Такие модели могут быть как собственно морфологическими, ареально-типологическими, функционально-семантическими, так и хронологически-статистическими, описательными, формальными. При этом надо различать исследования, направленные, с одной стороны, на построение системы языка как таковой, а с другой — на воссоздание истории текста. При моделировании системы языка главным является выявление основных доминирующих типов и тенденций; здесь наиболее показательны морфология, высокочастотные факты в статистике. История памятника связана с проблемами атрибуции текста, где главное — выделение диагностических различительных его признаков. Наиболее показательны в этом отношении письмо текста, его лексика, синтаксис, собственно стилистика, редкие факты статистики.
В процессе моделирования языка особое место занимают словоуказатели к древним памятникам литературы. Они нужны языковедам, литературоведам, историкам, этнографам, поскольку дают полное представление о лексике памятника, о типах слов и форм по их структуре, о характере применения титл, о видах использования графем и их последовательностях. Словоуказатели демонстрируют абсолютную частоту словоформы в тексте и в целом позволяют судить об общем семантическом характере приведенных слов. Идя по пути создания полных словоуказателей, реестров грамматических форм, конкордансов и словарей к отдельным памятникам (центрам письменности), сопоставляя затем между собой словники и словари текстов и зон, изученных лучше других, мы придем постепенно к относительно полной картине ареального и жанрового распределения лексики памятников письменности и сможем более уверенно говорить о неологизмах изводов, школ и авторов отдельных текстов.
Актуальной нерешенной проблемой в сфере составления автоматических словарей является автоматическое сведение словоформ к канонической (словарной) форме. Не говоря уже о трудности определения грамматической характеристики словоформы, следует отметить проблему отождествления графических вариантов одной и той же формы слова. Предпринимавшийся в этой области усилия пока плодов не принесли, и единственной надежной процедурой сведения словоформ к канонической форме, к сожалению, является ручное постредактирование полученного словаря.