Словарные средства анализа научно-технических текстов
Для распознавания в тексте словарного словосочетания необходима информация о семантико-синтаксических валентностях составляющих его слов. Такую информацию можно представить в виде лексико-синтаксического шаблона, который фиксирует лексемы и их грамматическую форму, а также задает синтаксические условия заполнения своих пустых мест (валентностей). Кроме того, в виде шаблонов удобно представлять… Читать ещё >
Словарные средства анализа научно-технических текстов (реферат, курсовая, диплом, контрольная)
Для анализа научно-технических документов предлагается использовать, кроме традиционных терминологического и морфологического словарей, следующие словарные средства, отображающие специфику научной прозы:
Словарь общенаучных слов и выражений;
Лексико-синтаксические шаблоны типичных фраз научной речи.
При построении словаря общенаучных слов и выражений была проведена функционально-семантическая классификация собранных единиц. Выражения были разбиты на группы исключительно по их смыслу и функции в тексте, без учета их грамматической формы и синтаксических характеристик.
В итоге получилось 53 группы, каждая из которых является классом слабой эквивалентности и включает в общем случае несколько семантически близких выражений разной грамматической природы. Каждой группе приписана соответствующая операция научного дискурса; эти операции частично приведены в таблице 1.
Для каждой единицы словаря общенаучной речи указывается ее классификационная группа (дискурсивная операция); для словосочетаний описываются их синтаксические характеристики (разрывность/ неразрывность и др.).
Для распознавания в тексте словарного словосочетания необходима информация о семантико-синтаксических валентностях составляющих его слов. Такую информацию можно представить в виде лексико-синтаксического шаблона, который фиксирует лексемы и их грамматическую форму, а также задает синтаксические условия заполнения своих пустых мест (валентностей). Кроме того, в виде шаблонов удобно представлять клишированные конструкции научной речи, составленные из нескольких словарных единиц и имеющие фиксированную синтаксическую структуру. К числу таких конструкций относятся определения новых терминов, состоящие из одного предложения, например, фраза «…значение, которое используется для расширения первоначального набора, мы будем называть существенным значением…». Указанная конструкция схематически может быть описана как.
NGACC ["мы"] «будем называть"TINS,.
где «мы» и «будем называть»? совместно встречающиеся лексемы, причем слово «мы» может отсутствовать; TINS — определяемый термин, выраженный согласованной именной группой, главное слово которой имеет форму творительного падежа; NGACC — определение или объяснение авторского термина, выраженное согласованной именной группой (возможно, расширенной придаточным предложением), главное слово которой имеет форму винительного падежа.
Таблица 1. Операции научного дискурса.
Операции. | Примеры слов и выражений. | |
Описание и констатация. | укажем, что; характеризуя | |
Конкретизация и уточнение. | в частности; в дополнение к | |
Причинно-следственные связи. | по этой причине; следовательно | |
Актуализация темы. | перейдем к; рассмотрим | |
Выделение информации. | особо подчеркнем; необходимо отметить | |
Предположения и допущения. | предположим/допустим, что | |
Определения. | будем называть; по определению | |
Сравнение и противопоставление. | с одной стороны; в отличие от; по сравнению с | |
Иллюстрация и приведение примеров. | к примеру; например | |
Обобщение и резюмирование. | суммируя вышесказанное; в общем | |
Упорядочивание и перечисление. | во-первых; наконец | |
Помета общенаучной переменной. | идея, модель, результат | |
Выражение мнения и оценивание. | целесообразно считать; по-видимому | |
Представленная в словаре общенаучной речи и наборе шаблонов семантико-синтаксическая информация позволяет производить содержательный анализ научно-технических текстов — распознавание примененных дискурсивных маркеров и операций научного дискурса.