Помощь в написании студенческих работ
Антистрессовый сервис

Семантический анализ документации

РефератПомощь в написанииУзнать стоимостьмоей работы

Сегодня семантический анализ все чаще ложится в основу инструментов, которые пытаются применить для управления бизнес-процессами, с помощью его принципов исследователи уже разработали подход Semantic Business Process Management, который позволит сделать совершенствование процессов гораздо легче. Эта методология принимает за основу необходимость автоматизации трансформации данных о бизнесе в ИТ… Читать ещё >

Семантический анализ документации (реферат, курсовая, диплом, контрольная)

Классические методы бизнес-анализа часто используют административную документацию для того, чтобы на основании ее описать процессы. Этот подход имеет ряд преимуществ, но не меньше и слабых сторон. Документация, а именно должностные или процессные инструкции, регламентирующая процесс, определяющая обязанность его участников или просто описывающая цепочки действий, которые составляют процесс, является отличным источником для сбора информации и анализа, так как обычно она четко структурирована и в ней достаточно полно описаны все необходимые для исследования элементы активностей. Преимущество естественного языка в этом дает достаточно легко определить структуру «субъект» — «действие» — «объект», что позволяет описать процесс как некий поток, над которым совершается некой ролью определенное действие. Однако в большинстве случаев главным минусом становится соответствие реального положения дел описывающей документации, в которой зафиксирован не сам фактический процесс, а лишь то, каким он должен быть, в каком порядке его следовало бы поддержать. Таким образом, административная документация не всегда является достаточно актуальным источником информации о процессах, но, не смотря на это, часто именно с ее помощью можно наиболее быстро и просто выявить основную структуру производственных активностей и понять их назначение.

Так как должностные инструкции и подобная документация обычно представляют собой «плоский» текст для использования сотрудниками компании, то автоматизировать ее исследование возможно лишь посредством быстрого распознания текста и дальнейшего его анализа, что и предлагает семантический анализ. На сегодняшний день семантический анализ текста стал уже весьма популярной методикой, которая используется в самых разных областях, чаще всего это маркетинг и реклама, социологические исследования и другие сферы, которые используют результаты анализа сайтов и страниц для продвижения каких-либо продуктов или идей в сети Интернет. Вот как в целом можно определить данный подход к анализу текстов: «семантический анализ — это метод обработки информации на естественном языке, анализирующий взаимосвязь между коллекцией документов и терминами, в них встречающимися, сопоставляющий определенные факторы, характерные всем документам и терминам» [31]. Однако семантический анализ является лишь основанием для разработки алгоритмов, которые производят скорее морфологический анализ должностных инструкций, который позволяет выявить необходимые для описания процесса структуры в тесте.

Целью семантического анализа документации является определение содержания, связей, частоты и формы представления информации, в результате чего может быть составлено характеризующее описание содержания документа и выделены морфологические структуры, являющиеся основами предложений («субъект» — «действие» — «объект»). Это позволяет производить быстрое исследование основной содержательной части, и, что особенно ценно для выявления процессов, выявлять связи между отдельными терминами, частоту их употребления, что может свидетельствовать об определенной роли данного объекта в процессе.

Сегодня семантический анализ все чаще ложится в основу инструментов, которые пытаются применить для управления бизнес-процессами [32, 33], с помощью его принципов исследователи уже разработали подход Semantic Business Process Management, который позволит сделать совершенствование процессов гораздо легче. Эта методология принимает за основу необходимость автоматизации трансформации данных о бизнесе в ИТ плоскость, что упростит обмен информацией между сферами информационных технологий и бизнеса, ведь сейчас для интерпретации проблем и их описания требуются отдельно обученные люди, стандартные документы и большое количество времени. Однако эта инновация пока встречает ряд трудностей, связанных, в первую очередь с наличием недостаточного объема и формата данных для полного описания процессов на стороне бизнеса и другими трудностями. На основании этого можно сделать вывод о том, что семантический анализ действительно уже сегодня является одной из основных молодых методик, которая в будущем может стать одной из основ получения данных о деятельности компаний и одним из ключевых инструментов автоматизированного выявления бизнес-процессов. По этой причине данное исследование включает семантический анализ в качестве одной из трех ключевых методологий, которые будут положены в основу исследования необходимых критериев данных для их успешного применения.

Основой для семантического анализа документации о процессе, как уже было сказано выше, является текст должностных и прочих инструкций на естественном языке, то есть составленный для прочтения людьми, математические алгоритмы, осуществляющие компьютерное «понимание» и категоризацию слов этого текста, и выбранные в качестве требуемых результатов анализа показатели или карты связей слов. Текст, подвергающийся анализу, может быть предоставлен в любом формате, в котором он находился первоначально, то есть, в отличие от журнала событий или обменных сообщений, он может носить характер обычной последовательности предложений без какой-либо структуры, при этом оставаясь доступным для обработки и полным смысла. Алгоритмы же, используемые для анализа таких текстов с целью выявления процесса, используются именно для выделения корневой части предложений, то есть сказуемого и подлежащего, а также дополнений, которые могут быть связаны со сказуемым. В частности, в зависимости от целей анализа морфемные единицы могут изменяться, если необходимо выявить другие параметры процесса. Классические же алгоритмы семантического анализа позволяют определить и общие параметры текста, которые также можно использовать для выявления процесса: количество уникальных слов, академичность языка автора, семантическое ядро и объем «воды» — текста, разбавляющего и соединяющего по смыслу ключевые слова. Результаты анализа же выводятся в виде статических показаний о тексте или цепочек связанных объектов, действий и субъектов, что непосредственно дает фактически сформированную модель в виде отдельных слов.

Таким образом, как и для глубинного анализа, основными показательными составляющими, которые обеспечивают успех применения данного метода, являются также исходные данные, алгоритм и выбранные критерии для оценки в ходе анализа.

Показать весь текст
Заполнить форму текущей работой