Помощь в написании студенческих работ
Антистрессовый сервис

Визуализация бикластеров ключевых фраз

РефератПомощь в написанииУзнать стоимостьмоей работы

В дополнение, в разработанном программном модуле, интерфейс для отображения таких графов является интерактивным, что позволяет пользователю передвигать вершины графа, а также выбирать интересующее ребро (то есть бикластер) и просматривать все находящиеся в нём фразы, а не только «доминирующие». В случае, если одно и то же ребро было извлечено из нескольких бикластеров, пользователь увидит… Читать ещё >

Визуализация бикластеров ключевых фраз (реферат, курсовая, диплом, контрольная)

Построение графов связей между понятиями (фразами) является, пожалуй, одним из основных возможных приложений бикластеров ключевых словосочетаний. В данной работе мы исследовали возможность построения таких графов и представляем здесь выработанный подход.

В этом подходе из каждого бикластера фраз, полученного в результате бикластеризации матрицы схожести между словосочетаниями, выделяется ровно одно ребро. Для этого в бикластере находится ряд с наибольшей плотностью (плотность ряда — это сумма его элементов, делённая на количество столбцов в бикластере) и столбец с наибольшей плотностью (плотность столбца определяется аналогично). Таким образом, мы находим «доминирующие» словосочетания для бикластера и связываем их ребром в графе. Направление ребра задаётся от столбца (словосочетания, соответствующего столбцу с наивысшей плотностью) к ряду. Такое направление связано с выбранным методом подсчёта схожести между ключевыми фразами: для пары фраз и (- соответствует ряду, а — столбцу в матрице схожести) подсчитывается количество текстов, для которых релевантны обе фразы и делится на количество всех текстов, для которых релевантна первая фраза —. В итоге, мы получаем степень зависимости фразы от фразы (), а значит, направленность в графе должна идти от вершины к вершине. Получаемый в результате граф может довольно неплохо отображать тематическую структуру коллекции текстов.

В дополнение, в разработанном программном модуле, интерфейс для отображения таких графов является интерактивным, что позволяет пользователю передвигать вершины графа, а также выбирать интересующее ребро (то есть бикластер) и просматривать все находящиеся в нём фразы, а не только «доминирующие». В случае, если одно и то же ребро было извлечено из нескольких бикластеров, пользователь увидит ключевые фразы, принадлежащие тому из бикластеров, которому соответствует наибольшее значение параметра (параметр является основным показателем для сравнения бикластеров в данной работе). Стоит ещё отметить, что вес — толщина — ребра отображается в соответствии с количеством бикластеров, из которых это ребро было извлечено.

Для реализации описанного выше интерфейса использовалась Python-библиотека для создания 2-D графики и анимации — NodeBox for OpenGL.

Показать весь текст
Заполнить форму текущей работой