Сеточные алгоритмы.
Актуальные проблемы кластерного анализа
Может обнаруживать кластеры произвольных форм. Автоматически подбирает количество кластеров. Применим только к данным низкой размерности. Необходимость в задании пороговых значений. Необходимо задавать количество кластеров; Необходимо задавать количество кластеров. Медленная работа на больших базах данных. Легко рассчитывается и интерпретируется. Работает на ограниченном объеме памяти. Понятность… Читать ещё >
Сеточные алгоритмы. Актуальные проблемы кластерного анализа (реферат, курсовая, диплом, контрольная)
Алгоритм WaveCluster.
Данные алгоритм относится к группе сеточных алгоритмов (Grid-based).
В основе алгоритма лежит метод волновых преобразований. На первом шаге работы, алгоритм обобщает данные, накладывая на пространство данных многомерную решетку. Последующие шаги анализируют уже не конкретные точки, а их обобщённые характеристики в каждой ячейке. После этого алгоритм применяет волновые преобразования к обобщённым данным.
Среди сеточных алгоритмов так же выделяют STING, OptiGrid, GRIDCLUS, GDILC.
Ниже, я хотел бы провести сравнительных анализ некоторых методов кластеризации, о которых ранее упоминалось.
Метод. | Достоинства. | Недостатки. |
CURE. |
| — Необходимость в задании пороговых значений и количества кластеров. |
BIRCH. |
|
|
MST. |
| — чувствителен к выбросам. |
k-средних. |
|
|
PAM. |
|
|
CLOPE. |
| |
Алгоритм HCM. |
|
|
Fuzzy. C-means. | — Нечеткость при определении объекта в кластер позволяет классифицировать пограничные объекты. |
|
WaveCluster. |
|
|
На первый взгляд, кажется, что результаты, полученные в результате кластеризации не имеют статистического обоснования. С другой стороны, при большом разнообразии вариантов понятия кластера, нестатическая интерпретация полученных результатов даёт возможность получить оценку, которая при использовании других методов бывает затруднительна.