ΠŸΠΎΠΌΠΎΡ‰ΡŒ Π² написании студСнчСских Ρ€Π°Π±ΠΎΡ‚
АнтистрСссовый сСрвис

ΠœΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠ° провСдСния иСрархичСского кластСрного Π°Π½Π°Π»ΠΈΠ·Π°

Π Π΅Ρ„Π΅Ρ€Π°Ρ‚ΠŸΠΎΠΌΠΎΡ‰ΡŒ Π² Π½Π°ΠΏΠΈΡΠ°Π½ΠΈΠΈΠ£Π·Π½Π°Ρ‚ΡŒ ΡΡ‚ΠΎΠΈΠΌΠΎΡΡ‚ΡŒΠΌΠΎΠ΅ΠΉ Ρ€Π°Π±ΠΎΡ‚Ρ‹

Π’Π·Π²Π΅ΡˆΠ΅Π½Π½Ρ‹ΠΉ Ρ†Π΅Π½Ρ‚Ρ€ΠΎΠΈΠ΄Π½Ρ‹ΠΉ ΠΌΠ΅Ρ‚ΠΎΠ΄ (ΠΌΠ΅Ρ‚ΠΎΠ΄ взвСшСнного ΠΏΠΎΠΏΠ°Ρ€Π½ΠΎΠ³ΠΎ Ρ†Π΅Π½Ρ‚Ρ€ΠΎΠΈΠ΄Π½ΠΎΠ³ΠΎ усрСднСния) Π­Ρ‚ΠΎΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΏΠΎΡ…ΠΎΠΆ Π½Π° ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΠΉ, Ρ€Π°Π·Π½ΠΈΡ†Π° состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ для ΡƒΡ‡Π΅Ρ‚Π° Ρ€Π°Π·Π½ΠΈΡ†Ρ‹ ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ€Π°Π·ΠΌΠ΅Ρ€Π°ΠΌΠΈ кластСров (числС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π² Π½ΠΈΡ…), ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ вСса. Π­Ρ‚ΠΎΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡Ρ‚ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π² ΡΠ»ΡƒΡ‡Π°ΡΡ…, Ссли ΠΈΠΌΠ΅ΡŽΡ‚ΡΡ прСдполоТСния ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ сущСствСнных ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠΉ Π² Ρ€Π°Π·ΠΌΠ΅Ρ€Π°Ρ… кластСров. Π­Ρ‚ΠΎ расстояниС рассчитываСтся ΠΊΠ°ΠΊ… Π§ΠΈΡ‚Π°Ρ‚ΡŒ Π΅Ρ‰Ρ‘ >

ΠœΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠ° провСдСния иСрархичСского кластСрного Π°Π½Π°Π»ΠΈΠ·Π° (Ρ€Π΅Ρ„Π΅Ρ€Π°Ρ‚, курсовая, Π΄ΠΈΠΏΠ»ΠΎΠΌ, ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½Π°Ρ)

ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ кластСрного Π°Π½Π°Π»ΠΈΠ·Π° ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ кластСрного Π°Π½Π°Π»ΠΈΠ·Π° ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ Π½Π° Π΄Π²Π΅ Π³Ρ€ΡƒΠΏΠΏΡ‹:

  • Β· иСрархичСскиС;
  • Β· нСиСрархичСскиС.

КаТдая ΠΈΠ· Π³Ρ€ΡƒΠΏΠΏ Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ мноТСство ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΎΠ² ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ².

Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ кластСрного Π°Π½Π°Π»ΠΈΠ·Π°, Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ для ΠΎΠ΄Π½ΠΈΡ… ΠΈ Ρ‚Π΅Ρ… ΠΆΠ΅ Π΄Π°Π½Π½Ρ‹Ρ…. Π­Ρ‚ΠΎ считаСтся Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΌ явлСниСм.

Π˜Π΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ кластСрного Π°Π½Π°Π»ΠΈΠ·Π° Π‘ΡƒΡ‚ΡŒ иСрархичСской кластСризации состоит Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΌ объСдинСнии ΠΌΠ΅Π½ΡŒΡˆΠΈΡ… кластСров Π² Π±ΠΎΠ»ΡŒΡˆΠΈΠ΅ ΠΈΠ»ΠΈ Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… кластСров Π½Π° ΠΌΠ΅Π½ΡŒΡˆΠΈΠ΅.

Π˜Π΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ Π°Π³Π»ΠΎΠΌΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ (Agglomerative Nesting, AGNES).

Π’ Π½Π°Ρ‡Π°Π»Π΅ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° всС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ кластСрами. На ΠΏΠ΅Ρ€Π²ΠΎΠΌ шагС Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΠΏΠΎΡ…ΠΎΠΆΠΈΠ΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ΡΡ Π² ΠΊΠ»Π°ΡΡ‚Π΅Ρ€. На ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… ΡˆΠ°Π³Π°Ρ… объСдинСниС продолТаСтся Π΄ΠΎ Ρ‚Π΅Ρ… ΠΏΠΎΡ€, ΠΏΠΎΠΊΠ° всС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π½Π΅ Π±ΡƒΠ΄ΡƒΡ‚ ΡΠΎΡΡ‚Π°Π²Π»ΡΡ‚ΡŒ ΠΎΠ΄ΠΈΠ½ кластСр.

Π˜Π΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ Π΄ΠΈΠ²ΠΈΠ·ΠΈΠΌΠ½Ρ‹Π΅ (Π΄Π΅Π»ΠΈΠΌΡ‹Π΅) ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ (DIvisive ANAlysis, DIANA).

Π­Ρ‚ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΡΠ²Π»ΡΡŽΡ‚ΡΡ логичСской ΠΏΡ€ΠΎΡ‚ΠΈΠ²ΠΎΠΏΠΎΠ»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒΡŽ Π°Π³Π»ΠΎΠΌΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½Ρ‹ΠΌ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌ. Π’ Π½Π°Ρ‡Π°Π»Π΅ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° всС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ°Ρ‚ ΠΎΠ΄Π½ΠΎΠΌΡƒ кластСру, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π½Π° ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… ΡˆΠ°Π³Π°Ρ… дСлится Π½Π° ΠΌΠ΅Π½ΡŒΡˆΠΈΠ΅ кластСры, Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ образуСтся ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ Ρ€Π°ΡΡ‰Π΅ΠΏΠ»ΡΡŽΡ‰ΠΈΡ… Π³Ρ€ΡƒΠΏΠΏ.

Π˜Π΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ кластСризации Ρ€Π°Π·Π»ΠΈΡ‡Π°ΡŽΡ‚ΡΡ ΠΏΡ€Π°Π²ΠΈΠ»Π°ΠΌΠΈ построСния кластСров. Π’ ΠΊΠ°Ρ‡Π΅ΡΡ‚Π²Π΅ ΠΏΡ€Π°Π²ΠΈΠ» Π²Ρ‹ΡΡ‚ΡƒΠΏΠ°ΡŽΡ‚ ΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ ΠΏΡ€ΠΈ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΈ вопроса ΠΎ «ΡΡ…оТСсти» ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΏΡ€ΠΈ ΠΈΡ… ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½Π΅Π½ΠΈΠΈ Π² Π³Ρ€ΡƒΠΏΠΏΡƒ (Π°Π³Π»ΠΎΠΌΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹) Π»ΠΈΠ±ΠΎ раздСлСния Π½Π° Π³Ρ€ΡƒΠΏΠΏΡ‹ (Π΄ΠΈΠ²ΠΈΠ·ΠΈΠΌΠ½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹).

Π˜Π΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ кластСрного Π°Π½Π°Π»ΠΈΠ·Π° ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ ΠΏΡ€ΠΈ Π½Π΅Π±ΠΎΠ»ΡŒΡˆΠΈΡ… ΠΎΠ±ΡŠΠ΅ΠΌΠ°Ρ… Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ….

ΠŸΡ€Π΅ΠΈΠΌΡƒΡ‰Π΅ΡΡ‚Π²ΠΎΠΌ иСрархичСских ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² кластСризации являСтся ΠΈΡ… Π½Π°Π³Π»ΡΠ΄Π½ΠΎΡΡ‚ΡŒ.

Π˜Π΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ связаны с ΠΏΠΎΡΡ‚Ρ€ΠΎΠ΅Π½ΠΈΠ΅ΠΌ Π΄Π΅Π½Π΄Ρ€ΠΎΠ³Ρ€Π°ΠΌΠΌ (ΠΎΡ‚ Π³Ρ€Π΅Ρ‡Π΅ΡΠΊΠΎΠ³ΠΎ dendron — «Π΄Π΅Ρ€Π΅Π²ΠΎ»), ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡΠ²Π»ΡΡŽΡ‚ΡΡ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠΌ иСрархичСского кластСрного Π°Π½Π°Π»ΠΈΠ·Π°. Π”Π΅Π½Π΄Ρ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ° описываСт Π±Π»ΠΈΠ·ΠΎΡΡ‚ΡŒ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… Ρ‚ΠΎΡ‡Π΅ΠΊ ΠΈ ΠΊΠ»Π°ΡΡ‚Π΅Ρ€ΠΎΠ² Π΄Ρ€ΡƒΠ³ ΠΊ Π΄Ρ€ΡƒΠ³Ρƒ, прСдставляСт Π² Π³Ρ€Π°Ρ„ичСском Π²ΠΈΠ΄Π΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ объСдинСния (раздСлСния) кластСров.

Π”Π΅Π½Π΄Ρ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ° (dendrogram) — дрСвовидная Π΄ΠΈΠ°Π³Ρ€Π°ΠΌΠΌΠ°, содСрТащая n ΡƒΡ€ΠΎΠ²Π½Π΅ΠΉ, ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… соотвСтствуСт ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΈΠ· ΡˆΠ°Π³ΠΎΠ² процСсса ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ укрупнСния кластСров.

Π”Π΅Π½Π΄Ρ€ΠΎΠ³Ρ€Π°ΠΌΠΌΡƒ Ρ‚Π°ΠΊΠΆΠ΅ Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ Π΄Ρ€Π΅Π²ΠΎΠ²ΠΈΠ΄Π½ΠΎΠΉ схСмой, Π΄Π΅Ρ€Π΅Π²ΠΎΠΌ объСдинСния кластСров, Π΄Π΅Ρ€Π΅Π²ΠΎΠΌ иСрархичСской структуры.

Π”Π΅Π½Π΄Ρ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ° прСдставляСт собой Π²Π»ΠΎΠΆΠ΅Π½Π½ΡƒΡŽ Π³Ρ€ΡƒΠΏΠΏΠΈΡ€ΠΎΠ²ΠΊΡƒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², которая измСняСтся Π½Π° Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… уровнях ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΈ.

БущСствуСт ΠΌΠ½ΠΎΠ³ΠΎ способов построСния Π΄Π΅Π½Π΄ΠΎΠ³Ρ€Π°ΠΌΠΌ. Π’ Π΄Π΅Π½Π΄ΠΎΠ³Ρ€Π°ΠΌΠΌΠ΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ Ρ€Π°ΡΠΏΠΎΠ»Π°Π³Π°Ρ‚ΡŒΡΡ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎ ΠΈΠ»ΠΈ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎ. ΠŸΡ€ΠΈΠΌΠ΅Ρ€ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎΠΉ Π΄Π΅Π½Π΄Ρ€ΠΎΠ³Ρ€Π°ΠΌΠΌΡ‹ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½ Π½Π° Ρ€ΠΈΡ. 13.4.

ΠšΠ²Π°Π΄Ρ€Π°Ρ‚ Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²Π° расстояния.

Для придания Π±ΠΎΠ»ΡŒΡˆΠΈΡ… вСсов Π±ΠΎΠ»Π΅Π΅ ΠΎΡ‚Π΄Π°Π»Π΅Π½Π½Ρ‹ΠΌ Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π° ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌ ΠΌΠΎΠΆΠ΅ΠΌ Π²ΠΎΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΎΠΌ Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²Π° расстояния ΠΏΡƒΡ‚Π΅ΠΌ возвСдСния Π² ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ стандартного Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²Π° расстояния.

ΠœΠ°Π½Ρ…ΡΡ‚Ρ‚Π΅Π½ΡΠΊΠΎΠ΅ расстояниС (расстояниС городских ΠΊΠ²Π°Ρ€Ρ‚Π°Π»ΠΎΠ²), Ρ‚Π°ΠΊΠΆΠ΅ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΠΎΠ΅ «Ρ…эмминговым» ΠΈΠ»ΠΈ «ΡΠΈΡ‚ΠΈ-Π±Π»ΠΎΠΊ» расстояниСм.

Π­Ρ‚ΠΎ расстояниС рассчитываСтся ΠΊΠ°ΠΊ срСднСС разностСй ΠΏΠΎ ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚Π°ΠΌ. Π’ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π΅ случаСв эта ΠΌΠ΅Ρ€Π° расстояния ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π°ΠΌ, ΠΏΠΎΠ΄ΠΎΠ±Π½Ρ‹ΠΌ расчСтам расстояния Π΅Π²ΠΊΠ»ΠΈΠ΄Π°. Однако, для этой ΠΌΠ΅Ρ€Ρ‹ влияниС ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… выбросов мСньшС, Ρ‡Π΅ΠΌ ΠΏΡ€ΠΈ использовании Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²Π° расстояния, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ здСсь ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚Ρ‹ Π½Π΅ Π²ΠΎΠ·Π²ΠΎΠ΄ΡΡ‚ся Π² ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚.

РасстояниС Π§Π΅Π±Ρ‹ΡˆΠ΅Π²Π°. Π­Ρ‚ΠΎ расстояниС стоит ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ, ΠΊΠΎΠ³Π΄Π° Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ Π΄Π²Π° ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΊΠ°ΠΊ «Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅», Ссли ΠΎΠ½ΠΈ ΠΎΡ‚Π»ΠΈΡ‡Π°ΡŽΡ‚ΡΡ ΠΏΠΎ ΠΊΠ°ΠΊΠΎΠΌΡƒ-Ρ‚ΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΈΠ·ΠΌΠ΅Ρ€Π΅Π½ΠΈΡŽ.

ΠŸΡ€ΠΎΡ†Π΅Π½Ρ‚ нСсогласия. Π­Ρ‚ΠΎ расстояниС вычисляСтся, Ссли Π΄Π°Π½Π½Ρ‹Π΅ ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹ΠΌΠΈ.

ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ объСдинСния ΠΈΠ»ΠΈ связи Когда ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ прСдставляСт собой ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΉ кластСр, расстояния ΠΌΠ΅ΠΆΠ΄Ρƒ этими ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‚ΡΡ Π²Ρ‹Π±Ρ€Π°Π½Π½ΠΎΠΉ ΠΌΠ΅Ρ€ΠΎΠΉ. Π’ΠΎΠ·Π½ΠΈΠΊΠ°Π΅Ρ‚ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ вопрос — ΠΊΠ°ΠΊ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ расстояния ΠΌΠ΅ΠΆΠ΄Ρƒ кластСрами? Π‘ΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΏΡ€Π°Π²ΠΈΠ»Π°, Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ объСдинСния ΠΈΠ»ΠΈ связи для Π΄Π²ΡƒΡ… кластСров.

ΠœΠ΅Ρ‚ΠΎΠ΄ Π±Π»ΠΈΠΆΠ½Π΅Π³ΠΎ сосСда ΠΈΠ»ΠΈ одиночная связь. Π—Π΄Π΅ΡΡŒ расстояниС ΠΌΠ΅ΠΆΠ΄Ρƒ двумя кластСрами опрСдСляСтся расстояниСм ΠΌΠ΅ΠΆΠ΄Ρƒ двумя Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ Π±Π»ΠΈΠ·ΠΊΠΈΠΌΠΈ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌΠΈ (блиТайшими сосСдями) Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… кластСрах. Π­Ρ‚ΠΎΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄ позволяСт Π²Ρ‹Π΄Π΅Π»ΡΡ‚ΡŒ кластСры сколь ΡƒΠ³ΠΎΠ΄Π½ΠΎ слоТной Ρ„ΠΎΡ€ΠΌΡ‹ ΠΏΡ€ΠΈ условии, Ρ‡Ρ‚ΠΎ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ части Ρ‚Π°ΠΊΠΈΡ… кластСров соСдинСны Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠ°ΠΌΠΈ Π±Π»ΠΈΠ·ΠΊΠΈΡ… Π΄Ρ€ΡƒΠ³ ΠΊ Π΄Ρ€ΡƒΠ³Ρƒ элСмСнтов. Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ Ρ€Π°Π±ΠΎΡ‚Ρ‹ этого ΠΌΠ΅Ρ‚ΠΎΠ΄Π° кластСры ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ΡΡ Π΄Π»ΠΈΠ½Π½Ρ‹ΠΌΠΈ «Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠ°ΠΌΠΈ» ΠΈΠ»ΠΈ «Π²ΠΎΠ»ΠΎΠΊΠ½ΠΈΡΡ‚Ρ‹ΠΌΠΈ» кластСрами, «ΡΡ†Π΅ΠΏΠ»Π΅Π½Π½Ρ‹ΠΌΠΈ вмСстС» Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ элСмСнтами, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ случайно оказались Π±Π»ΠΈΠΆΠ΅ ΠΎΡΡ‚Π°Π»ΡŒΠ½Ρ‹Ρ… Π΄Ρ€ΡƒΠ³ ΠΊ Π΄Ρ€ΡƒΠ³Ρƒ.

ΠœΠ΅Ρ‚ΠΎΠ΄ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΡƒΠ΄Π°Π»Π΅Π½Π½Ρ‹Ρ… сосСдСй ΠΈΠ»ΠΈ полная связь. Π—Π΄Π΅ΡΡŒ расстояния ΠΌΠ΅ΠΆΠ΄Ρƒ кластСрами ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‚ΡΡ наибольшим расстояниСм ΠΌΠ΅ΠΆΠ΄Ρƒ Π»ΡŽΠ±Ρ‹ΠΌΠΈ двумя ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌΠΈ Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… кластСрах (Ρ‚.Π΅. «Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΡƒΠ΄Π°Π»Π΅Π½Π½Ρ‹ΠΌΠΈ сосСдями»). ΠœΠ΅Ρ‚ΠΎΠ΄ Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ, ΠΊΠΎΠ³Π΄Π° ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ происходят ΠΈΠ· Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… «Ρ€ΠΎΡ‰». Если ΠΆΠ΅ кластСры ΠΈΠΌΠ΅ΡŽΡ‚ Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ Ρ€ΠΎΠ΄Π΅ ΡƒΠ΄Π»ΠΈΠ½Π΅Π½Π½ΡƒΡŽ Ρ„ΠΎΡ€ΠΌΡƒ ΠΈΠ»ΠΈ ΠΈΡ… Π΅ΡΡ‚СствСнный Ρ‚ΠΈΠΏ являСтся «Ρ†Π΅ΠΏΠΎΡ‡Π΅Ρ‡Π½Ρ‹ΠΌ», Ρ‚ΠΎ ΡΡ‚ΠΎΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄ Π½Π΅ ΡΠ»Π΅Π΄ΡƒΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ.

ΠœΠ΅Ρ‚ΠΎΠ΄ Π’Π°Ρ€Π΄Π° (Ward's method). Π’ ΠΊΠ°Ρ‡Π΅ΡΡ‚Π²Π΅ расстояния ΠΌΠ΅ΠΆΠ΄Ρƒ кластСрами бСрСтся прирост суммы ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΎΠ² расстояний ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π΄ΠΎ Ρ†Π΅Π½Ρ‚Ρ€ΠΎΠ² кластСров, ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌΡ‹ΠΉ Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ ΠΈΡ… ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½Π΅Π½ΠΈΡ (Ward, 1963). Π’ ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³ΠΈΡ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² кластСрного Π°Π½Π°Π»ΠΈΠ·Π° для ΠΎΡ†Π΅Π½ΠΊΠΈ расстояний ΠΌΠ΅ΠΆΠ΄Ρƒ кластСрами, здСсь ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ диспСрсионного Π°Π½Π°Π»ΠΈΠ·Π°. На ΠΊΠ°ΠΆΠ΄ΠΎΠΌ шагС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ΡΡ Ρ‚Π°ΠΊΠΈΠ΅ Π΄Π²Π° кластСра, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ приводят ΠΊ ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΠΌΡƒ ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΡŽ Ρ†Π΅Π»Π΅Π²ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ, Ρ‚. Π΅. Π²Π½ΡƒΡ‚Ρ€ΠΈΠ³Ρ€ΡƒΠΏΠΏΠΎΠ²ΠΎΠΉ суммы ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΎΠ². Π­Ρ‚ΠΎΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄ Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ Π½Π° ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½Π΅Π½ΠΈΠ΅ Π±Π»ΠΈΠ·ΠΊΠΎ располоТСнных кластСров ΠΈ «ΡΡ‚рСмится» ΡΠΎΠ·Π΄Π°Π²Π°Ρ‚ΡŒ кластСры ΠΌΠ°Π»ΠΎΠ³ΠΎ Ρ€Π°Π·ΠΌΠ΅Ρ€Π°.

ΠœΠ΅Ρ‚ΠΎΠ΄ нСвзвСшСнного ΠΏΠΎΠΏΠ°Ρ€Π½ΠΎΠ³ΠΎ срСднСго (ΠΌΠ΅Ρ‚ΠΎΠ΄ нСвзвСшСнного ΠΏΠΎΠΏΠ°Ρ€Π½ΠΎΠ³ΠΎ арифмСтичСского срСднСго — unweighted pair-group method using arithmetic averages, UPGMA (Sneath, Sokal, 1973)).

Π’ ΠΊΠ°Ρ‡Π΅ΡΡ‚Π²Π΅ расстояния ΠΌΠ΅ΠΆΠ΄Ρƒ двумя кластСрами бСрСтся срСднСС расстояниС ΠΌΠ΅ΠΆΠ΄Ρƒ всСми ΠΏΠ°Ρ€Π°ΠΌΠΈ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π² Π½ΠΈΡ…. Π­Ρ‚ΠΎΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄ слСдуСт ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ, Ссли ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ происходят ΠΈΠ· Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… «Ρ€ΠΎΡ‰», Π² ΡΠ»ΡƒΡ‡Π°ΡΡ… присутствия кластСров «Ρ†Π΅ΠΏΠΎΡ‡Π½ΠΎΠ³ΠΎ» Ρ‚ΠΈΠΏΠ°, ΠΏΡ€ΠΈ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠΈ Π½Π΅Ρ€Π°Π²Π½Ρ‹Ρ… Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΎΠ² кластСров.

ΠœΠ΅Ρ‚ΠΎΠ΄ взвСшСнного ΠΏΠΎΠΏΠ°Ρ€Π½ΠΎΠ³ΠΎ срСднСго (ΠΌΠ΅Ρ‚ΠΎΠ΄ взвСшСнного ΠΏΠΎΠΏΠ°Ρ€Π½ΠΎΠ³ΠΎ арифмСтичСского срСднСго). Π­Ρ‚ΠΎΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΏΠΎΡ…ΠΎΠΆ Π½Π° ΠΌΠ΅Ρ‚ΠΎΠ΄ нСвзвСшСнного ΠΏΠΎΠΏΠ°Ρ€Π½ΠΎΠ³ΠΎ срСднСго, Ρ€Π°Π·Π½ΠΈΡ†Π° состоит лишь Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ здСсь Π² ΠΊΠ°Ρ‡Π΅ΡΡ‚Π²Π΅ вСсового коэффициСнта ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Ρ€Π°Π·ΠΌΠ΅Ρ€ кластСра (число ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², содСрТащихся Π² ΠΊΠ»Π°ΡΡ‚Π΅Ρ€Π΅).

Π­Ρ‚ΠΎΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄ рСкомСндуСтся ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΠΌΠ΅Π½Π½ΠΎ ΠΏΡ€ΠΈ Π½Π°Π»ΠΈΡ‡ΠΈΠΈ прСдполоТСния ΠΎ ΠΊΠ»Π°ΡΡ‚Π΅Ρ€Π°Ρ… Ρ€Π°Π·Π½Ρ‹Ρ… Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΎΠ².

ΠΠ΅Π²Π·Π²Π΅ΡˆΠ΅Π½Π½Ρ‹ΠΉ Ρ†Π΅Π½Ρ‚Ρ€ΠΎΠΈΠ΄Π½Ρ‹ΠΉ ΠΌΠ΅Ρ‚ΠΎΠ΄ (ΠΌΠ΅Ρ‚ΠΎΠ΄ нСвзвСшСнного ΠΏΠΎΠΏΠ°Ρ€Π½ΠΎΠ³ΠΎ Ρ†Π΅Π½Ρ‚Ρ€ΠΎΠΈΠ΄Π½ΠΎΠ³ΠΎ усрСднСния).

Π’ ΠΊΠ°Ρ‡Π΅ΡΡ‚Π²Π΅ расстояния ΠΌΠ΅ΠΆΠ΄Ρƒ двумя кластСрами Π² ΡΡ‚ΠΎΠΌ ΠΌΠ΅Ρ‚ΠΎΠ΄Π΅ бСрСтся расстояниС ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΈΡ… Ρ†Π΅Π½Ρ‚Ρ€Π°ΠΌΠΈ тяТСсти.

Π’Π·Π²Π΅ΡˆΠ΅Π½Π½Ρ‹ΠΉ Ρ†Π΅Π½Ρ‚Ρ€ΠΎΠΈΠ΄Π½Ρ‹ΠΉ ΠΌΠ΅Ρ‚ΠΎΠ΄ (ΠΌΠ΅Ρ‚ΠΎΠ΄ взвСшСнного ΠΏΠΎΠΏΠ°Ρ€Π½ΠΎΠ³ΠΎ Ρ†Π΅Π½Ρ‚Ρ€ΠΎΠΈΠ΄Π½ΠΎΠ³ΠΎ усрСднСния) Π­Ρ‚ΠΎΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΏΠΎΡ…ΠΎΠΆ Π½Π° ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΠΉ, Ρ€Π°Π·Π½ΠΈΡ†Π° состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ для ΡƒΡ‡Π΅Ρ‚Π° Ρ€Π°Π·Π½ΠΈΡ†Ρ‹ ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ€Π°Π·ΠΌΠ΅Ρ€Π°ΠΌΠΈ кластСров (числС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π² Π½ΠΈΡ…), ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ вСса. Π­Ρ‚ΠΎΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡Ρ‚ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π² ΡΠ»ΡƒΡ‡Π°ΡΡ…, Ссли ΠΈΠΌΠ΅ΡŽΡ‚ΡΡ прСдполоТСния ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ сущСствСнных ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠΉ Π² Ρ€Π°Π·ΠΌΠ΅Ρ€Π°Ρ… кластСров.

ΠŸΠΎΠΊΠ°Π·Π°Ρ‚ΡŒ вСсь тСкст
Π—Π°ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ Ρ„ΠΎΡ€ΠΌΡƒ Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΉ Ρ€Π°Π±ΠΎΡ‚ΠΎΠΉ