ΠΡΠ³Π°Π½ΠΈΠ·Π°ΡΠΈΡ ΠΏΠΎΠΈΡΠΊΠ° ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ
ΠΡΠΆΠ½ΠΎ ΡΠ°ΠΊΠΆΠ΅ ΡΠ΅ΡΠΈΡΡ Π²ΠΎΠΏΡΠΎΡ Π½ΠΎΡΠΌΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ, ΡΠ°ΠΊ ΠΊΠ°ΠΊ Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²Π° Π΄ΠΈΡΡΠ°Π½ΡΠΈΡ, ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½Π½Π°Ρ ΠΊ Π½Π΅Π½ΠΎΡΠΌΠΈΡΠΎΠ²Π°Π½Π½ΡΠΌ Π²Π΅ΠΊΡΠΎΡΠ°ΠΌ, ΠΊΠ°ΠΊ ΠΏΡΠ°Π²ΠΈΠ»ΠΎ, Π΄Π΅Π»Π°Π΅Ρ Π»ΡΠ±ΠΎΠΉ Π±ΠΎΠ»ΡΡΠΎΠΉ Π΄ΠΎΠΊΡΠΌΠ΅Π½Ρ Π½Π΅ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠΌ Π΄Π»Ρ Π±ΠΎΠ»ΡΡΠΈΠ½ΡΡΠ²Π° Π·Π°ΠΏΡΠΎΡΠΎΠ², ΡΠ°ΠΊ ΠΊΠ°ΠΊ Π·Π°ΠΏΡΠΎΡΡ ΠΎΠ±ΡΡΠ½ΠΎ ΠΈΠΌΠ΅ΡΡ ΠΊΠΎΡΠΎΡΠΊΡΡ Π΄Π»ΠΈΠ½Ρ. ΠΠ»ΠΈΠ½Π½ΡΠ΅ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΡ Π±ΡΠ΄ΡΡ ΠΏΠΎΡ ΠΎΠΆΠΈ Π΄ΡΡΠ³ Π½Π° Π΄ΡΡΠ³Π° ΠΈΠ·-Π·Π° Π΄Π»ΠΈΠ½Ρ, Π° Π½Π΅ ΠΈΠ·-Π·Π° ΡΠ΅ΠΌΡ. ΠΠΎΡΠΈΠ½ΡΡΠ½ΠΎΠ΅ ΠΏΠΎΠ΄ΠΎΠ±ΠΈΠ΅ — ΡΡΠΎ ΠΊΠΎΡΠΈΠ½ΡΡ ΡΠ³Π»Π° ΠΌΠ΅ΠΆΠ΄Ρ Π΄Π²ΡΠΌΡ Π²Π΅ΠΊΡΠΎΡΠ°ΠΌΠΈ. ΠΠ½ΠΎ ΠΏΠΎΠΊΠ°Π·ΡΠ²Π°Π΅Ρ ΡΡ ΠΎΠ΄ΡΡΠ²ΠΎ… Π§ΠΈΡΠ°ΡΡ Π΅ΡΡ >
ΠΡΠ³Π°Π½ΠΈΠ·Π°ΡΠΈΡ ΠΏΠΎΠΈΡΠΊΠ° ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ (ΡΠ΅ΡΠ΅ΡΠ°Ρ, ΠΊΡΡΡΠΎΠ²Π°Ρ, Π΄ΠΈΠΏΠ»ΠΎΠΌ, ΠΊΠΎΠ½ΡΡΠΎΠ»ΡΠ½Π°Ρ)
ΠΠΠΠΠΠ ΠΠΠ£ΠΠ Π ΠΠ‘Π‘ΠΠ Π€Π΅Π΄Π΅ΡΠ°Π»ΡΠ½ΠΎΠ΅ Π³ΠΎΡΡΠ΄Π°ΡΡΡΠ²Π΅Π½Π½ΠΎΠ΅ Π±ΡΠ΄ΠΆΠ΅ΡΠ½ΠΎΠ΅ ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°ΡΠ΅Π»ΡΠ½ΠΎΠ΅ ΡΡΡΠ΅ΠΆΠ΄Π΅Π½ΠΈΠ΅ Π²ΡΡΡΠ΅Π³ΠΎ ΠΏΡΠΎΡΠ΅ΡΡΠΈΠΎΠ½Π°Π»ΡΠ½ΠΎΠ³ΠΎ ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΡ
" ΠΠΎΡΠΊΠΎΠ²ΡΠΊΠΈΠΉ Π³ΠΎΡΡΠ΄Π°ΡΡΡΠ²Π΅Π½Π½ΡΠΉ ΡΠ΅Ρ Π½ΠΈΡΠ΅ΡΠΊΠΈΠΉ ΡΠ½ΠΈΠ²Π΅ΡΡΠΈΡΠ΅Ρ ΡΠ°Π΄ΠΈΠΎΡΠ΅Ρ Π½ΠΈΠΊΠΈ, ΡΠ»Π΅ΠΊΡΡΠΎΠ½ΠΈΠΊΠΈ ΠΈ Π°Π²ΡΠΎΠΌΠ°ΡΠΈΠΊΠΈ"
Π Π΅ΡΠ΅ΡΠ°Ρ Π’Π΅ΠΌΠ°: «ΠΡΠ³Π°Π½ΠΈΠ·Π°ΡΠΈΡ ΠΏΠΎΠΈΡΠΊΠ° ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ»
ΠΠΎΡΠΊΠ²Π° 2012 Π³.
- ΠΠ²Π΅Π΄Π΅Π½ΠΈΠ΅
- 1. ΠΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΎΡΠ½ΠΎΠ²Π½ΡΡ ΠΊΠΎΠ½ΡΠ΅ΠΏΡΠΈΠΉ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΠΎΠ³ΠΎ ΠΏΠΎΠΈΡΠΊΠ°
- 2. ΠΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΏΠΎΠΈΡΠΊΠ° ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ
- 2.1 ΠΡΠ»Π΅Π²Π° ΠΌΠΎΠ΄Π΅Π»Ρ
- 2.2 ΠΠ΅ΠΊΡΠΎΡΠ½Π°Ρ ΠΌΠΎΠ΄Π΅Π»Ρ
- 2.3 ΠΠ΅ΡΡ ΠΏΠΎΠ΄ΠΎΠ±ΠΈΡ
- 2.4 ΠΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π²Π΅ΡΠ° ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ²
- 3. ΠΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² ΠΎΡΠ΅Π½ΠΊΠΈ ΠΊΠ°ΡΠ΅ΡΡΠ²Π° ΠΏΠΎΠΈΡΠΊΠ°
- 3.1 ΠΡΠ΅Π½ΠΊΠ° Π½Π΅ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΡΡ Π½Π°Π±ΠΎΡΠΎΠ² ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ° ΠΏΠΎΠΈΡΠΊΠ°
- 4. Π Π΅Π°Π»ΠΈΠ·Π°ΡΠΈΡ Π²Π΅ΠΊΡΠΎΡΠ½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² ΡΡΠ΅Π΄Π΅ Matlab
- 4.1 Π€ΡΠ½ΠΊΡΠΈΡ ΡΠ°ΡΡΠ΅ΡΠ° Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²ΠΎΠΉ ΠΌΠ΅ΡΡ
- 4.2 Π€ΡΠ½ΠΊΡΠΈΡ ΡΠ°ΡΡΠ΅ΡΠ° ΠΊΠΎΡΠΈΠ½ΡΡΠ½ΠΎΠΉ ΠΌΠ΅ΡΡ
- 4.3 Π Π°ΡΡΠ΅Ρ ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΡΡ ΡΠΏΠΈΡΠΊΠΎΠ² Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²
- 5. Π Π΅Π°Π»ΠΈΠ·Π°ΡΠΈΡ ΠΎΡΠ΅Π½ΠΎΠΊ ΠΊΠ°ΡΠ΅ΡΡΠ²Π° ΠΏΠΎΠΈΡΠΊΠ° Π² ΡΡΠ΅Π΄Π΅ Matlab
- 5.1 Π Π°ΡΡΠ΅Ρ ΡΠΎΡΠ½ΠΎΡΡΠΈ, ΠΏΠΎΠ»Π½ΠΎΡΡ ΠΈ F-ΠΌΠ΅ΡΡ Π² Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ ΠΎΡ ΡΠΈΡΠ»Π° Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²
- 5.2 ΠΠΈΡΡΠΈΠ½Π³ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΡ
- 6. Π Π°ΡΡΠ΅Ρ ΠΈΠ½ΡΠ΅ΡΠΏΠΎΠ»ΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠΉ ΡΡΠ΅Π΄Π½Π΅ΠΉ ΡΠΎΡΠ½ΠΎΡΡΠΈ, ROC-ΠΊΡΠΈΠ²ΠΎΠΉ ΠΈ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ ΡΠΎΡΠ½ΠΎΡΡΠΈ ΠΎΡ ΠΏΠΎΠ»Π½ΠΎΡΡ
- 6.1 Π€ΡΠ½ΠΊΡΠΈΡ Π΄Π»Ρ ΡΠ°ΡΡΠ΅ΡΠ° Π·Π½Π°ΡΠ΅Π½ΠΈΠΉ ΠΊΡΠΈΠ²ΠΎΠΉ ΡΠΎΡΠ½ΠΎΡΡΠΈ Π² Π·Π°Π΄Π°Π½Π½ΡΡ ΡΠΎΡΠΊΠ°Ρ
- 6.2 ΠΠΈΡΡΠΈΠ½Π³ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΡ
- 7. Π Π°ΡΡΠ΅Ρ ΡΡΠ΅Π΄Π½Π΅Π³ΠΎ Π·Π½Π°ΡΠ΅Π½ΠΈΡ ΡΡΠ΅Π΄Π½Π΅ΠΉ ΡΠΎΡΠ½ΠΎΡΡΠΈ
- 7.1 ΠΠΈΡΡΠΈΠ½Π³ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΡ
- ΠΡΠ²ΠΎΠ΄Ρ
- Π‘ΠΏΠΈΡΠΎΠΊ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌΠΎΠΉ Π»ΠΈΡΠ΅ΡΠ°ΡΡΡΡ
Π¦Π΅Π»ΠΈ ΠΏΡΠΎΡ ΠΎΠΆΠ΄Π΅Π½ΠΈΡ ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΡΡΠ²Π΅Π½Π½ΠΎΠΉ ΠΏΡΠ°ΠΊΡΠΈΠΊΠΈ:
Β· ΠΈΠ·ΡΡΠ΅Π½ΠΈΠ΅ ΠΎΡΠ½ΠΎΠ²Π½ΡΡ ΠΊΠΎΠ½ΡΠ΅ΠΏΡΠΈΠΉ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΠΎΠ³ΠΎ ΠΏΠΎΠΈΡΠΊΠ°;
Β· ΡΠ°ΡΡΠΌΠΎΡΡΠ΅Π½ΠΈΠ΅ Π±Π°Π·ΠΎΠ²ΡΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΏΠΎΠΈΡΠΊΠ° ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ;
Β· ΡΠ°ΡΡΠΌΠΎΡΡΠ΅Π½ΠΈΠ΅ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² ΠΎΡΠ΅Π½ΠΊΠΈ ΠΊΠ°ΡΠ΅ΡΡΠ²Π° ΠΏΠΎΠΈΡΠΊΠ° ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ;
Β· ΠΏΡΠΈΠΎΠ±ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ ΠΏΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΡ Π½Π°Π²ΡΠΊΠΎΠ² ΠΏΠΎ ΡΠ΅Π°Π»ΠΈΠ·Π°ΡΠΈΠΈ ΠΈΠ·ΡΡΠ΅Π½Π½ΡΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΈ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² Π² ΡΡΠ΅Π΄Π΅ Matlab.
1. ΠΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΎΡΠ½ΠΎΠ²Π½ΡΡ ΠΊΠΎΠ½ΡΠ΅ΠΏΡΠΈΠΉ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΠΎΠ³ΠΎ ΠΏΠΎΠΈΡΠΊΠ°
ΠΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΡΠΉ ΠΏΠΎΠΈΡΠΊ Π·Π°Π½ΠΈΠΌΠ°Π΅ΡΡΡ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ΠΌ, Ρ ΡΠ°Π½Π΅Π½ΠΈΠ΅ΠΌ, ΠΎΡΠ³Π°Π½ΠΈΠ·Π°ΡΠΈΠ΅ΠΉ ΠΈ ΠΎΠ±Π΅ΡΠΏΠ΅ΡΠ΅Π½ΠΈΠ΅ΠΌ Π΄ΠΎΡΡΡΠΏΠ° ΠΊ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΡΠΌ ΠΎΠ±ΡΠ΅ΠΊΡΠ°ΠΌ. ΠΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ ΠΈ ΠΎΡΠ³Π°Π½ΠΈΠ·Π°ΡΠΈΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ Π΄ΠΎΠ»ΠΆΠ½Ρ ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²Π»ΡΡΡ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ ΡΠ΄ΠΎΠ±Π½ΡΠΉ Π΄ΠΎΡΡΡΠΏ ΠΊ ΠΈΠ½ΡΠ΅ΡΠ΅ΡΡΡΡΠ΅ΠΉ Π΅Π³ΠΎ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ. ΠΡΠ½ΠΎΠ²Π½ΠΎΠΉ ΡΠ΅Π»ΡΡ ΡΠΈΡΡΠ΅ΠΌΡ ΠΠ ΡΠ²Π»ΡΠ΅ΡΡΡ ΠΏΠΎΠ»ΡΡΠ΅Π½ΠΈΠ΅ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ, ΠΊΠΎΡΠΎΡΠ°Ρ ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΠΏΠΎΠ»Π΅Π·Π½Π° ΠΈ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½Π° Π΄Π»Ρ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ, Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ Π΅Π³ΠΎ Π·Π°ΠΏΡΠΎΡΠ°. ΠΡΠ½ΠΎΠ²Π½ΠΎΠΉ Π°ΠΊΡΠ΅Π½Ρ Π΄Π΅Π»Π°Π΅ΡΡΡ Π½Π° ΡΠΎΠΌ, ΡΡΠΎ ΠΏΠΎΠΈΡΠΊ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ — ΡΡΠΎ Π½Π΅ ΠΏΠΎΠΈΡΠΊ Π΄Π°Π½Π½ΡΡ .
ΠΠΎΠΈΡΠΊ Π΄Π°Π½Π½ΡΡ — ΡΡΠΎ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΠ΅ Π²ΡΠ΅Ρ ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ², ΠΊΠΎΡΠΎΡΡΠ΅ ΡΠ΄ΠΎΠ²Π»Π΅ΡΠ²ΠΎΡΡΡΡ ΡΠ΅ΡΠΊΠΎ ΠΎΠΏΡΠ΅Π΄Π΅Π»Π΅Π½Π½ΡΠΌ ΡΡΠ»ΠΎΠ²ΠΈΡΠΌ, Π²ΡΡΠ°ΠΆΠ΅Π½Π½ΡΠΌ ΡΠ΅ΡΠ΅Π· ΡΠ·ΡΠΊ Π·Π°ΠΏΡΠΎΡΠΎΠ². ΠΠ°Π½Π½ΡΠ΅ ΠΈΠΌΠ΅ΡΡ ΡΡΡΠΎΠ³ΠΎ ΠΎΠΏΡΠ΅Π΄Π΅Π»Π΅Π½Π½ΡΡ ΡΡΡΡΠΊΡΡΡΡ ΠΈ ΡΠ΅ΠΌΠ°Π½ΡΠΈΠΊΡ. ΠΡΠΏΠΎΠ»ΡΠ·ΡΡΡΡΡ ΡΠΎΡΠΌΠ°Π»ΡΠ½ΡΠ΅ ΡΠ·ΡΠΊΠΈ Π·Π°ΠΏΡΠΎΡΠΎΠ² (Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, ΡΠ΅Π³ΡΠ»ΡΡΠ½ΡΠ΅ Π²ΡΡΠ°ΠΆΠ΅Π½ΠΈΡ). Π Π΅Π·ΡΠ»ΡΡΠ°ΡΡ ΠΎΠ±ΡΠ·Π°Π½Ρ Π±ΡΡΡ ΡΠΎΡΠ½ΡΠΌΠΈ, ΠΎΡΠΈΠ±ΠΊΠΈ Π½Π΅ Π΄ΠΎΠΏΡΡΠΊΠ°ΡΡΡΡ. ΠΠ΅Ρ ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½ΠΈΡ ΠΏΠΎ ΠΎΡΠ½ΠΎΡΠ΅Π½ΠΈΡ ΠΊ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΠΎΠΉ ΠΏΠΎΡΡΠ΅Π±Π½ΠΎΡΡΠΈ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ.
ΠΠΎΠΈΡΠΊ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ — ΡΡΠΎ Π½Π°Ρ ΠΎΠΆΠ΄Π΅Π½ΠΈΠ΅ ΠΌΠ°ΡΠ΅ΡΠΈΠ°Π»ΠΎΠ² (ΠΎΠ±ΡΡΠ½ΠΎ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²) Π½Π΅ΡΡΡΡΠΊΡΡΡΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΏΡΠΈΡΠΎΠ΄Ρ (ΠΎΠ±ΡΡΠ½ΠΎ ΡΠ΅ΠΊΡΡ), ΠΊΠΎΡΠΎΡΡΠ΅ ΡΠ΄ΠΎΠ²Π»Π΅ΡΠ²ΠΎΡΡΡΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΠΎΠΉ ΠΏΠΎΡΡΠ΅Π±Π½ΠΎΡΡΠΈ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ Π±ΠΎΠ»ΡΡΠΈΠ΅ ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΠΈ (ΠΎΠ±ΡΡΠ½ΠΎ Ρ ΡΠ°Π½ΡΡΠΈΠ΅ΡΡ Π½Π° ΠΌΠ½ΠΎΠ³ΠΈΡ ΠΊΠΎΠΌΠΏΡΡΡΠ΅ΡΠ°Ρ ). ΠΠ°ΠΏΡΠΎΡΡ ΠΎΠ±ΡΡΠ½ΠΎ Π½Π΅ ΡΡΡΡΠΊΡΡΡΠΈΡΠΎΠ²Π°Π½Ρ (Π·Π°ΠΏΡΠΎΡΡ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΠΊΠ»ΡΡΠ΅Π²ΡΡ ΡΠ»ΠΎΠ², ΠΊΠΎΠ½ΡΠ΅ΠΊΡΡΠ°, ΡΡΠ°Π·, Π·Π°ΠΏΡΠΎΡΡ Π½Π° Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠΌ ΡΠ·ΡΠΊΠ΅). ΠΡΠΈΠ±ΠΊΠΈ Π² ΠΏΠΎΠ»ΡΡΠ΅Π½Π½ΡΡ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ°Ρ Π΄ΠΎΠΏΡΡΡΠΈΠΌΡ. ΠΠΎΠ½ΡΠ΅ΠΏΡΠΈΡ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΡΡΠΈ ΠΏΠΎ ΠΎΡΠ½ΠΎΡΠ΅Π½ΠΈΡ ΠΊ ΠΏΠΎΡΡΠ΅Π±Π½ΠΎΡΡΡΠΌ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ Π·Π°Π½ΠΈΠΌΠ°Π΅Ρ ΡΠ΅Π½ΡΡΠ°Π»ΡΠ½ΠΎΠ΅ ΠΌΠ΅ΡΡΠΎ:
Β· ΠΡΡΡΠ΅ΡΡΠ²Π»ΡΠ΅ΡΡΡ ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ ΠΏΠΎ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΡΡΠΈ.
Β· ΠΠ΅ ΡΡΠ½Π° «ΡΡΠ΅ΠΏΠ΅Π½Ρ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΡΡΠΈ», ΠΊΠΎΡΠΎΡΠΎΠΉ Π΄ΠΎΠ²ΠΎΠ»Π΅Π½ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ. ΠΠ»Ρ ΡΠΈΡΡΠ΅ΠΌΡ ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ Π½Π΅ΠΈΠ·Π²Π΅ΡΡΠ½ΠΎ ΡΡΠΎ ΡΠ²Π»ΡΠ΅ΡΡΡ Π΄Π»Ρ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ Π±ΠΎΠ»Π΅Π΅ Π²Π°ΠΆΠ½ΡΠΌ — ΡΠΎΡΠ½ΠΎΡΡΡ ΠΈΠ»ΠΈ ΠΏΠΎΠ»Π½ΠΎΡΠ°.
Β· Π Π°Π½ΠΆΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ Π½Π°ΡΠΈΠ½Π°ΡΡ Ρ Π½Π°ΡΠ°Π»Π° ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ ΡΠΏΠΈΡΠΊΠ° ΠΈ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΡ Π΅Π³ΠΎ, ΠΏΠΎΠΊΠ° ΠΎΠ½ Π½Π΅ ΡΠ΄ΠΎΠ²Π»Π΅ΡΠ²ΠΎΡΠΈΡ ΡΠ²ΠΎΠΈ ΠΏΠΎΡΡΠ΅Π±Π½ΠΎΡΡΠΈ.
ΠΠΎΠ΄Π΅Π»Ρ ΠΏΠΎΠΈΡΠΊΠ° ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΠΎΠΏΡΠ΅Π΄Π΅Π»Π΅Π½Π° ΠΊΠ°ΠΊ:
Π³Π΄Π΅
D — Π½Π°Π±ΠΎΡ Π»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΡ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠΉ Π΄Π»Ρ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² Π² ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΠΈ.
Q — Π½Π°Π±ΠΎΡ Π»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΡ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠΉ Π΄Π»Ρ Π½ΡΠΆΠ΄ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ (Π·Π°ΠΏΡΠΎΡΠΎΠ²).
— ΡΡΠ½ΠΊΡΠΈΡ ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½ΠΈΡ, ΡΠ²ΡΠ·ΡΠ²Π°ΡΡΠ°Ρ Π΄Π΅ΠΉΡΡΠ²ΠΈΡΠ΅Π»ΡΠ½ΠΎΠ΅ ΡΠΈΡΠ»ΠΎ Ρ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ΠΌ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ° dj Π΄Π»Ρ Π·Π°ΠΏΡΠΎΡΠ° qi. Π’Π°ΠΊΠΎΠΉ ΡΠ΅ΠΉΡΠΈΠ½Π³ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΠ΅Ρ ΠΏΠΎΡΡΠ΄ΠΎΠΊ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² ΠΏΠΎ ΠΎΡΠ½ΠΎΡΠ΅Π½ΠΈΡ ΠΊ Π·Π°ΠΏΡΠΎΡΡ qi.
Π Π΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΡΡΡ:
Β· Π‘ΡΠ±ΡΠ΅ΠΊΡΠΈΠ²Π½Π°: Π΄Π²Π° ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ ΠΌΠΎΠ³ΡΡ ΠΈΠΌΠ΅ΡΡ ΠΎΠ΄Π½ΠΈ ΠΈ ΡΠ΅ ΠΆΠ΅ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΡΠ΅ ΠΏΠΎΡΡΠ΅Π±Π½ΠΎΡΡΠΈ, Π½ΠΎ ΠΏΠΎ-ΡΠ°Π·Π½ΠΎΠΌΡ ΠΎΡΠ΅Π½ΠΈΠ²Π°ΡΡ ΠΎΠ΄Π½ΠΈ ΠΈ ΡΠ΅ ΠΆΠ΅ Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΠ΅ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΡ.
Β· ΠΠΈΠ½Π°ΠΌΠΈΡΠ½Π° Π² ΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π΅ ΠΈ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ. ΠΠ°ΠΉΠ΄Π΅Π½Π½ΡΠ΅ ΠΈ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½Π½ΡΠ΅ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΡ ΠΌΠΎΠ³ΡΡ ΠΏΠΎΠ²Π»ΠΈΡΡΡ Π½Π° Π΅Π³ΠΎ ΠΎΡΠ΅Π½ΠΊΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ², ΠΊΠΎΡΠΎΡΡΠ΅ Π±ΡΠ΄ΡΡ ΠΏΠΎΠΊΠ°Π·Π°Π½Ρ ΠΏΠΎΠ·Π΄Π½Π΅Π΅. Π Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ ΠΎΡ ΡΠ²ΠΎΠ΅Π³ΠΎ ΡΠΎΡΡΠΎΡΠ½ΠΈΡ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ ΠΌΠΎΠΆΠ΅Ρ ΠΏΠΎ-ΡΠ°Π·Π½ΠΎΠΌΡ ΠΎΡΠ΅Π½ΠΈΠ²Π°ΡΡ ΠΎΠ΄ΠΈΠ½ ΠΈ ΡΠΎΡ ΠΆΠ΅ Π΄ΠΎΠΊΡΠΌΠ΅Π½Ρ Π΄Π»Ρ ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΈ ΡΠΎΠ³ΠΎ ΠΆΠ΅ Π·Π°ΠΏΡΠΎΡΠ°.
Β· ΠΠ½ΠΎΠ³ΠΎΠ³ΡΠ°Π½Π½Π°: ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΡΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ° ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΠ΅ΡΡΡ Π½Π΅ ΡΠΎΠ»ΡΠΊΠΎ ΡΠ΅ΠΌΠΎΠΉ, Π½ΠΎ ΠΈ Π°Π²ΡΠΎΡΠΈΡΠ΅ΡΠ½ΠΎΡΡΡΡ, ΡΠΏΠ΅ΡΠΈΡΠΈΡΠ½ΠΎΡΡΡΡ, ΠΏΠΎΠ»Π½ΠΎΡΠΎΠΉ, Π½ΠΎΠ²ΠΈΠ·Π½ΠΎΠΉ, ΡΡΠ½ΠΎΡΡΡΡ ΠΈ Ρ. ΠΏ.
Β· ΠΠ΅ΠΈΠ·Π²Π΅ΡΡΠ½Π° ΡΠΈΡΡΠ΅ΠΌΠ΅ Π΄ΠΎ ΠΎΡΠ΅Π½ΠΊΠΈ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ. Π‘ΠΈΡΡΠ΅ΠΌΠ° ΡΠ³Π°Π΄ΡΠ²Π°Π΅Ρ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΡΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² ΠΏΠΎ ΠΎΡΠ½ΠΎΡΠ΅Π½ΠΈΡ ΠΊ Π΄Π°Π½Π½ΠΎΠΌΡ Π·Π°ΠΏΡΠΎΡΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΡΠ°ΡΡΠ΅ΡΠ°, ΠΊΠΎΡΠΎΡΠ°Ρ Π·Π°Π²ΠΈΡΠΈΡ ΠΎΡ ΠΏΡΠΈΠ½ΡΡΠΎΠΉ IRM (Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, Π±ΡΠ»Π΅Π²Π°, Π²Π΅ΡΠΎΡΡΠ½ΠΎΡΡΠ½Π°Ρ, Π²Π΅ΠΊΡΠΎΡΠ½Π°Ρ).
2. ΠΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΏΠΎΠΈΡΠΊΠ° ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ
ΠΠΎΠ΄Π΅Π»ΠΈ ΠΏΠΎΠΈΡΠΊΠ° Π½Π°Π·Π½Π°ΡΠ°ΡΡ ΠΌΠ΅ΡΡ ΡΡ ΠΎΠ΄ΡΡΠ²Π° ΠΌΠ΅ΠΆΠ΄Ρ Π·Π°ΠΏΡΠΎΡΠΎΠΌ ΠΈ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠΌ. ΠΠ±ΡΠ°Ρ ΠΈΠ΄Π΅Ρ: ΡΠ΅ΠΌ ΡΠ°ΡΠ΅ ΡΠ΅ΡΠΌΠΈΠ½Ρ Π½Π°Ρ ΠΎΠ΄ΡΡΡΡ ΠΎΠ΄Π½ΠΎΠ²ΡΠ΅ΠΌΠ΅Π½Π½ΠΎ Π² Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ΅ ΠΈ Π² Π·Π°ΠΏΡΠΎΡΠ΅, ΡΠ΅ΠΌ Π±ΠΎΠ»Π΅Π΅ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠΌ ΡΡΠΈΡΠ°Π΅ΡΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½Ρ ΠΏΠΎ ΠΎΡΠ½ΠΎΡΠ΅Π½ΠΈΡ ΠΊ Π·Π°ΠΏΡΠΎΡΡ. Π‘ΡΡΠ°ΡΠ΅Π³ΠΈΡ ΠΏΠΎΠΈΡΠΊΠ° — ΡΡΠΎ Π°Π»Π³ΠΎΡΠΈΡΠΌ, ΠΊΠΎΡΠΎΡΡΠΉ ΠΏΡΠΈΠ½ΠΈΠΌΠ°Π΅Ρ Π·Π°ΠΏΡΠΎΡ q ΠΈ Π½Π°Π±ΠΎΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² d1, d2,…, dN ΠΈ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΠ΅Ρ ΠΊΠΎΡΡΡΠΈΡΠΈΠ΅Π½Ρ ΠΏΠΎΠ΄ΠΎΠ±ΠΈΡ SC (q, dj) Π΄Π»Ρ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΈΠ· Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² 1? j?N. ΠΠ»Π°ΡΡΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΠ: Π±ΡΠ»Π΅Π²Π°, Π²Π΅ΡΠΎΡΡΠ½ΠΎΡΡΠ½Π°Ρ, Π²Π΅ΠΊΡΠΎΡΠ½Π°Ρ.
ΠΠ°ΠΆΠ΄ΡΠΉ Π΄ΠΎΠΊΡΠΌΠ΅Π½Ρ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΠ΅ΡΡΡ Π½Π°Π±ΠΎΡΠΎΠΌ ΠΊΠ»ΡΡΠ΅Π²ΡΡ ΡΠ»ΠΎΠ², Π½Π°Π·ΡΠ²Π°Π΅ΠΌΡΡ ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΡΠΌΠΈ ΡΠ΅ΡΠΌΠΈΠ½Π°ΠΌΠΈ. ΠΠ½Π΄Π΅ΠΊΡΠ½ΡΠ΅ ΡΠ΅ΡΠΌΠΈΠ½Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡΡΡΡ Π΄Π»Ρ ΠΈΠ½Π΄Π΅ΠΊΡΠΈΡΠΎΠ²Π°Π½ΠΈΡ ΠΈ ΠΎΠ±ΠΎΠ±ΡΠ΅Π½ΠΈΡ ΡΠΎΠ΄Π΅ΡΠΆΠΈΠΌΠΎΠ³ΠΎ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°. Π Π°Π·Π»ΠΈΡΠ½ΡΠ΅ ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΡΠ΅ ΡΠ΅ΡΠΌΠΈΠ½Ρ ΠΎΡΠ»ΠΈΡΠ°ΡΡΡΡ ΠΏΠΎ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΡΡΠΈ, ΠΊΠΎΠ³Π΄Π° ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡΡΡΡ Π΄Π»Ρ ΠΎΠΏΠΈΡΠ°Π½ΠΈΡ ΡΠΎΠ΄Π΅ΡΠΆΠΈΠΌΠΎΠ³ΠΎ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°. ΠΡΠΎΡ ΡΡΡΠ΅ΠΊΡ ΠΎΡΡΠ°ΠΆΠ°Π΅ΡΡΡ Π² Π½Π°Π·Π½Π°ΡΠ΅Π½ΠΈΠΈ ΡΠΈΡΠ»ΠΎΠ²ΡΡ Π²Π΅ΡΠΎΠ² ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡ ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΠΎΠΌΡ ΡΠ΅ΡΠΌΠΈΠ½Ρ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°.
ΠΡΡΡΡ ti — ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΡΠΉ ΡΠ΅ΡΠΌΠΈΠ½, dj — Π΄ΠΎΠΊΡΠΌΠ΅Π½Ρ, Π° wi, j?0 — Π²Π΅Ρ, ΡΠ²ΡΠ·Π°Π½Π½ΡΠΉ Ρ ΠΏΠ°ΡΠΎΠΉ (ti, dj). wi, j ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΠ΅Ρ ΠΊΠ°ΡΠ΅ΡΡΠ²ΠΎ ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΠΎΠ³ΠΎ ΡΠ΅ΡΠΌΠΈΠ½Π° Π΄Π»Ρ ΠΎΠΏΠΈΡΠ°Π½ΠΈΡ ΡΠΌΡΡΠ»ΠΎΠ²ΠΎΠ³ΠΎ ΡΠΎΠ΄Π΅ΡΠΆΠ°Π½ΠΈΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°. ΠΠ°ΠΆΠ΄ΡΠΉ Π΄ΠΎΠΊΡΠΌΠ΅Π½Ρ ΡΠ²ΡΠ·Π°Π½ Ρ Π²Π΅ΠΊΡΠΎΡΠΎΠΌ ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ²:
wi, j=g (dj), Π³Π΄Π΅ g — ΡΡΠΎ ΡΡΠ½ΠΊΡΠΈΡ, ΠΊΠΎΡΠΎΡΠ°Ρ Π²ΡΡΠΈΡΠ»ΡΠ΅Ρ Π²Π΅Ρ ΡΠ΅ΡΠΌΠΈΠ½Π° ti Π² Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ΅ dj (wi, j=0 ΠΎΠ±ΠΎΠ·Π½Π°ΡΠ°Π΅Ρ ΡΠ΅ΡΠΌΠΈΠ½ ti, ΠΊΠΎΡΠΎΡΡΠΉ Π½Π΅ ΠΏΠΎΡΠ²Π»ΡΠ΅ΡΡΡ Π² dj) ΠΈ M — ΡΡΠΎ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ².
ΠΠ΅ΡΠ° ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ², ΠΊΠ°ΠΊ ΠΏΡΠ°Π²ΠΈΠ»ΠΎ, ΠΏΡΠ΅Π΄ΠΏΠΎΠ»Π°Π³Π°ΡΡΡΡ Π½Π΅Π·Π°Π²ΠΈΡΠΈΠΌΡΠΌΠΈ Π΄ΡΡΠ³ ΠΎΡ Π΄ΡΡΠ³Π°. ΠΡΠΎ ΠΎΠ·Π½Π°ΡΠ°Π΅Ρ, ΡΡΠΎ Π·Π½Π°Π½ΠΈΡ ΠΎ Π²Π΅ΡΠ΅ wi, j, ΡΠ²ΡΠ·Π°Π½Π½ΠΎΠΌ Ρ ΠΏΠ°ΡΠΎΠΉ (ti, dj), Π½ΠΈΡΠ΅Π³ΠΎ Π½Π΅ Π³ΠΎΠ²ΠΎΡΡΡ Π½Π°ΠΌ ΠΎ Π²Π΅ΡΠ΅ wi+1,j ΡΠ²ΡΠ·Π°Π½Π½ΠΎΠΌ Ρ ΠΏΠ°ΡΠΎΠΉ (ti+1, dj). ΠΡΠΎ ΡΠ²Π»ΡΠ΅ΡΡΡ ΡΠΏΡΠΎΡΠ΅Π½ΠΈΠ΅ΠΌ, ΠΏΠΎΡΠΎΠΌΡ ΡΡΠΎ Π²Ρ ΠΎΠΆΠ΄Π΅Π½ΠΈΡ ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ² Π² Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ΅ Π²Π·Π°ΠΈΠΌΠΎΡΠ²ΡΠ·Π°Π½Ρ. ΠΠΎΠ»Π΅Π΅ ΠΏΠΎΠ·Π΄Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΠ (LSI, pLSA, LDA) Π² ΡΠ²Π½ΠΎΠΌ Π²ΠΈΠ΄Π΅ ΠΎΠ±ΡΠ°ΡΠ°ΡΡΡΡ ΠΊ ΠΊΠΎΡΡΠ΅Π»ΡΡΠΈΠΈ ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ².
2.1 ΠΡΠ»Π΅Π²Π° ΠΌΠΎΠ΄Π΅Π»Ρ
ΠΡΠ»Π΅Π²Π° ΠΌΠΎΠ΄Π΅Π»Ρ ΠΏΠΎΠΈΡΠΊΠ° ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ — ΡΡΠΎ ΠΏΡΠΎΡΡΠ°Ρ ΠΏΠΎΠΈΡΠΊΠΎΠ²Π°Ρ ΠΌΠΎΠ΄Π΅Π»Ρ, ΠΎΡΠ½ΠΎΠ²Π°Π½Π½Π°Ρ Π½Π° ΡΠ΅ΠΎΡΠΈΠΈ ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ² ΠΈ Π±ΡΠ»Π΅Π²ΠΎΠΉ Π°Π»Π³Π΅Π±ΡΠ΅. ΠΠ½Π°ΡΠΈΠΌΠΎΡΡΡ ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΠΎΠ³ΠΎ ΡΠ΅ΡΠΌΠΈΠ½Π° ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½Π° Ρ ΠΏΠΎΠΌΠΎΡΡΡ Π΄Π²ΠΎΠΈΡΠ½ΠΎΠ³ΠΎ Π²Π΅ΡΠ°:
ΡΠ²ΡΠ·Π°Π½ Ρ ΠΏΠ°ΡΠΎΠΉ (ti, dj).
Rdj — Ρ Π½Π°Π±ΠΎΡΠΎΠΌ ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ² Π΄Π»Ρ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°.
Rti — Ρ Π½Π°Π±ΠΎΡΠΎΠΌ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² Π΄Π»Ρ ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΠΎΠ³ΠΎ ΡΠ΅ΡΠΌΠΈΠ½Π°.
ΠΠ°ΠΏΡΠΎΡΡ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΡΡΡΡ ΠΊΠ°ΠΊ Π»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΠ΅ Π²ΡΡΠ°ΠΆΠ΅Π½ΠΈΡ Π½Π°Π΄ ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΡΠΌΠΈ ΡΠ΅ΡΠΌΠΈΠ½Π°ΠΌΠΈ (ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ Π»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΠΎΠΏΠ΅ΡΠ°ΡΠΈΠΈ AND, OR ΠΈ NOT). ΠΠ°ΠΏΡΠΈΠΌΠ΅Ρ, Brutus AND Caesar, NOT Calpurnia. Π Π΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΡΡΡ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΠ΅ΡΡΡ Π² Π²ΠΈΠ΄Π΅ Π΄Π²ΠΎΠΈΡΠ½ΠΎΠ³ΠΎ ΡΠ²ΠΎΠΉΡΡΠ²Π° Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°:
SC (q, dj)=0 ΠΈΠ»ΠΈ SC (q, dj) = 1.
ΠΡΠΈΠΌΠ΅Ρ. ΠΡΡΡΡ Π΅ΡΡΡ ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΡ ΠΈΠ· ΡΡΠ΅Ρ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²:
d1 = [1,1,1]T
d2 = [1,0,0]T
d3 = [0,1,0]T
Π ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡΡΡΡ 3 ΡΠ΅ΡΠΌΠΈΠ½Π°. ΠΠ½ΠΎΠΆΠ΅ΡΡΠ²Π° Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ², ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΡΡΠΈΡ ΡΠ΅ΡΠΌΠΈΠ½Π°ΠΌ:
Rt1 = {d1, d2}, Rt2 = {d1, d3}, Rt3 = {d1}
Π’ΠΎΠ³Π΄Π° ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ°ΠΌΠΈ Π·Π°ΠΏΡΠΎΡΠΎΠ² Π±ΡΠ΄ΡΡ:
ΠΠ°ΠΆΠ΄ΡΠΉ Π»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΠΉ Π·Π°ΠΏΡΠΎΡ ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΠΏΠ΅ΡΠ΅ΠΏΠΈΡΠ°Π½ Π² Π΄ΠΈΠ·ΡΡΠ½ΠΊΡΠΈΠ²Π½ΠΎΠΉ Π½ΠΎΡΠΌΠ°Π»ΡΠ½ΠΎΠΉ ΡΠΎΡΠΌΠ΅. ΠΠ°ΠΏΡΠΈΠΌΠ΅Ρ:
q = ta? (tb? tc) = qdnf = (ta? tb? tc)? (ta? tb? tc)? (ta? tb? tc)
ΠΠ°ΠΆΠ΄Π°Ρ Π΄ΠΈΠ·ΡΡΠ½ΠΊΡΠΈΡ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΠ΅Ρ ΡΠΎΠ±ΠΎΠΉ ΠΈΠ΄Π΅Π°Π»ΡΠ½ΡΠΉ Π½Π°Π±ΠΎΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ². ΠΠΎΠΊΡΠΌΠ΅Π½Ρ ΡΠ΄ΠΎΠ²Π»Π΅ΡΠ²ΠΎΡΡΠ΅Ρ Π·Π°ΠΏΡΠΎΡΡ, Π΅ΡΠ»ΠΈ ΠΎΠ½ ΡΠΎΠ΄Π΅ΡΠΆΠΈΡΡΡ Π² ΡΠ΅ΡΠΌΠΈΠ½Π°Ρ Π΄ΠΈΠ·ΡΡΠ½ΠΊΡΠΈΠΈ:
qdnf = (ta? tb? tc)? (ta? tb? tc)? (ta? tb? tc)
qdnf = (1,1,1)? (1,1,0)? (1,0,0)
SC (q, dj)=
ΠΠΎΡΡΠΎΠΈΠ½ΡΡΠ²Π° Π±ΡΠ»Π΅Π²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ:
Β· ΠΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΠ΅ Π²ΡΡΠ°ΠΆΠ΅Π½ΠΈΡ ΠΈΠΌΠ΅ΡΡ ΡΠΎΡΠ½ΡΡ ΡΠ΅ΠΌΠ°Π½ΡΠΈΠΊΡ.
Β· ΠΡΠΏΠΎΠ»ΡΠ·ΡΡΡΡΡ ΡΡΡΡΠΊΡΡΡΠΈΡΠΎΠ²Π°Π½Π½ΡΠ΅ Π·Π°ΠΏΡΠΎΡΡ.
Β· ΠΠ»Ρ ΠΎΠΏΡΡΠ½ΡΡ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Π΅ΠΉ ΠΎΠ½Π° ΠΈΠ½ΡΡΠΈΡΠΈΠ²Π½Π°.
Β· ΠΡΠΎΡΡΠΎΠΉ ΠΈ Π°ΠΊΠΊΡΡΠ°ΡΠ½ΡΠΉ ΡΠΎΡΠΌΠ°Π»ΠΈΠ·ΠΌ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ» ΠΏΡΠΈΠ½ΡΡΡ Π΅Π΅ Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ ΡΠ°Π½Π½ΠΈΡ ΠΊΠΎΠΌΠΌΠ΅ΡΡΠ΅ΡΠΊΠΈΡ Π±ΠΈΠ±Π»ΠΈΠΎΠ³ΡΠ°ΡΠΈΡΠ΅ΡΠΊΠΈΡ ΡΠΈΡΡΠ΅ΠΌΠ°Ρ .
ΠΠ΅Π΄ΠΎΡΡΠ°ΡΠΊΠΈ Π±ΡΠ»Π΅Π²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ:
Β· ΠΠ΅ ΠΎΡΡΡΠ΅ΡΡΠ²Π»ΡΠ΅ΡΡΡ ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅. Π‘ΡΡΠ°ΡΠ΅Π³ΠΈΡ ΠΏΠΎΠΈΡΠΊΠ° ΠΎΡΠ½ΠΎΠ²Π°Π½Π° Π½Π° Π΄Π²ΠΎΠΈΡΠ½ΠΎΠΌ ΠΊΡΠΈΡΠ΅ΡΠΈΠΈ ΡΠ΅ΡΠ΅Π½ΠΈΡ, Ρ. Π΅. Π΄ΠΎΠΊΡΠΌΠ΅Π½Ρ ΠΏΡΠ΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅ΡΡΡ Π»ΠΈΠ±ΠΎ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠΌ, Π»ΠΈΠ±ΠΎ Π½Π΅ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠΌ.
Β· ΠΠ΅ ΠΏΡΠΎΡΡΠΎ ΠΏΠ΅ΡΠ΅Π²Π΅ΡΡΠΈ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΠΎΠ΅ ΡΡΠ΅Π±ΠΎΠ²Π°Π½ΠΈΠ΅ Π² Π»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΎΠ΅ Π²ΡΡΠ°ΠΆΠ΅Π½ΠΈΠ΅.
2.2 ΠΠ΅ΠΊΡΠΎΡΠ½Π°Ρ ΠΌΠΎΠ΄Π΅Π»Ρ
ΠΠ΅ΠΊΡΠΎΡΠ½Π°Ρ ΠΌΠΎΠ΄Π΅Π»Ρ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΠ΅Ρ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΡ ΠΈ Π·Π°ΠΏΡΠΎΡΡ Π² Π²ΠΈΠ΄Π΅ Π²Π΅ΠΊΡΠΎΡΠΎΠ² Π² ΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π΅ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ². ΠΠ½Π°ΡΠΈΠΌΠΎΡΡΡ ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΠΎΠ³ΠΎ ΡΠ΅ΡΠΌΠΈΠ½Π° ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½Π° Π²Π΅ΡΠ΅ΡΡΠ²Π΅Π½Π½ΡΠΌ Π²Π΅ΡΠΎΠΌ.
wi, j ?0 ΡΠ²ΡΠ·Π°Π½ Ρ ΠΏΠ°ΡΠΎΠΉ (ti, dj)
ΠΠ°ΠΆΠ΄ΡΠΉ Π΄ΠΎΠΊΡΠΌΠ΅Π½Ρ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ Π²Π΅ΠΊΡΠΎΡΠΎΠΌ Π² M-ΠΌΠ΅ΡΠ½ΠΎΠΌ ΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π΅, Π³Π΄Π΅ M — ΡΡΠΎ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ²
ΠΠ°ΠΆΠ΄ΡΠΉ ΡΠ΅ΡΠΌΠΈΠ½ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΠ΅Ρ ΡΠΎΠ±ΠΎΠΉ Π΅Π΄ΠΈΠ½ΠΈΡΠ½ΡΠΉ Π²Π΅ΠΊΡΠΎΡ
ΡΠΊΠ°Π·ΡΠ²Π°ΡΡΠΈΠΉ Π½Π°ΠΏΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ i-ΠΎΠΉ ΠΎΡΠΈ. ΠΠ½ΠΎΠΆΠ΅ΡΡΠ²ΠΎ Π²Π΅ΠΊΡΠΎΡΠΎΠ² ti, i=1,…M ΡΠΎΡΠΌΠΈΡΡΡΡ ΠΊΠ°Π½ΠΎΠ½ΠΈΡΠ΅ΡΠΊΠΈΠΉ Π±Π°Π·ΠΈΡ Π΄Π»Ρ Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²Π° ΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π° M. ΠΡΠ±ΠΎΠΉ Π²Π΅ΠΊΡΠΎΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ° dj ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ Π΅Π³ΠΎ ΡΠ°Π·Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅ΠΌ ΠΏΠΎ ΠΊΠ°Π½ΠΎΠ½ΠΈΡΠ΅ΡΠΊΠΎΠΌΡ Π±Π°Π·ΠΈΡΡ (ΡΠΌ. ΡΠΈΡ.1):
Π ΠΈΡΡΠ½ΠΎΠΊ 1. ΠΠ΅ΠΊΡΠΎΡΠ½ΠΎΠ΅ ΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²ΠΎ, ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½Π½ΠΎΠ΅ ΡΡΠ΅ΠΌΡ ΡΠ΅ΡΠΌΠΈΠ½Π°ΠΌΠΈ.
ΠΠΎΠΊΡΠΌΠ΅Π½ΡΡ, Π±Π»ΠΈΠ·ΠΊΠΈΠ΅ Π΄ΡΡΠ³ ΠΊ Π΄ΡΡΠ³Ρ Π² Π²Π΅ΠΊΡΠΎΡΠ½ΠΎΠΌ ΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π΅, ΠΏΠΎΡ ΠΎΠΆΠΈ Π΄ΡΡΠ³ Π½Π° Π΄ΡΡΠ³Π°. ΠΠ°ΠΏΡΠΎΡ ΡΠ°ΠΊ ΠΆΠ΅ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΠ΅ΡΡΡ Π² Π²ΠΈΠ΄Π΅ Π²Π΅ΠΊΡΠΎΡΠ°:
ΠΠΎΠ΄Π΅Π»Ρ Π²Π΅ΠΊΡΠΎΡΠ½ΠΎΠ³ΠΎ ΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π° Π²ΡΡΠΈΡΠ»ΡΠ΅Ρ ΡΡ ΠΎΠ΄ΡΡΠ²ΠΎ SC (q, dj) ΠΌΠ΅ΠΆΠ΄Ρ Π·Π°ΠΏΡΠΎΡΠΎΠΌ ΠΈ ΠΊΠ°ΠΆΠ΄ΡΠΌ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠΌ ΠΈ ΡΠΎΡΡΠ°Π²Π»ΡΠ΅Ρ ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ ΡΠΏΠΈΡΠΎΠΊ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ². ΠΠ½Π° ΠΏΡΠΈΠ½ΠΈΠΌΠ°Π΅Ρ Π²ΠΎ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΡ, ΠΊΠΎΡΠΎΡΡΠ΅ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΡΡ ΡΡΠ»ΠΎΠ²ΠΈΡΠΌ Π·Π°ΠΏΡΠΎΡΠ° Π»ΠΈΡΡ ΡΠ°ΡΡΠΈΡΠ½ΠΎ. Π Π°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ Π½Π°Π±ΠΎΡ Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² Π±ΠΎΠ»Π΅Π΅ ΡΡΡΠ΅ΠΊΡΠΈΠ²Π΅Π½ (Π»ΡΡΡΠ΅ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΠ΅Ρ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΠΎΠΉ ΠΏΠΎΡΡΠ΅Π±Π½ΠΎΡΡΠΈ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ), ΡΠ΅ΠΌ Π½Π°Π±ΠΎΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ², Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΡ Π±ΡΠ»Π΅Π²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΡΡ. Π‘ΡΡΠ΅ΡΡΠ²ΡΡΡ ΡΠ°Π·Π»ΠΈΡΠ½ΡΠ΅ ΠΌΠ΅ΡΡ, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΌΠΎΠ³ΡΡ Π±ΡΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½Ρ Π΄Π»Ρ ΠΎΡΠ΅Π½ΠΊΠΈ ΡΡ ΠΎΠ΄ΡΡΠ²Π° Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ².
2.3 ΠΠ΅ΡΡ ΠΏΠΎΠ΄ΠΎΠ±ΠΈΡ
ΠΠ΅ΡΠ° ΠΏΠΎΠ΄ΠΎΠ±ΠΈΡ ΠΌΠ΅ΠΆΠ΄Ρ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°ΠΌΠΈ Π΄ΠΎΠ»ΠΆΠ½Π° ΠΎΡΠ²Π΅ΡΠ°ΡΡ ΡΠ»Π΅Π΄ΡΡΡΠΈΠΌ ΡΡΠ΅Π±ΠΎΠ²Π°Π½ΠΈΡΠΌ:
Β· ΠΡΠ»ΠΈ d1 ΡΡΠ΄ΠΎΠΌ Ρ d2, ΡΠΎ d2 ΡΡΠ΄ΠΎΠΌ Ρ d1.
Β· ΠΡΠ»ΠΈ d1 ΡΡΠ΄ΠΎΠΌ Ρ d2, Π° d2 ΡΡΠ΄ΠΎΠΌ Ρ d3, ΡΠΎ d1 Π½Π°Ρ ΠΎΠ΄ΠΈΡΡΡ Π½Π΅Π΄Π°Π»Π΅ΠΊΠΎ ΠΎΡ d3.
Β· ΠΠ΅ ΡΡΡΠ΅ΡΡΠ²ΡΠ΅Ρ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² Π±Π»ΠΈΠΆΠ΅ ΠΊ d, ΡΠ΅ΠΌ ΡΠ°ΠΌ d.
ΠΡΠΈΠΌΠ΅ΡΡ ΠΌΠ΅Ρ ΠΏΠΎΠ΄ΠΎΠ±ΠΈΡ:
Β· ΠΠ²ΠΊΠ»ΠΈΠ΄ΠΎΠ²Π° Π΄ΠΈΡΡΠ°Π½ΡΠΈΡ.
Β· ΠΠΎΡΠΈΠ½ΡΡΠ½ΠΎΠ΅ ΠΏΠΎΠ΄ΠΎΠ±ΠΈΠ΅.
Β· Π‘ΠΊΠ°Π»ΡΡΠ½ΠΎΠ΅ ΠΏΡΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΠ΅.
Β· ΠΠ΅ΡΠ° ΠΠ°ΠΊΠΊΠ°ΡΠ°.
Β· ΠΠΎΡΡΡΠΈΡΠΈΠ΅Π½Ρ ΠΠ°ΠΉΡΠ°.
Β· ΠΠ΅ΡΠ° Π¨ΠΈΠΌΠΊΠ΅Π²ΠΈΡΠ°-Π‘ΠΈΠΌΠΏΡΠΎΠ½Π°.
ΠΠ²ΠΊΠ»ΠΈΠ΄ΠΎΠ²Π° Π΄ΠΈΡΡΠ°Π½ΡΠΈΡ — ΡΡΠΎ Π΄Π»ΠΈΠ½Π° ΡΠ°Π·Π½ΠΎΡΡΠ½ΠΎΠ³ΠΎ Π²Π΅ΠΊΡΠΎΡΠ°:
ΠΠ½Π° ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΠΏΡΠ΅ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½Π° Π² ΠΊΠΎΡΡΡΠΈΡΠΈΠ΅Π½Ρ ΠΏΠΎΠ΄ΠΎΠ±ΠΈΡ ΡΠ°Π·Π»ΠΈΡΠ½ΡΠΌΠΈ ΡΠΏΠΎΡΠΎΠ±Π°ΠΌΠΈ:
ΠΡΠΆΠ½ΠΎ ΡΠ°ΠΊΠΆΠ΅ ΡΠ΅ΡΠΈΡΡ Π²ΠΎΠΏΡΠΎΡ Π½ΠΎΡΠΌΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ, ΡΠ°ΠΊ ΠΊΠ°ΠΊ Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²Π° Π΄ΠΈΡΡΠ°Π½ΡΠΈΡ, ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½Π½Π°Ρ ΠΊ Π½Π΅Π½ΠΎΡΠΌΠΈΡΠΎΠ²Π°Π½Π½ΡΠΌ Π²Π΅ΠΊΡΠΎΡΠ°ΠΌ, ΠΊΠ°ΠΊ ΠΏΡΠ°Π²ΠΈΠ»ΠΎ, Π΄Π΅Π»Π°Π΅Ρ Π»ΡΠ±ΠΎΠΉ Π±ΠΎΠ»ΡΡΠΎΠΉ Π΄ΠΎΠΊΡΠΌΠ΅Π½Ρ Π½Π΅ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠΌ Π΄Π»Ρ Π±ΠΎΠ»ΡΡΠΈΠ½ΡΡΠ²Π° Π·Π°ΠΏΡΠΎΡΠΎΠ², ΡΠ°ΠΊ ΠΊΠ°ΠΊ Π·Π°ΠΏΡΠΎΡΡ ΠΎΠ±ΡΡΠ½ΠΎ ΠΈΠΌΠ΅ΡΡ ΠΊΠΎΡΠΎΡΠΊΡΡ Π΄Π»ΠΈΠ½Ρ. ΠΠ»ΠΈΠ½Π½ΡΠ΅ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΡ Π±ΡΠ΄ΡΡ ΠΏΠΎΡ ΠΎΠΆΠΈ Π΄ΡΡΠ³ Π½Π° Π΄ΡΡΠ³Π° ΠΈΠ·-Π·Π° Π΄Π»ΠΈΠ½Ρ, Π° Π½Π΅ ΠΈΠ·-Π·Π° ΡΠ΅ΠΌΡ. ΠΠΎΡΠΈΠ½ΡΡΠ½ΠΎΠ΅ ΠΏΠΎΠ΄ΠΎΠ±ΠΈΠ΅ — ΡΡΠΎ ΠΊΠΎΡΠΈΠ½ΡΡ ΡΠ³Π»Π° ΠΌΠ΅ΠΆΠ΄Ρ Π΄Π²ΡΠΌΡ Π²Π΅ΠΊΡΠΎΡΠ°ΠΌΠΈ. ΠΠ½ΠΎ ΠΏΠΎΠΊΠ°Π·ΡΠ²Π°Π΅Ρ ΡΡ ΠΎΠ΄ΡΡΠ²ΠΎ, Π° Π½Π΅ Π΄ΠΈΡΡΠ°Π½ΡΠΈΡ. ΠΠ»Ρ ΠΊΠΎΡΠΈΠ½ΡΡΠ½ΠΎΠ³ΠΎ ΠΏΠΎΠ΄ΠΎΠ±ΠΈΡ Π½Π΅ Π²ΡΠΏΠΎΠ»Π½ΡΠ΅ΡΡΡ Π½Π΅ΡΠ°Π²Π΅Π½ΡΡΠ²ΠΎ ΡΡΠ΅ΡΠ³ΠΎΠ»ΡΠ½ΠΈΠΊΠ°.
ΠΠΎΡΠΈΠ½ΡΡΠ½Π°Ρ ΠΌΠ΅ΡΠ° Π½ΠΎΡΠΌΠ°Π»ΠΈΠ·ΡΠ΅Ρ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ Ρ ΡΡΠ΅ΡΠΎΠΌ Π΄Π»ΠΈΠ½Ρ Π²Π΅ΠΊΡΠΎΡΠ° Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°. ΠΠ»Ρ Π΄Π²ΡΡ Π²Π΅ΠΊΡΠΎΡΠΎΠ² ΡΡ ΠΎΠ΄ΡΡΠ²ΠΎ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΠ΅ΡΡΡ ΠΈΡ Π½Π°ΠΏΡΠ°Π²Π»Π΅Π½ΠΈΡΠΌΠΈ. ΠΠ»Ρ Π½ΠΎΡΠΌΠ°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π½ΡΡ Π²Π΅ΠΊΡΠΎΡΠΎΠ² ΠΊΠΎΡΠΈΠ½ΡΡΠ½ΠΎΠ΅ ΠΏΠΎΠ΄ΠΎΠ±ΠΈΠ΅ ΡΠ°Π²Π½ΠΎ ΠΈΡ ΡΠΊΠ°Π»ΡΡΠ½ΠΎΠΌΡ ΠΏΡΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΡ.
ΠΠ΅ΡΡ ΠΏΠΎΠ΄ΠΎΠ±ΠΈΡ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΡΡΡΡ Π΄Π»Ρ Π΄Π²ΡΡ ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ»ΡΠ½ΡΡ ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ² A ΠΈ B:
ΠΠ΅ΡΠ° ΠΠ°ΠΊΠΊΠ°ΡΠ°:
ΠΠΎΡΡΡΠΈΡΠΈΠ΅Π½Ρ ΠΠ°ΠΉΡΠ°:
ΠΠ΅ΡΠ° Π¨ΠΈΠΌΠΊΠ΅Π²ΠΈΡΠ°-Π‘ΠΈΠΌΠΏΡΠΎΠ½Π°:
ΠΠ½ΠΈ ΠΌΠΎΠ³ΡΡ Π±ΡΡΡ ΡΠ°ΡΡΠΈΡΠ΅Π½Ρ Π΄Π»Ρ Π½Π΅Π΄Π²ΠΎΠΈΡΠ½ΡΡ Π²Π΅ΠΊΡΠΎΡΠΎΠ².
Π Π°ΡΡΠΈΡΠ΅Π½Π½Π°Ρ ΠΌΠ΅ΡΠ° ΠΠ°ΠΊΠΊΠ°ΡΠ°.
2.4 ΠΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π²Π΅ΡΠ° ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ²
ΠΠ°ΠΌ Π½ΡΠΆΠ½ΠΎ ΡΠ°ΡΡΠΌΠΎΡΡΠ΅ΡΡ Π΄Π²Π° Π²ΠΎΠΏΡΠΎΡΠ°. ΠΠΎ-ΠΏΠ΅ΡΠ²ΡΡ , ΠΏΡΠΈ Π΄Π²ΠΎΠΈΡΠ½ΠΎΠΌ Π½Π°Π·Π½Π°ΡΠ΅Π½ΠΈΠΈ Π²Π΅ΡΠ° ΠΏΠΎΡ ΠΎΠΆΠΈΠ΅ ΡΠ΅ΡΠΌΠΈΠ½Ρ ΡΠ°ΡΡΠΌΠ°ΡΡΠΈΠ²Π°ΡΡΡΡ ΠΏΠΎ-ΡΠ°Π·Π½ΠΎΠΌΡ. ΠΠΎ-Π²ΡΠΎΡΡΡ , Π½ΠΎΡΠΌΠ°Π»ΠΈΠ·Π°ΡΠΈΡ ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ Π½Π΅Π΄ΠΎΡΡΠ°ΡΠΎΡΠ½ΠΎΠΉ Π΄Π»Ρ ΠΊΠΎΠΌΠΏΠ΅Π½ΡΠ°ΡΠΈΠΈ ΡΠ°Π·Π½ΠΈΡΡ Π² Π΄Π»ΠΈΠ½Π°Ρ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ². ΠΠΎΠ»Π΅Π΅ Π΄Π»ΠΈΠ½Π½ΡΠΉ Π΄ΠΎΠΊΡΠΌΠ΅Π½Ρ ΠΈΠΌΠ΅Π΅Ρ Π±ΠΎΠ»ΡΡΠ΅ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΠ΅ΠΉ ΡΠΎΠ΄Π΅ΡΠΆΠ°ΡΡ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠ΅ ΠΊ Π·Π°ΠΏΡΠΎΡΡ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½ΡΡ. ΠΠΎΡΡΠΎΠΌΡ Π²Π΅Ρ ΠΈΠ½Π΄Π΅ΠΊΡΠ½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ² Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±ΡΡΡ ΠΏΡΠΎΠΏΠΎΡΡΠΈΠΎΠ½Π°Π»Π΅Π½ ΠΎΠ΄Π½ΠΎΠ²ΡΠ΅ΠΌΠ΅Π½Π½ΠΎ ΠΈΡ Π²Π°ΠΆΠ½ΠΎΡΡΠΈ Π² Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ΅ ΠΈ Π²ΠΎ Π²ΡΠ΅ΠΉ ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΠΈ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ².
ΠΠ΅Ρ wi, j ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΡΠ°ΡΡΡΠΈΡΠ°Π½ ΠΏΠΎ ΡΠ»Π΅Π΄ΡΡΡΠ΅ΠΉ ΡΠΎΡΠΌΡΠ»Π΅:
— ΡΠ°ΡΡΠΎΡΠ° ΡΠ΅ΡΠΌΠΈΠ½Π° ti Π² Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ΅ dj. ΠΠ±Π΅ΡΠΏΠ΅ΡΠΈΠ²Π°Π΅Ρ ΠΌΠ΅ΡΡ ΡΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ Ρ ΠΎΡΠΎΡΠΎ ΡΠ΅ΡΠΌΠΈΠ½ ΠΎΠΏΠΈΡΡΠ²Π°Π΅Ρ ΡΠΎΠ΄Π΅ΡΠΆΠΈΠΌΠΎΠ΅ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°.
— ΠΎΠ±ΡΠ°ΡΠ½Π°Ρ ΡΠ°ΡΡΠΎΡΠ° Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ° Π΄Π»Ρ ΡΠ΅ΡΠΌΠΈΠ½Π° ti. Π’Π΅ΡΠΌΠΈΠ½Ρ, ΠΏΠΎΡΠ²Π»ΡΡΡΠΈΠ΅ΡΡ Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°Ρ , Π½Π΅ ΠΎΡΠ΅Π½Ρ ΠΏΠΎΠ»Π΅Π·Π½Ρ Π΄Π»Ρ ΠΎΡΠ»ΠΈΡΠΈΡ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΡ ΠΎΡ Π½Π΅ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ².
ΠΠ΅Ρ ΡΠ΅ΡΠΌΠΈΠ½Π° ΡΠ²Π΅Π»ΠΈΡΠΈΠ²Π°Π΅ΡΡΡ Ρ ΡΠΎΡΡΠΎΠΌ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²Π° Π΅Π³ΠΎ Π²Ρ ΠΎΠΆΠ΄Π΅Π½ΠΈΠΉ Π² Π΄ΠΎΠΊΡΠΌΠ΅Π½Ρ ΠΈ Ρ ΡΠ΅Π΄ΠΊΠΎΡΡΡΡ ΠΏΠΎΡΠ²Π»Π΅Π½ΠΈΡ ΡΠ΅ΡΠΌΠΈΠ½Π° Π²ΠΎ Π²ΡΠ΅ΠΉ ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΠΈ.
Π§Π°ΡΡΠΎΡΠ° ΡΠ΅ΡΠΌΠΈΠ½Π° Π² Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ΅:
ΠΠ½ΠΎΠ³Π΄Π°, ΡΡΠΎΠ±Ρ ΠΏΡΠ΅Π΄ΠΎΡΠ²ΡΠ°ΡΠΈΡΡ ΡΠΌΠ΅ΡΠ΅Π½ΠΈΠ΅ Π² ΡΡΠΎΡΠΎΠ½Ρ Π±ΠΎΠ»Π΅Π΅ Π΄Π»ΠΈΠ½Π½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ², ΡΠ°ΡΡΡΠΈΡΡΠ²Π°Π΅ΡΡΡ ΠΊΠ°ΠΊ:
ΠΠΈΠ±ΠΎ ΠΏΡΠΎΡΡΠΎ:
ΠΠ±ΡΠ°ΡΠ½Π°Ρ ΡΠ°ΡΡΠΎΡΠ° Π΄Π»Ρ ΡΠ΅ΡΠΌΠΈΠ½Π°:
Π³Π΄Π΅ N — ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² Π² ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΠΈ, ni — ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ², ΡΠΎΠ΄Π΅ΡΠΆΠ°ΡΠΈΡ ti.
ΠΡΠ»ΠΎ ΠΏΡΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΎ ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²ΠΎ ΡΠ»ΡΡΡΠ΅Π½ΠΈΠΉ Π² ΡΡ Π΅ΠΌΠ΅ tfidf. Π‘Π»Π΅Π΄ΡΡΡΠ°Ρ ΡΠΎΡΠΌΡΠ»Π° Π±ΡΠ»Π° ΠΎΠΏΡΠ΅Π΄Π΅Π»Π΅Π½Π° Π² ΠΊΠ°ΡΠ΅ΡΡΠ²Π΅ Ρ ΠΎΡΠΎΡΠ΅ΠΉ ΡΠ΅Π°Π»ΠΈΠ·Π°ΡΠΈΠΈ:
ΠΠΎΡΡΠΎΠΈΠ½ΡΡΠ²Π° Π²Π΅ΠΊΡΠΎΡΠ½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ:
Β· Π‘Ρ Π΅ΠΌΠ°, ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΡΡΠ°Ρ Π²Π΅ΡΠ° ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ², ΠΏΠΎΠ²ΡΡΠ°Π΅Ρ ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΡ ΠΏΠΎΠΈΡΠΊΠ° ΠΏΠΎ ΠΎΡΠ½ΠΎΡΠ΅Π½ΠΈΡ ΠΊ Π±ΡΠ»Π΅Π²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ.
Β· Π‘ΡΡΠ°ΡΠ΅Π³ΠΈΡ ΡΠ°ΡΡΠΈΡΠ½ΠΎΠ³ΠΎ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΠΈΡ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π½Π°Ρ ΠΎΠ΄ΠΈΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΡ, ΡΠ°ΡΡΠΈΡΠ½ΠΎ ΡΠ΄ΠΎΠ²Π»Π΅ΡΠ²ΠΎΡΡΡΡΠΈΠ΅ ΡΡΠ»ΠΎΠ²ΠΈΡΠΌ Π·Π°ΠΏΡΠΎΡΠ°.
Β· Π Π°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΡΠ΅ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ ΠΏΠΎΠΈΡΠΊΠ° ΠΈ ΠΊΠΎΠ½ΡΡΠΎΠ»Ρ ΠΈΡ Π²Π΅Π»ΠΈΡΠΈΠ½Ρ.
Β· ΠΠΈΠ±ΠΊΠΎΡΡΡ ΠΈ ΠΈΠ½ΡΡΠΈΡΠΈΠ²Π½Π°Ρ Π³Π΅ΠΎΠΌΠ΅ΡΡΠΈΡΠ΅ΡΠΊΠ°Ρ ΠΈΠ½ΡΠ΅ΡΠΏΡΠ΅ΡΠ°ΡΠΈΡ.
ΠΠ΅Π΄ΠΎΡΡΠ°ΡΠΊΠΈ Π²Π΅ΠΊΡΠΎΡΠ½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ:
Β· ΠΡΠ΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ ΠΎ Π½Π΅Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ ΠΌΠ΅ΠΆΠ΄Ρ ΡΠ΅ΡΠΌΠΈΠ½Π°ΠΌΠΈ.
Β· ΠΠ΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ ΡΡΡΡΠΊΡΡΡΠΈΡΠΎΠ²Π°Π½Π½ΡΡ Π·Π°ΠΏΡΠΎΡΠΎΠ² (Π½Π΅Ρ ΠΎΠΏΠ΅ΡΠ°ΡΠΎΡΠΎΠ² OR, AND, NOT).
Β· Π’Π΅ΡΠΌΠΈΠ½Ρ ΡΠ²Π»ΡΡΡΡΡ ΠΎΡΡΠΌΠΈ (Π΄Π°ΠΆΠ΅ Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ ΡΡΠ΅ΠΌΠΌΠΈΠ½Π³Π° ΠΌΠΎΠΆΠ΅Ρ ΠΏΠΎΠ»ΡΡΠΈΡΡΡΡ Π±ΠΎΠ»Π΅Π΅ 20 000 ΠΈΠ·ΠΌΠ΅ΡΠ΅Π½ΠΈΠΉ).
3. ΠΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² ΠΎΡΠ΅Π½ΠΊΠΈ ΠΊΠ°ΡΠ΅ΡΡΠ²Π° ΠΏΠΎΠΈΡΠΊΠ°
ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΡΠΉ Π²Π΅ΠΊΡΠΎΡΠ½ΡΠΉ matlab ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠ°
ΠΠ»Π°Π²Π½ΠΎΠΉ ΠΌΠ΅ΡΠΎΠΉ ΠΊΠ°ΡΠ΅ΡΡΠ²Π° ΠΏΠΎΠΈΡΠΊΠ° ΡΠ²Π»ΡΠ΅ΡΡΡ «ΡΡΠ°ΡΡΡΠ΅» ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ. ΠΠ½ΠΎ Π·Π°Π²ΠΈΡΠΈΡ ΠΎΡ ΠΌΠ½ΠΎΠ³ΠΈΡ ΡΠ°ΠΊΡΠΎΡΠΎΠ²:
Β· Π Π΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΡΡΠΈ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠΎΠ².
Β· ΠΠΈΠ·Π°ΠΉΠ½Π° ΠΌΠ°ΠΊΠ΅ΡΠ° ΠΈΠ½ΡΠ΅ΡΡΠ΅ΠΉΡΠ° ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ.
Β· Π‘ΠΊΠΎΡΠΎΡΡΠΈ ΠΎΡΠΊΠ»ΠΈΠΊΠ°.
Β· Π¦Π΅Π»Π΅Π²ΠΎΠ³ΠΎ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΡ:
o ΠΠ΅Π±-Π΄Π²ΠΈΠΆΠΎΠΊ: ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ Π½Π°Ρ ΠΎΠ΄ΠΈΡ ΡΠΎ, ΡΡΠΎ Ρ ΠΎΡΠ΅Ρ, ΠΈ Π²ΠΎΠ·Π²ΡΠ°ΡΠ°Π΅ΡΡΡ ΠΊ Π΄Π²ΠΈΠΆΠΊΡ.
o Π‘Π°ΠΉΡ ΠΏΡΠΎΠ΄Π°ΠΆΠΈ ΠΎΠ½Π»Π°ΠΉΠ½: ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ Π½Π°Ρ ΠΎΠ΄ΠΈΡ ΡΠΎ, ΡΡΠΎ Ρ ΠΎΡΠ΅Ρ, ΠΈ Π΄Π΅Π»Π°Π΅Ρ ΠΏΠΎΠΊΡΠΏΠΊΡ.
o Π‘Π°ΠΉΡΡ ΠΏΡΠ΅Π΄ΠΏΡΠΈΡΡΠΈΠΉ, ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΉ, Π³ΠΎΡΡΠ΄Π°ΡΡΡΠ²Π°, ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΡ: Π·Π°Π±ΠΎΡΠ° ΠΎ «ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΠΈ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ» (ΠΊΠ°ΠΊ ΠΌΠ½ΠΎΠ³ΠΎ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ ΠΎΠ½ ΡΠΎΡ ΡΠ°Π½ΡΠ΅Ρ, ΠΊΠΎΠ³Π΄Π° ΠΈΡΠ΅Ρ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ).
ΠΠ°ΡΠ΅ΡΡΠ²ΠΎ ΡΠΈΡΡΠ΅ΠΌΡ Π·Π°Π²ΠΈΡΠΈΡ ΠΎΡ ΡΠΊΠΎΡΠΎΡΡΠΈ ΠΈΠ½Π΄Π΅ΠΊΡΠ°ΡΠΈΠΈ, ΡΠΊΠΎΡΠΎΡΡΠΈ ΠΏΠΎΠΈΡΠΊΠ°, Π²Π΅Π»ΠΈΡΠΈΠ½Ρ ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΠΈ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ², ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ° Π·Π°ΠΏΡΠΎΡΠΎΠ², ΡΠΊΠΎΡΠΎΡΡΠΈ ΠΏΡΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠΈ ΡΠ»ΠΎΠΆΠ½ΡΡ Π·Π°ΠΏΡΠΎΡΠΎΠ². Π§ΡΠΎΠ±Ρ ΠΈΠ·ΠΌΠ΅ΡΠΈΡΡ ΡΡΡΠ΅ΠΊΡΠΈΠ²Π½ΠΎΡΡΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΠΎΠ³ΠΎ ΠΏΠΎΠΈΡΠΊΠ°, Π½Π°ΠΌ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΡ:
Β· ΡΠ΅ΡΡΠΎΠ²Π°Ρ ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² (Π΄ΠΎΠ»ΠΆΠ½Π° ΠΈΠΌΠ΅ΡΡ ΡΠ°Π·ΡΠΌΠ½ΡΠΉ ΡΠ°Π·ΠΌΠ΅Ρ). ΠΠ΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎ ΡΡΡΠ΅Π΄Π½ΡΡΡ ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΡ, ΡΠ°ΠΊ ΠΊΠ°ΠΊ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ ΡΠΈΠ»ΡΠ½ΠΎ ΠΎΡΠ»ΠΈΡΠ°ΡΡΡΡ Π² Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ ΠΎΡ ΡΠ°Π·Π»ΠΈΡΠ½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² ΠΈ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΡΡ ΠΏΠΎΡΡΠ΅Π±Π½ΠΎΡΡΠ΅ΠΉ.
Β· ΡΠ΅ΡΡΠΎΠ²ΡΠΉ Π½Π°Π±ΠΎΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΡΡ ΠΏΠΎΡΡΠ΅Π±Π½ΠΎΡΡΠ΅ΠΉ, Π²ΡΡΠ°ΠΆΠ΅Π½Π½ΡΠΉ ΡΠ΅ΡΠ΅Π· Π·Π°ΠΏΡΠΎΡΡ,
Β· Π½Π°Π±ΠΎΡ ΠΎΡΠ΅Π½ΠΎΠΊ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΡΡΠΈ, ΠΎΠ±ΡΡΠ½ΠΎ ΡΡΠΎ Π΄Π²ΠΎΠΈΡΠ½ΠΎΠ΅ ΠΎΠ±ΠΎΠ·Π½Π°ΡΠ΅Π½ΠΈΠ΅ Π΄Π»Ρ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΏΠ°ΡΡ Π·Π°ΠΏΡΠΎΡ-Π΄ΠΎΠΊΡΠΌΠ΅Π½Ρ, ΠΏΠΎΠΊΠ°Π·ΡΠ²Π°ΡΡΠ΅Π΅ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ΅Π½ Π»ΠΈ ΡΠ΅Π·ΡΠ»ΡΡΠ°Ρ.
Π Π΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΡΡΡ ΠΎΡΠ΅Π½ΠΈΠ²Π°Π΅ΡΡΡ ΠΏΠΎ ΠΎΡΠ½ΠΎΡΠ΅Π½ΠΈΡ ΠΊ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΠΎΠΉ ΠΏΠΎΡΡΠ΅Π±Π½ΠΎΡΡΠΈ, Π° Π½Π΅ ΠΊ Π·Π°ΠΏΡΠΎΡΡ. ΠΠΎΠΊΡΠΌΠ΅Π½Ρ ΡΠ²Π»ΡΠ΅ΡΡΡ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠΌ, Π΅ΡΠ»ΠΈ ΠΎΠ½ ΠΎΡΠ½ΠΎΡΠΈΡΡΡ ΠΊ ΡΠΊΠ°Π·Π°Π½Π½ΠΎΠΉ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΠΎΠΉ ΠΏΠΎΡΡΠ΅Π±Π½ΠΎΡΡΠΈ, Π° Π½Π΅ ΠΏΡΠΎΡΡΠΎ ΡΠΎΠ΄Π΅ΡΠΆΠΈΡ Π²ΡΠ΅ ΡΠ»ΠΎΠ²Π° ΠΈΠ· Π·Π°ΠΏΡΠΎΡΠ°.
3.1 ΠΡΠ΅Π½ΠΊΠ° Π½Π΅ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΡΡ Π½Π°Π±ΠΎΡΠΎΠ² ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ° ΠΏΠΎΠΈΡΠΊΠ°
Π’ΠΎΡΠ½ΠΎΡΡΡ (P): Π΄ΠΎΠ»Ρ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² ΠΈΠ· Π²ΡΠ΅Ρ Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΡ .
P (ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠ΅|Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΠ΅) =
= #(Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΠ΅ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠ΅ ΠΎΠ±ΡΠ΅ΠΊΡΡ) / #(Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΠ΅ ΠΎΠ±ΡΠ΅ΠΊΡΡ)
ΠΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΠΈΡΡ «ΡΡΠ΅ΠΏΠ΅Π½Ρ Π½Π°Π΄Π΅ΠΆΠ½ΠΎΡΡΠΈ» ΡΠΈΡΡΠ΅ΠΌΡ. ΠΠ΅ ΡΡΠΈΡΡΠ²Π°Π΅Ρ ΠΎΠ±ΡΠ΅Π΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ².
ΠΠΎΠ»Π½ΠΎΡΠ° ®: Π΄ΠΎΠ»Ρ Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΡ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² ΠΈΠ· Π²ΡΠ΅Ρ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΡ Π² ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΠΈ.
P (Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΠ΅|ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠ΅) =
= #(Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΠ΅ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠ΅ ΠΎΠ±ΡΠ΅ΠΊΡΡ) / #(ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠ΅ ΠΎΠ±ΡΠ΅ΠΊΡΡ)
ΠΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΠΈΡΡ «ΡΡΠ΅ΠΏΠ΅Π½Ρ ΠΏΠΎΠ»Π½ΠΎΡΡ» ΡΠΈΡΡΠ΅ΠΌΡ.
Π’Π°Π±Π»ΠΈΡΠ° 1. ΠΠ±ΠΎΠ·Π½Π°ΡΠ΅Π½ΠΈΡ ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ² Π² ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΠΈ ΠΎΠ±ΡΠ°Π±Π°ΡΡΠ²Π°Π΅ΠΌΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ².
Relevant (ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠ΅) | Non-relevant (Π½Π΅ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠ΅) | ||
Retrieved (Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΠ΅) | true positive (TP) (Π²Π΅ΡΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡΠ΅Π»ΡΠ½ΡΠ΅) | false positive (FP) (Π»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡΠ΅Π»ΡΠ½ΡΠ΅) | |
Not retrieved (Π½Π΅Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΠ΅) | false negative (FN) (Π»ΠΎΠΆΠ½ΠΎ ΠΎΡΡΠΈΡΠ°ΡΠ΅Π»ΡΠ½ΡΠ΅) | true negative (TN) (Π²Π΅ΡΠ½ΠΎ ΠΎΡΡΠΈΡΠ°ΡΠ΅Π»ΡΠ½ΡΠ΅) | |
Π ΠΈΡΡΠ½ΠΎΠΊ 2. ΠΡΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ ΠΎΠ±ΡΠ°Π±Π°ΡΡΠ²Π°Π΅ΠΌΠΎΠΉ ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΠΈ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ².
Π’ΠΎΡΠ½ΠΎΡΡΡ — Π΄ΠΎΠ»Ρ ΠΏΡΠ°Π²ΠΈΠ»ΡΠ½ΡΡ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΉ.
Π’ΠΎΡΠ½ΠΎΡΡΡ Π½Π΅ ΠΏΠΎΠ΄Ρ ΠΎΠ΄ΠΈΡ Π΄Π»Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ Π² ΠΊΠΎΠ½ΡΠ΅ΠΊΡΡΠ΅ ΠΠ. ΠΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ ΡΠ»ΡΡΠ°ΡΡ Π΄Π°Π½Π½ΡΠ΅ ΠΊΡΠ°ΠΉΠ½Π΅ ΠΈΡΠΊΠ°ΠΆΠ΅Π½Ρ, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, 99,9% Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² ΡΠ²Π»ΡΡΡΡΡ Π½Π΅ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠΌΠΈ. Π ΡΡΠΎΠΌ ΡΠ»ΡΡΠ°Π΅ ΡΠΈΡΡΠ΅ΠΌΠ°, Π½Π°ΡΡΡΠΎΠ΅Π½Π½Π°Ρ Π½Π° ΠΌΠ°ΠΊΡΠΈΠΌΠΈΠ·Π°ΡΠΈΡ ΡΠΎΡΠ½ΠΎΡΡΠΈ Π±ΡΠ΄Π΅Ρ ΠΏΠΎΡΡΠΈ Π²ΡΠ΅Π³Π΄Π° ΠΎΠ±ΡΡΠ²Π»ΡΡΡ ΠΊΠ°ΠΆΠ΄ΡΠΉ Π΄ΠΎΠΊΡΠΌΠ΅Π½Ρ Π½Π΅ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠΌ.
ΠΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΡΡΠ°ΡΡ Π²ΡΡΠΎΠΊΡΡ ΠΏΠΎΠ»Π½ΠΎΡΡ (Π½ΠΎ Π½ΠΈΠ·ΠΊΡΡ ΡΠΎΡΠ½ΠΎΡΡΡ), ΠΈΠ·Π²Π»Π΅ΠΊΠ°Ρ Π²ΡΠ΅ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΡ Π΄Π»Ρ Π²ΡΠ΅Ρ Π·Π°ΠΏΡΠΎΡΠΎΠ². ΠΠΎΠ»Π½ΠΎΡΠ° ΡΠ²Π»ΡΠ΅ΡΡΡ Π½Π΅ΡΠ±ΡΠ²Π°ΡΡΠ΅ΠΉ ΡΡΠ½ΠΊΡΠΈΠ΅ΠΉ ΠΎΡ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²Π° Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ². Π’ΠΎΡΠ½ΠΎΡΡΡ ΠΎΠ±ΡΡΠ½ΠΎ ΠΏΠ°Π΄Π°Π΅Ρ (Π² Ρ ΠΎΡΠΎΡΠΈΡ ΡΠΈΡΡΠ΅ΠΌΠ°Ρ ). Π’ΠΎΡΠ½ΠΎΡΡΡ ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ Π²ΡΡΠΈΡΠ»Π΅Π½Π° Π½Π° ΡΠ°Π·Π½ΡΡ ΡΡΠΎΠ²Π½ΡΡ ΠΏΠΎΠ»Π½ΠΎΡΡ. ΠΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»ΠΈ, ΠΎΡΠΈΠ΅Π½ΡΠΈΡΠΎΠ²Π°Π½Π½ΡΠ΅ Π½Π° Π²ΡΡΠΎΠΊΡΡ ΡΠΎΡΠ½ΠΎΡΡΡ — Π²Π΅Π±-ΡΠ΅ΡΡΠ΅ΡΡ, Π½Π° Π²ΡΡΠΎΠΊΡΡ ΠΏΠΎΠ»Π½ΠΎΡΡ — ΠΏΡΠΎΡΠ΅ΡΡΠΈΠΎΠ½Π°Π»ΡΠ½ΡΠ΅ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΠ΅Π»ΠΈ, ΡΡΠΈΡΡΡ, Π°Π½Π°Π»ΠΈΡΠΈΠΊΠΈ.
F-ΠΌΠ΅ΡΠ° ΡΠ²Π»ΡΠ΅ΡΡΡ ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΌΠ΅ΡΠΎΠΉ, ΠΎΡΠ΅Π½ΠΈΠ²Π°ΡΡΠ΅ΠΉ ΠΊΠΎΠΌΠΏΡΠΎΠΌΠΈΡΡ ΠΌΠ΅ΠΆΠ΄Ρ ΡΠΎΡΠ½ΠΎΡΡΡΡ ΠΈ ΠΏΠΎΠ»Π½ΠΎΡΠΎΠΉ (Π²Π·Π²Π΅ΡΠ΅Π½Π½ΠΎΠ΅ ΡΡΠ΅Π΄Π½Π΅Π΅ Π³Π°ΡΠΌΠΎΠ½ΠΈΡΠ΅ΡΠΊΠΎΠ΅):
ΠΡΠΈ Π·Π½Π°ΡΠ΅Π½ΠΈΠΈ Π²<1 Π°ΠΊΡΠ΅Π½Ρ Π΄Π΅Π»Π°Π΅ΡΡΡ Π½Π° ΡΠΎΡΠ½ΠΎΡΡΠΈ, ΠΏΡΠΈ Π²>1 — Π½Π° ΠΏΠΎΠ»Π½ΠΎΡΠ΅.
ΠΠ±ΡΡΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΡΡ ΡΠ±Π°Π»Π°Π½ΡΠΈΡΠΎΠ²Π°Π½Π½Π°Ρ F-ΠΌΠ΅ΡΠ°, Ρ. Π΅. Π²=1 ΠΈΠ»ΠΈ Π±=Π
ΠΠΎΠ³Π΄Π° Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π΄Π²ΡΡ ΡΠΈΡΠ΅Π» ΠΎΡΠ»ΠΈΡΠ°ΡΡΡΡ, ΡΡΠ΅Π΄Π½Π΅Π΅ Π³Π°ΡΠΌΠΎΠ½ΠΈΡΠ΅ΡΠΊΠΎΠ΅ Π±Π»ΠΈΠΆΠ΅ ΠΊ ΠΈΡ ΠΌΠΈΠ½ΠΈΠΌΡΠΌΡ, ΡΠ΅ΠΌ ΡΡΠ΅Π΄Π½Π΅Π΅ Π°ΡΠΈΡΠΌΠ΅ΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΠΈΠ»ΠΈ Π³Π΅ΠΎΠΌΠ΅ΡΡΠΈΡΠ΅ΡΠΊΠΎΠ΅. ΠΠ°ΠΏΡΠΈΠΌΠ΅Ρ, Π΅ΡΠ»ΠΈ 1 ΠΈΠ· 10 000 Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ΅Π½, ΠΌΡ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΠΎΠ»ΡΡΠ°ΡΡ 100% ΠΏΠΎΠ»Π½ΠΎΡΡ, ΠΈΠ·Π²Π»Π΅ΠΊΠ°Ρ Π²ΡΠ΅ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΡ. Π‘ΡΠ΅Π΄Π½Π΅Π΅ Π°ΡΠΈΡΠΌΠ΅ΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ Π±ΡΠ΄Π΅Ρ 50%, Π° Π³Π°ΡΠΌΠΎΠ½ΠΈΡΠ΅ΡΠΊΠΎΠ΅ — 0,02%.
ΠΠΎΠ»Π½ΠΎΡΠ°, ΡΠΎΡΠ½ΠΎΡΡΡ ΠΈ F-ΠΌΠ΅ΡΠ° ΡΠ²Π»ΡΡΡΡΡ ΠΌΠ΅ΡΠ°ΠΌΠΈ, ΠΎΡΠ½ΠΎΠ²Π°Π½Π½ΡΠΌΠΈ Π½Π° ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²Π°Ρ (Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, Π½Π΅ΡΠΏΠΎΡΡΠ΄ΠΎΡΠ΅Π½Π½ΡΠΉ Π½Π°Π±ΠΎΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²). Π ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΡΡ ΠΏΠΎΠΈΡΠΊΠΎΠ²ΡΡ ΡΠΈΡΡΠ΅ΠΌΠ°Ρ Π·Π½Π°ΡΠ΅Π½ΠΈΡ P ΠΈ R ΡΠ²ΡΠ·Π°Π½Ρ Ρ ΠΏΠΎΠ·ΠΈΡΠΈΠ΅ΠΉ Π² ΡΠ΅ΠΉΡΠΈΠ½Π³Π΅. ΠΡΠ΅Π½ΠΊΠ° ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡΡΡ ΠΏΡΡΠ΅ΠΌ Π²ΡΡΠΈΡΠ»Π΅Π½ΠΈΡ ΡΠΎΡΠ½ΠΎΡΡΠΈ, ΠΊΠ°ΠΊ ΡΡΠ½ΠΊΡΠΈΠΈ ΠΎΡ ΠΏΠΎΠ»Π½ΠΎΡΡ. ΠΡΠ»ΠΈ (k+1)-ΡΠΉ Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΠΉ Π΄ΠΎΠΊΡΠΌΠ΅Π½Ρ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ΅Π½, ΡΠΎ R (k+1) > R (k), Π° P (k+1) > P (k). ΠΡΠ»ΠΈ (k+1)-ΡΠΉ Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΠΉ Π΄ΠΎΠΊΡΠΌΠ΅Π½Ρ Π½Π΅ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ΅Π½, ΡΠΎ R (k+1) = R (k), Π½ΠΎ P (k+1) < P (k). Π§ΡΠΎΠ±Ρ ΡΠ΄Π°Π»ΠΈΡΡ ΠΊΠΎΠ»Π΅Π±Π°Π½ΠΈΡ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΡΡ ΠΈΠ½ΡΠ΅ΡΠΏΠΎΠ»ΠΈΡΠΎΠ²Π°Π½Π½Π°Ρ ΡΠΎΡΠ½ΠΎΡΡΡ.
ΠΠ΄ΠΈΠ½Π½Π°Π΄ΡΠ°ΡΠΈΡΠΎΡΠ΅ΡΠ½Π°Ρ ΠΈΠ½ΡΠ΅ΡΠΏΠΎΠ»ΠΈΡΠΎΠ²Π°Π½Π½Π°Ρ ΡΡΠ΅Π΄Π½ΡΡ ΡΠΎΡΠ½ΠΎΡΡΡ (11-point interpolated average precision). ΠΠ·ΠΌΠ΅ΡΡΠ΅ΡΡΡ ΡΠΎΡΠ½ΠΎΡΡΡ Π½Π° 11 ΡΡΠΎΠ²Π½ΡΡ ΠΏΠΎΠ»Π½ΠΎΡΡ {0.0, 0.1, 0.2,…, 1.0}, Π·Π°ΡΠ΅ΠΌ ΡΠ°ΡΡΡΠΈΡΡΠ²Π°Π΅ΡΡΡ ΡΡΠ΅Π΄Π½Π΅Π΅ Π°ΡΠΈΡΠΌΠ΅ΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΡΡΠΎΠ²Π½Ρ ΡΠΎΡΠ½ΠΎΡΡΠΈ.
Π§ΡΠΎΠ±Ρ Π½Π°ΠΉΡΠΈ ΡΡΠ΅Π΄Π½Π΅Π΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ ΡΡΠ΅Π΄Π½Π΅ΠΉ ΡΠΎΡΠ½ΠΎΡΡΠΈ (mean average precision (MAP)), Π²ΡΡΠΈΡΠ»ΡΠ΅ΡΡΡ ΡΡΠ΅Π΄Π½ΡΡ ΡΠΎΡΠ½ΠΎΡΡΡ (AP) Π΄Π»Ρ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΠΎΠ³ΠΎ Π·Π°ΠΏΡΠΎΡΠ°. ΠΠ°ΡΠ΅ΠΌ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ ΡΡΠ΅Π΄Π½Π΅ΠΉ ΡΠΎΡΠ½ΠΎΡΡΠΈ ΠΏΠΎΠ»ΡΡΠ°Π΅ΡΡΡ Π΄Π»Ρ Π½Π°Π±ΠΎΡΠ° ΠΈΠ· ΠΏΠ΅ΡΠ²ΡΡ k Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ², ΠΈΠΌΠ΅ΡΡΠΈΡ ΡΡ ΠΏΠΎΡΠ»Π΅ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π½Π°Ρ ΠΎΠΆΠ΄Π΅Π½ΠΈΡ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΠ³ΠΎ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°. MAP = ΡΡΠ΅Π΄Π½Π΅Π΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ AP ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²Π° ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΡΡ ΠΏΠΎΡΡΠ΅Π±Π½ΠΎΡΡΠ΅ΠΉ.
— Π·Π°ΠΏΡΠΎΡ?
— Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΡ, ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΠ΅ Π·Π°ΠΏΡΠΎΡΡ
— ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ Π½Π°Π±ΠΎΡ ΠΏΠ΅ΡΠ²ΡΡ k Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΡ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠΎΠ².
ΠΠ»Ρ ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΠΎΠΉ ΠΏΠΎΡΡΠ΅Π±Π½ΠΎΡΡΠΈ AP ΡΠ²ΡΠ·Π°Π½Π° Ρ ΠΏΠ»ΠΎΡΠ°Π΄ΡΡ ΠΏΠΎΠ΄ Π½Π΅ΠΈΠ½ΡΠ΅ΡΠΏΠΎΠ»ΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΊΡΠΈΠ²ΠΎΠΉ ΡΠΎΡΠ½ΠΎΡΡΠΈ/ΠΏΠΎΠ»Π½ΠΎΡΡ. ΠΡΠΈΠΌΠ΅Ρ:
Π Π°ΡΡΠ΅Ρ ΡΠΎΡΠ½ΠΎΡΡΠΈ Π΄Π»Ρ k. Π€ΠΈΠΊΡΠΈΡΡΠ΅ΡΡΡ k — ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΈΠ·Π²Π»Π΅ΠΊΠ°Π΅ΠΌΡΡ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠΎΠ², Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ k=10. ΠΡΡΠΈΡΠ»ΡΠ΅ΡΡΡ ΡΠΎΡΠ½ΠΎΡΡΡ Π΄Π»Ρ ΠΏΠ΅ΡΠ²ΡΡ k ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ². ΠΠΎΡΡΠΎΠΈΠ½ΡΡΠ²ΠΎ: Π½Π΅ ΡΡΠ΅Π±ΡΠ΅ΡΡΡ ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²Π° ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² (ΠΏΠΎΠ»Π΅Π·Π½ΠΎ Π΄Π»Ρ Π²Π΅Π±-ΠΏΠΎΠΈΡΠΊΠ°). ΠΠ΅Π΄ΠΎΡΡΠ°ΡΠΎΠΊ: ΠΎΠ±ΡΠ΅Π΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² ΡΠΈΠ»ΡΠ½ΠΎ Π²Π»ΠΈΡΠ΅Ρ Π½Π° ΡΠΎΡΠ½ΠΎΡΡΡ Π΄Π»Ρ k. ΠΠ°ΠΏΡΠΈΠΌΠ΅Ρ, Π΅ΡΠ»ΠΈ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² ΡΠ°Π²Π½ΠΎ 8, ΡΠΎ ΡΠΎΡΠ½ΠΎΡΡΡ Π΄Π»Ρ 20 Π±ΡΠ΄Π΅Ρ Π½Π΅ Π±ΠΎΠ»Π΅Π΅ 0,4.
R-ΡΠΎΡΠ½ΠΎΡΡΡ. ΠΠ»Ρ ΠΈΠ·Π²Π΅ΡΡΠ½ΠΎΠ³ΠΎ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΠ³ΠΎ ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²Π° ΡΠ°Π·ΠΌΠ΅ΡΠ° Rel Π²ΡΡΠΈΡΠ»ΡΠ΅ΡΡΡ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² r ΡΡΠ΅Π΄ΠΈ ΠΏΠ΅ΡΠ²ΡΡ Rel ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠΎΠ² ΠΏΠΎΠΈΡΠΊΠ°. ΠΠΎΡΡΠΎΠΈΠ½ΡΡΠ²ΠΎ: ΠΈΠ΄Π΅Π°Π»ΡΠ½Π°Ρ ΡΠΈΡΡΠ΅ΠΌΠ° Π΄ΠΎΡΡΠΈΠ³Π°Π΅Ρ R-ΡΠΎΡΠ½ΠΎΡΡΡ = 1,0. ΠΠ΅Π΄ΠΎΡΡΠ°ΡΠΎΠΊ: ΡΠ°ΡΡΠΌΠ°ΡΡΠΈΠ²Π°Π΅ΡΡΡ ΡΠΎΠ»ΡΠΊΠΎ ΠΎΠ΄Π½Π° ΡΠΎΡΠΊΠ° Π½Π° ΠΊΡΠΈΠ²ΠΎΠΉ ΡΠΎΡΠ½ΠΎΡΡΡ/ΠΏΠΎΠ»Π½ΠΎΡΠ°.
ΠΠΏΠ΅ΡΠ°ΡΠΈΠΎΠ½Π½Π°Ρ Ρ Π°ΡΠ°ΠΊΡΠ΅ΡΠΈΡΡΠΈΠΊΠ° ΠΏΡΠΈΠ΅ΠΌΠ½ΠΈΠΊΠ° (receiver operating characteristic). ROC-ΠΊΡΠΈΠ²Π°Ρ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ°Π΅Ρ Π³ΡΠ°ΡΠΈΠΊ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ Π΄ΠΎΠ»ΠΈ Π²Π΅ΡΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡΠ΅Π»ΡΠ½ΡΡ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΉ (ΡΡΠ²ΡΡΠ²ΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΠΈ) ΠΎΡ Π΄ΠΎΠ»ΠΈ Π»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡΠ΅Π»ΡΠ½ΡΡ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΉ (1 — ΡΠΏΠ΅ΡΠΈΡΠΈΡΠ½ΠΎΡΡΡ).
ΠΠΎΠ»Ρ TP = ΡΡΠ²ΡΡΠ²ΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΡ = ΠΏΠΎΠ»Π½ΠΎΡΠ° = TP / (TP + FN)
ΠΠΎΠ»Ρ FP = 1 — ΡΠΏΠ΅ΡΠΈΡΠΈΡΠ½ΠΎΡΡΡ = FP / (FP + TN)
4. Π Π΅Π°Π»ΠΈΠ·Π°ΡΠΈΡ Π²Π΅ΠΊΡΠΎΡΠ½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² ΡΡΠ΅Π΄Π΅ Matlab
ΠΡ ΠΎΠ΄Π½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅:
Β· terms — ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²ΠΎ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ²;
Β· docs — ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²ΠΎ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²;
Β· freq — ΡΠ°Π±Π»ΠΈΡΠ° ΡΠ°ΡΡΠΎΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ².
ΠΡΡ ΠΎΠ΄Π½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅:
Β· answer_euc — ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ ΡΠΏΠΈΡΠΎΠΊ ΠΏΡΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠΈ Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²ΠΎΠΉ ΠΌΠ΅ΡΡ;
Β· answer_cos — ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ ΡΠΏΠΈΡΠΎΠΊ ΠΏΡΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠΈ ΠΊΠΎΡΠΈΠ½ΡΡΠ½ΠΎΠΉ ΠΌΠ΅ΡΡ.
4.1 Π€ΡΠ½ΠΊΡΠΈΡ ΡΠ°ΡΡΠ΅ΡΠ° Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²ΠΎΠΉ ΠΌΠ΅ΡΡ
function SC = euclideanSM (q, d)
SC = 1/(1+norm (q-d));
4.2 Π€ΡΠ½ΠΊΡΠΈΡ ΡΠ°ΡΡΠ΅ΡΠ° ΠΊΠΎΡΠΈΠ½ΡΡΠ½ΠΎΠΉ ΠΌΠ΅ΡΡ
function SC = cosineSM (q, d)
SC = q'*d/(norm (q)*norm (d));
4.3 Π Π°ΡΡΠ΅Ρ ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΡΡ ΡΠΏΠΈΡΠΊΠΎΠ² Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²
% Π Π°ΡΡΠ΅Ρ Π²Π΅ΡΠΎΠ² Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²
N = size (docs, 1); % ΠΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²
M = size (terms, 1); % ΠΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ²
% Π§Π°ΡΡΠΎΡΠ° ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ² Π² Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°Ρ
tf = 1 + log (freq);
tf (freq == 0) = 0;
df = zeros (M, 1);
for i = 1: M
df (i) = sum (freq (i:) > 0);
end
idf = log (N./df);
W = zeros (M, N);
for i = 1: M
for j = 1: N
W (i, j) = tf (i, j)*idf (i);
end
end
% ΠΠ°ΠΏΡΠΎΡ
q = [1;0;0;1]; % Π Π΅Π°Π»ΠΈΠ·Π°ΡΠΈΡ Π·Π°ΠΏΡΠΎΡΠ° Π² ΡΠ»ΡΡΠ°Π΅ ΡΠ΅ΡΡΡΠ΅Ρ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ²
% ΠΠΎΡΠΌΠ°Π»ΠΈΠ·Π°ΡΠΈΡ Π²Π΅ΠΊΡΠΎΡΠΎΠ²
for j = 1: N
W (, j) = W (, j)/norm (W (, j));
end
q = q/norm (q);
score_euc = zeros (1,N);
score_cos = zeros (1,N);
for j = 1: N
score_euc (j) = euclideanSM (q, W (, j));
score_cos (j) = cosineSM (q, W (, j));
end
% ΠΡΡΠΈΡΠ»Π΅Π½ΠΈΠ΅ ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ ΡΠΏΠΈΡΠΊΠ° Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²
[ranked_score_euc, i_euc] = sort (score_euc,'descend');
[ranked_score_cos, i_cos] = sort (score_cos,'descend');
% Π Π°ΡΡΠ΅ΡΡ Π΄Π»Ρ Π²ΡΠ²ΠΎΠ΄Π° ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠΎΠ²
answer_euc = cell (N, 2);
answer_cos = cell (N, 2);
for j = 1: N
%answer_euc{j, 1} = docs{i_euc (j)}; % ΠΡΠ²ΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°
answer_euc{j, 1} = i_euc (j); % ΠΡΠ²ΠΎΠ΄ ΠΏΠΎΡΡΠ΄ΠΊΠΎΠ²ΠΎΠ³ΠΎ Π½ΠΎΠΌΠ΅ΡΠ° Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°
answer_euc{j, 2} = ranked_score_euc (j);
%answer_cos{j, 1} = docs{i_cos (j)};
answer_cos{j, 1} = i_cos (j);
answer_cos{j, 2} = ranked_score_cos (j);
end
% ΠΡΠ²ΠΎΠ΄ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠΎΠ²
disp ('ΠΠ²ΠΊΠ»ΠΈΠ΄ΠΎΠ²Π° ΠΌΠ΅ΡΠ°:');
answer_euc
disp ('ΠΠΎΡΠΈΠ½ΡΡΠ½Π°Ρ ΠΌΠ΅ΡΠ°:');
answer_cos
5. Π Π΅Π°Π»ΠΈΠ·Π°ΡΠΈΡ ΠΎΡΠ΅Π½ΠΎΠΊ ΠΊΠ°ΡΠ΅ΡΡΠ²Π° ΠΏΠΎΠΈΡΠΊΠ° Π² ΡΡΠ΅Π΄Π΅ Matlab
5.1 Π Π°ΡΡΠ΅Ρ ΡΠΎΡΠ½ΠΎΡΡΠΈ, ΠΏΠΎΠ»Π½ΠΎΡΡ ΠΈ F-ΠΌΠ΅ΡΡ Π² Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ ΠΎΡ ΡΠΈΡΠ»Π° Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²
ΠΡ ΠΎΠ΄Π½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅:
Β· ΡΠΏΠΈΡΠΎΠΊ ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²;
Β· relevance — ΠΌΠ°ΡΡΠΈΠ², ΡΠΊΠ°Π·ΡΠ²Π°ΡΡΠΈΠΉ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΡΡΡ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ° Π·Π°ΠΏΡΠΎΡΡ;
ΠΡΡ ΠΎΠ΄Π½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅:
Β· precision — ΠΌΠ°ΡΡΠΈΠ² ΡΠΎΡΠ½ΠΎΡΡΠΈ Π΄Π»Ρ ΡΠΈΠΊΡΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ ΡΠΈΡΠ»Π° ΠΏΠ΅ΡΠ²ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²;
Β· recall — ΠΌΠ°ΡΡΠΈΠ² ΠΏΠΎΠ»Π½ΠΎΡΡ Π΄Π»Ρ ΡΠΈΠΊΡΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ ΡΠΈΡΠ»Π° ΠΏΠ΅ΡΠ²ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²;
Β· f_measure_A — F-ΠΌΠ΅ΡΠ° Π΄Π»Ρ ΠΏΠ΅ΡΠ²ΡΡ 20 Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²;
Β· f_measure_B — F-ΠΌΠ΅ΡΠ° Π΄Π»Ρ ΠΏΠ΅ΡΠ²ΡΡ 50 Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ².
5.2 ΠΠΈΡΡΠΈΠ½Π³ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΡ
numTot = length (relevance);
numStep = round (numTot/10);
precision = zeros (numStep, 1);
recall = zeros (numStep, 1);
numRet = 10:10:numTot;
% Π Π°ΡΡΠ΅Ρ ΡΠΎΡΠ½ΠΎΡΡΠΈ ΠΈ ΠΏΠΎΠ»Π½ΠΎΡΡ Π΄Π»Ρ ΡΠΈΠΊΡΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ ΡΠΈΡΠ»Π° ΠΏΠ΅ΡΠ²ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²
for j = 1: numStep
TP = 0;
FP = 0;
TN = 0;
FN = 0;
for i = 1: numRet (j)
if relevance (i) == 1
TP = TP + 1;
else
FP = FP + 1;
end
end
for i = numRet (j)+1:numTot
if relevance (i) == 1
FN = FN + 1;
else
TN = TN + 1;
end
end
precision (j) = TP / (TP + FP); % Π Π°ΡΡΠ΅Ρ ΡΠΎΡΠ½ΠΎΡΡΠΈ
recall (j) = TP / (TP + FN); % Π Π°ΡΡΠ΅Ρ ΠΏΠΎΠ»Π½ΠΎΡΡ
end
% ΠΡΠ²ΠΎΠ΄ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² ΡΠΎΡΠ½ΠΎΡΡΠΈ ΠΈ ΠΏΠΎΠ»Π½ΠΎΡΡ
figure
plot (numRet, recall,'b'), hold on, plot (numRet, precision,'r'), hold off
legend ('ΠΏΠΎΠ»Π½ΠΎΡΠ°','ΡΠΎΡΠ½ΠΎΡΡΡ');
xlabel ('ΠΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ Π½Π°ΠΉΠ΄Π΅Π½Π½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²');
% Π Π°ΡΡΠ΅Ρ F-ΠΌΠ΅ΡΡ Π΄Π»Ρ ΠΏΠ΅ΡΠ²ΡΡ 20 ΠΈ 50 Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²
% ΠΠ΅ΡΠ° ΠΈΠ·ΠΌΠ΅Π½ΡΠ΅ΡΡΡ Π² Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½Π΅ [0;5]
beta = 0:0.01:5;
f_measure_A = (beta.^2 + 1)*precision (2)*recall (2)./(precision (2)*beta.^2 + recall (2));
f_measure_B = (beta.^2 + 1)*precision (5)*recall (5)./(precision (5)*beta.^2 + recall (5));
% ΠΡΠ²ΠΎΠ΄ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² F-ΠΌΠ΅Ρ
figure
plot (beta, f_measure_A,'b'), hold on, plot (beta, f_measure_B,'r'), hold off
legend ('F-ΠΌΠ΅ΡΠ° A','F-ΠΌΠ΅ΡΠ° B');
xlabel ('Beta');
6. Π Π°ΡΡΠ΅Ρ ΠΈΠ½ΡΠ΅ΡΠΏΠΎΠ»ΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠΉ ΡΡΠ΅Π΄Π½Π΅ΠΉ ΡΠΎΡΠ½ΠΎΡΡΠΈ, ROC-ΠΊΡΠΈΠ²ΠΎΠΉ ΠΈ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ ΡΠΎΡΠ½ΠΎΡΡΠΈ ΠΎΡ ΠΏΠΎΠ»Π½ΠΎΡΡ
ΠΡ ΠΎΠ΄Π½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅:
Β· ΡΠΏΠΈΡΠΎΠΊ ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²;
Β· relevance — ΠΌΠ°ΡΡΠΈΠ², ΡΠΊΠ°Π·ΡΠ²Π°ΡΡΠΈΠΉ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΡΡΡ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ° Π·Π°ΠΏΡΠΎΡΡ;
ΠΡΡ ΠΎΠ΄Π½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅:
Β· precision — ΠΌΠ°ΡΡΠΈΠ² ΡΠΎΡΠ½ΠΎΡΡΠΈ Π΄Π»Ρ ΡΠΈΠΊΡΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ ΡΠΈΡΠ»Π° ΠΏΠ΅ΡΠ²ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²;
Β· recall — ΠΌΠ°ΡΡΠΈΠ² ΠΏΠΎΠ»Π½ΠΎΡΡ Π΄Π»Ρ ΡΠΈΠΊΡΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ ΡΠΈΡΠ»Π° ΠΏΠ΅ΡΠ²ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²;
Β· precisionI — ΠΈΠ½ΡΠ΅ΡΠΏΠΎΠ»ΠΈΡΠΎΠ²Π°Π½Π½Π°Ρ ΡΠΎΡΠ½ΠΎΡΡΡ;
Β· IAP11 — 11 ΡΠΎΡΠ΅ΠΊ ΠΈΠ½ΡΠ΅ΡΠΏΠΎΠ»ΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠΉ ΡΡΠ΅Π΄Π½Π΅ΠΉ ΡΠΎΡΠ½ΠΎΡΡΠΈ;
Β· fp_rate — Π΄ΠΎΠ»Ρ Π½Π΅Π²Π΅ΡΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡΠ΅Π»ΡΠ½ΡΡ ;
Β· tp_rate — Π΄ΠΎΠ»Ρ Π²Π΅ΡΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡΠ΅Π»ΡΠ½ΡΡ .
6.1 Π€ΡΠ½ΠΊΡΠΈΡ Π΄Π»Ρ ΡΠ°ΡΡΠ΅ΡΠ° Π·Π½Π°ΡΠ΅Π½ΠΈΠΉ ΠΊΡΠΈΠ²ΠΎΠΉ ΡΠΎΡΠ½ΠΎΡΡΠΈ Π² Π·Π°Π΄Π°Π½Π½ΡΡ ΡΠΎΡΠΊΠ°Ρ
function i = nearestPoint (v, n)
x = find (v >= n);
i = x (1);
end
6.2 ΠΠΈΡΡΠΈΠ½Π³ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΡ
numTot = length (relevance);
precision = zeros (numTot, 1);
precisionI = zeros (numTot, 1);
recall = zeros (numTot, 1);
fp_rate = zeros (numTot, 1);
for numRet = 1: numTot
TP = 0;
FP = 0;
TN = 0;
FN = 0;
for i = 1: numRet
if relevance (i) == 1
TP = TP + 1;
else
FP = FP + 1;
end
end
for i = numRet+1:numTot
if relevance (i) == 1
FN = FN + 1;
else
TN = TN + 1;
end
end
precision (numRet) = TP / (TP + FP);
recall (numRet) = TP / (TP + FN);
% Π Π°ΡΡΠ΅Ρ Π΄ΠΎΠ»ΠΈ Π»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡΠ΅Π»ΡΠ½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²
fp_rate (numRet) = FP / (FP + TN);
end
% Π Π°ΡΡΠ΅Ρ ΠΈΠ½ΡΠ΅ΡΠΏΠΎΠ»ΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠΉ ΡΠΎΡΠ½ΠΎΡΡΠΈ
precisionI (end) = precision (end);
for i = numTot-1:-1:1
precisionI (i) = max (precision (i), precisionI (i+1));
end
% Π Π°ΡΡΠ΅Ρ 11 ΡΠΎΡΠ΅ΠΊ ΠΈΠ½ΡΠ΅ΡΠΏΠΎΠ»ΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠΉ ΡΡΠ΅Π΄Π½Π΅ΠΉ ΡΠΎΡΠ½ΠΎΡΡΠΈ
IAP11 = zeros (11,1);
for i = 1:11
IAP11(i) = precisionI (nearestPoint (recall, 0.1*(i-1)));
end
% ΠΡΠ²ΠΎΠ΄ Π³ΡΠ°ΡΠΈΠΊΠ° Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ ΡΠΎΡΠ½ΠΎΡΡΠΈ ΠΎΡ ΠΏΠΎΠ»Π½ΠΎΡΡ
figure
plot (recall, precision,'b'), hold on, plot (recall, precisionI,'r')
plot (0:0.1:1,IAP11,'ok'), hold off
ylabel ('ΡΠΎΡΠ½ΠΎΡΡΡ')
xlabel ('ΠΏΠΎΠ»Π½ΠΎΡΠ°')
legend ('Π½Π΅ΠΈΠ½ΡΠ΅ΡΠΏΠΎΠ»ΠΈΡΠΎΠ²Π°Π½Π½Π°Ρ','ΠΈΠ½ΡΠ΅ΡΠΏΠΎΠ»ΠΈΡΠΎΠ²Π°Π½Π½Π°Ρ','IAP_{11}')
% ROC-ΠΊΡΠΈΠ²Π°Ρ
tp_rate = recall;
figure
plot (fp_rate, tp_rate,'b')
ylabel ('TP_{Π΄ΠΎΠ»Ρ}')
xlabel ('FP_{Π΄ΠΎΠ»Ρ}')
title ('ROC')
7. Π Π°ΡΡΠ΅Ρ ΡΡΠ΅Π΄Π½Π΅Π³ΠΎ Π·Π½Π°ΡΠ΅Π½ΠΈΡ ΡΡΠ΅Π΄Π½Π΅ΠΉ ΡΠΎΡΠ½ΠΎΡΡΠΈ
ΠΡ ΠΎΠ΄Π½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅:
Β· Q ΡΠΏΠΈΡΠΊΠΎΠ² ΡΠ°Π½ΠΆΠΈΡΠΎΠ²Π°Π½Π½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² Π΄Π»Ρ (ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡ Π΄Π»Ρ Π·Π°ΠΏΡΠΎΡΠ°);
Β· relevance — Q-ΠΌΠ΅ΡΠ½ΡΠΉ ΠΌΠ°ΡΡΠΈΠ², ΡΠΊΠ°Π·ΡΠ²Π°ΡΡΠΈΠΉ ΡΠ΅Π»Π΅Π²Π°Π½ΡΠ½ΠΎΡΡΡ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ° Π·Π°ΠΏΡΠΎΡΡ;
ΠΡΡ ΠΎΠ΄Π½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅:
Β· precision — ΠΌΠ°ΡΡΠΈΠ² ΡΠΎΡΠ½ΠΎΡΡΠΈ Π΄Π»Ρ ΡΠΈΠΊΡΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ ΡΠΈΡΠ»Π° ΠΏΠ΅ΡΠ²ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ²;
Β· AP — ΠΌΠ°ΡΡΠΈΠ² ΡΡΠ΅Π΄Π½ΠΈΡ ΡΠΎΡΠ½ΠΎΡΡΠ΅ΠΉ Π΄Π»Ρ Π·Π°ΠΏΡΠΎΡΠΎΠ²;
Β· MAP — ΡΡΠ΅Π΄Π½Π΅Π΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ ΡΡΠ΅Π΄Π½Π΅ΠΉ ΡΠΎΡΠ½ΠΎΡΡΠΈ.
7.1 ΠΠΈΡΡΠΈΠ½Π³ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΡ
[numTot, Q] = size (relevance);
m = zeros (Q, 1);
AP = zeros (Q, 1);
for j = 1: Q
m (j) = sum (relevance (, j));
precision = zeros (m (j), 1);
index = 0;
TP = 0;
FP = 0;
i = 1;
while index < m (j)
if relevance (i, j) == 1
TP = TP + 1;
index = index + 1;
precision (index) = TP / (TP + FP);
else
FP = FP + 1;
end
i = i + 1;
end
% Π Π°ΡΡΠ΅Ρ ΡΡΠ΅Π΄Π½Π΅ΠΉ ΡΠΎΡΠ½ΠΎΡΡΠΈ
AP (j) = mean (precision);
end
% Π Π°ΡΡΠ΅Ρ ΡΡΠ΅Π΄Π½Π΅Π³ΠΎ Π·Π½Π°ΡΠ΅Π½ΠΈΡ ΡΡΠ΅Π΄Π½Π΅ΠΉ ΡΠΎΡΠ½ΠΎΡΡΠΈ
MAP = mean (AP)
ΠΡΠ²ΠΎΠ΄Ρ
ΠΠΎ Π²ΡΠ΅ΠΌΡ ΠΏΡΠΎΡ ΠΎΠΆΠ΄Π΅Π½ΠΈΡ ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΡΡΠ²Π΅Π½Π½ΠΎΠΉ ΠΏΡΠ°ΠΊΡΠΈΠΊΠΈ:
Β· ΠΈΠ·ΡΡΠ΅Π½Ρ ΠΎΡΠ½ΠΎΠ²Π½ΡΠ΅ ΠΊΠΎΠ½ΡΠ΅ΠΏΡΠΈΠΈ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΠΎΠ³ΠΎ ΠΏΠΎΠΈΡΠΊΠ°;
Β· ΡΠ°ΡΡΠΌΠΎΡΡΠ΅Π½Ρ Π±Π°Π·ΠΎΠ²ΡΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΠΎΠΈΡΠΊΠ° ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ, Π²ΡΠ΄Π΅Π»Π΅Π½Ρ ΠΈΡ ΠΎΡΠ½ΠΎΠ²Π½ΡΠ΅ ΠΏΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π° ΠΈ Π½Π΅Π΄ΠΎΡΡΠ°ΡΠΊΠΈ, ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²Π΅Π½Π½ΠΎ ΠΊΠΎΡΠΎΡΡΠΌ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΠΈΡΡ Π΄Π»Ρ ΡΠ΅ΡΠ΅Π½ΠΈΡ ΠΊΠ°ΠΊΠΈΡ Π·Π°Π΄Π°Ρ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Π΄Π°Π½Π½ΡΡ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ Π²ΡΠ³ΠΎΠ΄Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΡΡ ΠΈΠ»ΠΈ ΠΈΠ½ΡΡ Π²ΡΡΠΈΡΠ»ΠΈΡΠ΅Π»ΡΠ½ΡΡ ΠΌΠΎΠ΄Π΅Π»Ρ;
Β· ΡΠ°ΡΡΠΌΠΎΡΡΠ΅Π½Ρ ΠΌΠ΅ΡΠΎΠ΄Ρ ΠΎΡΠ΅Π½ΠΊΠΈ ΠΊΠ°ΡΠ΅ΡΡΠ²Π° ΠΏΠΎΠΈΡΠΊΠ° ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ, ΠΏΠΎΠΊΠ°Π·Π°Π½Ρ ΠΎΡΠ½ΠΎΠ²Π½ΡΠ΅ ΡΠ»ΡΡΠ°ΠΈ ΠΈΡ ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΡ;
Β· ΠΏΡΠΈΠΎΠ±ΡΠ΅ΡΠ΅Π½Ρ ΠΏΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠ΅ Π½Π°Π²ΡΠΊΠΈ ΠΏΠΎ ΡΠ΅Π°Π»ΠΈΠ·Π°ΡΠΈΠΈ ΠΈΠ·ΡΡΠ΅Π½Π½ΡΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΈ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² Π² ΡΡΠ΅Π΄Π΅ Matlab.
Π‘ΠΏΠΈΡΠΎΠΊ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌΠΎΠΉ Π»ΠΈΡΠ΅ΡΠ°ΡΡΡΡ
Β· R. Baeza-Yates, B. Ribeiro-Nieto, «Modern Information Retrieval», 1999
Β· C.D. Manning, P. Raghavan and H. Schutze, «Introduction to Information Retrieval», Cambridge University Press. 2008