ΠŸΠΎΠΌΠΎΡ‰ΡŒ Π² написании студСнчСских Ρ€Π°Π±ΠΎΡ‚
АнтистрСссовый сСрвис

Π˜Π½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ΅ срСдство поиска рСгуляторных ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² Π³Π΅Π½ΠΎΠΌΠ°Ρ…

Π”ΠΈΠΏΠ»ΠΎΠΌΠ½Π°ΡΠŸΠΎΠΌΠΎΡ‰ΡŒ Π² Π½Π°ΠΏΠΈΡΠ°Π½ΠΈΠΈΠ£Π·Π½Π°Ρ‚ΡŒ ΡΡ‚ΠΎΠΈΠΌΠΎΡΡ‚ΡŒΠΌΠΎΠ΅ΠΉ Ρ€Π°Π±ΠΎΡ‚Ρ‹

НС ΠΎΡ‡Π΅Π½ΡŒ высокоС качСство PWM ΠΌΠΎΠΆΠ΅Ρ‚ Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΠ±ΡŠΡΡΠ½ΡΡ‚ΡŒΡΡ ΠΌΠ°Π»Ρ‹ΠΌ числом сайтов, извСстных для Π΄Π°Π½Π½ΠΎΠ³ΠΎ Ρ„Π°ΠΊΡ‚ΠΎΡ€Π°. Π’ ΡΡ‚ΠΎΠΌ случаС PWM ΠΌΠΎΠΆΠ΅Ρ‚ Π½Π΅ ΠΎΡ‚Ρ€Π°ΠΆΠ°Ρ‚ΡŒ всСх Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… Π²Π°Ρ€ΠΈΠ°Ρ†ΠΈΠΉ сайтов, вслСдствиС Ρ‡Π΅Π³ΠΎ ΠΏΡ€ΠΈ поискС Ρ‚Π°ΠΊΠΎΠΉ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π΅ΠΉ большоС количСство Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… сайтов Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π½Π°ΠΉΠ΄Π΅Π½ΠΎ. Π’ Ρ‚Π°ΠΊΠΈΡ… случаях ΠΈΠΌΠ΅Π΅Ρ‚ смысл ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡ‚ΡŒ сайты связывания Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² ΠΎΠ΄Π½ΠΎΠ³ΠΎ сСмСйства, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ послСдниС часто ΠΈΠΌΠ΅ΡŽΡ‚ ΠΎΡ‡Π΅Π½ΡŒ… Π§ΠΈΡ‚Π°Ρ‚ΡŒ Π΅Ρ‰Ρ‘ >

Π˜Π½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ΅ срСдство поиска рСгуляторных ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² Π³Π΅Π½ΠΎΠΌΠ°Ρ… (Ρ€Π΅Ρ„Π΅Ρ€Π°Ρ‚, курсовая, Π΄ΠΈΠΏΠ»ΠΎΠΌ, ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½Π°Ρ)

Π˜Π½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ΅ срСдство поиска рСгуляторных ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² Π³Π΅Π½ΠΎΠΌΠ°Ρ…

Π’ ΠΏΡ€ΠΎΡ†Π΅ΡΡΠ΅ ΠΆΠΈΠ·Π½Π΅Π΄Π΅ΡΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΊΠ»Π΅Ρ‚ΠΊΠΈ Π½Π΅ Π²ΡΠ΅ Π³Π΅Π½Ρ‹ ΡΠΊΡΠΏΡ€Π΅ΡΡΠΈΡ€ΡƒΡŽΡ‚ΡΡ ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ. Π­Ρ‚ΠΎ достигаСтся Π·Π° ΡΡ‡Π΅Ρ‚ рСгуляции. ПониманиС ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΠ° рСгуляции экспрСссии Π³Π΅Π½ΠΎΠ² — ваТнСйшая Π·Π°Π΄Π°Ρ‡Π° Π±ΠΈΠΎΠ»ΠΎΠ³ΠΈΠΈ. ΠŸΡ€ΠΈ ΠΈΠ·ΡƒΡ‡Π΅Π½ΠΈΠΈ рСгуляции экспрСссии Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ транскрипции Π²Π°ΠΆΠ½ΠΎ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ Π±Π΅Π»ΠΊΠΈ-рСгуляторы (транскрипционныС Ρ„Π°ΠΊΡ‚ΠΎΡ€Ρ‹), Π½ΠΎ ΠΈ ΡƒΡ‡Π°ΡΡ‚ΠΊΠΈ ΠΈΡ… ΡΠ²ΡΠ·Ρ‹Π²Π°Π½ΠΈΡ с ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒΡŽ Π”ΠΠš. Π’ Π½Π°ΡΡ‚оящСС врСмя Π² ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚ΠΎΠΌ доступС находится большоС количСство сСквСнированных Π³Π΅Π½ΠΎΠΌΠΎΠ² ΠΈ Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΠΎ ΡΠΊΡΠΏΡ€Π΅ΡΡΠΈΠΈ Π³Π΅Π½ΠΎΠ², Ρ‡Ρ‚ΠΎ позволяСт ΠΈΠ·ΡƒΡ‡Π°Ρ‚ΡŒ Ρ€Π΅Π³ΡƒΠ»ΡΡ†ΠΈΡŽ ΠΏΡƒΡ‚Π΅ΠΌ Π°Π½Π°Π»ΠΈΠ·Π° ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ². Π—Π°Π΄Π°Ρ‡Π° поиска рСгуляторных ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² Π½Π°Π±ΠΎΡ€Π΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ Π”ΠΠš — классичСская Π·Π°Π΄Π°Ρ‡Π° Π±ΠΈΠΎΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠΊΠΈ. К Π½Π°ΡΡ‚ΠΎΡΡ‰Π΅ΠΌΡƒ ΠΌΠΎΠΌΠ΅Π½Ρ‚Ρƒ создано ΠΎΠ³Ρ€ΠΎΠΌΠ½ΠΎΠ΅ количСство Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ², ΠΎΠ΄Π½Π°ΠΊΠΎ всС ΠΎΠ½ΠΈ ΠΈΠΌΠ΅ΡŽΡ‚ свои ограничСния, ΠΈ Π½Π΅ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΠ΅Ρ‚ ΡƒΠ½ΠΈΠ²Π΅Ρ€ΡΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Ρ€Π΅ΡˆΠ°Π΅Ρ‚ эту Π·Π°Π΄Π°Ρ‡Ρƒ.

Π˜Π·Π²Π΅ΡΡ‚Π½ΠΎ, Ρ‡Ρ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠ΅ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹, Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ эффСктивны ΠΈ ΡƒΠ½ΠΈΠ²Π΅Ρ€ΡΠ°Π»ΡŒΠ½Ρ‹. Π’ Π΄Π°Π½Π½ΠΎΠΉ Ρ€Π°Π±ΠΎΡ‚Π΅ ΠΌΡ‹ ΠΏΡ€Π΅Π΄ΡΡ‚авляСм Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… Π”ΠΠš, ΡΠΎΠ²ΠΌΠ΅Ρ‰Π°ΡŽΡ‰ΠΈΠΉ словарныС Ρ‚Π΅Ρ…Π½ΠΈΠΊΠΈ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠΈ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠ΅ скрытыС марковскиС ΠΌΠΎΠ΄Π΅Π»ΠΈ (БММ).

ВСкст Ρ€Π°Π±ΠΎΡ‚Ρ‹ содСрТит ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ основныС Ρ€Π°Π·Π΄Π΅Π»Ρ‹: Π²Π²Π΅Π΄Π΅Π½ΠΈΠ΅, ΠΎΠ±Π·ΠΎΡ€ Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Ρ‹, ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»Ρ‹ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹, Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹, Π·Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅, Π²Ρ‹Π²ΠΎΠ΄Ρ‹ ΠΈ ΡΠΏΠΈΡΠΎΠΊ Ρ†ΠΈΡ‚ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠΉ Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Ρ‹. Π’ Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Π½ΠΎΠΌ ΠΎΠ±Π·ΠΎΡ€Π΅ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°ΡŽΡ‚ΡΡ биологичСскиС аспСкты Π·Π°Π΄Π°Ρ‡ΠΈ, Π° Ρ‚Π°ΠΊΠΆΠ΅ описываСтся классификация ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² ΠΈ ΠΎΡΠ½ΠΎΠ²Π½Ρ‹Π΅ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ². Π’ ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»Π°Ρ… ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°Ρ… ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ рассказываСтся ΠΎΠ± ΡƒΡΡ‚ройствС Π±Π°Π·ΠΎΠ²ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΈ ΠΎ Π΅Π³ΠΎ модификациях. Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π°Ρ… описываСтся тСстированиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π½Π° Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…, Π° Ρ‚Π°ΠΊΠΆΠ΅ сравнСниС Π΅Π³ΠΎ Ρ€Π°Π±ΠΎΡ‚Ρ‹ с Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ.

ЦСль Ρ€Π°Π±ΠΎΡ‚Ρ‹

Π”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½Ρ‹ΠΉ Π² Π»Π°Π±ΠΎΡ€Π°Ρ‚ΠΎΡ€ΠΈΠΈ Π±ΠΈΠΎΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠΊΠΈ Π€Π‘Π‘ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄Π½Ρ‹Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒΡŽ ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΈ ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² слоТной структуры с Π²Π°Ρ€ΠΈΠ°Π±Π΅Π»ΡŒΠ½Ρ‹ΠΌ спСйсСром; Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Ρ‚ΡŒ эту ΠΌΠΎΠ΄ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡŽ Π½Π° ΡΠ·Ρ‹ΠΊΠ΅ программирования высокого уровня; Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ графичСский интСрфСйс ΠΈ Π²Π΅Π±-рСсурс для обСспСчСния ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚ΠΎΠ³ΠΎ доступа ΠΊ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡƒ ΠΈ ΡƒΠ΄ΠΎΠ±Π½ΠΎΠ³ΠΎ просмотра Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ².

Π—Π°Π΄Π°Ρ‡ΠΈ

1. На ΠΎΡΠ½ΠΎΠ²Π΅ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰Π΅Π³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° поиска Π½Π΅ΠΏΠ°Π»ΠΈΠ½Π΄Ρ€ΠΎΠΌΠ½Ρ‹Ρ… ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΉ Π΄Π»ΠΈΠ½Ρ‹ Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… трСбуСтся ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² с Π±ΠΎΠ»Π΅Π΅ слоТной структурой:

a. ΠŸΠ°Π»ΠΈΠ½Π΄Ρ€ΠΎΠΌ

b. ΠŸΠΎΠ²Ρ‚ΠΎΡ€

c. Π˜Π½Π²Π΅Ρ€Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΉ ΠΏΠΎΠ²Ρ‚ΠΎΡ€.

2. ΠŸΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ схСмы скрытых марковских ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (БММ) для поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² с Π±ΠΎΠ»Π΅Π΅ слоТной структурой.

3. Π Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ языка программирования Java.

4. ΠŸΡ€ΠΎΡ‚Π΅ΡΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π½Π° ΠΈΡΠΊΡƒΡΡΡ‚Π²Π΅Π½Π½Ρ‹Ρ… ΠΈ Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ с Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ².

Π Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ графичСский интСрфСйс ΠΈ Π²Π΅Π±-рСсурс для обСспСчСния ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚ΠΎΠ³ΠΎ доступа ΠΊ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡƒ ΠΈ ΡƒΠ΄ΠΎΠ±Π½ΠΎΠ³ΠΎ просмотра Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ².

1. ΠžΠ±Π·ΠΎΡ€ Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Ρ‹

1.1 ВранскрипционныС Ρ„Π°ΠΊΡ‚ΠΎΡ€Ρ‹

1.1.1 ΠžΠ±Ρ‰ΠΈΠ΅ свСдСния

Π˜Π½ΠΈΡ†ΠΈΠ°Ρ†ΠΈΡ транскрипции — слоТный процСсс, ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ зависит ΠΎΡ‚ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ устроСна ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ Π”ΠΠš нСпосрСдствСнно Π²Π±Π»ΠΈΠ·ΠΈ Π½Π°Ρ‡Π°Π»Π° транскрибируСмой области (Π° Ρƒ ΡΡƒΠΊΠ°Ρ€ΠΈΠΎΡ‚ Ρ‚Π°ΠΊΠΆΠ΅ ΠΈ Π² Π±ΠΎΠ»Π΅Π΅ Π΄Π°Π»Π΅ΠΊΠΈΡ… участках Π³Π΅Π½ΠΎΠΌΠ° — энхансСрах ΠΈ ΡΠ°ΠΉΠ»Π΅Π½ΡΠ΅Ρ€Π°Ρ…), Π° Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΡ‚ Π½Π°Π»ΠΈΡ‡ΠΈΡ ΠΈΠ»ΠΈ отсутствия Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π±Π΅Π»ΠΊΠΎΠ²Ρ‹Ρ… транскрипционных Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ².

Π€Π°ΠΊΡ‚ΠΎΡ€Ρ‹ транскрипции — Π±Π΅Π»ΠΊΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ€Π΅Π³ΡƒΠ»ΠΈΡ€ΡƒΡŽΡ‚ Ρ‚Ρ€Π°Π½ΡΠΊΡ€ΠΈΠΏΡ†ΠΈΡŽ ΠΏΡƒΡ‚Π΅ΠΌ связывания со ΡΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½Ρ‹ΠΌΠΈ участками Π”ΠΠš — сайтами связывания. ВранскрипционныС Ρ„Π°ΠΊΡ‚ΠΎΡ€Ρ‹ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡŽΡ‚ свою Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ ΡΠ°ΠΌΠΎΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½ΠΎ Π»ΠΈΠ±ΠΎ Π² ΠΊΠΎΠΌΠΏΠ»Π΅ΠΊΡΠ΅ с Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ Π±Π΅Π»ΠΊΠ°ΠΌΠΈ. Π Π°Π·Π»ΠΈΡ‡Π°ΡŽΡ‚ рСпрСссорныС ΠΈ Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠ΅ транскрипционныС Ρ„Π°ΠΊΡ‚ΠΎΡ€Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ соотвСтствСнно ΡΠ½ΠΈΠΆΠ°ΡŽΡ‚ ΠΈΠ»ΠΈ ΠΏΠΎΠ²Ρ‹ΡˆΠ°ΡŽΡ‚ константу связывания РНК-ΠΏΠΎΠ»ΠΈΠΌΠ΅Ρ€Π°Π·Ρ‹ с Ρ€Π΅Π³ΡƒΠ»ΡΡ‚ΠΎΡ€Π½Ρ‹ΠΌΠΈ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΠΌΠΈ экспрСссируСмого Π³Π΅Π½Π°.

ΠžΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‰Π°Ρ Ρ‡Π΅Ρ€Ρ‚Π° Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² транскрипции — Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ Π² ΠΈΡ… ΡΠΎΡΡ‚Π°Π²Π΅ ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΈΠ»ΠΈ Π±ΠΎΠ»Π΅Π΅ Π”ΠΠš-ΡΠ²ΡΠ·Ρ‹Π²Π°ΡŽΡ‰ΠΈΡ… Π΄ΠΎΠΌΠ΅Π½ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π²Π·Π°ΠΈΠΌΠΎΠ΄Π΅ΠΉΡΡ‚Π²ΡƒΡŽΡ‚ с Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€Π½Ρ‹ΠΌΠΈ участками Π”ΠΠš, располоТСнными Π² Ρ€Π΅Π³ΡƒΠ»ΡΡ‚ΠΎΡ€Π½Ρ‹Ρ… областях Π³Π΅Π½ΠΎΠ².

ВранскрипционныС Ρ„Π°ΠΊΡ‚ΠΎΡ€Ρ‹ Π±Ρ‹Π²Π°ΡŽΡ‚ конститутивныС (всСгда Π°ΠΊΡ‚ΠΈΠ²Π½Ρ‹Π΅ Π² ΠΊΠ»Π΅Ρ‚ΠΊΠ΅) ΠΈ Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΡƒΠ΅ΠΌΡ‹Π΅ (Π°ΠΊΡ‚ΠΈΠ²Π½Ρ‹ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… условиях). АктивируСмыС Π² ΡΠ²ΠΎΡŽ ΠΎΡ‡Π΅Ρ€Π΅Π΄ΡŒ Ρ€Π°Π·Π΄Π΅Π»ΡΡŽΡ‚ Π½Π° Ρ‚канСспСцифичСскиС (ΡƒΡ‡Π°ΡΡ‚Π²ΡƒΡŽΡ‚ Π² Ρ€Π°Π·Π²ΠΈΡ‚ΠΈΠΈ ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΌΠ°) ΠΈ ΡΠΈΠ³Π½Π°Π»-зависимыС, ΠΈΠ»ΠΈ Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€Ρ‹ (Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‚ внСшнСго сигнала для Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ).

Для функционирования транскрипционных Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² Ρ‡Π°Ρ‰Π΅ всСго Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Ρ„ΠΎΡ€ΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ Π³Π΅Ρ‚Π΅Ρ€ΠΎΠ΄ΠΈΠΌΠ΅Ρ€Π½ΠΎΠ³ΠΎ ΠΈΠ»ΠΈ Π³ΠΎΠΌΠΎΠ΄ΠΈΠΌΠ΅Ρ€Π½ΠΎΠ³ΠΎ комплСкса. НапримСр, Π³Π΅Ρ‚Π΅Ρ€ΠΎΠ΄ΠΈΠΌΠ΅Ρ€Π½Ρ‹Π΅ комплСксы Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… ядСрных Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€ΠΎΠ² с Ρ€Π΅Ρ‚ΠΈΠ½ΠΎΠΈΠ΄Π½Ρ‹ΠΌ Π₯ Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€ΠΎΠΌ (RXR). Π‘ΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ Ρ‚Π°ΠΊΠΆΠ΅ ΠΈ Π³ΠΎΠΌΠΎΠ΄ΠΈΠΌΠ΅Ρ€Π½Ρ‹Π΅ комплСксы RXR (рис. 1).

Рис. 1. ΠŸΡ€ΠΈΠΌΠ΅Ρ€ Π³Π΅Ρ‚Π΅Ρ€ΠΎΠ΄ΠΈΠΌΠ΅Ρ€Π° RXR/TR ΠΈ Π³ΠΎΠΌΠΎΠ΄ΠΈΠΌΠ΅Ρ€Π° RXR

ΠžΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ Π΄ΠΈΠΌΠ΅Ρ€ΠΎΠ² Π²Ρ‹Π³ΠΎΠ΄Π½ΠΎ, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ Π·Π° ΡΡ‡Π΅Ρ‚ способа связывания Π΄ΠΈΠΌΠ΅Ρ€Π° с Π”ΠΠš ΠΈ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π΄Ρ€ΡƒΠ³ΠΈΡ… особСнностСй ΠΏΠΎΠ²Ρ‹ΡˆΠ°Π΅Ρ‚ΡΡ ΡΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒ Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ². К Ρ‚ΠΎΠΌΡƒ ΠΆΠ΅, ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ Ρ‚Π°ΠΊΠΈΠ΅ транскрипционныС Ρ„Π°ΠΊΡ‚ΠΎΡ€Ρ‹, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ядСрный Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€ RXR, для ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… количСство сайтов связывания большС, Ρ‡Π΅ΠΌ для ΠΌΠ½ΠΎΠ³ΠΈΡ… Π΄Ρ€ΡƒΠ³ΠΈΡ…, ΠΈ ΡΡ‚ΠΎ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ поиску сайта с ΠΌΠ°ΠΊΡΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΌ сродством.

Π’ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΠΈ ΠΎΡ‚ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ части Π΄ΠΈΠΌΠ΅Ρ€Π° располоТСны Π΄Ρ€ΡƒΠ³ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π΄Ρ€ΡƒΠ³Π°, сайт связывания Ρ‚Π°ΠΊΠΎΠ³ΠΎ Π΄ΠΈΠΌΠ΅Ρ€Π° с Π”ΠΠš ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡ‚ΡŒ собой ΠΏΠ°Π»ΠΈΠ½Π΄Ρ€ΠΎΠΌ, прямой ΠΏΠΎΠ²Ρ‚ΠΎΡ€ ΠΈΠ»ΠΈ ΠΈΠ½Π²Π΅Ρ€Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΉ ΠΏΠΎΠ²Ρ‚ΠΎΡ€ (Π’Π°Π±Π»ΠΈΡ†Π° 1) [5, 6].

Π’Π°Π±Π»ΠΈΡ†Π° 1. Π’ΠΈΠΏΡ‹ структур сайтов связывания транскрипционных Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ²

ΠŸΠ°Π»ΠΈΠ½Π΄Ρ€ΠΎΠΌ

5' - GACTGCGCAGTC-3'

3' - GACTGCGCAGTC-5'

ΠŸΡ€ΡΠΌΠΎΠΉ ΠΏΠΎΠ²Ρ‚ΠΎΡ€

5' - GACTGCagtGACTGC-3'

3' - GCAGTCactGCAGTC-5'

Π˜Π½Π²Π΅Ρ€Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΉ ΠΏΠΎΠ²Ρ‚ΠΎΡ€

5' - GACTGCagtGCAGTC-3'

3' - GACTGCactGCAGTC-5'

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ поиск ΠΌΠΎΡ‚ΠΈΠ² марковский модСль

ΠŸΠ°Π»ΠΈΠ½Π΄Ρ€ΠΎΠΌ — это сайт, ΠΏΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΉ своСму ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎΠΌΡƒ ΠΊΠΎΠΌΠΏΠ»Π΅ΠΌΠ΅Π½Ρ‚Ρƒ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, CACGTG). Π‘Π°ΠΉΡ‚Ρ‹ прямых ΠΈ ΠΈΠ½Π²Π΅Ρ€Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… ΠΏΠΎΠ²Ρ‚ΠΎΡ€ΠΎΠ² состоят ΠΈΠ· Π΄Π²ΡƒΡ… ΠΏΠ»Π΅Ρ‡, Ρ€Π°Π·Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΊΠΎΠΌ — спСйсСром. Π”Π»ΠΈΠ½Π° спСйсСра часто постоянна, Π½ΠΎ ΠΈΠ½ΠΎΠ³Π΄Π° ΠΌΠΎΠΆΠ΅Ρ‚ Π²Π°Ρ€ΡŒΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒΡΡ Π½Π° Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΎ Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄ΠΎΠ². ΠŸΠ»Π΅Ρ‡ΠΈ прямых ΠΏΠΎΠ²Ρ‚ΠΎΡ€ΠΎΠ² ΠΈΠΌΠ΅ΡŽΡ‚ ΡΠΎΠ²ΠΏΠ°Π΄Π°ΡŽΡ‰ΡƒΡŽ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ. ΠŸΠ»Π΅Ρ‡ΠΈ ΠΈΠ½Π²Π΅Ρ€Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… ΠΏΠΎΠ²Ρ‚ΠΎΡ€ΠΎΠ² ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎ ΠΊΠΎΠΌΠΏΠ»Π΅ΠΌΠ΅Π½Ρ‚Π°Ρ€Π½Ρ‹. Если Π΄Π»ΠΈΠ½Π° спСйсСра ΠΈΠ½Π²Π΅Ρ€Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ ΠΏΠΎΠ²Ρ‚ΠΎΡ€Π° Ρ€Π°Π²Π½Π° Π½ΡƒΠ»ΡŽ, этот сайт ΠΌΠΎΠΆΠ½ΠΎ Π½Π°Π·Π²Π°Ρ‚ΡŒ ΠΏΠ°Π»ΠΈΠ½Π΄Ρ€ΠΎΠΌΠΎΠΌ.

1.1.2 Π Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ структуры сайтов связывания

Рассмотрим Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ структуры сайтов связывания Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€ΠΎΠ² стСроидных Π³ΠΎΡ€ΠΌΠΎΠ½ΠΎΠ². Π­Ρ‚ΠΎ Π²Π½ΡƒΡ‚Ρ€ΠΈΠΊΠ»Π΅Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€Ρ‹, Ρ‡Π°Ρ‰Π΅ всСго Π»ΠΎΠΊΠ°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π½Ρ‹Π΅ Π² ΡΠ΄Ρ€Π΅ ΠΈ ΠΎΡΡƒΡ‰Π΅ΡΡ‚Π²Π»ΡΡŽΡ‰ΠΈΠ΅ ΠΏΠ΅Ρ€Π΅Π΄Π°Ρ‡Ρƒ сигнала ΠΎΡ‚ ΡΡ‚Π΅Ρ€ΠΎΠΈΠ΄Π½Ρ‹Ρ… Π³ΠΎΡ€ΠΌΠΎΠ½ΠΎΠ².

Π”ΠΠš-ΡΠ²ΡΠ·Ρ‹Π²Π°ΡŽΡ‰ΠΈΠΉ Π΄ΠΎΠΌΠ΅Π½ стСроидных Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€ΠΎΠ² содСрТит аминокислоты, спСцифично ΡΠ²ΡΠ·Ρ‹Π²Π°ΡŽΡ‰ΠΈΠ΅ΡΡ с Π³ΠΎΡ€ΠΌΠΎΠ½-Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½Π½Ρ‹ΠΌ элСмСнтом (сайтом связывания) Π½Π° ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π”ΠΠš. Π­Ρ‚ΠΎΡ‚ участок состоит ΠΈΠ· 66−68 высоко консСрвативных аминокислот, ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… 8 цистСинов ΠΎΠ±Ρ€Π°Π·ΡƒΡŽΡ‚ 2 структуры Ρ‚ΠΈΠΏΠ° Ρ†ΠΈΠ½ΠΊΠΎΠ²Ρ‹Ρ… ΠΏΠ°Π»ΡŒΡ†Π΅Π², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π²Π·Π°ΠΈΠΌΠΎΠ΄Π΅ΠΉΡΡ‚Π²ΡƒΡŽΡ‚ с Π”ΠΠš. ΠžΡΡ‚Π°Π»ΡŒΠ½Ρ‹Π΅ аминокислоты Π”ΠΠš-ΡΠ²ΡΠ·Ρ‹Π²Π°ΡŽΡ‰Π΅Π³ΠΎ Π΄ΠΎΠΌΠ΅Π½Π° ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‚ ΡΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒ связывания Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… стСроидных Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€ΠΎΠ² (рис. 2).

Рис. 2. Π‘Ρ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π° Π”ΠΠš-ΡΠ²ΡΠ·Ρ‹Π²Π°ΡŽΡ‰Π΅Π³ΠΎ Π΄ΠΎΠΌΠ΅Π½Π° ядСрных Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€ΠΎΠ². Π‘ΠΈΠ½ΠΈΠΌΠΈ ΠΊΡ€ΡƒΠΆΠΊΠ°ΠΌΠΈ ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π΅Π½Ρ‹ остатки цистСина, ΠΎΠ±Ρ€Π°Π·ΡƒΡŽΡ‰ΠΈΠ΅ ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ связи с Ρ†ΠΈΠ½ΠΊΠΎΠΌ (Zn), ΠΎΡ€Π°Π½ΠΆΠ΅Π²Ρ‹ΠΌΠΈ — аминокислотныС остатки, нСпосрСдствСнно ΠΊΠΎΠ½Ρ‚Π°ΠΊΡ‚ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠ΅ с Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄Π°ΠΌΠΈ, Π·Π΅Π»Π΅Π½Ρ‹ΠΌΠΈ — аминокислотныС остатки, ΡƒΡ‡Π°ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ Π² Π΄ΠΈΠΌΠ΅Ρ€ΠΈΠ·Π°Ρ†ΠΈΠΈ Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€ΠΎΠ²

ΠžΠ±Ρ‰Π°Ρ схСма взаимодСйствия Ρ‚Π°ΠΊΠΎΠ²Π°: Π΄Π²Π° Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€Π° ΡΠ²ΡΠ·Ρ‹Π²Π°ΡŽΡ‚ΡΡ с Π³ΠΎΡ€ΠΌΠΎΠ½ΠΎΠΌ, Π° Π·Π°Ρ‚Π΅ΠΌ ΠΎΠ±Ρ€Π°Π·ΡƒΡŽΡ‚ Π³ΠΎΠΌΠΎΠ΄ΠΈΠΌΠ΅Ρ€. Π­Ρ‚ΠΎΡ‚ Π³ΠΎΠΌΠΎΠ΄ΠΈΠΌΠ΅Ρ€ связываСтся с Π³ΠΎΡ€ΠΌΠΎΠ½-Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ элСмСнтом. Π—Π°Ρ‚Π΅ΠΌ Π² ΠΏΡ€ΠΎΡ†Π΅ΡΡ транскрипции Π²ΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‚ΡΡ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ транскрипционныС Ρ„Π°ΠΊΡ‚ΠΎΡ€Ρ‹ ΠΈ Π ΠΠš ΠΏΠΎΠ»ΠΈΠΌΠ΅Ρ€Π°Π·Π° II, Ρ‡Ρ‚ΠΎ стабилизируСт ΠΏΡ€Π΅ΠΈΠ½ΠΈΡ†ΠΈΠ°Ρ‚ΠΈΠ²Π½Ρ‹ΠΉ комплСкс ΠΈ Π·Π°ΠΏΡƒΡΠΊΠ°Π΅Ρ‚ синтСз мРНК (рис. 3).

Рис. 3. ΠžΠ±Ρ‰Π°Ρ схСма ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΠ° Ρ€Π°Π±ΠΎΡ‚Ρ‹ Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€ΠΎΠ² стСроидных Π³ΠΎΡ€ΠΌΠΎΠ½ΠΎΠ². HRE — Π³ΠΎΡ€ΠΌΠΎΠ½-Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ элСмСнт, pol II — РНК ΠΏΠΎΠ»ΠΈΠΌΠ΅Ρ€Π°Π·Π° II

Π‘Π°ΠΉΡ‚ связывания Ρ‡Π°Ρ‰Π΅ всСго располоТСн Π² ΠΏΡ€ΠΎΠΌΠΎΡ‚ΠΎΡ€Π½ΠΎΠΉ области ΠΈΠ»ΠΈ Π½Π° Ρ€Π°ΡΡΡ‚оянии Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΊΠΈΠ»ΠΎΠ±Π°Π· Π΄ΠΎ TATA ΠΈ CAAT боксов, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ находятся рядом с ΡΠ°ΠΉΡ‚ΠΎΠΌ Π½Π°Ρ‡Π°Π»Π° транскрипции. ΠŸΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ Π² ΠΏΠΎΡΠ»Π΅Π΄Π½Π΅ΠΌ случаС ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΎΠ½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ нуклСосомы ΠΌΠΎΠΆΠ΅Ρ‚ ΡƒΡΠΈΠ»ΠΈΠ²Π°Ρ‚ΡŒ ΡΡ‚ΠΈΠΌΡƒΠ»ΠΈΡ€ΡƒΡŽΡ‰Π΅Π΅ дСйствиС Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€ΠΎΠ² Π½Π° Ρ‚Ρ€Π°Π½ΡΠΊΡ€ΠΈΠΏΡ†ΠΈΡŽ Π·Π° ΡΡ‡Π΅Ρ‚ образования ΠΏΠ΅Ρ‚Π»ΠΈ (рис. 4).

Рис. 4. УчастиС нуклСосомы Π² ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠΈ ΠΏΠ΅Ρ‚Π»ΠΈ для усилСния дСйствия Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€Π° Π½Π° ΠΏΡ€ΠΎΡ†Π΅ΡΡ транскрипции. NR — ядСрный Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€, HRE — Π³ΠΎΡ€ΠΌΠΎΠ½-Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ элСмСнт, TF — транскрипционный Ρ„Π°ΠΊΡ‚ΠΎΡ€, TFBS — Π΅Π³ΠΎ сайт связывания, Pol — РНК ΠΏΠΎΠ»ΠΈΠΌΠ΅Ρ€Π°Π·Π° II

Π“ΠΎΠΌΠΎΠ΄ΠΈΠΌΠ΅Ρ€Ρ‹ Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€ΠΎΠ² I Ρ‚ΠΈΠΏΠ° ΡΠ²ΡΠ·Ρ‹Π²Π°ΡŽΡ‚ΡΡ с ΡΠ°ΠΉΡ‚Π°ΠΌΠΈ, ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΠΌΠΈ структуру Ρ‚ΠΈΠΏΠ° ΠΏΠ°Π»ΠΈΠ½Π΄Ρ€ΠΎΠΌ ΠΈΠ»ΠΈ ΠΈΠ½Π²Π΅Ρ€Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΉ ΠΏΠΎΠ²Ρ‚ΠΎΡ€ со ΡΠΏΠ΅ΠΉΡΠ΅Ρ€ΠΎΠΌ Π΄Π»ΠΈΠ½ΠΎΠΉ Π² 3 Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄Π°. Π“ΠΎΠΌΠΎΠ΄ΠΈΠΌΠ΅Ρ€Ρ‹ Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€ΠΎΠ² II Ρ‚ΠΈΠΏΠ° ΡΠ²ΡΠ·Ρ‹Π²Π°ΡŽΡ‚ΡΡ с ΡΠ°ΠΉΡ‚Π°ΠΌΠΈ, ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΠΌΠΈ структуру Ρ‚ΠΈΠΏΠ° прямой ΠΏΠΎΠ²Ρ‚ΠΎΡ€ с Π²Π°Ρ€ΠΈΠ°Π±Π΅Π»ΡŒΠ½Ρ‹ΠΌ спСйсСром Π΄Π»ΠΈΠ½Ρ‹ 0−5 Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄ΠΎΠ² (рис. 5).

Рис. 5. ВзаимодСйствиС связанных с Π³ΠΎΡ€ΠΌΠΎΠ½ΠΎΠΌ (Ρ‡Π΅Ρ€Π½Ρ‹Π΅ Ρ‚Ρ€Π΅ΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊΠΈ) Π³ΠΎΠΌΠΎΠ΄ΠΈΠΌΠ΅Ρ€ΠΎΠ² Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€ΠΎΠ² стСроидных Π³ΠΎΡ€ΠΌΠΎΠ½ΠΎΠ² с Π³ΠΎΡ€ΠΌΠΎΠ½-Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ элСмСнтом (HRE)

Π Π°Π·ΠΌΠ΅Ρ€ спСйсСра ΠΌΠ΅ΠΆΠ΄Ρƒ полусайтами Π³ΠΎΡ€ΠΌΠΎΠ½-Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… элСмСнтов опрСдСляСт взаимодСйствиС с Π”ΠΠš Π΄ΠΈΠΌΠ΅Ρ€Π½Ρ‹Ρ… ядСрных Ρ€Π΅Ρ†Π΅ΠΏΡ‚ΠΎΡ€ΠΎΠ². Π§Π΅ΠΌ большС Π΄Π»ΠΈΠ½Π° спСйсСра, Ρ‚Π΅ΠΌ Π±ΠΎΠ»Π΅Π΅ спСцифичСн Π³ΠΎΡ€ΠΌΠΎΠ½-Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ элСмСнт (рис. 6).

Рис. 6. Π—Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ спСцифичности сайтов связывания транскрипционных Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² ΠΎΡ‚ Π΄Π»ΠΈΠ½Ρ‹ спСйсСра Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π³Π΅Ρ‚Π΅Ρ€ΠΎΠ΄ΠΈΠΌΠ΅Ρ€ΠΎΠ² RXR

1.2 Бпособы прСдставлСния рСгуляторных элСмСнтов

НаиболСС распространСнными способами прСдставлСния ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ сайтов связывания Π±Π΅Π»ΠΊΠΎΠ² с Π”ΠΠš ΡΠ²Π»ΡΡŽΡ‚ΡΡ консСнсус (рСгулярноС Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅) ΠΈ ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΎΠ½Π½Π°Ρ вСсовая ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° (PWM — position weight matrix, ΠΈΠ»ΠΈ PSSM — position-specific scoring matrix). ΠšΠΎΠ½ΡΠ΅Π½ΡΡƒΡ прСдставляСт собой ΠΎΠ±Ρ‰ΠΈΠΉ Π²ΠΈΠ΄ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ сайта — слово, составлСнноС ΠΈΠ· Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄ΠΎΠ², Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ часто Π²ΡΡ‚Ρ€Π΅Ρ‡Π°ΡŽΡ‰ΠΈΡ…ΡΡ Π² ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹Ρ… позициях сайта. Часто для ΡƒΡ‡Π΅Ρ‚Π° Π²Π°Ρ€ΠΈΠ°Ρ†ΠΈΠΉ Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… позициях консСнсуса ΠΏΠΎΠΌΠΈΠΌΠΎ основных Ρ‡Π΅Ρ‚Ρ‹Ρ€Π΅Ρ… Π±ΡƒΠΊΠ² ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ обозначСния Π²Ρ‹Ρ€ΠΎΠΆΠ΄Π΅Π½Π½Ρ‹Ρ… Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄ΠΎΠ² Π² ΡΠΎΠΎΡ‚вСтствии с Π½ΠΎΡ€ΠΌΠ°ΠΌΠΈ IUPAC. ΠšΠΎΠ½ΡΠ΅Π½ΡΡƒΡΡ‹ Ρ…ΠΎΡ€ΠΎΡˆΠΎ подходят для описания сайтов связывания Π±Π΅Π»ΠΊΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡΠ²ΡΠ·Ρ‹Π²Π°ΡŽΡ‚ΡΡ со ΡΡ‚Ρ€ΠΎΠ³ΠΎ консСрвативной ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒΡŽ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π±Π΅Π»ΠΊΠΈ систСмы рСстрикции-ΠΌΠΎΠ΄ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΈ II-ΠΎΠ³ΠΎ Ρ‚ΠΈΠΏΠ°).

Однако консСнсус Π½Π΅ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ‚ Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΠΎΠΏΠΈΡΠ°Ρ‚ΡŒ сайты Π² Ρ‚ΠΎΠΌ случаС, Ссли ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ сайта сильно Π²Π°Ρ€ΡŒΠΈΡ€ΡƒΠ΅Ρ‚ΡΡ. PWM, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π²ΠΏΠ΅Ρ€Π²Ρ‹Π΅ Π±Ρ‹Π»ΠΈ Π²Π²Π΅Π΄Π΅Π½Ρ‹ для характСристики сайтов ΠΈΠ½ΠΈΡ†ΠΈΠ°Ρ†ΠΈΠΈ транскрипции ΠΈ Ρ‚рансляции Ρƒ E.coli [9, 10], Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π»ΡƒΡ‡ΡˆΠ΅ подходят для описания сайтов связывания Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² транскрипции, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ способны количСствСнно ΠΎΡ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ΠΈΠ·ΠΎΠ²Π°Ρ‚ΡŒ частыС ΠΈ Ρ€Π΅Π΄ΠΊΠΈΠ΅ Π²Π°Ρ€ΠΈΠ°Ρ†ΠΈΠΈ Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ сайтов, Ρ‡Ρ‚ΠΎ Π½Π΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ Π² ΡΠ»ΡƒΡ‡Π°Π΅ рСгулярных Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ.

PWM ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ собой ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ L Π§ 4 (L — Π΄Π»ΠΈΠ½Π° сайта), ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ элСмСнт ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΎΡ‚Ρ€Π°ΠΆΠ°Π΅Ρ‚ частоту встрСчаСмости Π΄Π°Π½Π½ΠΎΠ³ΠΎ Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄Π° Π² Π΄Π°Π½Π½ΠΎΠΉ ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΈ сайта. ВСс, ΠΏΠΎΡ€ΠΎΠΆΠ΄Π°Π΅ΠΌΡ‹ΠΉ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π΅ΠΉ ΠΏΡ€ΠΈ Π²Ρ‹Ρ€Π°Π²Π½ΠΈΠ²Π°Π½ΠΈΠΈ с Π΄Π°Π½Π½Ρ‹ΠΌ участком ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ, ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ вычисляСтся ΠΊΠ°ΠΊ сумма элСмСнтов ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹, ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄Π°ΠΌ, стоящим Π² ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΈ рассматриваСмого участка (рис. 7).

Рис. 7. ΠšΠΎΠ½ΡΡ‚Ρ€ΡƒΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΎΠ½Π½ΠΎΠΉ вСсовой ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ (PWM) сайта связывания Ρ„Π°ΠΊΡ‚ΠΎΡ€Π° транскрипции (TFBS). (Π°) Π’Ρ‹Ρ€Π°Π²Π½ΠΈΠ²Π°Π½ΠΈΠ΅ дСсяти извСстных ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ TFBS. (b) ΠŸΠΎΠ΄ΡΡ‡Π΅Ρ‚ частот появлСния ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄Π° Π² ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΈ сайта (Π² Π΄Π°Π½Π½ΠΎΠΌ случаС Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρ‹ Π½Π΅ Π½ΠΎΡ€ΠΌΠΈΡ€ΠΎΠ²Π°Π½Ρ‹). Π­Ρ‚Π° Ρ‚Π°Π±Π»ΠΈΡ†Π° ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΈ Π½Π°Π·Ρ‹Π²Π°Π΅Ρ‚ся ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΎΠ½Π½ΠΎΠΉ вСсовой ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π΅ΠΉ. (с) Для Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ PWM часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π΄ΠΈΠ°Π³Ρ€Π°ΠΌΠΌΠ° logo, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΡΡ‚Π΅ΠΏΠ΅Π½ΡŒ консСрвативности ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΈ ΠΏΠΎΠΊΠ°Π·Π°Π½Π° высотой Π±ΡƒΠΊΠ²

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, PWM прСдоставляСт достаточно ΠΏΠΎΠ»Π½ΠΎΠ΅ описаниС участка Π”ΠΠš, с ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ способСн ΡΠ²ΡΠ·Ρ‹Π²Π°Ρ‚ΡŒΡΡ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹ΠΉ Π±Π΅Π»ΠΎΠΊ, ΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½Π° ΠΏΡ€ΠΈ сканировании Π³Π΅Π½ΠΎΠΌΠ½ΠΎΠΉ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ для поиска сайтов, Π΄Π°ΡŽΡ‰ΠΈΡ… достаточно Ρ…ΠΎΡ€ΠΎΡˆΠΈΠΉ вСс. ИспользованиС PWM позволяСт достаточно эффСктивно ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ сайты связывания Π±Π΅Π»ΠΊΠΎΠ². Π’Π°ΠΊ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, для 95% сайтов связывания тканСспСцифичСского Ρ„Π°ΠΊΡ‚ΠΎΡ€Π° ΠΏΠ΅Ρ‡Π΅Π½ΠΈ HNF-1, Π½Π°ΠΉΠ΄Π΅Π½Π½Ρ‹Ρ… Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… ΠΏΡ€ΠΈΠΌΠ°Ρ‚ΠΎΠ² ΠΈΠ· GenBank с ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π΅ΠΉ PWM ΠΈ ΠΎΡ‚Π»ΠΈΡ‡Π°ΡŽΡ‰ΠΈΡ…ΡΡ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ высоким вСсом, Π±Ρ‹Π»ΠΎ ΡΠΊΡΠΏΠ΅Ρ€ΠΈΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎ ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ связываниС с HNF-1 in vitro.

На Π½Π°ΡΡ‚оящий ΠΌΠΎΠΌΠ΅Π½Ρ‚ сущСствуСт Π΄Π²Π΅ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΠΏΠΎΠ»Π½Ρ‹Π΅ ΠΊΡƒΡ€ΠΈΡ€ΡƒΠ΅ΠΌΡ‹Π΅ Π±Π°Π·Ρ‹ PWM сайтов связывания Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² транскрипции: TRANSFAC ΠΈ JASPAR. JASPAR содСрТит Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ мСньшС Π΄Π°Π½Π½Ρ‹Ρ…, ΠΏΡ€ΠΈ Ρ‚ΠΎΠΌ Ρ‡Ρ‚ΠΎ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ транскрипционному Ρ„Π°ΠΊΡ‚ΠΎΡ€Ρƒ соотвСтствуСт Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ΄Π½Π° PWM, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ TRANSFAC содСрТит ΠΏΠΎ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΎ PWM для Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ². ΠšΡ€ΠΎΠΌΠ΅ этого сущСствуСт нСсколько Π±Π°Π· Π΄Π°Π½Π½Ρ‹Ρ…, содСрТащих рСгуляторныС области Π³Π΅Π½ΠΎΠ² (SCPD [15], TRRD [16]), Π° Ρ‚Π°ΠΊΠΆΠ΅ Π½Π΅Π΄Π°Π²Π½ΠΎ созданная Π±Π°Π·Π° Π΄Π°Π½Π½Ρ‹Ρ… UniPROBE [17], которая содСрТит сайты связывания транскрипционных Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ², ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ Π±Π΅Π»ΠΎΠΊ-ΡΠ²ΡΠ·Ρ‹Π²Π°ΡŽΡ‰ΠΈΡ… ΠΌΠΈΠΊΡ€ΠΎΡ‡ΠΈΠΏΠΎΠ² (protein binding microarray, PBM).

Поиск сайтов связывания Π±Π΅Π»ΠΊΠΎΠ² in silico — это Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ шаг ΠΊ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΡŽ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Ρ… сайтов. РСгуляция Π³Π΅Π½ΠΎΠ² сильно зависит Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΡ‚ ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Ρ‹ Ρ…Ρ€ΠΎΠΌΠ°Ρ‚ΠΈΠ½Π° ΠΈ Π”ΠΠš-мСтилирования [19−21]. Π‘ΠΎΠ»ΡŒΡˆΠ°Ρ Ρ‡Π°ΡΡ‚ΡŒ хромосомной Π”ΠΠš прСдставляСт собой ΠΊΠΎΠΌΠΏΠ°ΠΊΡ‚Π½ΠΎ ΡƒΠΏΠ°ΠΊΠΎΠ²Π°Π½Π½Ρ‹ΠΉ Π³Π΅Ρ‚Π΅Ρ€ΠΎΡ…Ρ€ΠΎΠΌΠ°Ρ‚ΠΈΠ½ ΠΈ Π²ΡΠ»Π΅Π΄ΡΡ‚Π²ΠΈΠ΅ этого ΠΈΠ·ΠΎΠ»ΠΈΡ€ΠΎΠ²Π°Π½Π° ΠΎΡ‚ Π²Π·Π°ΠΈΠΌΠΎΠ΄Π΅ΠΉΡΡ‚вия с Ρ‚ранскрипционными Ρ„Π°ΠΊΡ‚ΠΎΡ€Π°ΠΌΠΈ. ΠœΠ΅Ρ‚ΠΈΠ»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ Π”ΠΠš Ρ‚ΠΎΠΆΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΡ€Π΅ΠΏΡΡ‚ΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ ΡΠ²ΡΠ·Ρ‹Π²Π°Π½ΠΈΡŽ Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² с ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹ΠΌΠΈ участками Π”ΠΠš, Π° Ρ‚Π°ΠΊΠΆΠ΅ Π²Π»ΠΈΡΡ‚ΡŒ Π½Π° ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Ρƒ Ρ…Ρ€ΠΎΠΌΠ°Ρ‚ΠΈΠ½Π°. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ ΠΏΠΎΡ‚Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½Ρ‹Π΅ сайты, ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Π΅ΠΌΡ‹Π΅ ΠΏΡ€ΠΈ ΠΏΠΎΠ»Π½ΠΎΠ³Π΅Π½ΠΎΠΌΠ½ΠΎΠΌ поискС Π±Π΅Π· ΡƒΡ‡Π΅Ρ‚Π° этих Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ², Π½Π΅ ΡΠ²Π»ΡΡŽΡ‚ся Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ in vivo, хотя ΠΎΠ½ΠΈ Π±Ρ‹Π»ΠΈ Π±Ρ‹ способны ΡΠ²ΡΠ·Ρ‹Π²Π°Ρ‚ΡŒ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Π΅ транскрипционныС Ρ„Π°ΠΊΡ‚ΠΎΡ€Ρ‹, Π±ΡƒΠ΄ΡƒΡ‡ΠΈ ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ΠΌΠΈ для взаимодСйствия.

Π‘Π»Π΅Π΄ΡƒΠ΅Ρ‚ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ, нСсмотря Π½Π° Π²ΡΠ΅ свои достоинства, PWM всС-Ρ‚Π°ΠΊΠΈ ΠΈΠΌΠ΅Π΅Ρ‚ нСсколько нСдостатков. Одним ΠΈΠ· Π½ΠΈΡ… являСтся Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ стандартная PWM Π½Π΅ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Π΅Ρ‚ Π²Π·Π°ΠΈΠΌΠ½ΠΎΠ΅ влияниС сосСдних ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΉ сайта (мононуклСотидная модСль). Однако Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ Ρ‚Π°ΠΊΠΈΡ… зависимостСй Π±Ρ‹Π»ΠΎ ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ для Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² [22−24]. Π’ Ρ‚Π°ΠΊΠΈΡ… случаях ΠΌΠΎΠ΄Π΅Π»ΠΈ Π±ΠΎΠ»Π΅Π΅ высокого порядка (Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°ΡŽΡ‰ΠΈΠ΅ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΉ сайта), Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π΄ΠΈΠ½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄Π½Ρ‹Π΅ PWM, Π΄Π΅ΠΌΠΎΠ½ΡΡ‚Ρ€ΠΈΡ€ΡƒΡŽΡ‚ Π±ΠΎΠ»Π΅Π΅ Π°ΠΊΠΊΡƒΡ€Π°Ρ‚Π½ΠΎΠ΅ прСдсказаниС ΠΏΠΎΡ‚Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… сайтов [24−27].

К Ρ‚ΠΎΠΌΡƒ ΠΆΠ΅, Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… случаях Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΠΎΠ»ΠΎΠ²ΠΈΠ½Π° (ΠΈΠ»ΠΈ Π΄Π°ΠΆΠ΅ мСньшС) ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΉ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ ΠΎΠ±Π»Π°Π΄Π°ΡŽΡ‚ достаточно высоким ΡƒΡ€ΠΎΠ²Π½Π΅ΠΌ консСрвативности, Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ Ρ‡Π΅Π³ΠΎ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ поиска с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ‚Π°ΠΊΠΎΠΉ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ ΠΏΠ°Π΄Π°Π΅Ρ‚. Иногда такая ΠΊΠΎΠ½ΡΠ΅Ρ€Π²Π°Ρ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ PWM ΠΎΡ‚Ρ€Π°ΠΆΠ°Π΅Ρ‚ ΡΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒ транскрипционного Ρ„Π°ΠΊΡ‚ΠΎΡ€Π°, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ сам ΠΏΠΎ ΡΠ΅Π±Π΅ слабо взаимодСйствуСт с Π”ΠΠš, Π° Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ дСйствия достигаСтся Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² ΠΊΠΎΠ½Ρ‚СкстС сосСдних сайтов связывания. Π’Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅, Π² Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π΅ случаСв Π½ΠΈΠ·ΠΊΠΎΠ΅ качСство PWM ΠΎΠ±ΡŠΡΡΠ½ΡΠ΅Ρ‚ΡΡ Π½Π΅ ΡΠ²ΠΎΠΉΡΡ‚Π²Π°ΠΌΠΈ транскрипционного Ρ„Π°ΠΊΡ‚ΠΎΡ€Π°, Π°, скорСС, нСдостаточно ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½Ρ‹ΠΌ составлСниСм PWM.

НС ΠΎΡ‡Π΅Π½ΡŒ высокоС качСство PWM ΠΌΠΎΠΆΠ΅Ρ‚ Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΠ±ΡŠΡΡΠ½ΡΡ‚ΡŒΡΡ ΠΌΠ°Π»Ρ‹ΠΌ числом сайтов, извСстных для Π΄Π°Π½Π½ΠΎΠ³ΠΎ Ρ„Π°ΠΊΡ‚ΠΎΡ€Π°. Π’ ΡΡ‚ΠΎΠΌ случаС PWM ΠΌΠΎΠΆΠ΅Ρ‚ Π½Π΅ ΠΎΡ‚Ρ€Π°ΠΆΠ°Ρ‚ΡŒ всСх Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… Π²Π°Ρ€ΠΈΠ°Ρ†ΠΈΠΉ сайтов, вслСдствиС Ρ‡Π΅Π³ΠΎ ΠΏΡ€ΠΈ поискС Ρ‚Π°ΠΊΠΎΠΉ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π΅ΠΉ большоС количСство Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… сайтов Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π½Π°ΠΉΠ΄Π΅Π½ΠΎ. Π’ Ρ‚Π°ΠΊΠΈΡ… случаях ΠΈΠΌΠ΅Π΅Ρ‚ смысл ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡ‚ΡŒ сайты связывания Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² ΠΎΠ΄Π½ΠΎΠ³ΠΎ сСмСйства, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ послСдниС часто ΠΈΠΌΠ΅ΡŽΡ‚ ΠΎΡ‡Π΅Π½ΡŒ ΠΏΠΎΡ…ΠΎΠΆΡƒΡŽ структуру ΠΈ ΡΠΏΠΎΡΠΎΠ± связывания. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, ΠΏΡ€ΠΈ нСдостаткС извСстных сайтов Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… случаях ΠΌΠΎΠΆΠ½ΠΎ ΡΠΎΠ·Π΄Π°Π²Π°Ρ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ рСгуляторных элСмСнтов, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π΅ Π”ΠΠš-Π±Π΅Π»ΠΊΠΎΠ²Ρ‹Ρ… взаимодСйствий. ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹, ΠΎΠΏΠΈΡ€Π°ΡŽΡ‰ΠΈΠ΅ΡΡ Π½Π° ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ Ρ‚Π°ΠΊΠΎΠ³ΠΎ Ρ€ΠΎΠ΄Π°, ΠΏΠΎΠΊΠ° Π½Π΅ ΠΌΠ½ΠΎΠ³ΠΎΡ‡ΠΈΡΠ»Π΅Π½Π½Ρ‹ (Π² ΠΎΡΠ½ΠΎΠ²Π½ΠΎΠΌ ΠΈΠ·-Π·Π° ΠΌΠ°Π»ΠΎΠ³ΠΎ числа Ρ€Π°ΡΡˆΠΈΡ„Ρ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… структур Π”ΠΠš-Π±Π΅Π»ΠΊΠΎΠ²Ρ‹Ρ… комплСксов), ΠΎΠ΄Π½Π°ΠΊΠΎ Π² ΠΏΠΎΡΠ»Π΅Π΄Π½Π΅Π΅ врСмя эта ΠΎΠ±Π»Π°ΡΡ‚ΡŒ Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ развиваСтся [29, 30]. Π’Π°ΠΊΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‚ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚ΡŒ Π½ΠΎΠ²Ρ‹Π΅ рСгуляторныС ΠΌΠΎΡ‚ΠΈΠ²Ρ‹ [31], Π½ΠΎ ΠΈ ΡƒΠ»ΡƒΡ‡ΡˆΠΈΡ‚ΡŒ качСство ΡƒΠΆΠ΅ ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΡ…ΡΡ PWM.

Π’ ΡΠ»ΡƒΡ‡Π°Π΅, ΠΊΠΎΠ³Π΄Π° нСдостаток сайтов Π²ΠΎΡΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ Π½Π΅ ΡƒΠ΄Π°Π΅Ρ‚ся ΠΈΠ»ΠΈ сайты слишком консСрвативны, ΠΏΡ€ΠΈ построСнии PWM ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ искусствСнный ΠΏΡ€ΠΈΠ΅ΠΌ «Ρ€Π°Π·ΠΌΡ‹Π²Π°Π½ΠΈΡ» ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹. Для этого часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ псСвдоотсчСты. ΠŸΡ€ΠΎΡΡ‚Π΅ΠΉΡˆΠΈΠΉ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ псСвдоотсчСтов — ΠΏΡ€ΠΈΠ±Π°Π²ΠΈΡ‚ΡŒ Π΄ΠΎ Π½ΠΎΡ€ΠΌΠΈΡ€ΠΎΠ²ΠΊΠΈ ΠΊ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ счСтчику Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄ΠΎΠ² Π² ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΈ PWM ΠΊΠ°ΠΊΡƒΡŽ-Ρ‚ΠΎ Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρƒ. Π’Π΅Π»ΠΈΡ‡ΠΈΠ½Π° псСвдоотсчСтов ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ выбираСтся Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΡ… ΡΡƒΠΌΠΌΠ° Π±Ρ‹Π»Π° ΠΏΡ€ΠΎΠΏΠΎΡ€Ρ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Π°, Π³Π΄Π΅ N — количСство ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ Π² Π²Ρ‹Ρ€Π°Π²Π½ΠΈΠ²Π°Π½ΠΈΠΈ.

Для ΠΎΡ†Π΅Π½ΠΊΠΈ качСства PWM часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ энтропийноС расстояниС (ΠΈΠ»ΠΈ условноС ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎΠ΅ содСрТаниС) ΠΎΡ‚ Ρ„ΠΎΠ½ΠΎΠ²ΠΎΠ³ΠΎ распрСдСлСния частот ΠΏΠΎ Ρ„ΠΎΡ€ΠΌΡƒΠ»Π΅ ΠšΡƒΠ»ΡŒΠ±Π°ΠΊΠ°-Π›Π΅ΠΉΠ±Π΅Ρ€Π° [34]:

Π³Π΄Π΅ I — ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎΠ΅ содСрТаниС, f (b, j) — наблюдаСмая частота Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄Π° b Π² ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΈ j, p(b) — фоновая частота Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄Π° b.

1.3 Алгоритмы поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ²

Π˜ΡΡ‚ΠΎΡ€ΠΈΡ‡Π΅ΡΠΊΠΈ слоТилось, Ρ‡Ρ‚ΠΎ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² создано для поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² Ρ€Π΅Π³ΡƒΠ»ΡΡ‚ΠΎΡ€Π½Ρ‹Ρ… областях ΠΏΠ΅Ρ€Π΅Π΄ совмСстно Ρ€Π΅Π³ΡƒΠ»ΠΈΡ€ΡƒΠ΅ΠΌΡ‹ΠΌΠΈ Π³Π΅Π½Π°ΠΌΠΈ ΠΈΠ· ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π³Π΅Π½ΠΎΠΌΠ°. ΠžΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠ΅ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ экспрСссии Π³Π΅Π½ΠΎΠ² Ρ‡Π°Ρ‰Π΅ всСго Π²Ρ‹Π·Π²Π°Π½ΠΎ совмСстной транскрипционной рСгуляциСй. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π·Π°Π΄Π°Ρ‡Ρƒ поиска сайтов связывания транскрипционного Ρ„Π°ΠΊΡ‚ΠΎΡ€Π° ΠΌΠΎΠΆΠ½ΠΎ свСсти ΠΊ Π·Π°Π΄Π°Ρ‡Π΅ поиска ΠΌΠΎΡ‚ΠΈΠ²Π° Π² Π½Π°Π±ΠΎΡ€Π΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ Π”ΠΠš. Π’ ΡΠ»ΡƒΡ‡Π°Π΅ ΠΏΡ€ΠΎΠΊΠ°Ρ€ΠΈΠΎΡ‚ связываниС достигаСтся Π² Π±ΠΎΠ»ΡŒΡˆΠ΅ΠΉ стСпСни Π·Π° ΡΡ‡Π΅Ρ‚ аффинности сайта связывания ΠΈ Ρ‚ранскрипционного Ρ„Π°ΠΊΡ‚ΠΎΡ€Π°, сайты связывания довольно Π΄Π»ΠΈΠ½Π½Ρ‹Π΅, ΠΈ, ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, ΠΏΠ΅Ρ€Π΅Π΄ Π³Π΅Π½ΠΎΠΌ присутствуСт ΠΎΠ΄ΠΈΠ½ сайт. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ для поиска Ρ‚Π°ΠΊΠΈΡ… ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Ρ‡Π°Ρ‰Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠΈ, способныС ΠΈΡΠΊΠ°Ρ‚ΡŒ ΠΎΠ΄ΠΈΠ½ достаточно консСрвативный сайт, прСдставлСнный Π² ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ. Π’ ΡΠ»ΡƒΡ‡Π°Π΅ эукариот сайты ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΈΠ΅ ΠΈ Π²Ρ‹Ρ€ΠΎΠΆΠ΄Π΅Π½Π½Ρ‹Π΅, ΠΈ ΡΠ²ΡΠ·Ρ‹Π²Π°Π½ΠΈΠ΅ достигаСтся Π² Π±ΠΎΠ»ΡŒΡˆΠ΅ΠΉ стСпСни Π·Π° ΡΡ‡Π΅Ρ‚ большого количСства сайтов Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ, Π½Π΅ΠΆΠ΅Π»ΠΈ Ρ‡Π΅ΠΌ Π·Π° ΡΡ‡Π΅Ρ‚ аффинности. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ, Π² ΡΠ»ΡƒΡ‡Π°Π΅ эукариот поиск сильно ослоТняСтся: искомый ΠΌΠΎΡ‚ΠΈΠ² опрСдСляСтся ΠΊΠ°ΠΊ Π½Π°Π±ΠΎΡ€ Π½Π΅ ΠΎΡ‡Π΅Π½ΡŒ консСрвативных сайтов, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ пСрСпрСдставлСны Π² ΠΈΡΡ…ΠΎΠ΄Π½Ρ‹Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ….

ВпослСдствии стало извСстно, Ρ‡Ρ‚ΠΎ Ρƒ Π²Ρ‹ΡΡˆΠΈΡ… эукариот рСгуляторныС сайты ΠΌΠΎΠ³ΡƒΡ‚ ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Ρ‹Π²Π°Ρ‚ΡŒ Ρ‚Π°ΠΊ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹Π΅ ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡ†ΠΈΠΎΠ½Π½Ρ‹Π΅ элСмСнты (composite elements, CEs) [35], Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ нСбольшиС Π³Ρ€ΡƒΠΏΠΏΡ‹ сайтов, Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ΠΈΠ·ΡƒΡŽΡ‰ΠΈΠ΅ΡΡ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹ΠΌ взаиморасполоТСниСм. БиологичСскиС ΠΏΡ€ΠΈΡ‡ΠΈΠ½Ρ‹, Π²Π΅Π΄ΡƒΡ‰ΠΈΠ΅ ΠΊ Ρ‚Π°ΠΊΠΎΠΌΡƒ нСслучайному Ρ€Π°ΡΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΡŽ сайтов, понятны: транскрипционныС Ρ„Π°ΠΊΡ‚ΠΎΡ€Ρ‹, ΡΠ²ΡΠ·Ρ‹Π²Π°ΡΡΡŒ с Π”ΠΠš, Ρ‚Π°ΠΊΠΆΠ΅ Π²Π·Π°ΠΈΠΌΠΎΠ΄Π΅ΠΉΡΡ‚Π²ΡƒΡŽΡ‚ ΠΌΠ΅ΠΆΠ΄Ρƒ собой для достиТСния Π½ΡƒΠΆΠ½ΠΎΠ³ΠΎ влияния Π½Π° ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ транскрипции [36, 37]. Π”Ρ€ΡƒΠ³ΠΈΠΌΠΈ словами, располоТСниС рСгуляторных сайтов обусловлСно Ρ‚Ρ€Π΅Ρ…ΠΌΠ΅Ρ€Π½ΠΎΠΉ структурой Π±Π΅Π»ΠΊΠΎΠ²ΠΎΠ³ΠΎ комплСкса, Π²ΠΎΠ²Π»Π΅Ρ‡Π΅Π½Π½ΠΎΠ³ΠΎ Π² ΠΈΠ½ΠΈΡ†ΠΈΠ°Ρ†ΠΈΡŽ транскрипции. Π’ ΡΠ°ΠΌΠΎΠΌ простом случаС Π‘Π• — это ΠΏΠ°Ρ€Π° сайтов связывания ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… транскрипционных Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ², совмСстно Π²Π»ΠΈΡΡŽΡ‰ΠΈΡ… Π½Π° ΡΠΊΡΠΏΡ€Π΅ΡΡΠΈΡŽ Π³Π΅Π½Π°.

МассовоС сСквСнированиС Π³Π΅Π½ΠΎΠΌΠΎΠ² ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΠ»ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ близкородствСнныС Π³Π΅Π½ΠΎΠΌΡ‹ для Π°Π½Π°Π»ΠΈΠ·Π° рСгуляции. Π‘Ρ‹Π»ΠΈ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, Π±Π΅Ρ€ΡƒΡ‰ΠΈΠ΅ Π½Π° Π²Ρ…ΠΎΠ΄ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΡ€ΠΎΠΌΠΎΡ‚ΠΎΡ€Π½Ρ‹Π΅ участки ΠΎΡ€Ρ‚ΠΎΠ»ΠΎΠ³ΠΈΡ‡Π½Ρ‹Ρ… Π³Π΅Π½ΠΎΠ² ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΌΠ΅ΠΆΠ²ΠΈΠ΄ΠΎΠ²ΠΎΠ³ΠΎ Π³Π΅Π½ΠΎΠΌΠ½ΠΎΠ³ΠΎ сравнСния, ΠΈΠ»ΠΈ филогСнСтичСского Ρ„ΡƒΡ‚ΠΏΡ€ΠΈΠ½Ρ‚ΠΈΠ½Π³Π°. Основная идСя этого ΠΌΠ΅Ρ‚ΠΎΠ΄Π° состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ элСмСнты Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… Π”ΠΠš находятся ΠΏΠΎΠ΄ Π΄Π°Π²Π»Π΅Π½ΠΈΠ΅ΠΌ ΠΎΡ‚Π±ΠΎΡ€Π°. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ консСрвативныС сайты Π² Π½Π°Π±ΠΎΡ€Π΅ рСгуляторных областСй ΠΎΡ€Ρ‚ΠΎΠ»ΠΎΠ³ΠΈΡ‡Π½Ρ‹Ρ… Π³Π΅Π½ΠΎΠ² скорСС всСго ΡΠ²Π»ΡΡŽΡ‚ΡΡ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ рСгуляторными элСмСнтами (рис. 8). Для опрСдСлСния Ρ‚Π°ΠΊΠΈΡ… элСмСнтов Ρ‡Π°Ρ‰Π΅ всСго строится мноТСствСнноС Π²Ρ‹Ρ€Π°Π²Π½ΠΈΠ²Π°Π½ΠΈΠ΅ ΠΏΡ€ΠΎΠΌΠΎΡ‚ΠΎΡ€Π½Ρ‹Ρ… областСй ΠΎΡ€Ρ‚ΠΎΠ»ΠΎΠ³ΠΈΡ‡Π½Ρ‹Ρ… Π³Π΅Π½ΠΎΠ², Π° Π·Π°Ρ‚Π΅ΠΌ Π½Π° Π½Π΅ΠΌ Π²Ρ‹Π΄Π΅Π»ΡΡŽΡ‚ΡΡ консСрвативныС участки.

Рис. 8. ΠŸΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΡΡ€Π°Π²Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ Π³Π΅Π½ΠΎΠΌΠΈΠΊΠΈ ΠΊ ΠΏΠΎΠΈΡΠΊΡƒ рСгуляторных ΠΌΠΎΠ΄ΡƒΠ»Π΅ΠΉ. (Π°) Π²Ρ‹Ρ€Π°Π²Π½ΠΈΠ²Π°Π½ΠΈΠ΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ Π΄Π°Π»Π΅ΠΊΠΈΡ… Π²ΠΈΠ΄ΠΎΠ² ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Π΅Ρ‚ высоко консСрвативныС Π½Π΅ΠΊΠΎΠ΄ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠ΅ участки. Π”ΠΈΠ°Π³Ρ€Π°ΠΌΠΌΡ‹ Π΄Π΅ΠΌΠΎΠ½ΡΡ‚Ρ€ΠΈΡ€ΡƒΡŽΡ‚ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ ΡΡ‚Π΅ΠΏΠ΅Π½ΡŒ консСрвативности ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΠΌΠΈ Π½Π΅ΠΊΠΎΠ΄ΠΈΡ€ΡƒΡŽΡ‰ΠΈΡ… областСй ΠΏΠ΅Ρ€Π΅Π΄ Π³Π΅Π½ΠΎΠΌ Pax6 ΠΈΠ· Π³Π΅Π½ΠΎΠΌΠΎΠ² Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°, ΠΌΡ‹ΡˆΠΈ, крысы ΠΈ Ρ€Ρ‹Π±Ρ‹ Fugu. (b) ΠšΠΎΠ½ΡΠ΅Ρ€Π²Π°Ρ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ этого участка Π²Ρ‹ΡˆΠ΅, Ρ‡Π΅ΠΌ оТидалось [39]

ПозднСС Π±Ρ‹Π»ΠΈ созданы Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠ΅ Π΄Π²Π° основных ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π° для поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… Π”ΠΠš, примСняя ΠΈΡ… ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ ΠΈΠ»ΠΈ ΠΏΠΎ ΠΎΡ‡Π΅Ρ€Π΅Π΄ΠΈ. Авторы ΡƒΡ‚Π²Π΅Ρ€ΠΆΠ΄Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΊΡ€Π°ΠΉΠ½Π΅ эффСктивны, Π½ΠΎ ΠΈΡ… ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ Π½Π΅ Π²ΡΠ΅Π³Π΄Π° Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ ΠΈΠ·-Π·Π° отсутствия Π΄Π°Π½Π½Ρ‹Ρ….

Π˜Ρ‚Π°ΠΊ, с Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния исходных Π΄Π°Π½Π½Ρ‹Ρ…, Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ Π½Π° Ρ‚Ρ€ΠΈ основныС Π³Ρ€ΡƒΠΏΠΏΡ‹:

1. Алгоритмы, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠ΅ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ Π½Π°Π±ΠΎΡ€Ρ‹ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ для поиска Π² Π½ΠΈΡ… ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ².

2. Алгоритмы, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΡΡ€Π°Π²Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ Π³Π΅Π½ΠΎΠΌΠΈΠΊΠΈ для поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² ΠΏΡ€ΠΎΠΌΠΎΡ‚ΠΎΡ€Π½Ρ‹Ρ… областях ΠΎΡ€Ρ‚ΠΎΠ»ΠΎΠ³ΠΈΡ‡Π½Ρ‹Ρ… Π³Π΅Π½ΠΎΠ² ΠΈΠ· Ρ€Π°Π·Π½Ρ‹Ρ… Π²ΠΈΠ΄ΠΎΠ².

3. Алгоритмы, ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠ΅ Π΄Π²Π° ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π°.

1.3.1 Алгоритмы поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² Π½Π°Π±ΠΎΡ€Π΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ

Π‘ Π°Π»Π³ΠΎΡ€ΠΈΡ‚мичСской Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² Π½Π°Π±ΠΎΡ€Π΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ дСлят Π½Π°:

1. ΠΏΠ΅Ρ€Π΅Π±ΠΎΡ€Π½Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, основанныС Π½Π° ΡΠ»ΠΎΠ²Π°Ρ€Π½Ρ‹Ρ… Ρ‚Π΅Ρ…Π½ΠΈΠΊΠ°Ρ…

2. Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠ΅ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ вСроятностныС ΠΌΠΎΠ΄Π΅Π»ΠΈ.

ΠŸΠ΅Ρ€Π΅Π±ΠΎΡ€Π½Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΎΠ±Π΅ΡΠΏΠ΅Ρ‡ΠΈΠ²Π°ΡŽΡ‚ Π½Π°Ρ…ΠΎΠΆΠ΄Π΅Π½ΠΈΠ΅ глобального ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ, Π½ΠΎ ΠΏΡ€ΠΈ этом Π½Π° Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°Ρ… Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ довольно Π΄ΠΎΠ»Π³ΠΎΠ΅ врСмя. К ΠΏΠ΅Ρ€Π΅Π±ΠΎΡ€Π½Ρ‹ΠΌ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌ относятся: Oligo-Analysis [40, 41], YMF [42−44], Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠ΅ суффиксныС Π΄Π΅Ρ€Π΅Π²ΡŒΡ [45−48], ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Π³Ρ€Π°Ρ„ΠΎΠ² [49, 50]

Алгоритмы, ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‰ΠΈΠ΅ вСроятностныС ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ…ΠΎΡ€ΠΎΡˆΠΈ Ρ‚Π΅ΠΌ, Ρ‡Ρ‚ΠΎ находят ΠΏΡ€ΠΈΠ±Π»ΠΈΠ·ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ Π·Π° Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠ΅ врСмя. Π­Ρ‚ΠΎ позволяСт ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ ΠΈΡ… ΠΊ Π±ΠΎΠ»ΡŒΡˆΠΈΠΌ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°ΠΌ. НСдостатком являСтся Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ нСсколько ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² для поиска, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΏΠΎΠ΄Π±ΠΈΡ€Π°Ρ‚ΡŒ. К ΡΠΎΠΆΠ°Π»Π΅Π½ΠΈΡŽ, всС вСроятностныС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ Π½Π΅ Π³Π°Ρ€Π°Π½Ρ‚ΠΈΡ€ΡƒΡŽΡ‚ нахоТдСния Π»ΡƒΡ‡ΡˆΠ΅Π³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ Ρ„ΠΎΡ€ΠΌΡ‹ локального поиска. К Π½ΠΈΠΌ относятся: Consensus [51, 52], NestedMICA [53], Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄ максимизации оТидания (expectation maximization, EM) [54, 55], Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Gibbs sampling [56, 57] ΠΈ Π΄ΠΎΠΏΠΎΠ»Π½Π΅Π½ΠΈΡ ΠΊ Π½Π΅ΠΌ.

ΠŸΠ΅Ρ€Π΅Π±ΠΎΡ€Π½Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, основанныС Π½Π° ΡΠ»ΠΎΠ²Π°Ρ€Π½Ρ‹Ρ… Ρ‚Π΅Ρ…Π½ΠΈΠΊΠ°Ρ…

Π’Π°Π½ Π₯СльдСн ΠΈ Π΄Ρ€. Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π»ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ², Π½Π°Π·Π²Π°Π½Π½Ρ‹ΠΉ Oligo-Analysis. Π”Π°Π½Π½Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΈΡ‰Π΅Ρ‚ Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΈΠ΅ пСрСпрСдставлСнныС слова — участки, частота встрСчаСмости ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π² Π½Π°Ρ‡Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… Π²Ρ‹ΡˆΠ΅ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… Ρ„ΠΎΠ½ΠΎΠ²Ρ‹Ρ… частот. Π€ΠΎΠ½ΠΎΠ²Ρ‹Π΅ частоты Π±Ρ‹Π»ΠΈ рассчитаны для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ слова ΠΈΠ· Π²ΡΠ΅Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ Π½Π΅ΠΊΠΎΠ΄ΠΈΡ€ΡƒΡŽΡ‰ΠΈΡ… участков Π³Π΅Π½ΠΎΠΌΠΎΠ² Π΄Ρ€ΠΎΠΆΠΆΠ΅ΠΉ. НСсмотря Π½Π° ΠΎΠ±Ρ‰ΡƒΡŽ простоту, Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΏΠΎΠΊΠ°Π·Π°Π» Π²Ρ‹ΡΠΎΠΊΡƒΡŽ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ ΠΏΡ€ΠΈ поискС ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² Ρ€Π΅Π³ΡƒΠ»ΡΡ‚ΠΎΡ€Π½Ρ‹Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… Π΄Ρ€ΠΎΠΆΠΆΠ΅ΠΉ (Saccharomyces cerevisiae). К ΡΠΎΠΆΠ°Π»Π΅Π½ΠΈΡŽ, Π΄Π°Π½Π½Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ для поиска довольно ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΈΡ… консСрвативных ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ². ПозднСС, Π²Π°Π½ Π₯СльдСн ΠΈ Π΄Ρ€. ΡƒΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½ΡΡ‚Π²ΠΎΠ²Π°Π»ΠΈ свой Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, Π΄ΠΎΠ±Π°Π²ΠΈΠ² Π² Π½Π΅Π³ΠΎ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΈΡΠΊΠ°Ρ‚ΡŒ ΠΌΠΎΡ‚ΠΈΠ²Ρ‹, состоящиС ΠΈΠ· Π΄Π²ΡƒΡ… частСй, Ρ€Π°Π·Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… спСйсСром. Π’Π°ΠΊ ΠΊΠ°ΠΊ спСйсСр ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌ для ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΌΠΎΡ‚ΠΈΠ²Π°, Π΄Π»ΠΈΠ½Ρƒ ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΊΠ° ΠΌΠΎΠΆΠ½ΠΎ Π²Π°Ρ€ΡŒΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΡ‚ 0 Π΄ΠΎ 16. Частота Ρ‚Π°ΠΊΠΎΠ³ΠΎ Π΄Π²ΠΎΠΉΠ½ΠΎΠ³ΠΎ ΠΌΠΎΡ‚ΠΈΠ²Π° ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ вычислСна ΠΊΠ°ΠΊ сумма частот Π΄Π²ΡƒΡ… ΠΏΠ»Π΅Ρ‡ ΠΈΠ»ΠΈ ΠΆΠ΅ ΠΊΠ°ΠΊ общая частота Π΄Π²ΠΎΠΉΠ½ΠΎΠ³ΠΎ ΠΌΠΎΡ‚ΠΈΠ²Π°. ΠžΡΠ½ΠΎΠ²Π½Ρ‹ΠΌ нСдостатком Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π²Π°Π½ Π₯СльдСна являСтся Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ Π² Π½Π΅ΠΌ ищутся Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ вхоТдСния слов, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π½Π΅ ΡƒΡ‡ΠΈΡ‚ываСтся Π²Π°Ρ€ΠΈΠ°Π±Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ сайтов.

Π’ΠΎΠΌΠΏΠ° ΠΎΠ±Ρ€Π°Ρ‚ΠΈΠ» Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ Π½Π° ΡΡ‚Ρƒ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ, ΠΈ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΠ» свой Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠΉ ΡΠ»ΠΎΠ²Π°Ρ€Π½ΡƒΡŽ Ρ‚Π΅Ρ…Π½ΠΈΠΊΡƒ, для поиска ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΈΡ… ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… Π”ΠΠš. Π’ ΠΏΡ€ΠΎΡ†Π΅ΡΡΠ΅ Π΅Π³ΠΎ Ρ€Π°Π±ΠΎΡ‚Ρ‹ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΎΡ‚Ρ€Π΅Π·ΠΊΠ° s Π΄Π»ΠΈΠ½Ρ‹ k рассчитываСтся Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Ns — количСство Π²Ρ…ΠΎΠΆΠ΄Π΅Π½ΠΈΠΉ слова s Π² ΠΈΡΡ…ΠΎΠ΄Π½Ρ‹Π΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ с Π΄ΠΎΠΏΡƒΡΡ‚ΠΈΠΌΡ‹ΠΌ количСством Π·Π°ΠΌΠ΅Π½. Π’Π°ΠΊΠΆΠ΅ рассчитываСтся Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ N's, вычислСнноС для случайно сгСнСрированной ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Ρ‚ΠΎΠΉ ΠΆΠ΅ Π΄Π»ΠΈΠ½Ρ‹. ΠœΠ΅Ρ€ΠΎΠΉ Ρ‚ΠΎΠ³ΠΎ, являСтся Π»ΠΈ s ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠΌ, считаСтся Ρ€Π°Π·Π½ΠΎΡΡ‚ΡŒ Ns — N's.

Π’ Π΄Π°Π»ΡŒΠ½Π΅ΠΉΡˆΠΈΡ… Ρ€Π°Π±ΠΎΡ‚Π°Ρ… этот ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ Π±Ρ‹Π» ΡƒΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½ΡΡ‚Π²ΠΎΠ²Π°Π½. ΠŸΡƒΡΡ‚ΡŒ Π₯ — ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Π°Ρ случайная ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ Π΄Π»ΠΈΠ½Ρ‹ L. Ѐоновая частота ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄Π° полагаСтся Ρ€Π°Π²Π½ΠΎΠΉ 0.25, ΠΈΠ»ΠΈ ΠΆΠ΅ Π²Ρ‹Ρ‡ΠΈΡΠ»ΡΡ‚ΡŒΡΡ ΠΏΠΎ Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠΌΡƒ Π½Π°Π±ΠΎΡ€Ρƒ Π΄Π°Π½Π½Ρ‹Ρ…. ΠŸΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρ‡Ρ‚ΠΎ ps — это Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ Π₯ содСрТит хотя Π±Ρ‹ ΠΎΠ΄Π½ΠΎ слово s Π΄Π»ΠΈΠ½Ρ‹ k ΠΈΠ»ΠΈ ΠΆΠ΅ любого Π΅Π³ΠΎ сосСда (Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ слово, ΠΎΡ‚Π»ΠΈΡ‡Π°ΡŽΡ‰Π΅Π΅ΡΡ Π² Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… позициях). Если ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π² Π½Π°Π±ΠΎΡ€Π΅ ΠΈΠ· N случайных ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ Π΄Π»ΠΈΠ½Ρ‹ L ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ нСзависимы, ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅ΠΌΠΎΠ΅ количСство встрСч слова s ΠΈ Π΅Π³ΠΎ сосСдСй Π² ΡΡ‚ΠΎΠΌ Π½Π°Π±ΠΎΡ€Π΅ Π΅ΡΡ‚ΡŒ, стандартноС ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠ΅ Ρ€Π°Π²Π½ΠΎ .

Π’ΠΎΠ³Π΄Π°

Π³Π΄Π΅ — z-score ΠΈΠ»ΠΈ ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠ΅ Π² ΡΡ‚Π°Π½Π΄Π°Ρ€Ρ‚Π½Ρ‹Ρ… Π΅Π΄ΠΈΠ½ΠΈΡ†Π°Ρ…. Π’Π΅Π»ΠΈΡ‡ΠΈΠ½Π° ΠΈΠΌΠ΅Π΅Ρ‚ стандартноС Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎΠ΅ распрСдСлСниС ΠΈ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ‚ ΡΡ€Π°Π²Π½ΠΈΠ²Π°Ρ‚ΡŒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΌΠΎΡ‚ΠΈΠ²Ρ‹. Π’ΠΎΠΌΠΏΠ° ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠΈΠ» эффСктивный Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΎΡ†Π΅Π½ΠΊΠΈ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠΉ марковскиС ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΏΠΎΠ΄ΠΎΠ±Π½Ρ‹ΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄, Π‘ΠΈΠ½Ρ…Π° ΠΈ Π’ΠΎΠΌΠΏΠ° [43, 44] Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π»ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ YMF (Yeast Motif Finder), Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ для расчСта Ρ„ΠΎΠ½ΠΎΠ²ΠΎΠ³ΠΎ распрСдСлСния частот ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΡŽΡ‚ΡΡ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ марковской ΠΌΠΎΠ΄Π΅Π»ΠΈ. Для опрСдСлСния ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ всС ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π”ΠΠš Π΄Ρ€ΠΎΠΆΠΆΠ΅ΠΉ. Алгоритм Π²ΠΎΠ·Π²Ρ€Π°Ρ‰Π°Π΅Ρ‚ ΠΌΠΎΡ‚ΠΈΠ²Ρ‹ с Π½Π°ΠΈΠ±ΠΎΠ»ΡŒΡˆΠ΅ΠΉ Π²Π΅Π»ΠΈΡ‡ΠΈΠ½ΠΎΠΉ z-score. Авторы протСстировали свой Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π½Π° Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°Ρ… ΠΈΠ· Π³Π΅Π½ΠΎΠΌΠΎΠ² Π΄Ρ€ΠΎΠΆΠΆΠ΅ΠΉ ΠΈ ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΈ Π΅Π³ΠΎ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ.

Π’Π°Π½Π΅Ρ‚ ΠΈ Π΄Ρ€. использовали суффиксныС Π΄Π΅Ρ€Π΅Π²ΡŒΡ для прСдставлСния Π½Π°Π±ΠΎΡ€Π° ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ ΠΏΡ€ΠΈ создании Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° для поиска Π΅Π΄ΠΈΠ½ΠΈΡ‡Π½Ρ‹Ρ… ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² ΠΏΠΎΠ»Π½Ρ‹Ρ… Π³Π΅Π½ΠΎΠΌΠ°Ρ… Π±Π°ΠΊΡ‚Π΅Ρ€ΠΈΠΉ. ΠœΠ°Ρ€ΡΠ°Π½ ΠΈ Π‘Π°Π³ΠΎΡ‚ Π΄ΠΎΠ±Π°Π²ΠΈΠ»ΠΈ Π² ΡΡ‚ΠΎΡ‚ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ поиск ΠΊΠΎΠΌΠ±ΠΈΠ½Π°Ρ†ΠΈΠΉ ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ². ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²Π»Π΅Π½ΠΈΠ΅ Π½Π°Π±ΠΎΡ€Π° ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ Π² Π²ΠΈΠ΄Π΅ суффиксного Π΄Π΅Ρ€Π΅Π²Π° Π΄Π°Π²Π°Π»ΠΎ ΠΎΠ³Ρ€ΠΎΠΌΠ½ΠΎΠ΅ количСство Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, Π½ΠΎ, нСсмотря Π½Π° ΡΡ‚ΠΎ, ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠ° оказалась эффСктивной.

Π‘ΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠ΅ суффиксныС Π΄Π΅Ρ€Π΅Π²ΡŒΡ ΠΈ ΠΈΡ… Π²Π°Ρ€ΠΈΠ°Ρ†ΠΈΠΈ, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ Weeder ΠΈ MITRA (Mismatch Tree Algorithm), созданныС ПавСси ΠΈ Π΄Ρ€. ΠΈ Π­ΡΠΊΠΈΠ½Ρ‹ΠΌ ΠΈ ΠŸΠ΅Π²Π·Π½Π΅Ρ€ΠΎΠΌ соотвСтствСнно, Π° Ρ‚Π°ΠΊΠΆΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠ΅ словарныС Ρ‚Π΅Ρ…Π½ΠΈΠΊΠΈ совмСстно с Π³Ρ€Π°Ρ„ΠΎΠ²Ρ‹ΠΌΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠ°ΠΌΠΈ, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ WINNOWER ΠΈ cWINNOWER.

ВСроятностныС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹

Одним ΠΈΠ· ΠΏΠ΅Ρ€Π²Ρ‹Ρ… вСроятностных ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² поиска сайтов связывания транскрипционных Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² стал вСроятностный Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π₯Π΅Ρ€Ρ‚Ρ†Π° ΠΈ Π΄Ρ€. Он ΡΠ²Π»ΡΠ΅Ρ‚ся ΠΆΠ°Π΄Π½Ρ‹ΠΌ ΠΈ ΠΈΡ‰Π΅Ρ‚ ΠΌΠΎΡ‚ΠΈΠ², прСдставлСнный Π² Π²ΠΈΠ΄Π΅ PWM, с Π½Π°ΠΈΠ±ΠΎΠ»ΡŒΡˆΠΈΠΌ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹ΠΌ содСрТаниСм. ΠŸΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅Ρ‚ΡΡ, Ρ‡Ρ‚ΠΎ каТдая исходная ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ содСрТит Ρ€ΠΎΠ²Π½ΠΎ ΠΎΠ΄ΠΈΠ½ сайт. ПозднСС этот Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π±Ρ‹Π» ΡƒΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½ΡΡ‚Π²ΠΎΠ²Π°Π½. Π’ Π΅Π³ΠΎ послСднСй вСрсии (Consensus), Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½ΠΎΠΉ Π₯Π΅Ρ€Ρ‚Ρ†Π΅ΠΌ ΠΈ Π‘Ρ‚ΠΎΡ€ΠΌΠΎ [52], ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ ΠΌΠ΅Ρ‚ΠΎΠ΄. Бтроится PWM ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ случайному слову Π΄Π»ΠΈΠ½Ρ‹ l. Π”Π°Π»Π΅Π΅ ΠΏΠΎ ΠΎΡ‡Π΅Ρ€Π΅Π΄ΠΈ ΠΈΠ· ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ выбираСтся слово, ΠΈΠΌΠ΅ΡŽΡ‰Π΅Π΅ ΠΌΠ°ΠΊΡΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΉ вСс ΠΏΠΎ PWM ΠΈ Π΄ΠΎΠ±Π°Π²Π»ΡΠ΅Ρ‚ся ΠΊ ΠΈΡΡ…ΠΎΠ΄Π½ΠΎΠΌΡƒ слову. ПослС ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ добавлСния выбираСтся Π½Π°Π±ΠΎΡ€ слов с Π½Π°ΠΈΠ±ΠΎΠ»ΡŒΡˆΠΈΠΌ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹ΠΌ содСрТаниСм. По ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΌ словам PWM пСрСстраиваСтся.

Π‘ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ вСроятностных Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ эвристичСскиС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ ΠΌΠ΅Ρ‚ΠΎΠ΄ максимизации оТидания ΠΈ Gibbs sampling, Π° Ρ‚Π°ΠΊΠΆΠ΅ дополнСния ΠΊ Π½ΠΈΠΌ.

ΠœΠ΅Ρ‚ΠΎΠ΄ максимизации оТидания

Одним ΠΈΠ· ΡˆΠΈΡ€ΠΎΠΊΠΎ извСстных ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² вСроятностных ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰ΠΈΡ… эффСктивно Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с Π±ΠΎΠ»ΡŒΡˆΠΈΠΌΠΈ объСмами Π΄Π°Π½Π½Ρ‹Ρ…, являСтся EM-Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ. Π•Π³ΠΎ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ происходит ΠΎΡ‚ ΡΠ»ΠΎΠ² «expectation-maximization», Ρ‡Ρ‚ΠΎ пСрСводится ΠΊΠ°ΠΊ «ΠΎΠΆΠΈΠ΄Π°Π½ΠΈΠ΅-максимизация». Π­Ρ‚ΠΎ связано с Ρ‚Π΅ΠΌ, Ρ‡Ρ‚ΠΎ каТдая итСрация содСрТит Π΄Π²Π° шага: вычислСниС матСматичСских ΠΎΠΆΠΈΠ΄Π°Π½ΠΈΠΉ (expectation) ΠΈ ΠΌΠ°ΠΊΡΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡŽ (maximisation). Алгоритм основан Π½Π° ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠ΅ ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠ³ΠΎ вычислСния ΠΎΡ†Π΅Π½ΠΎΠΊ максимального правдоподобия, ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½ΠΎΠΉ Π² 1977 Π³.

EM-Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π²ΠΏΠ΅Ρ€Π²Ρ‹Π΅ Π±Ρ‹Π» ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ для поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π›ΠΎΡ€Π΅Π½Ρ†Π΅ΠΌ ΠΈ Π Π΅ΠΉΠ»Π»ΠΈ. Π˜Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ — это Π΄ΠΎΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ ΠΊ ΠΆΠ°Π΄Π½ΠΎΠΌΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡƒ Π₯Π΅Ρ€Ρ‚Ρ†Π° ΠΈ Π΄Ρ€. ΠŸΠ΅Ρ€Π²ΠΎΠ½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ этот Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π±Ρ‹Π» Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½ для поиска Π±Π΅Π»ΠΊΠΎΠ²Ρ‹Ρ… ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ², Π½ΠΎ ΠΎΠ½ Ρ‚Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ ΠΈ Π΄Π»Ρ поиска Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… Π”ΠΠš. ΠœΠ΅Ρ‚ΠΎΠ΄ Π½Π΅ Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ Π½ΠΈΠΊΠ°ΠΊΠΎΠ³ΠΎ выравнивания сайтов Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ…, Π½ΠΎ ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ каТдая ΠΈΠ· Π½ΠΈΡ… Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ΄ΠΈΠ½ сайт. Набор сайтов находится ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ, описанным Π²Ρ‹ΡˆΠ΅ (см. ΠΎΠ±Π·ΠΎΡ€ Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Ρ‹, вСроятностныС ΠΌΠΎΠ΄Π΅Π»ΠΈ). ΠΠ΅Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ Π² Ρ€Π°ΡΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠΈ сайтов устраняСтся с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° максимизации оТидания, Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‰Π΅Π³ΠΎ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ. ΠŸΡƒΡΡ‚ΡŒ g,jk — Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ искомый ΠΌΠΎΡ‚ΠΈΠ² начинаСтся Π² j ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΈ Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ k, Π° f (i, ?) — Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ символа ? Π² ΠΊΠΎΠ»ΠΎΠ½ΠΊΠ΅ i для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ символа ΠΈΠ· Π°Π»Ρ„Π°Π²ΠΈΡ‚Π° ΠΈ 1? i ?l. Π’ ΠΏΡ€ΠΎΡ†Π΅ΡΡΠ΅ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° происходит ΠΏΠ΅Ρ€Π΅ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ g ΠΈ f Π΄ΠΎ Ρ‚Π΅Ρ… ΠΏΠΎΡ€, ΠΏΠΎΠΊΠ° f Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΌΠ°Π»ΠΎ ΠΈΠ·ΠΌΠ΅Π½ΡΡ‚ΡŒΡΡ. Π­Ρ‚ΠΎ ΠΏΠ΅Ρ€Π΅ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ происходит с ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ байСсовских ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊ.

Алгоритм MEME [55], созданный Π‘Π΅ΠΉΠ»ΠΈ ΠΈ Π­Π»ΠΊΠ°Π½ΠΎΠΌ, примСняСт ΡΡ‚Ρ€Π°Ρ‚Π΅Π³ΠΈΡŽ EM для поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ². Π’ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ΅ MEME ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Ρ‚Ρ€ΠΈ новаторскиС ΠΈΠ΄Π΅ΠΈ для поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ². Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, участки Π½Π°Ρ‡Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ ΠΊΠ°ΠΊ ΠΎΡ‚ΠΏΡ€Π°Π²Π½Ρ‹Π΅ Ρ‚ΠΎΡ‡ΠΊΠΈ для Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°. Π­Ρ‚ΠΎ позволяСт ΠΏΠΎΠ²Ρ‹ΡΠΈΡ‚ΡŒ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΈ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ нахоТдСния глобально ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ. Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, ΠΎΡ‚ΠΌΠ΅Π½Π΅Π½ΠΎ Ρ‚Ρ€Π΅Π±ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π² ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π΄ΠΎΠ»ΠΆΠ΅Π½ Π²ΡΡ‚Ρ€Π΅Ρ‡Π°Ρ‚ΡŒΡΡ Π² Ρ‚очности ΠΎΠ΄ΠΈΠ½ сайт. Π’-Ρ‚Ρ€Π΅Ρ‚ΡŒΠΈΡ…, Π·Π° ΡΡ‡Π΅Ρ‚ особСнностСй вСроятностной ΠΌΠΎΠ΄Π΅Π»ΠΈ, появилась Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ Π² ΠΎΠ΄Π½ΠΎΠΌ Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… сразу нСсколько ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ².

ΠœΠ΅Ρ‚ΠΎΠ΄ Gibbs sampling

Gibbs sampling прСдставляСт собой довольно ΡˆΠΈΡ€ΠΎΠΊΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹ΠΉ стохастичСский Π°Π½Π°Π»ΠΎΠ³ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° максимизации оТидания. Π­Ρ‚ΠΎΡ‚ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΈΡ‰Π΅Ρ‚ максимальноС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΎΡ‚ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…. Основная идСя Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ. На ΠΊΠ°ΠΆΠ΄ΠΎΠΌ шагС случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ выбираСтся ΠΎΠ΄Π½Π° пСрСмСнная, ΠΈ Π΅Π΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ мСняСтся ΠΏΡ€ΠΈ фиксированных значСниях Π΄Ρ€ΡƒΠ³ΠΈΡ… ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…. Если это ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ Π²ΠΎΠ·Ρ€Π°ΡΡ‚Π°Π½ΠΈΡŽ Ρ†Π΅Π»Π΅Π²ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ, пСрСмСнная ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ Π²Ρ‹Π±Ρ€Π°Π½Π½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅. ΠŸΡ€ΠΎΡ†Π΅ΡΡ повторяСтся Π΄ΠΎ Ρ‚Π΅Ρ… ΠΏΠΎΡ€, ΠΏΠΎΠΊΠ° Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π½Π΅ ΠΏΠ΅Ρ€Π΅ΡΡ‚Π°Π½Π΅Ρ‚ Π·Π½Π°Ρ‡ΠΈΠΌΠΎ ΠΌΠ΅Π½ΡΡ‚ΡŒΡΡ.

ΠœΠ΅Ρ‚ΠΎΠ΄ Gibbs sampling Π±Ρ‹Π» Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½ Π“Π΅ΠΌΠ°Π½ΠΎΠΌ ΠΈ Π“Π΅ΠΌΠ°Π½ΠΎΠΌ для восстановлСния ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ. Π’ΠΏΠ΅Ρ€Π²Ρ‹Π΅ Π² Π±ΠΈΠΎΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠΊΠ΅ этот ΠΌΠ΅Ρ‚ΠΎΠ΄ Π±Ρ‹Π» ΠΏΡ€ΠΈΠΌΠ΅Π½Ρ‘Π½ для построСния мноТСствСнного выравнивания ЛорСнсом ΠΈ Π΄Ρ€. Π Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΌΠΎΠ΄ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΈ этого ΠΌΠ΅Ρ‚ΠΎΠ΄Π° часто ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ для поиска слабых ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ². Gibbs sampling — это ΠΏΠΎΠ΄Ρ…ΠΎΠ΄, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠΉ марковскиС Ρ†Π΅ΠΏΠΈ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠœΠΎΠ½Ρ‚Π΅-ΠšΠ°Ρ€Π»ΠΎ (MCMC). Для расчСта вСроятностСй Π½Π° Π΄Π°Π½Π½ΠΎΠΌ шагС марковскиС Ρ†Π΅ΠΏΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ вСроятности, ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ Π½Π° ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΌ шагС. Π‘ΡƒΡ‚ΡŒ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° ΠœΠΎΠ½Ρ‚Π΅-ΠšΠ°Ρ€Π»ΠΎ состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π²Ρ‹Π±ΠΎΡ€ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π³ΠΎ шага осущСствляСтся случайно с Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ, зависящСй ΠΎΡ‚ Ρ‚Π΅ΠΊΡƒΡ‰Π΅Π³ΠΎ состояния. Π’ ΡΠ°ΠΌΠΎΠΉ простой вСрсии ΠΌΠ΅Ρ‚ΠΎΠ΄Π° Gibbs sampling ΠΌΡ‹ ΠΈΡ‰Π΅ΠΌ Π»ΡƒΡ‡ΡˆΠΈΠΉ консСрвативный Π½Π΅Ρ€Π°Π·Ρ€Ρ‹Π²Π½Ρ‹ΠΉ ΠΌΠΎΡ‚ΠΈΠ² Π΄Π»ΠΈΠ½Ρ‹ l Π² Π²ΠΈΠ΄Π΅ PWM. ΠŸΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅Ρ‚ΡΡ, Ρ‡Ρ‚ΠΎ искомый сайт встрСчаСтся Π²ΠΎ Π²ΡΠ΅Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ….

Поиск осущСствляСтся Π² Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΎ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΉ. Π‘Π½Π°Ρ‡Π°Π»Π° случайно выбираСтся ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ слову Π΄Π»ΠΈΠ½Ρ‹ l ΠΈΠ· ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ. Π­Ρ‚ΠΈ слова Ρ„ΠΎΡ€ΠΌΠΈΡ€ΡƒΡŽΡ‚ Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠ΅ мноТСство Π²Ρ…ΠΎΠΆΠ΄Π΅Π½ΠΈΠΉ ΠΌΠΎΡ‚ΠΈΠ²Π°. ΠžΠ±ΠΎΠ·Π½Π°Ρ‡ΠΈΠΌ ΠΏΠΎΠ·ΠΈΡ†ΠΈΡŽ слова Π² i-ΠΉ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Ρ‡Π΅Ρ€Π΅Π· Oi.

Π˜Ρ‚Π΅Ρ€Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ шаг:

Π‘Π΅Ρ€Ρ‘ΠΌ ΠΎΠ΄Π½Ρƒ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ i. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π²Ρ‹Π±ΠΈΡ€Π°ΡŽΡ‚ ΠΏΠΎ ΠΎΡ‡Π΅Ρ€Π΅Π΄ΠΈ, хотя Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Ρ‹, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, случайный Π²Ρ‹Π±ΠΎΡ€. БущСствСнно, Ρ‡Ρ‚ΠΎ Ρƒ Π²ΡΠ΅Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ ΡˆΠ°Π½ΡΡ‹ Π±Ρ‹Ρ‚ΡŒ Π²Ρ‹Π±Ρ€Π°Π½Π½Ρ‹ΠΌΠΈ Ρ€Π°Π²Π½Ρ‹.

Π‘Ρ‚Ρ€ΠΎΠΈΠΌ PWM ΠΏΠΎ Π²Ρ‹Π±Ρ€Π°Π½Π½Ρ‹ΠΌ словам ΠΈΠ· Π²ΡΠ΅Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ, ΠΊΡ€ΠΎΠΌΠ΅ i. Π‘Π΅Ρ€Π΅ΠΌ ΠΊΠ°ΠΆΠ΄ΠΎΠ΅ слово Π΄Π»ΠΈΠ½Ρ‹ l ΠΈΠ· i-ΠΎΠΉ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΈ Π²Ρ‹Ρ‡ΠΈΡΠ»ΡΠ΅ΠΌ Π‘Π°ΠΉΠ΅ΡΠΎΠ²ΡΠΊΡƒΡŽ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ Π΄Π°Π½Π½ΠΎΠ΅ слово ΠΌΠΎΠ³Π»ΠΎ Π±Ρ‹ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎΡ€ΠΎΠΆΠ΄Π΅Π½ΠΎ PWM, Π° Π½Π΅ Ρ„ΠΎΠ½ΠΎΠΌ.

Π Π°Π·Ρ‹Π³Ρ€Π°Π΅ΠΌ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π΅ Oi' случайно ΠΈΠ· Π²ΡΠ΅Ρ… слов Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ i Π΄Π»ΠΈΠ½Ρ‹ l, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½ΠΎΠ΅ распрСдСлСниС вСроятностСй.

ЗамСняСм Oi Π½Π° Oi'.

Π˜Ρ‚Π΅Ρ€Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ шаг повторяСтся Π΄ΠΎ Ρ‚Π΅Ρ… ΠΏΠΎΡ€, ΠΏΠΎΠΊΠ° Π½Π°Π±ΠΎΡ€ слов Π½Π΅ ΡΡ‚Π°Π½Π΅Ρ‚ Π½Π΅ΠΈΠ·ΠΌΠ΅Π½Π½Ρ‹ΠΌ.

ДополнСния ΠΊ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρƒ Gibbs sampling

Π ΠΎΡ‚ ΠΈ Π΄Ρ€. создали Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° Gibbs sampling Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² AlignACE (Aligns Nucleic Acid Conserved Elements). ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ отличия ΠΎΡ‚ ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Gibbs sampling состоят Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, Ρ„ΠΎΠ½ΠΎΠ²Ρ‹Π΅ частоты Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄ΠΎΠ² фиксированы ΠΈ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‚ частотам Π² Π³Π΅Π½ΠΎΠΌΠ΅ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 62% A+T Π² ΡΠ»ΡƒΡ‡Π°Π΅ Π΄Ρ€ΠΎΠΆΠΆΠ΅ΠΉ). Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΌ шагС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΈΡ‰Π΅Ρ‚ ΠΌΠΎΡ‚ΠΈΠ² ΠΏΠΎ Π΄Π²ΡƒΠΌ цСпям ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ, ΠΈ ΠΏΠ΅Ρ€Π΅ΠΊΡ€Ρ‹Π²Π°ΡŽΡ‰ΠΈΠ΅ΡΡ сайты ΠΈΡΠΊΠ»ΡŽΡ‡Π΅Π½Ρ‹, Π΄Π°ΠΆΠ΅ Ссли ΠΎΠ½ΠΈ находятся Π½Π° Ρ€Π°Π·Π½Ρ‹Ρ… цСпях. Π’-Ρ‚Ρ€Π΅Ρ‚ΡŒΠΈΡ…, Π² AlignACE ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΌΠ΅Ρ‚ΠΎΠ΄ MAP (maximum a posteriori log-likelihood) для ΠΎΡ†Π΅Π½ΠΊΠΈ качСства ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ². Π­Ρ‚ΠΎ ΠΌΠ΅Ρ€Π° Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ ΠΌΠΎΡ‚ΠΈΠ² встрСтился Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π½Π΅ ΡΠ»ΡƒΡ‡Π°ΠΉΠ½ΠΎ. Π’Π°ΠΆΠ½ΠΎΠΉ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΡŒΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° MAP являСтся Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ Π² Π½Π΅ΠΌ учитываСтся Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ распрСдСлСниС частот Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄ΠΎΠ² Π² Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Π΅ΠΌΡ‹Ρ… Π³Π΅Π½ΠΎΠΌΠ°Ρ…, Π½ΠΎ ΠΈ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ особСнности (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, А-Π±ΠΎΠ³Π°Ρ‚Ρ‹Π΅ участки Π² Π”ΠΠš Π΄Ρ€ΠΎΠΆΠΆΠ΅ΠΉ). Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅, ΠΌΠΎΡ‚ΠΈΠ²Ρ‹, ΠΏΠΎΡ€ΠΎΠΆΠ΄Π΅Π½Π½Ρ‹Π΅ Ρ‚Π°ΠΊΠΈΠΌΠΈ особСнностями Π³Π΅Π½ΠΎΠΌΠ°, ΠΈΡΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‚ΡΡ ΠΈΠ· ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹Ρ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ².

ПозднСС, Π₯ьюгСс ΠΈ Π΄Ρ€. использовали AlignACE для поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² Π½Π°Π±ΠΎΡ€Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½ΠΎ Π²Π°ΠΆΠ½Ρ‹Ρ… Π³Π΅Π½ΠΎΠ² Π΄Ρ€ΠΎΠΆΠΆΠ΅ΠΉ. ВмСсто MAP для ΠΎΡ†Π΅Π½ΠΊΠΈ Π½Π°ΠΉΠ΄Π΅Π½Π½Ρ‹Ρ… ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² Π΄Π°Π½Π½ΠΎΠΌ случаС использовался ΡƒΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½ΡΡ‚Π²ΠΎΠ²Π°Π½Π½Ρ‹ΠΉ ΠΌΠ΅Ρ‚ΠΎΠ΄. Π£Ρ‡ΠΈΡ‚Ρ‹Π²Π°Π»ΠΈΡΡŒ особСнности ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹Ρ… Π½Π°Ρ‡Π°Π»ΡŒΠ½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ Π²Ρ‹Π΄Π΅Π»ΡΠ»ΠΈΡΡŒ Ρ‚Π΅ ΠΌΠΎΡ‚ΠΈΠ²Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π±ΠΎΠ»Π΅Π΅ вСроятно ΡΠ²Π»ΡΡŽΡ‚ΡΡ Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ сайтами, Ρ‡Π΅ΠΌ случайными мусорными ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΠΌΠΈ.

ЀидТс ΠΈ Π΄Ρ€. Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π»ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ MotifSampler, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Gibbs sampling со ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌΠΈ измСнСниями. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ΄Π½ΠΎΠ³ΠΎ сайта Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π±ΠΎΠ»Π΅Π΅ Π½Π΅ ΡΠ²Π»ΡΠ΅Ρ‚ся ΠΎΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ. Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, Π² Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ марковскиС Ρ†Π΅ΠΏΠΈ высокого порядка для построСния Ρ„ΠΎΠ½ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ. Алгоритм примСняли для поиска рСгуляторных ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² Π³Π΅Π½ΠΎΠΌΠ°Ρ… Π±Π°ΠΊΡ‚Π΅Ρ€ΠΈΠΉ ΠΈ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… растСний.

На ΠΎΡΠ½ΠΎΠ²Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Gibbs sampling, Π›ΡŒΡŽ ΠΈ Π΄Ρ€. Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π»ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ BioProspector, ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°ΡŽΡ‰ΠΈΠΉ ΠΏΡ€ΠΎΠΌΠΎΡ‚ΠΎΡ€Π½Ρ‹Π΅ области ΠΏΠ΅Ρ€Π΅Π΄ совмСстно Ρ€Π΅Π³ΡƒΠ»ΠΈΡ€ΡƒΠ΅ΠΌΡ‹ΠΌΠΈ Π³Π΅Π½Π°ΠΌΠΈ. ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ отличия ΠΎΡ‚ ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ Gibbs sampling состоят Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, Π² Π½Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ марковскиС Ρ†Π΅ΠΏΠΈ ΠΎΡ‚ Π½ΡƒΠ»Π΅Π²ΠΎΠ³ΠΎ Π΄ΠΎ Ρ‚Ρ€Π΅Ρ‚ΡŒΠ΅Π³ΠΎ порядка для построСния Ρ„ΠΎΠ½ΠΎΠ²ΠΎΠ³ΠΎ распрСдСлСния. ΠŸΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ для Π½ΠΈΡ… Π·Π°Π΄Π°ΡŽΡ‚ΡΡ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΌ ΠΈΠ»ΠΈ Π²Ρ‹Ρ‡ΠΈΡΠ»ΡΡŽΡ‚ΡΡ ΠΏΠΎ ΠΈΡΡ…ΠΎΠ΄Π½Ρ‹ΠΌ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΠΌΠΈ. Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ позволяСт ΠΈΡΠΊΠ°Ρ‚ΡŒ Π΄Π²ΠΎΠΉΠ½Ρ‹Π΅ ΠΌΠΎΡ‚ΠΈΠ²Ρ‹, Ρ€Π°Π·Π΄Π΅Π»Π΅Π½Π½Ρ‹Π΅ спСйсСром, ΠΈ ΠΏΠ°Π»ΠΈΠ½Π΄Ρ€ΠΎΠΌΠ½Ρ‹Π΅ ΠΌΠΎΡ‚ΠΈΠ²Ρ‹. Алгоритм использовали для поиска сайтов связывания ΠΊΠ°ΠΊ Π² ΠΏΡ€ΠΎΠΊΠ°Ρ€ΠΈΠΎΡ‚Π°Ρ…, Ρ‚Π°ΠΊ ΠΈ ΡΡƒΠΊΠ°Ρ€ΠΈΠΎΡ‚Π°Ρ… (Π΄Ρ€ΠΎΠΆΠΆΠ°Ρ…).

Π¨ΠΈΠ΄Π° Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π» Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² GibbsSt, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠΉ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΈΠΌΠΈΡ‚Π°Ρ†ΠΈΠΈ Ρ‚Π΅ΠΏΠ»ΠΎΠ²ΠΎΠ³ΠΎ ΠΎΡ‚ΠΆΠΈΠ³Π° (simulated annealing [63]) совмСстно с Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠΌ Gibbs sampling. ПозТС стало извСстно, Ρ‡Ρ‚ΠΎ этот ΠΌΠ΅Ρ‚ΠΎΠ΄ Π³ΠΎΡ€Π°Π·Π΄ΠΎ Π»ΡƒΡ‡ΡˆΠ΅ Ρ€Π΅ΡˆΠ°Π΅Ρ‚ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹, связанныС с Π½Π°Ρ…ΠΎΠΆΠ΄Π΅Π½ΠΈΠ΅ΠΌ локально Π»ΡƒΡ‡ΡˆΠ΅Π³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ. Π’ Π±ΠΈΠΎΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΊΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΈΠΌΠΈΡ‚Π°Ρ†ΠΈΠΈ Ρ‚Π΅ΠΏΠ»ΠΎΠ²ΠΎΠ³ΠΎ ΠΎΡ‚ΠΆΠΈΠ³Π° Π² ΠΎΡΠ½ΠΎΠ²Π½ΠΎΠΌ примСняСтся для ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² поиска Π² ΠΏΡ€ΠΎΡΡ‚ранствС Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ [65, 66]. Π’ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ΅ GibbsST ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΈΠΌΠΈΡ‚Π°Ρ†ΠΈΠΈ Ρ‚Π΅ΠΏΠ»ΠΎΠ²ΠΎΠ³ΠΎ ΠΎΡ‚ΠΆΠΈΠ³Π° ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Gibbs sampling.

Π”Ρ€ΡƒΠ³ΠΈΠ΅ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Ρ‹

Π₯ью ΠΈ Π΄Ρ€. использовали ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ для создания Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² EMD. Алгоритм основан Π½Π° ΠΊΠ»Π°ΡΡ‚Π΅Ρ€ΠΈΠ·Π°Ρ†ΠΈΠΈ. Π’ Π½Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ комбинация прСдсказаний, ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΈΠ· ΠΌΠ½ΠΎΠΆΠ΅ΡΡ‚Π²Π° ΠΏΡ€ΠΎΠ±Π΅Π³ΠΎΠ² ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΈΠ»ΠΈ Π±ΠΎΠ»Π΅Π΅ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² поиска: AlignACE, Bioprospector, MDScan [71], MEME ΠΈ MotifSampler. Алгоритм Π² 22.4% случаСв ΠΏΠΎΠΊΠ°Π·Π°Π» Π±ΠΎΠ»Π΅Π΅ высокий Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚, Π½Π΅ΠΆΠ΅Π»ΠΈ всС ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎ. EMD ΠΏΠΎΠΊΠ°Π·Π°Π» Π½Π°ΠΈΠ±ΠΎΠ»ΡŒΡˆΡƒΡŽ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Π² ΡΠ»ΡƒΡ‡Π°Π΅ поиска Π² ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΈΡ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ…. Π’ ΡΠ»ΡƒΡ‡Π°Π΅ поиска Π² Π΄Π»ΠΈΠ½Π½Ρ‹Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ…, ΠΎΠ½ Π²ΡΠ΅Π³Π΄Π° Π±ΠΎΠ»Π΅Π΅ ΠΈΠ»ΠΈ ΠΏΠΎ ΠΊΡ€Π°ΠΉΠ½Π΅ΠΉ ΠΌΠ΅Ρ€Π΅ Ρ‚Π°ΠΊΠΆΠ΅ эффСктивСн, ΠΊΠ°ΠΊ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Π΅ элСмСнты Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°.

Каплан ΠΈ Π΄Ρ€. создали Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠΉ ΠΏΠΎΠΌΠΈΠΌΠΎ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ Π”ΠΠš ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π΅ Π”ΠΠš-ΡΠ²ΡΠ·Ρ‹Π²Π°ΡŽΡ‰ΠΈΡ… Π΄ΠΎΠΌΠ΅Π½ΠΎΠ² извСстных транскрипционных Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ². По Π½ΠΈΠΌ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ сайты связывания, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ищутся Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ….

Π›ΡŒΡŽ ΠΈ Π΄Ρ€. Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π»ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, основанный Π½Π° Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтях, для поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… Π”ΠΠš ΠΈ Π±Π΅Π»ΠΊΠΎΠ²Ρ‹Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ…. Π‘Π΅Ρ‚ΡŒ содСрТит нСсколько ΡƒΡ€ΠΎΠ²Π½Π΅ΠΉ. ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΠ΅ ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² происходит ΠΏΠΎΡΡ‚ΡƒΠΏΠ°Ρ‚Π΅Π»ΡŒΠ½ΠΎ: Π½Π° Π²Π΅Ρ€Ρ…Π½Π΅ΠΌ ΡƒΡ€ΠΎΠ²Π½Π΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ разбиваСтся Π½Π° Π½Π΅Π±ΠΎΠ»ΡŒΡˆΠΈΠ΅ участки, Π° Π½Π° Π½ΠΈΠΆΠ½Π΅ΠΌ эти участки ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΡ†ΠΈΡ€ΡƒΡŽΡ‚ΡΡ Π½Π° ΠΌΠΎΡ‚ΠΈΠ²Π½Ρ‹Π΅ ΠΈ Ρ„ΠΎΠ½ΠΎΠ²Ρ‹Π΅. ΠŸΡ€ΠΈ этом ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ ΡΠΎΡ…Ρ€Π°Π½ΡΡŽΡ‚ΡΡ ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ся для уточнСния Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… тСстах. ОсновноС прСимущСство Ρ‚Π°ΠΊΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΎΠ½ Ρ…ΠΎΡ€ΠΎΡˆΠΎ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ с Π΄Π»ΠΈΠ½Π½Ρ‹ΠΌΠΈ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΠΌΠΈ

ΠšΠΈΠ½Π³ΡΡ„ΠΎΡ€Π΄ ΠΈ Π΄Ρ€. Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π»ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ для поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… Π”ΠΠš, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΈΡ‰Π΅Ρ‚ Π½Π°Π±ΠΎΡ€ ΠΏΠΎΠ΄ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠ³ΠΎ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ сумма ΠΏΠΎΠΏΠ°Ρ€Π½Ρ‹Ρ… расстояний ΠΌΠ΅ΠΆΠ΄Ρƒ Π½ΠΈΠΌΠΈ Π±Ρ‹Π»Π° минимальна. Для этого ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ цСлочислСнноС Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ΅ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ (ILP). ΠŸΡ€Π΅ΠΈΠΌΡƒΡ‰Π΅ΡΡ‚Π²ΠΎΠΌ Π΄Π°Π½Π½ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° являСтся Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ ΠΎΠ½ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ нСбольшоС врСмя Π½Π° Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°Ρ… любой Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρ‹. ВСстированиС Π½Π° ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… ΠΈΠ· E.coli ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΎ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, ΡΠΎΠΏΠΎΡΡ‚Π°Π²ΠΈΠΌΡƒΡŽ с ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒΡŽ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ², основанных Π½Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ΅ Gibbs sampling.

Π›Π΅ ΠΈ Π΄Ρ€. создали гСнСтичСский Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ HIGEDA, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠΉ Π² Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠΉ стадии Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ EM для поиска Π»ΡƒΡ‡ΡˆΠΈΡ… ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΌΠΎΡ‚ΠΈΠ²Π°. Помимо этого, HIGEDA ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΊΠ°Ρ‚ΡŒ ΠΌΠΎΡ‚ΠΈΠ²Ρ‹ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ с ΠΌΡƒΡ‚ациями, Π½ΠΎ ΠΈ Ρ ΠΈΠ½ΡΠ΅Ρ€Ρ†ΠΈΡΠΌΠΈ ΠΈ Π΄Π΅Π»Π΅Ρ†ΠΈΡΠΌΠΈ.

1.3.2 Алгоритмы, основанныС Π½Π° ΠΌΠ΅Ρ‚ΠΎΠ΄Π΅ филогСнСтичСского Ρ„ΡƒΡ‚ΠΏΡ€ΠΈΠ½Ρ‚ΠΈΠ½Π³Π°

ОсновноС прСимущСство филогСнСтичСского Ρ„ΡƒΡ‚ΠΏΡ€ΠΈΠ½Ρ‚ΠΈΠ½Π³Π° ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΎΠΌ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠΌ совмСстно Ρ€Π΅Π³ΡƒΠ»ΠΈΡ€ΡƒΠ΅ΠΌΡ‹Π΅ Π³Π΅Π½Ρ‹, состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ ΠΎΡ€Ρ‚ΠΎΠ»ΠΎΠ³ΠΈΡ‡Π½Ρ‹Π΅ Π³Π΅Π½Ρ‹ часто Π±Ρ‹Π²Π°Π΅Ρ‚ ΠΏΡ€ΠΎΡ‰Π΅, Ρ‡Π΅ΠΌ совмСстно Ρ€Π΅Π³ΡƒΠ»ΠΈΡ€ΡƒΠ΅ΠΌΡ‹Π΅. На ΡΠ΅Π³ΠΎΠ΄Π½ΡΡˆΠ½ΠΈΠΉ дСнь Π² ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚ΠΎΠΌ доступС находится большоС количСство Π°Π½Π½ΠΎΡ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… Π³Π΅Π½ΠΎΠΌΠΎΠ², Π² Ρ‚ΠΎΠΌ числС близкородствСнных, Ρ‡Ρ‚ΠΎ позволяСт ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ Ρ‚Π΅Ρ…Π½ΠΈΠΊΡƒ филогСнСтичСского Ρ„ΡƒΡ‚ΠΏΡ€ΠΈΠ½Ρ‚ΠΈΠ½Π³Π° для поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ². Для опрСдСлСния рСгуляторных элСмСнтов Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… Ρ‡Π°Ρ‰Π΅ всСго строится мноТСствСнноС Π²Ρ‹Ρ€Π°Π²Π½ΠΈΠ²Π°Π½ΠΈΠ΅ ΠΏΡ€ΠΎΠΌΠΎΡ‚ΠΎΡ€Π½Ρ‹Ρ… областСй ΠΎΡ€Ρ‚ΠΎΠ»ΠΎΠ³ΠΈΡ‡Π½Ρ‹Ρ… Π³Π΅Π½ΠΎΠ², Π° Π·Π°Ρ‚Π΅ΠΌ Π½Π° Π½Π΅ΠΌ Π²Ρ‹Π΄Π΅Π»ΡΡŽΡ‚ΡΡ особо консСрвативныС участки. ΠŸΠΎΡΡ‚Ρ€ΠΎΠ΅Π½ΠΈΠ΅ мноТСствСнного выравнивания осущСствляСтся ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ Ρ‚Π°ΠΊΠΈΡ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ², ΠΊΠ°ΠΊ CLUSTAL W.

К ΡΠΎΠΆΠ°Π»Π΅Π½ΠΈΡŽ, Π±Ρ‹Π»ΠΎ ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ [76−78], Ρ‡Ρ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠ΅ филогСнСтичСский Ρ„ΡƒΡ‚ΠΏΡ€ΠΈΠ½Ρ‚ΠΈΠ½Π³ Π½Π΅ Π²ΡΠ΅Π³Π΄Π° ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΡ‹. Если сравниваСмыС Π²ΠΈΠ΄Ρ‹ слишком Π±Π»ΠΈΠ·ΠΊΠΈ Π΄Ρ€ΡƒΠ³ Π΄Ρ€ΡƒΠ³Ρƒ Π² ΡΠΌΡ‹ΡΠ»Π΅ ΡΠ²ΠΎΠ»ΡŽΡ†ΠΈΠΎΠ½Π½ΠΎΠ³ΠΎ расстояния (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΡˆΡ‚Π°ΠΌΠΌΡ‹ ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π²ΠΈΠ΄Π°) Π²Ρ‹Ρ€Π°Π²Π½ΠΈΠ²Π°Π½ΠΈΠ΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½ΠΎ, Π½ΠΎ Π½Π΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠ²Π½ΠΎ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ элСмСнты Π½Π΅ Π±ΠΎΠ»Π΅Π΅ консСрвативны, Ρ‡Π΅ΠΌ ΠΎΠΊΡ€ΡƒΠΆΠ°ΡŽΡ‰Π°Ρ Π½Π΅Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Π°Ρ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ. Если ΠΆΠ΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΎΡ‡Π΅Π½ΡŒ сильно Ρ€Π°Π·ΠΎΡˆΠ»ΠΈΡΡŒ, слоТно ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΡƒΠ΄ΠΎΠ²Π»Π΅Ρ‚Π²ΠΎΡ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ Π²Ρ‹Ρ€Π°Π²Π½ΠΈΠ²Π°Π½ΠΈΠ΅. Π’ ΡΡ‚ΠΎΠΌ случаС совмСстно с Ρ„илогСнСтичСским Ρ„ΡƒΡ‚ΠΏΡ€ΠΈΠ½Ρ‚ΠΈΠ½Π³ΠΎΠΌ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Ρ‚Π°ΠΊΠΈΠ΅ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ², ΠΊΠ°ΠΊ MEME, Consensus ΠΈΠ»ΠΈ Gibbs sampling.

ΠšΠ»ΠΈΡ„Ρ‚Π΅Π½ ΠΈ Π΄Ρ€. использовали AlignACE для поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² ΡΡ€Π°Π²Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΌ Π°Π½Π°Π»ΠΈΠ·Π΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ Π”ΠΠš Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… Π²ΠΈΠ΄ΠΎΠ² Saccharomyces, ΠΈ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΈ Ρ…ΠΎΡ€ΠΎΡˆΠΈΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Π² Ρ‚Π΅Ρ… случаях, ΠΊΠΎΠ³Π΄Π° ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ глобальноС Π²Ρ‹Ρ€Π°Π²Π½ΠΈΠ²Π°Π½ΠΈΠ΅ Π±Ρ‹Π»ΠΎ Π½Π΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ. Маккью ΠΈ Π΄Ρ€. использовали Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Gibbs sampling совмСстно с Ρ„илогСнСтичСским Ρ„ΡƒΡ‚ΠΏΡ€ΠΈΠ½Ρ‚ΠΈΠ½Π³ΠΎΠΌ для поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² Π³Π΅Π½ΠΎΠΌΠ°Ρ… ΠΏΡ€ΠΎΡ‚Π΅ΠΎΠ±Π°ΠΊΡ‚Π΅Ρ€ΠΈΠΉ.

Π‘Π»Π°Π½ΡˆΠ΅Ρ‚Ρ‚ ΠΈ Π’ΠΎΠΌΠΏΠ° создали эффСктивно Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‰ΠΈΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ², ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠΉ филогСнСтичСский Ρ„ΡƒΡ‚ΠΏΡ€ΠΈΠ½Ρ‚ΠΈΠ½Π³ совмСстно с Π΄ΠΈΠ½Π°ΠΌΠΈΡ‡Π΅ΡΠΊΠΈΠΌ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ. Π’ ΡΠ²ΠΎΠ΅ΠΉ Ρ€Π°Π±ΠΎΡ‚Π΅ Π‘Π»Π°Π½ΡˆΠ΅Ρ‚Ρ‚ ΠΈ Π’ΠΎΠΌΠΏΠ° ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΠ»ΠΈ, Ρ‡Ρ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² часто Π½Π΅ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°ΡŽΡ‚ ΡΡ‚Π΅ΠΏΠ΅Π½ΡŒ ΡΠ²ΠΎΠ»ΡŽΡ†ΠΈΠΎΠ½Π½ΠΎΠΉ близости ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ ΠΈ ΡΡ‡ΠΈΡ‚Π°ΡŽΡ‚ ΠΈΡ… Π½Π΅Π·Π°Π²ΠΈΡΠΈΠΌΡ‹ΠΌΠΈ. Π­Ρ‚ΠΎ особСнно ΠΊΡ€ΠΈΡ‚ΠΈΡ‡Π½ΠΎ Π² ΡΠ»ΡƒΡ‡Π°Π΅, Ссли производится Π°Π½Π°Π»ΠΈΠ· большого количСства Π³Π΅Π½ΠΎΠΌΠΎΠ², срСди ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΏΡ€ΠΈΡΡƒΡ‚ΡΡ‚Π²ΡƒΡŽΡ‚ ΠΊΠ°ΠΊ ΠΎΡ‡Π΅Π½ΡŒ Π±Π»ΠΈΠ·ΠΊΠΈΠ΅ Π² ΡΠ²ΠΎΠ»ΡŽΡ†ΠΈΠΎΠ½Π½ΠΎΠΌ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠΈ (ΡˆΡ‚Π°ΠΌΠΌΡ‹), Ρ‚Π°ΠΊ ΠΈ Π΄Π°Π»Π΅ΠΊΠΈΠ΅ (Ρ‚ΠΈΠΏΡ‹ ΠΈ Π²Ρ‹ΡˆΠ΅). Π’ ΡΡ‚ΠΎΠΌ случаС ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ Π²Ρ‹Ρ€Π°Π²Π½ΠΈΠ²Π°Π½ΠΈΠ΅ Ρ‚Ρ€ΡƒΠ΄Π½ΠΎ. К Ρ‚ΠΎΠΌΡƒ ΠΆΠ΅, Ссли Π² Π½Π°Π±ΠΎΡ€Π΅ исходных Π΄Π°Π½Π½Ρ‹Ρ… Π΅ΡΡ‚ΡŒ нСсколько Π³Ρ€ΡƒΠΏΠΏ Ρ€Π°Π·Π½ΠΎΠ³ΠΎ Ρ€Π°Π·ΠΌΠ΅Ρ€Π°, состоящих ΠΈΠ· ΠΎΡ‡Π΅Π½ΡŒ Π±Π»ΠΈΠ·ΠΊΠΈΡ… Π²ΠΈΠ΄ΠΎΠ², Ρ‚ΠΎ Ρ Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° поиска Π±ΠΎΠ»ΡŒΡˆΡƒΡŽ Π·Π½Π°Ρ‡ΠΈΠΌΠΎΡΡ‚ΡŒ Π±ΡƒΠ΄ΡƒΡ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ ΠΌΠΎΡ‚ΠΈΠ²Ρ‹, ΠΏΡ€ΠΈΡΡƒΡ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ Π² ΡΠ°ΠΌΠΎΠΉ многочислСнной Π³Ρ€ΡƒΠΏΠΏΠ΅. Π”Π°ΠΆΠ΅ использования ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² взвСшивания ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ Π½Π΅ Π΄ΠΎΡΡ‚Π°Ρ‚ΠΎΡ‡Π½ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ Ρ‚Π°ΠΊΡƒΡŽ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ.

ΠšΠ»ΠΈΡ„Ρ‚Π΅Π½ ΠΈ Π΄Ρ€. использовали филогСнСтичСский Ρ„ΡƒΡ‚ΠΏΡ€ΠΈΠ½Ρ‚ΠΈΠ½Π³ для поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² Π² ΡˆΠ΅ΡΡ‚ΠΈ Π³Π΅Π½ΠΎΠΌΠ°Ρ… Saccharomyces. Авторы ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠ»ΠΈ Π‘LUSTAL W Π΄Π»Ρ выравнивания ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ. Они ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ»ΠΈ мноТСство статистичСски достовСрных консСрвативных участков. Но ΡΡ‚ΠΎΡ‚ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Π±Ρ‹Π» ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΠΎΡ‚ΠΎΠΌΡƒ, Ρ‡Ρ‚ΠΎ Π³Π΅Π½ΠΎΠΌΡ‹ для исслСдования Π±Ρ‹Π»ΠΈ Ρ‚Ρ‰Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΡ‚ΠΎΠ±Ρ€Π°Π½Ρ‹ Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ расстояниС ΠΌΠ΅ΠΆΠ΄Ρƒ Π½ΠΈΠΌΠΈ Π±Ρ‹Π»ΠΎ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΌ.

1.3.3 Алгоритмы, ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠ΅ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Ρ‹

ΠšΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΌΠΎΠ³ΡƒΡ‚ ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Ρ‚ΡŒ Π΄Π°Π½Π½Ρ‹Π΅, состоящиС ΠΈΠ· ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ ΠΈ ΠΏΠ΅Ρ€Π΅Π΄ совмСстно Ρ€Π΅Π³ΡƒΠ»ΠΈΡ€ΡƒΠ΅ΠΌΡ‹ΠΌΠΈ Π³Π΅Π½Π°ΠΌΠΈ, ΠΈ ΠΏΠ΅Ρ€Π΅Π΄ ΠΎΡ€Ρ‚ΠΎΠ»ΠΎΠ³ΠΈΡ‡Π½Ρ‹ΠΌΠΈ Π³Π΅Π½Π°ΠΌΠΈ. ΠŸΡ€ΠΈ этом ΠΎΠ½ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ², Π² Ρ‚ΠΎΠΌ числС ΠΈ Ρ„илогСнСтичСский Ρ„ΡƒΡ‚ΠΏΡ€ΠΈΠ½Ρ‚ΠΈΠ½Π³. Π’Π°ΠΊΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°ΡŽΡ‚ Π΄Π²Π° Π²Π°ΠΆΠ½Π΅ΠΉΡˆΠΈΡ… аспСкта опрСдСлСния значимости ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ²: ΠΏΠ΅Ρ€Π΅ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»Π΅Π½Π½ΠΎΡΡ‚ΡŒ ΠΈ ΠΌΠ΅ΠΆΠ²ΠΈΠ΄ΠΎΠ²ΡƒΡŽ ΠΊΠΎΠ½ΡΠ΅Ρ€Π²Π°Ρ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ.

Алгоритм КСллиса ΠΈ Π΄Ρ€. осущСствляСт поиск Π² Π΄Π²Π΅ стадии: сначала Π² ΡΠΌΠ΅ΡˆΠ°Π½Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… находятся высоко консСрвативныС участки, Π° ΡƒΠΆΠ΅ срСди Π½ΠΈΡ… ищутся пСрСпрСдставлСнныС. ΠŸΡ€Π°ΠΊΠ°Ρˆ ΠΈ Π΄Ρ€. Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π»ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ OrthoMeme, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠΉ ΠΌΠ΅Ρ‚ΠΎΠ΄ максимизации оТидания, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ Π΄Π²Π° Π²ΠΈΠ΄Π° поиска Π² ΡΠΌΠ΅ΡˆΠ°Π½Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… осущСствляСтся ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ.

Π’Π°Π½Π³ ΠΈ Π‘Ρ‚ΠΎΡ€ΠΌΠΎ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π»ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ PhyloCon, основанный Π½Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ΅ Consensus. Π’ Π½Π΅ΠΌ поиск осущСствляСтся Π² Π΄Π²Π΅ стадии. Π‘Π½Π°Ρ‡Π°Π»Π° для областСй ΠΏΠ΅Ρ€Π΅Π΄ ΠΎΡ€Ρ‚ΠΎΠ»ΠΎΠ³ΠΈΡ‡Π½Ρ‹ΠΌΠΈ Π³Π΅Π½Π°ΠΌΠΈ строится мноТСствСнныС выравнивания ΠΈ Π²Ρ‹Π΄Π΅Π»ΡΡŽΡ‚ся консСрвативныС области, ΠΏΠΎ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ ΡΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‚ΡΡ PWM. Π”Π°Π»Π΅Π΅ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… PWM ΠΌΠΎΡ‚ΠΈΠ²Ρ‹ ищутся ΠΏΠ΅Ρ€Π΅Π΄ всСми Π³Π΅Π½Π°ΠΌΠΈ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π³Π΅Π½ΠΎΠΌΠ°. Авторы ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΈ, Ρ‡Ρ‚ΠΎ PhyloCon ΠΈΠΌΠ΅Π΅Ρ‚ ΠΎΡ‡Π΅Π½ΡŒ Π½ΠΈΠ·ΠΊΠΈΠΉ ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ пСрСпрСдсказаний. Алгоритм Ρ…ΠΎΡ€ΠΎΡˆΠΎ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ ΠΊΠ°ΠΊ Π½Π° ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΈΡ…, Ρ‚Π°ΠΊ ΠΈ Π½Π° Π΄Π»ΠΈΠ½Π½Ρ‹Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ….

ΠžΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΡŒΡŽ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½ΠΎΠ³ΠΎ Π‘ΠΈΠ½Ρ…Π° ΠΈ Π΄Ρ€. являСтся Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈ построСнии мноТСствСнного выравнивания допускаСтся условиС, Ρ‡Ρ‚ΠΎ ΠΌΠΎΡ‚ΠΈΠ² ΠΌΠΎΠΆΠ΅Ρ‚ Π²ΡΡ‚Ρ€Π΅Ρ‚ΠΈΡ‚ΡŒΡΡ Π½Π΅ Π²ΠΎ Π²ΡΠ΅Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ…. Авторы протСстировали Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π½Π° ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… ΠΈΠ· Π³Π΅Π½ΠΎΠΌΠΎΠ² Π΄Ρ€ΠΎΠΆΠΆΠ΅ΠΉ, ΠΌΡƒΡ…ΠΈ ΠΈ Π΄Π°ΠΆΠ΅ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°. Π‘Ρ€Π°Π²Π½Π΅Π½ΠΈΠ΅ с Ρ‚Π°ΠΊΠΈΠΌΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ, ΠΊΠ°ΠΊ MEME, OrthoMEME, PhyloGibbs [85], EMnEm ΠΈ GIBBS (Wadsworth Gibbs sampler) ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΎ, Ρ‡Ρ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π±ΠΎΠ»Π΅Π΅ эффСктивСн Π² Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π΅ случаСв.

1.3.4 Π‘Ρ€Π°Π²Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ Π°Π½Π°Π»ΠΈΠ· Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ²

БСйчас доступно ΠΎΠ³Ρ€ΠΎΠΌΠ½ΠΎΠ΅ количСство Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ². К ΡΠΎΠΆΠ°Π»Π΅Π½ΠΈΡŽ, Π½Π΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ Π²Ρ‹Π΄Π΅Π»ΠΈΡ‚ΡŒ ΠΎΠ΄ΠΈΠ½ ΡƒΠ½ΠΈΠ²Π΅Ρ€ΡΠ°Π»ΡŒΠ½Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ: ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΈΠ· Π½ΠΈΡ… ΠΈΠΌΠ΅Π΅Ρ‚ свои ограничСния. Π’ Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Π΅ описано нСсколько Ρ€Π°Π±ΠΎΡ‚ ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ².

Π’ΠΎΠΌΠΏΠ° ΠΈ Π΄Ρ€. сравнили 13 Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ²: AlignACE, ANN-Spec [89], Consensus, GLAM [90], Improbizer [91], MEME, MITRA, MotifSampler, Oligo/Dyad-Analysis, QuickScore [92], SeSiMCMC [67], Weeder ΠΈ YMF. Для этого Π±Ρ‹Π»ΠΈ созданы Π½Π°Π±ΠΎΡ€Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ…, состоящиС ΠΈΠ· ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ, содСрТащих извСстныС сайты связывания транскрипционных Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² ΠΈΠ· Π±Π°Π·Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ… TRANSFAC. Авторам Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² Π±Ρ‹Π»ΠΎ ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΎ ΠΏΡ€ΠΎΡ‚Π΅ΡΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ свои инструмСнты Π½Π° Π΄Π°Π½Π½Ρ‹Ρ… Π½Π°Π±ΠΎΡ€Π°Ρ… с Ρ‡Π΅Ρ‚ΠΊΠΎ установлСнными ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌΠΈ ΠΈ ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²ΠΈΡ‚ΡŒ для сравнСния Π»ΡƒΡ‡ΡˆΠΈΠΉ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚. Π‘Ρ€Π°Π²Π½Π΅Π½ΠΈΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΎ ΠΎΠ±Ρ‰ΡƒΡŽ Π½ΠΈΠ·ΠΊΡƒΡŽ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Ρ€Π°Π±ΠΎΡ‚Ρ‹ всСх Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ². Однако Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Weeder ΠΏΡ€Π΅Π²Π·ΠΎΡˆΠ΅Π» Π΄Ρ€ΡƒΠ³ΠΈΠ΅ Π² Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π΅ случаСв. ΠŸΡ€ΠΈ этом SeSiMCMC оказался эффСктивнСС ΠΏΡ€ΠΈ тСстировании Π½Π° ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… ΠΈΠ· Π³Π΅Π½ΠΎΠΌΠΎΠ² ΠΌΡƒΡ…, Π° MEME3 (Ρ€Π°Π·Π½ΠΎΠ²ΠΈΠ΄Π½ΠΎΡΡ‚ΡŒ MEME) ΠΈ YMF — Π½Π° ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ… ΠΈΠ· Π³Π΅Π½ΠΎΠΌΠΎΠ² ΠΌΡ‹ΡˆΠ΅ΠΉ. Авторы ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠ»ΠΈ, Ρ‡Ρ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠ΅ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Ρ‹ для поиска ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ², Π±ΡƒΠ΄ΡƒΡ‚ Π±ΠΎΠ»Π΅Π΅ эффСктивны ΠΈ ΡƒΠ½ΠΈΠ²Π΅Ρ€ΡΠ°Π»ΡŒΠ½Ρ‹.

Π₯ью ΠΈ Π΄Ρ€. Ρ‚Π°ΠΊΠΆΠ΅ сравнили Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, Π½ΠΎ ΠΏΡ€ΠΈ этом использовали ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΈΠ· Π±Π°Π·Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ… Ρ€Π΅Π³ΡƒΠ»ΠΎΠ½ΠΎΠ² E.coli RegulonDB [93], Π° Ρ‚Π°ΠΊΠΆΠ΅ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΠ»ΠΈ Π°Π²Ρ‚ΠΎΡ€Π°ΠΌ самим ΠΏΠΎΠ΄Π±ΠΈΡ€Π°Ρ‚ΡŒ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ поиска ΠΈ ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²Π»ΡΡ‚ΡŒ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π»ΡƒΡ‡ΡˆΠΈΠΉ, Π½ΠΎ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹. Π’ ΡΠΊΡΠΏΠ΅Ρ€ΠΈΠΌΠ΅Π½Ρ‚Π΅ участвовали ΠΏΡΡ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ²: AlignACE, MEME, BioProspector, MDScan ΠΈ MotifSampler. К ΡΠΎΠΆΠ°Π»Π΅Π½ΠΈΡŽ, это исслСдованиС Ρ‚Π°ΠΊΠΆΠ΅ ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΎ ΠΎΠ±Ρ‰ΡƒΡŽ Π½ΠΈΠ·ΠΊΡƒΡŽ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ всСх Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ². Основной ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΎΠΉ практичСски всСх Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² Π±Ρ‹Π»Π° Π΄Π»ΠΈΠ½Π° ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ — ΠΏΡ€ΠΈ ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠΈ значСния этого ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°, Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Ρ€Π΅Π·ΠΊΠΎ ΡƒΡ…ΡƒΠ΄ΡˆΠ°Π»ΠΈΡΡŒ. Π›ΠΈΠ΄Π΅Ρ€ΠΎΠΌ Π±Ρ‹Π» ΠΏΡ€ΠΈΠ·Π½Π°Π½ популярный Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ MEME, показавший ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Π² 52% ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ срСднСго уровня 15%-35%.

1.4 Π‘ΠΊΡ€Ρ‹Ρ‚Ρ‹Π΅ марковскиС ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ Π²ΡΠΏΠΎΠΌΠΎΠ³Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹

Бкрытая марковская модСль (БММ, Hidden Markov Model, HMM) — статистичСская модСль, ΠΈΠΌΠΈΡ‚ΠΈΡ€ΡƒΡŽΡ‰Π°Ρ Ρ€Π°Π±ΠΎΡ‚Ρƒ процСсса, ΠΏΠΎΡ…ΠΎΠΆΠ΅Π³ΠΎ Π½Π° ΠΌΠ°Ρ€ΠΊΠΎΠ²ΡΠΊΠΈΠΉ процСсс с Π½Π΅ΠΈΠ·Π²Π΅ΡΡ‚Π½Ρ‹ΠΌΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌΠΈ. Π—Π°Π΄Π°Ρ‡Π° состоит Π² ΠΎΡ†Π΅Π½ΠΊΠ΅ нСизвСстных ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΏΠΎ Π½Π°Π±Π»ΡŽΠ΄Π°Π΅ΠΌΡ‹ΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ. ΠŸΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½Ρ‹ Π² Π΄Π°Π»ΡŒΠ½Π΅ΠΉΡˆΠ΅ΠΌ Π°Π½Π°Π»ΠΈΠ·Π΅. БММ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ рассмотрСна ΠΊΠ°ΠΊ ΡΠ΅Ρ‚ΡŒ условных БайСсовских вСроятностСй.

ΠŸΠ΅Ρ€Π²Ρ‹Π΅ Π·Π°ΠΌΠ΅Ρ‚ΠΊΠΈ ΠΎ ΡΠΊΡ€Ρ‹Ρ‚Ρ‹Ρ… марковских модСлях ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π» Π‘Π°ΡƒΠΌ Π² 1960;Ρ…, ΠΈ ΡƒΠΆΠ΅ Π² 70-Ρ… ΠΈΡ… Π²ΠΏΠ΅Ρ€Π²Ρ‹Π΅ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠ»ΠΈ ΠΏΡ€ΠΈ распознавании Ρ€Π΅Ρ‡ΠΈ. Π‘ ΡΠ΅Ρ€Π΅Π΄ΠΈΠ½Ρ‹ 1980;Ρ… БММ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ ΠΏΡ€ΠΈ Π°Π½Π°Π»ΠΈΠ·Π΅ биологичСских ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ, Π² Ρ‡Π°ΡΡ‚ности, Π”ΠΠš.

Π­Π»Π΅ΠΌΠ΅Π½Ρ‚Π°ΠΌΠΈ скрытой марковской ΠΌΠΎΠ΄Π΅Π»ΠΈ ΡΠ²Π»ΡΡŽΡ‚ΡΡ состояния. ΠžΠ±ΠΎΠ·Π½Π°Ρ‡ΠΈΠΌ состояниС Π² ΠΌΠΎΠΌΠ΅Π½Ρ‚ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ t Ρ‡Π΅Ρ€Π΅Π· x(t) (рис. 9.). КаТдоС состояниС ΠΈΠΌΠ΅Π΅Ρ‚ эмиссионныС вСроятности — распрСдСлСниС срСди всСх Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ. НаблюдаСмоС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π² ΠΌΠΎΠΌΠ΅Π½Ρ‚ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ t ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡ΠΈΠΌ Ρ‡Π΅Ρ€Π΅Π· y(t). ΠœΠ΅ΠΆΠ΄Ρƒ состояниями ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Ρ‹ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄Π½Ρ‹Π΅ вСроятности. Для БММ 1-Π³ΠΎ порядка состояниС x(t) Π² ΠΌΠΎΠΌΠ΅Π½Ρ‚ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ t зависит Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΡ‚ ΡΠΎΡΡ‚ояния x (t? 1) Π² ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΠΉ ΠΌΠΎΠΌΠ΅Π½Ρ‚ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. Π­Ρ‚ΠΎ называСтся свойством ΠœΠ°Ρ€ΠΊΠΎΠ²Π°.

Рис. 9. ΠžΠ±Ρ‰Π°Ρ структура БММ

Π’Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΡƒΠ²ΠΈΠ΄Π΅Ρ‚ΡŒ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Π΄Π»ΠΈΠ½Ρ‹ L Ρ€Π°Π²Π½Π°

Π—Π΄Π΅ΡΡŒ сумма ΠΏΡ€ΠΎΠ±Π΅Π³Π°Π΅Ρ‚ ΠΏΠΎ Π²ΡΠ΅ΠΌ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹ΠΌ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΠΌ скрытых ΡƒΠ·Π»ΠΎΠ². ΠœΠ΅Ρ‚ΠΎΠ΄ подсчёта Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ P(Y) ΠΏΠΎΠ»Π½Ρ‹ΠΌ ΠΏΠ΅Ρ€Π΅Π±ΠΎΡ€ΠΎΠΌ — ΠΎΡ‡Π΅Π½ΡŒ Ρ‚Ρ€ΡƒΠ΄ΠΎΡ‘ΠΌΠΊΠΈΠΉ для ΠΌΠ½ΠΎΠ³ΠΈΡ… Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡, Π³Π΄Π΅ количСство Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… состояний ΠΎΡ‡Π΅Π½ΡŒ Π²Π΅Π»ΠΈΠΊΠΎ. Но ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ эвристичСскиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰ΠΈΠ΅ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ эту Π·Π°Π΄Π°Ρ‡Ρƒ Π·Π° ΠΏΡ€ΠΈΠ΅ΠΌΠ»Π΅ΠΌΠΎΠ΅ врСмя. К Ρ‚Π°ΠΊΠΈΠΌ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌ относятся Π’ΠΈΡ‚Π΅Ρ€Π±ΠΈ ΠΈ Π²ΠΏΠ΅Ρ€Π΅Π΄-Π½Π°Π·Π°Π΄ (forward-backward).

Алгоритм Π²ΠΏΠ΅Ρ€Π΅Π΄-Π½Π°Π·Π°Π΄ вычисляСт P(Y) для ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠΉ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π½Π°Π±Π»ΡŽΠ΄Π°Π΅ΠΌΡ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΈ Π²ΠΎΡΡΡ‚Π°Π½Π°Π²Π»ΠΈΠ²Π°Π΅Ρ‚ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ состояний ΠΏΠΎ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π½Π°Π±Π»ΡŽΠ΄Π°Π΅ΠΌΡ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ (Ρ€Π°Π·ΠΌΠ΅Ρ‚ΠΊΠ°). БММ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ Π² Π²ΠΈΠ΄Π΅ многодольного Π³Ρ€Π°Ρ„Π°, Π³Π΄Π΅ ΡƒΠ·Π»Ρ‹ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‚ состояниям, Π° Π΄ΠΎΠ»ΠΈ Π³Ρ€Π°Ρ„Π° — позициям Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π½Π°Π±Π»ΡŽΠ΄Π°Π΅ΠΌΡ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ. Π’ΠΎΠ³Π΄Π° Ρ€Π°Π·ΠΌΠ΅Ρ‚ΠΊΠ° ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π½Π°Π±Π»ΡŽΠ΄Π°Π΅ΠΌΡ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Π² Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ… БММ Π΅ΡΡ‚ΡŒ ΠΏΡƒΡ‚ΡŒ Π² Π΄Π°Π½Π½ΠΎΠΌ Π³Ρ€Π°Ρ„Π΅. Основная идСя Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ. Π’Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ ΠΏΡƒΡ‚ΡŒ ΠΏΡ€ΠΎΠΉΠ΄Π΅Ρ‚ Ρ‡Π΅Ρ€Π΅Π· Π΄Π°Π½Π½Ρ‹ΠΉ ΡƒΠ·Π΅Π» Π³Ρ€Π°Ρ„Π°, складываСтся ΠΈΠ· Π²ΡΠ΅Ρ… ΠΏΡƒΡ‚Π΅ΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π²Π΅Π΄ΡƒΡ‚ Π² Π΄Π°Π½Π½ΡƒΡŽ Ρ‚ΠΎΡ‡ΠΊΡƒ ΠΈΠ· Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠΉ ΠΈ ΠΈΠ· ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎΠΉ. Алгоритм Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ Π² ΡΠ΅Π±Ρ Π΄Π²Π΅ стадии: ΠΏΡ€ΠΎΡ…ΠΎΠ΄ «Π²ΠΏΠ΅Ρ€Π΅Π΄» ΠΈ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ «Π½Π°Π·Π°Π΄». ΠŸΡ€ΠΈ ΠΏΡ€ΠΎΡ…ΠΎΠ΄Π΅ «Π²ΠΏΠ΅Ρ€Π΅Π΄» для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠΈ вычисляСтся Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΠΏΡ€ΠΈΠΉΡ‚ΠΈ Π² ΡΡ‚Ρƒ Ρ‚ΠΎΡ‡ΠΊΡƒ ΠΈΠ· Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠΉ, Π° ΠΏΡ€ΠΈ ΠΏΡ€ΠΎΡ…ΠΎΠ΄Π΅ «Π½Π°Π·Π°Π΄» — ΠΈΠ· ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎΠΉ. Π”Π°Π»Π΅Π΅ для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΈ ΠΌΠΎΠΆΠ½ΠΎ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ вСроятности всСх состояний ΠΈ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ вСроятноС.

Π’ Π΄Π°Π½Π½ΠΎΠΉ Ρ€Π°Π±ΠΎΡ‚Π΅ для обучСния БММ использовался Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π’ΠΈΡ‚Π΅Ρ€Π±ΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΡƒΡŽ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ состояний (ΠΏΡƒΡ‚ΡŒ) для ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠΉ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π½Π°Π±Π»ΡŽΠ΄Π°Π΅ΠΌΡ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ. Алгоритм рСкурсивСн, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΈ ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎΠ³ΠΎ состояний.

ΠŸΡƒΡΡ‚ΡŒ Π΄Π°Π½Π° БММ с Π½Π°Π±ΠΎΡ€ΠΎΠΌ состояний X, эмиссионными вСроятностями ei, Π² ΡΠΎΡΡ‚оянии xi ΠΈ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄Π½Ρ‹ΠΌΠΈ вСроятностями ai,j ΠΈΠ· i-Π³ΠΎ состояния Π² j-ΠΎΠ΅,. ВрСбуСтся Π½Π°ΠΉΡ‚ΠΈ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΡƒΡŽ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ состояний

ΠŸΡƒΡΡ‚ΡŒ вСроятности Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ вСроятного ΠΏΡƒΡ‚ΠΈ Π² ΡΠΎΡΡ‚ояниС k с Π½Π°Π±Π»ΡŽΠ΄Π°Π΅ΠΌΡ‹ΠΌ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ i извСстны для всСх k. Π’ΠΎΠ³Π΄Π°

ΠŸΠΎΠ»Π½Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ:

Π˜Π½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΡ (i = 0):, для k > 0.

РСкурсия (i = 1…L):

ВСрминация:

ΠžΠ±Ρ€Π°Ρ‚Π½Ρ‹ΠΉ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ (i = L…1):

Основная практичСская ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° Π² ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² Π’ΠΈΡ‚Π΅Ρ€Π±ΠΈ ΠΈ Π²ΠΏΠ΅Ρ€Π΅Π΄-Π½Π°Π·Π°Π΄ Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΏΠ΅Ρ€Π΅ΠΌΠ½ΠΎΠΆΠ΅Π½ΠΈΠ΅ ΠΌΠ½ΠΎΠ³ΠΈΡ… вСроятностСй Π΄Π°Π΅Ρ‚ ΠΌΠ°Π»Ρ‹Π΅ числа, ΠΈΠ·-Π·Π° Ρ‡Π΅Π³ΠΎ ΠΌΠΎΠ³ΡƒΡ‚ Π²ΠΎΠ·Π½ΠΈΠΊΠ°Ρ‚ΡŒ ΠΏΠΎΡ‚Π΅Ρ€ΠΈ точности. По ΡΡ‚ΠΎΠΉ ΠΏΡ€ΠΈΡ‡ΠΈΠ½Π΅ Ρ‡Π°Ρ‰Π΅ всСго Ρ‚Π°ΠΊΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡŽΡ‚ΡΡ Π² Π»ΠΎΠ³Π°Ρ€ΠΈΡ„мичСском пространствС, Π³Π΄Π΅ произвСдСния вСроятностСй ΠΏΡ€Π΅Π²Ρ€Π°Ρ‰Π°ΡŽΡ‚ΡΡ Π² ΡΡƒΠΌΠΌΡ‹ Π»ΠΎΠ³Π°Ρ€ΠΈΡ„ΠΌΠΎΠ² вСроятностСй.

2. ΠœΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»Ρ‹ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹

2.1 Π‘Π°Π·ΠΎΠ²Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ

2.1.1 ΠžΠ±Ρ‰Π°Ρ схСма

Π’ ΠΊΠ°Ρ‡Π΅ΡΡ‚Π²Π΅ Π±Π°Π·ΠΎΠ²ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π±Ρ‹Π» использован Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ поиска Π½Π΅ΠΏΠ°Π»ΠΈΠ½Π΄Ρ€ΠΎΠΌΠ½Ρ‹Ρ… ΠΌΠΎΡ‚ΠΈΠ²ΠΎΠ² ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΉ Π΄Π»ΠΈΠ½Ρ‹, Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½Ρ‹ΠΉ Π² Π»Π°Π±ΠΎΡ€Π°Ρ‚ΠΎΡ€ΠΈΠΈ Π±ΠΈΠΎΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠΊΠΈ Π€Π‘Π‘. Алгоритм Π±Π΅Ρ€Π΅Ρ‚ Π½Π° Π²Ρ…ΠΎΠ΄ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π”ΠΠš, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π½Π°ΠΉΡ‚ΠΈ ΠΌΠΎΡ‚ΠΈΠ² (Π½Π°Π±ΠΎΡ€ сайтов). Поиск ΠΌΠΎΡ‚ΠΈΠ²Π° осущСствляСтся Π² Π΄Π²Π° основных этапа:

1. Поиск пСрСпрСдставлСнных слов-ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚ΠΎΠ² ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΉ Π΄Π»ΠΈΠ½Ρ‹ Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ…

2. ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ БММ, созданных Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ слов-ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚ΠΎΠ².

2.1.2 Поиск слов-ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚ΠΎΠ²

Π’ ΠΊΠ°Ρ‡Π΅ΡΡ‚Π²Π΅ исходных ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π½Π° ΡΡ‚ΠΎΠΌ этапС ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π΄Π»ΠΈΠ½Π° слова-Π·Π°Ρ‚Ρ€Π°Π²ΠΊΠΈ ΠΈ ΠΊΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ допустимых Π·Π°ΠΌΠ΅Π½.

Π‘Π½Π°Ρ‡Π°Π»Π° создаСтся ΡΠ»ΠΎΠ²Π°Ρ€ΡŒ ΠΈΠ· Π²ΡΠ΅Ρ… Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… слов Π·Π°Π΄Π°Π½Π½ΠΎΠΉ Π΄Π»ΠΈΠ½Ρ‹. БосСдями Π² Ρ‚Π°ΠΊΠΎΠΌ словарС ΡΡ‡ΠΈΡ‚Π°ΡŽΡ‚ΡΡ слова, количСство Π·Π°ΠΌΠ΅Π½ ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ (расстояниС ΠΏΠΎ Π₯эммингу) Π½Π΅ ΠΏΡ€Π΅Π²Ρ‹ΡˆΠ°Π΅Ρ‚ допустимый ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ. Π—Π°Ρ‚Π΅ΠΌ для слов ΠΈΠ· ΡΠ»ΠΎΠ²Π°Ρ€Ρ считаСтся количСство Π²Ρ…ΠΎΠΆΠ΄Π΅Π½ΠΈΠΉ Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ с Π·Π°Π΄Π°Π½Π½Ρ‹ΠΌ количСством Π·Π°ΠΌΠ΅Π½. Если Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π½Π°ΠΉΠ΄Π΅Π½Ρ‹ слова ΠΈΠ· ΡΠ»ΠΎΠ²Π°Ρ€Ρ, Ρ‚ΠΎ ΡΡ‡Π΅Ρ‚Ρ‡ΠΈΠΊ Π²Ρ…ΠΎΠΆΠ΄Π΅Π½ΠΈΠΉ увСличиваСтся Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ для Π΄Π°Π½Π½ΠΎΠ³ΠΎ слова, Π½ΠΎ ΠΈ Π΄Π»Ρ всСх Π΅Π³ΠΎ сосСдСй. Π­Ρ‚Π° опСрация проводится для Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ ΠΈ Π΄Π»Ρ случайно сгСнСрированных ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ Ρ‚Π°ΠΊΠΎΠΉ ΠΆΠ΅ Π΄Π»ΠΈΠ½Ρ‹ с Ρ‚Π΅ΠΌΠΈ ΠΆΠ΅ частотами Π½ΡƒΠΊΠ»Π΅ΠΎΡ‚ΠΈΠ΄ΠΎΠ². Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ Ρ€Π΅Π°Π»ΡŒΠ½ΡƒΡŽ ΠΈ Ρ„ΠΎΠ½ΠΎΠ²ΡƒΡŽ частоты Π²Ρ…ΠΎΠΆΠ΄Π΅Π½ΠΈΠΉ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ слова ΠΈΠ· ΡΠ»ΠΎΠ²Π°Ρ€Ρ с Π·Π°Π΄Π°Π½Π½Ρ‹ΠΌ ΡƒΡ€ΠΎΠ²Π½Π΅ΠΌ Π·Π°ΠΌΠ΅Π½. Для Ρ‚ΠΎΠ³ΠΎ Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ достовСрныС Ρ„ΠΎΠ½ΠΎΠ²Ρ‹Π΅ частоты, производится нСсколько (ΠΎΠΊΠΎΠ»ΠΎ 10) Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΉ случайных ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ.

Π”Π°Π»Π΅Π΅ ΠΏΠΎ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ для Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΈ Ρ„ΠΎΠ½ΠΎΠ²ΠΎΠ³ΠΎ распрСдСлСний вычисляСтся Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Π° hCount (см. Π½ΠΈΠΆΠ΅), Π° Π·Π°Ρ‚Π΅ΠΌ строится частотная гистограмма для этой Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρ‹ (рис. 10).

Π³Π΄Π΅ count — количСство Π²Ρ…ΠΎΠΆΠ΄Π΅Π½ΠΈΠΉ слова, min — минимальноС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ гистограммы, step — шаг гистограммы, scale — шкала гистограммы, dictsize — Ρ€Π°Π·ΠΌΠ΅Ρ€ Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ словаря.

Рис. 10. Гистограмма Ρ„ΠΎΠ½ΠΎΠ²ΠΎΠ³ΠΎ ΠΈ Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ распрСдСлСний Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρ‹ hCount. Π—Π΄Π΅ΡΡŒ n(hCount) — количСство слов ΠΈΠ· ΡΠ»ΠΎΠ²Π°Ρ€Ρ с Π΄Π°Π½Π½Ρ‹ΠΌ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ hCount, foreground — Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠ΅ распрСдСлСниС, background — Ρ„ΠΎΠ½ΠΎΠ²ΠΎΠ΅ распрСдСлСниС, foreground (trend) ΠΈ background (trend) — Π»ΠΈΠ½ΠΈΠΈ Ρ‚Ρ€Π΅Π½Π΄Π° для ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… распрСдСлСний

ΠŸΠΎΠΊΠ°Π·Π°Ρ‚ΡŒ вСсь тСкст
Π—Π°ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ Ρ„ΠΎΡ€ΠΌΡƒ Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΉ Ρ€Π°Π±ΠΎΡ‚ΠΎΠΉ