Помощь в написании студенческих работ
Антистрессовый сервис

Скрытые модели Маркова

РефератПомощь в написанииУзнать стоимостьмоей работы

Проблема, обозначенная в предыдущем подпараграфе, состоит в том, что, наблюдая в исследуемом белке с неизвестной структурой чередование гидрофобных и гидрофильных остатков, т. е. символов аминокислотной последовательности, мы не знаем, какой моделью — трансмембранной или внеклеточно-цитозольной — они были сгенерированы. Для того чтобы отразить ситуацию в нашей новой модели, произведем интеграцию… Читать ещё >

Скрытые модели Маркова (реферат, курсовая, диплом, контрольная)

Проблема, обозначенная в предыдущем подпараграфе, состоит в том, что, наблюдая в исследуемом белке с неизвестной структурой чередование гидрофобных и гидрофильных остатков, т. е. символов аминокислотной последовательности, мы не знаем, какой моделью — трансмембранной или внеклеточно-цитозольной — они были сгенерированы. Для того чтобы отразить ситуацию в нашей новой модели, произведем интеграцию описанных выше моделей Марковских цепей. Сделать это достаточно просто (рис. 2.15, а): нужно добавить лишь еще один «внутренний» стохастический процесс, переключающий модели. Получившаяся модель называется скрытой моделью Маркова, поскольку помимо наблюдаемого процесса генерации символов существует скрытый процесс, переключающий модели, согласно которым происходит генерация символов.

Скрытая модель Маркова как объединение моделей цепей Маркова. Вероятности и а' - определяют частоту генерации символов.

Рис. 2.15. Скрытая модель Маркова как объединение моделей цепей Маркова. Вероятности и а' - определяют частоту генерации символов.

Н и L согласно типу цепи, а вероятности Рк т контролируют процесс переключения моделей (а); более каноническое изображение модели а (б).

Состояния характеризуются частотами генерации символов ek(oj), и вероятностями переходов между состояниями я, -.

Иными словами, формально скрытая модель Маркова (НММ) является системой с набором фиксированных состояний Q (qx, q2, •••> 4n) и вероятностных переходов между ними A (aqlql, aqX q2, aqN q{J …, aqN qN). При этом каждое состояние в каждый момент времени с какой-то вероятностью, и для различных состояний системы эти вероятности отличаются, может подавать на выход системы определенный символ из некоторого стандартного набора 0(Oj, о2,…, ом), сигнализируя внешнему наблюдателю о состоянии системы в данный момент. Обозначим вероятности генерации символов различными состояниями как ek(pf) при k е Q и Oj е О (см. рис. 2.15, б).

В общем виде процесс работы с НММ состоит из двух этапов:

  • 1) изначально вероятности переходов между состояниями неизвестны, и нужно их рассчитать или предоставить системе тренировочный набор (см. подробнее ниже), на основании которого, используя специализированные алгоритмы, система сама настроит внутренние связи. После расчета параметров или самостоятельного обучения система готова к работе;
  • 2) после настройки система позволяет решать ряд задач:
    • а) при предъявлении системе некоторой последовательности символов, можно определить, с какой вероятностью эта последовательность может быть получена с помощью данной системы;
  • б) на основании некоторой последовательности символов и настроенной системы можно определить наиболее вероятную последовательность состояний, через которые прошла система, для получения данной последовательности;
  • в) имея только модель, можно найти наиболее вероятную последовательность, которая может быть получена с помощью данной системы.

В применении к описанной выше проблеме анализа трансмембранных белков решение перечисленных задач соответствует следующим возможностям:

  • а) если известна последовательность анализируемого белка, можно определить вероятность того, что он трансмембранный, согласно критериям тренировочного набора;
  • б) для последовательности исследуемого белка можно получить наиболее вероятное с точки зрения модели распределение трансмембранных и внеклеточно-цитозольных фрагментов вдоль последовательности;
  • в) отталкиваясь только от модели, можно получить наиболее вероятную последовательность гидрофобных и гидрофильных остатков. Однако в рамках задачи анализа трапсмембрапных белков эта информация особого интереса не представляет.
Показать весь текст
Заполнить форму текущей работой