Протеомика — примеры моделей
Дальнейшие улучшения изложенной выше схемы связаны с учетом неравномерности расположения пропусков во множественных выравниваниях, на основе которых составляется профиль, кластеризацией высокогомологичных последовательностей при составлении профиля, а также с созданием специализированных алгоритмов, ориентированных на выравнивание типа последовательность — профиль. В случае использования профилей… Читать ещё >
Протеомика — примеры моделей (реферат, курсовая, диплом, контрольная)
Профили аминокислотных последовательностей, позиционнозависимые матрицы замещения
Выравнивание аминокислотных последовательностей хорошо работает при достаточно высоких коэффициентах идентичности последовательностей (более 35—40%). Однако если учесть тот факт, что большинство белков, обладающих сходными пространственными структурами, имеют коэффициент идентичности порядка 7—10% (см. подпараграф 3.4.2), становится понятна востребованность подходов, позволяющих корректно выравнивать последовательности, имеющие коэффициент идентичности менее 35%.
Одним из способов повысить чувствительность выравниваний стало применение для выравнивания с исследуемой последовательностью не отдельных последовательностей из базы данных, а групп последовательностей, объединенных во множественные выравнивания, т. е. вместо выравнивания типа последовательность — последовательность использовать выравнивание типа последовательность — группа последовательностей (рис. 3.28). Позже этот подход трансформировался в использование профилей аминокислотных последовательностей.
Допустим, у нас имеется множественное выравнивание аминокислотных последовательностей. Каждая позиция этого выравнивания характеризуется определенным соотношением частот встречаемости аминокислот в соответствующем ей столбце выравнивания. Если мы поделим частоту встречаемости каждого остатка в данной позиции на его «среднюю» частоту встречаемости в белках, то получим набор коэффициентов, показывающий предпочтения нахождения конкретных типов остатков в данной позиции множественного выравнивания относительно случайного распределения остатков.
Рис. 3.28. Пример выравнивания последовательности (нижняя строчка) против набора родственных последовательностей, составляющих множественное выравнивание:
остатки множественного выравнивания, совпадающие с остатками в последовательности, выделены рамочками Для удобства дальнейшей работы с данными коэффициентами, и как это принято для матриц замещения, используют логарифмы коэффициентов. Обработав подобным образом все позиции множественного выравнивания, мы получим то, что называется профилем аминокислотных последовательностей, или позиционно-зависимой матрицей замещения (position specific substitution matrix). Действительно, при обычном выравнивании последовательностей каждая позиция одной из выравниваемых последовательностей замещается на «столбец» значений, который берется из матрицы замещения. Соответственно, позиции, в которых находятся одинаковые остатки, будут иметь одинаковые столбцы.
В случае использования профилей аминокислотных последовательностей каждый столбец специфичен для каждой позиции, что и позволяет добиваться большей чувствительности при выравнивании типа последовательность — профиль относительно выравниваний типа последовательность — последовательность (рис. 3.29).
Дальнейшие улучшения изложенной выше схемы связаны с учетом неравномерности расположения пропусков во множественных выравниваниях, на основе которых составляется профиль, кластеризацией высокогомологичных последовательностей при составлении профиля, а также с созданием специализированных алгоритмов, ориентированных на выравнивание типа последовательность — профиль.