Помощь в написании студенческих работ
Антистрессовый сервис

Регуляторные модули в эукариотах: предсказание, анализ структуры и консервативности

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Актуальным является разработка алгоритмов, позволяющих выявлять закономерности расположения ССТФ, характерные для набора сходно функционирующих регуляторных модулей, и использовать информацию о выявленной структуре для повышения качества предсказаний регуляторных модулей в геномах эукариот. Предсказание регуляторных модуней, характеризующихся сходной структурой, позволит выявлять ко-регулируемые… Читать ещё >

Регуляторные модули в эукариотах: предсказание, анализ структуры и консервативности (реферат, курсовая, диплом, контрольная)

Содержание

  • Актуальность темы
  • Цели и задачи работы
  • Научная новизна и практическое значение
  • Апробация работы
  • Список публикаций по теме диссертации
  • Список используемых сокращений и обозначений
  • Объем и структура диссертации
  • 1. Обзор литературы
    • 1. 1. Регуляция экспрессии генов
    • 1. 2. Регуляция транскрипции генов
      • 1. 2. 1. Цис-регуляторные модули и их структура
      • 1. 2. 2. Экспериментальные методы исследования транскрипции генов
  • Методы нахождения сайтов связывания ТФ
  • Методы определения уровня экспрессии генов
    • 1. 2. 3. Базы данных по транскрипционной регуляции
    • 1. 3. Биоинформатические подходы к поиску транскрипционных регуляторных элементов в геномах эукариот
    • 1. 3. 1. Сайты связывания факторов транскрипции
  • Способы представления сайтов связывания ТФ в биоинформатике
  • Методы нахождения мотивов
  • Базы данных мотивов ССТФ
    • 1. 3. 2. Скрытые Марковские модели
  • Декодирование последовательности состояний
  • Обучение параметров СММ
  • Обобщенные СММ
    • 1. 3. 3. Поиск регуляторных участков в геномах эукариот
  • Методы, основанные на предпосылке о кластеризации ССТФ
  • Использование межвидового сравнения
  • Привлечение дополнительной информации
    • 2. Поиск регуляторных модулей в геномах эукариот
    • 2. 1. Алгоритм поиска регуляторных модулей в геномах эукариот
    • 2. 1. 1. Модель регуляторных модулей эукариот
  • Подготовка ПВМ и поиск потенциальных ССТФ в последовательности 60 Фиксированные параметры модели
    • 2. 1. 2. Обучение параметров модели
    • 2. 1. 3. Применение модели для поиска регуляторных модулей
    • 2. 1. 4. Оценка консервативности регуляторных модулей
    • 2. 1. 5. Реализация алгоритма
    • 2. 2. Тестирование разработанного подхода поиска регуляторных модулей на известных биологических системах
    • 2. 2. 1. Тестирование на системе мышечных генов позвоночных
    • 2. 2. 2. Тестирование на системе раннего развития Drosophila
    • 2. 3. Преимущество учета структурных особенностей для предсказания регуляторных модулей в геномах эукариот
  • 3. Применение разработанного алгоритма для полногеномного поиска регуляторных модулей с заданной структурой и выявления ко-регулируемых генов
    • 3. 1. Общая схема поиска ко-регулируемых генов
    • 3. 2. Полногеномный поиск генов, ко-регулируемых с генами из системы раннего развития Drosophila
  • 4. Выявление структуры регуляторных модулей
    • 4. 1. Анализ структуры регуляторных модулей мышечных генов позвоночных
    • 4. 2. Анализ структуры регуляторных модулей генов развития Drosophila
      • 4. 2. 1. Анализ параметров обученной модели
      • 4. 2. 2. Анализ структурных особенностей потенциальных регуляторных модулей

Актуальность темы

.

Одной из важнейших задач биоинформатики является выявление и изучение участков ДНК, участвующих в регуляции транскрипции генов. Эта задача стала особенно актуальной в последнее время в связи с появлением огромного количества новых геномных последовательностей, нуждающихся в функциональной аннотации.

Регуляторные участки ДНК, участвующие в регуляции транскрипции генов, представляют собой сайты связывания транскрипционных факторов (ТФ), специфически связывающихся с ДНК и влияющих на уровень транскрипции соответствующих генов. Основными трудностями при идентификации сайтов связывания транскрипционных факторов (ССТФ) в геномах эукариот являются сравнительно небольшая длина (5−12 пар нуклеотидов, пн) и значительная вырожденность ССТФ. К тому же сайты связывания могут располагаться довольно далеко (до 60 тыс. пн) от регулируемого гена. Таким образом, даже при наличии известной модели ССТФ (например, позиционно-весовой матрицы, ПВМ) поиск сайтов связывания дает огромное количество ложно-положительных предсказаний.

Однако известно, что в геномах эукариот ССТФ часто организованы в группы (кластеры, цис-регуляторные модули), покрывающие участки ДНК протяженностью несколько сотен пар оснований. По-видимому, эти модули координируют белок-белковые взаимодействия, тем самым регулируя уровень транскрипции генов. До сих пор не до конца понятно, как они устроены. Большинство исследователей обращают внимание именно на тип и близкое расположение ССТФ, однако было показано, что во многих случаях важным фактором является порядок расположения ССТФ и расстояния между ними [Макееу е (а1. 2003, НаШкав е/ а/. 2006, Ма1уз е/ а1. 2006, Рара15епко а. 2009], то есть структура (грамматика) регуляторных модулей. Знание структуры регуляторных модулей могло бы не только значительно повысить качество предсказания программ для поиска регуляторных элементов, но также позволило бы предсказывать совместную работу ТФ.

Свидетельством функциональной важности структуры регуляторных модулей может служить сохранение грамматики модулей в процессе эволюции даже при значительной дивергенции геномных последовательностей. С другой стороны, структура регуляторных модулей сходно регулируемых генов, по-видимому, также должна быть похожей. Таким образом, анализ регуляторных участков ортологичных и/или ко-регулируемых генов позволит определить функционально важные закономерности расположения сайтов связывания.

Актуальным является разработка алгоритмов, позволяющих выявлять закономерности расположения ССТФ, характерные для набора сходно функционирующих регуляторных модулей, и использовать информацию о выявленной структуре для повышения качества предсказаний регуляторных модулей в геномах эукариот. Предсказание регуляторных модуней, характеризующихся сходной структурой, позволит выявлять ко-регулируемые гены. Кроме того, выявленные закономерности взаимного расположения ССТФ могут быть использованы для описания работы данной регуляторной системы.

Цели и задачи работы.

Целью данной работы является разработка эффективных алгоритмов, методов и программных приложений для предсказания и анализа регуляторных транскрипционных модулей и их структуры в геномах эукариот и применение разработанных методов к различным эукариотическим системам. В ходе работы были поставлены следующие задачи:

• предложить способ описания структуры регуляторных модулей, включающей частоты сайтов связывания разных типов, предпочтение следования сайтов и характерные распределения расстояний между соседними сайтами;

• разработать алгоритм выявления структуры регуляторных модулей, содержащихся в наборе геномных последовательностей;

• разработать метод для поиска регуляторных модулей с учетом их структуры;

• разработать метод полногеномного поиска ко-регулируемых генов на основе наличия и консервативности предсказанных регуляторных модулей;

• применить разработанные алгоритмы для поиска регуляторных модулей и ко-регулируемых генов к ряду биологических системпровести сравнение результатов, полученных с помощью разработанных алгоритмов, и результатов других программ, применяющихся в данной области;

• провести анализ структуры регуляторных модулей для ряда биологических систем, и сравнить сделанные наблюдения с содержащейся в литературе информацией о совместной работе транскрипционных факторов.

Научная новизна и практическое значение.

Научная новизна работы состоит в разработке новой вероятностной модели регуляторных модулей эукариот, описывающей их структуру, включающую частоты сайтов, предпочтение следования сайтов связывания и предпочтительные распределения расстояний между ними, а также применении этой модели для выявления структуры регуляторных модулей ортологичных и/или ко-регулируемых генов. Применение обобщенных скрытых Марковских моделей позволяет эффективно моделировать любые распределения расстояний между сайтами в регуляторных модулях. Обучение параметров модели на наборе ортологичных последовательностей позволяет учитывать эволюционную консервативность регуляторных модулей без использования выравнивания последовательностей, что делает алгоритм независимым от степени дивергенции последовательностей.

Разработанный и реализованный метод поиска регуляторных модулей в геномах эукариот (свидетельство о регистрации в Государственном фонде алгоритмов и программ № 2 012 610 082) может быть использован для аннотации геномных последовательностей, изучения механизмов регуляции транскрипции и эволюции регуляторных модулей, поиска ко-регулируемых генов, а также для исследования генетических заболеваний, связанных с регуляцией экспрессии генов.

Апробация работы.

Основные положения диссертации были представлены на международных конференциях: 3rd International Moscow Conference on Computational Molecular Biology MCCMB'07 (Москва, июль 2007), 4th International Moscow Conference on Computational Molecular Biology MCCMB'09 (Москва, июль 2009), 5th International Moscow Conference on Computational Molecular Biology MCCMB’ll (Москва, июль 2011), 30-й конференции молодых ученых и специалистов ИППИ РАН ИТиС'07 (Звенигород, сентябрь 2007), 31-й конференции молодых ученых и специалистов ИППИ РАН ИТиС'08 (Геленджик, октябрь 2008), 32-й конференции молодых ученых и специалистов ИППИ РАН ИТиС'09 (Бекасово, декабрь 2009), 33-й конференции молодых ученых и специалистов ИППИ РАН ИТиС'10 (Геленджик, сентябрь 2010), 34-й конференции молодых ученых и специалистов ИППИ РАН ИТиС'11 (Геленджик, октябрь 2011), 4th International Conference on Bioinformatics Models, Methods and Algorithms BIOINFORMATICS'2012 (Виламура, Португалия, февраль 2012) и на научных встречах международной учебно-научной группы «Regulation and Evolution of Cellular Systems (RECESS)».

Список публикаций по теме диссертации.

Статьи в научных журналах.

1. Anna A. Nikulova, Alexander V. Favorov, Roman A. Sutormin, Vsevolod J. Makeev, Andrey A. Mironov. CORECLUST: identification of the conserved CRM grammar together with prediction of gene regulation. Nucleic Acids Research (2012) — doi: 10.1093/nar/gks235.

2. А. А. Никулова, M. С. Полищук, В. Г. Туманян, В. Ю. Макеев, А. А. Миронов, А. В. Фаворов. Корреляции кластеров сайтов связывания и экспериментальных данных по связыванию белков с ДНК позволяют предполагать структуру регуляторных модулей. Биофизика (2012) 57(2): 212−214.

Тезисы конференций.

1. Nikulova A.A., Mironov А.А. Computational prediction and analysis of transcriptional regulatory modules in mammals. Proceedings of the 3rd International Moscow Conference on Computational Molecular Biology (MCCMB'07), 2007, p. 228−229.

2. Никулова A.A., Миронов А. А. Поиск и анализ кластеров сайтов связывания транскрипционных факторов в геномах млекопитающих. Труды 30-й конференции молодых ученых и специалистов ИППИ РАН ИТиС'07, 2007, с. 284−285.

3. Никулова А. А., Сутормин Р. А., Фаворов А. В., Миронов А. А. Построение НММ, основанной на правилах взаиморасположения сайтов связывания транскрипционных факторов, и ее применение для поиска корегулируемых генов в геномах рода Drosophila. Труды 31-й конференции молодых ученых и специалистов ИППИ РАН ИТиС'08, 2008, с. 352−353.

4. Nikulova A., Mironov A. Prediction of regulatory elements in Drosophila genomes using hidden Markov model based on the arrangement of transcription factor binding sites. Proc. 4th International Moscow Conference on Computational Molecular Biology (MCCMB'09), 2009, pp. 261−262.

5.Nikulova A.A., Favorov A.V., Sutormin R.A., Mironov A.A. Prediction and Comparative Analysis of Transcriptional Regulatory Regions in Drosophila Genomes. Труды 32-й конференции молодых ученых и специалистов ИППИ РАН ИТиС'09, 2009, с. 290−291.

6. Никулова А. А., Фаворов А. В., Миронов А. А. Предсказание и анализ консервативных транскрипционных регуляторных областей в геномах рода Drosophila. Труды 33-й конференции молодых ученых и специалистов ИППИ РАН ИТиС'10, 2010, с. 422−426.

7. А.А. Nikulova, A.V. Favorov, А.А. Mironov. An approach to predict cis-regulatory modules and identify conserved regulatory grammar in eukaryotic genomes. Proceedings of International Moscow Conference on Computational Molecular Biology (MCCMB'll), 2011, p. 253.

8. A.A. Nikulova, A.V. Favorov, A.A. Mironov. CORECLUST: prediction of cis-regulatory modules and revealing their internal structure. Труды 34-й конференции молодых ученых и специалистов ИППИ РАН ИТиС'11, 2011, с. 64−69.

9. А.А. Nikulova, A.V. Favorov, V.Yu. Makeev and A.A. Mironov. A generalized hidden Markov model for prediction of cis-regulatory modules in eukaryote genomes and description of their internal structure. Proceedings of 3rd International Conference on Bioinformatics Models, Methods and Algorithms (BIOINFORMATICS'2012), pp. 34−41.

Государственная регистрация программы.

1. Никулова А. А., Сутормин Р. А., Фаворов А. В., Макеев В. Ю., Миронов А. А. Программа для поиска кластеров регуляторных сигналов в геномах эукариот. Свидетельство № 2 012 610 082.

Список используемых сокращений и обозначений.

ТФ — фактор транскрипции;

ССТФ — сайт связывания фактора транскрипциипн — пары нуклеотндов (единица измерения длины участка ДНК);

ПВМ — позиционная весовая матрица;

ЦРМ — цис-регуляторный модуль;

СММ — скрытая Марковская модель.

Объем и структура диссертации.

Диссертационная работа изложена на 125 страницах и состоит из введения, четырех глав, выводов и списка цитированной литературы. Глава 1 содержит обзор литературы по теме диссертации. Глава 2 содержит описание и тестирование разработанного алгоритма для предсказания регуляторных моделей в геномах эукариот. Глава 3 содержит описание и тестирование алгоритма полногеномного поиска ко-регулируемых генов, разработанного в данной работе. Глава 4 содержит описание применения разработанного алгоритма для выявления структуры регуляторных модулей и обсуждение полученных результатов в контексте литературных данных.

Список литературы

включает 149 наименований. Работа содержит 23 рисунка, 5 таблиц и 2 приложения.

Основные результаты и выводы.

1. Разработана вероятностная модель регуляторных модулей эукариот, описывающая их структуру, а именно частоты встречаемости сайтов связывания факторов транскрипции, предпочтение следования сайтов и характерные распределения расстояний между соседними сайтами.

2. Разработан и реализован метод определения параметров модели, описывающих структуру регуляторных модулей (закономерностей взаиморасположения сайтов связывания).

3. Разработан и реализован метод поиска регуляторных модулей в геномах эукариот для набора системо-специфичных ТФ, в основе которой лежит вероятностная модель регуляторных модулей. Показано, что разработанный метод позволяет эффективно искать регуляторные модули для набора системо-специфичных ТФ для генов из различных регуляторных систем и организмов.

4. Разработан метод полногеномного поиска ко-регулируемых генов на основе анализа предсказанных регуляторных модулей и оценки консервативности их структуры. Эффективность разработанного подхода продемонстрирована на примере системы раннего развития ИгозорИИа.

5. Проведен анализ структуры регуляторных модулей для генов позвоночных, специфически экспрессирующихся в мышечной ткани, и генов раннего развития Вго8орЫа. Продемонстрирована возможность применения разработанного подхода к изучению совместной работы ТФ, а также выявлен ряд ранее неизвестных особенностей распределений расстояний между сайтами, позволяющих предполагать различные механизмы взаимодействия комплекса ТФ с ДНК, в том числе связывание комплекса с компактизованной ДНК.

Благодарности.

Хочу выразить искреннюю благодарность своему научному руководителю Андрею Александровичу Миронову за руководство и помощь при выполнении диссертации, а также коллегам из лаборатории биоинформатики ФББ МГУ и УНЦ «Биоинформатика» ИППИ РАН за ценные советы и помощь в выполнении работы. Хочу также поблагодарить свою семью и друзей за терпение и поддержку при подготовке диссертации.

Показать весь текст

Список литературы

  1. Aerts, S., Van Loo, P., Thijs, G., Moreau, Y., De Moor, В., 2003. Computational detection of cis-regulatory modules. Bioinformatics, 19(Suppl. 2), ii5-iil4.
  2. Anderson, G.M., Freytag, S.O., 1991. Synergistic activation of a human promoter in vivo by transcription factor Spl. Mol. Cell. Biol., 11, 1935−1943.
  3. Asai, K., Hayamizu, S., Handa, K., 1993. Prediction of Protein Secondary Structure by the Hidden Markov Model. Comput Appl Biosci 9, 141−146.
  4. Ashburner, M., Ball, C.A., Blake, J.A., Botstein, D., Butler, H., Cherry, J.M., Davis, A.P., Dolinski, K., Dwight, S.S., Eppig, J.T. et al., 2000. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nat. Genet., 25, 25−29.
  5. Ashraf, S.I., Ip, Y.T., 1998. Transcriptional control: repression by local chromatin modification. Curr. Biol. 8, R683−686.
  6. Bailey, T.L., Boden, M., Buske, F.A., Frith, M., Grant, C.E., Clementi, L., Ren, J., Li, W.W., Noble, W.S., 2009. MEME SUITE: tools for motif discovery and searching. Nucleic Acids Res. 37, W202−208.
  7. Bailey, T.L., Noble, W.S., 2003. Searching for statistically significant regulatory modules. Bioinformatics 19 Suppl 2, U16−25.
  8. Barski, A., Zhao, K., 2009. Genomic location analysis by ChlP-Seq. J. Cell. Biochem. 107, 11−18.
  9. Baum, L.E., Petrie, Т., Soules, G., Weiss, N., 1970. A maximization technique occurring in the statistical analysis of probabilistic functions of Markov chains. Ann. Math. Statist. 41(1), 164−171.
  10. Beissbarth, Т., Speed, T.P., 2004. GOstat: find statistically overrepresented Gene Ontologies within a group of genes. Bioinformatics, 20, 1464−1465.
  11. Berezikov, E., Guryev, V., Plasterk, R.H.A., Cuppen, E., 2004. CONREAL: conserved regulatory elements anchored alignment algorithm for identification of transcription factor binding sites by phylogenetic footprinting. Genome Res. 14, 170−178.
  12. Berg, O.G., von Hippel, P.H., 1985. Diffusion-controlled macromolecular interactions. Annu Rev Biophys Biophys Chem 14, 131−160.
  13. Berman, B.P., Nibu, Y., Pfeiffer, B.D., Tomancak, P., Celniker, S.E., Levine, M., Rubin,
  14. G.M., Eisen, M.B., 2002. Exploiting transcription factor binding site clustering to identify cis-regulatory modules involved in pattern formation in the Drosophila genome. Proc. Natl. Acad. Sci. U.S.A 99, 757−762.
  15. , E., 2007. Evolutionary genomics: come fly with us. Nature 450, 184−185.
  16. , M.R., 2005. Genome annotation past, present, and future: how to define an ORF at each locus. Genome Res. 15, 1777−1786.
  17. , V., 2011. Epigenetics: Unravelling the cancer code. Nature 471, S12−13.
  18. Brunak, S., Engelbrecht, J., Knudsen, S., 1991. Prediction of human mRNA donor and acceptor sites from the DNA sequence. J. Mol. Biol. 220, 49−65.
  19. Bulyk, M.L., Johnson, P.L.F., Church, G.M., 2002. Nucleotides of transcription factor binding sites exert interdependent effects on the binding affinities of transcription factors. Nucleic Acids Res. 30, 1255−1261.
  20. Chan, B.Y., Kibler, D., 2005. Using hexamers to predict cis-regulatory motifs in Drosophila. BMC Bioinformatics 6, 262.
  21. Chaya, D., Zaret, K.S., 2004. Sequential chromatin immunoprecipitation from animal tissues. Meth. Enzymol. 376, 361−372.
  22. , J., 2009. Serial analysis of binding elements for transcription factors. Methods Mol. Biol. 567, 113−132.
  23. Chytil, M., Peterson, B.R., Erlanson, D.A., Verdine, G.L., 1998. The orientation of the AP-1 heterodimer on DNA strongly affects transcriptional potency. Proc. Natl. Acad. Sci. U.S.A. 95,14 076−14 081.
  24. , PR., 2003. Nongenic transcription, gene regulation and action at a distance. J. Cell. Sci. 116, 4483−4491.
  25. Dermitzakis, E.T., Clark, A.G., 2002. Evolution of transcription factor binding sites in Mammalian gene regulatory regions: conservation and turnover. Mol. Biol. Evol. 19, 1114−1121.
  26. Devonshire, A.S., Elaswarapu, R., Foy, C.A., 2010. Evaluation of external RNA controls for the standardisation of gene expression biomarker measurements. BMC Genomics 11, 662.
  27. Deyell, R.J., Attiyeh, E.F., 2011. Advances in the understanding of constitutional and somatic genomic alterations in neuroblastoma. Cancer Genet 204, 113−121.
  28. Diamond, M.I., Miner, J.N., Yoshinaga, S.K., Yamamoto, K.R., 1990. Transcription factor interactions: selectors of positive or negative regulation from a single DNA element. Science 249, 1266−1272.
  29. Djuranovic, S., Nahvi, A., Green, R., 2011. A parsimonious model for gene regulation by miRNAs. Science 331, 550−553.
  30. , R., 1998. Biological sequence analysis: probabilistic models of proteins and nucleic acids. Cambridge University Press.
  31. Ellington, A.D., Szostak, J.W., 1990. In vitro selection of RNA molecules that bind specific ligands. Nature 346, 818−822.
  32. Erives, A., Levine, M., 2004. Coordinate enhancers share common organizational features in the Drosophila genome. Proc. Natl. Acad. Sci. U.S.A 101, 3851−3856.
  33. Fariselli, P., Martelli, P.L., Casadio, R., 2005. A new decoding algorithm for hidden Markov models improves the prediction of the topology of all-beta membrane proteins. BMC Bioinformatics 6 Suppl 4, S12.
  34. Farkas, G., Leibovitch, B.A., Elgin, S.C., 2000. Chromatin organization and transcriptional control of gene expression in Drosophila. Gene 253, 117−136.
  35. , J.W., 1996. Coordinate positioning of MEF2 and myogenin binding sites. Gene 172, GC19−32.
  36. Frazer, K.A., Sheehan, J.B., Stokowski, R.P., Chen, X., Hosseini, R., Cheng, J.F., Fodor, S.P., Cox, D.R., Patil, N., 2001. Evolutionarily conserved sequences on human chromosome 21.
  37. Genome Res. 11, 1651−1659.
  38. Fried, M., Crothers, D.M., 1981. Equilibria and kinetics of lac repressor-operator interactions by polyacrylamide gel electrophoresis. Nucleic Acids Res. 9, 6505−6525.
  39. Frith, M.C., Hansen, U., Weng, Z., 2001. Detection of cis-element clusters in higher eukaryotic DNA. Bioinformatics 17, 878−889.
  40. Frith, M.C., Li, M.C., Weng, Z., 2003. Cluster-Buster: finding dense clusters of motifs in DNA sequences. Nucleic Acids Res 31, 3666−3668.
  41. Frith, M.C., Spouge, J.L., Hansen, U., Weng, Z., 2002. Statistical significance of clusters of motifs represented by position specific scoring matrices in nucleotide sequences. Nucleic Acids Res. 30,3214−3224.
  42. Fu, W., Ray, P., Xing, E.P., 2009. DISCOVER: a feature-based discriminative method for motif search in complex genomes. Bioinformatics, 25(12), i321-i329.
  43. Gallo, S.M., Gerrard, D.T., Miner, D., Simich, M., Des Soye, B., Bergman, C.M., Halfon, M.S., 2011. REDfly v3.0: toward a comprehensive database of transcriptional regulatory elements in Drosophila. Nucleic Acids Res. 39, D118−123.
  44. Gershenzon, N.I., Stormo, G.D., Ioshikhes, I.P., 2005. Computational technique for improvement of the position-weight matrices for the DNA/protein binding sites. Nucleic Acids Res. 33,2290−2301.
  45. Gerstein, M., Sonnhammer, E.L., Chothia, C., 1994. Volume changes in protein evolution. J. Mol. Biol 236, 1067−1078.
  46. Gondor, A., Ohlsson, R., 2009. Chromosome crosstalk in three dimensions. Nature 461, 212−217.
  47. Gorodkin, J., Staerfeldt, H.H., Lund, O., Brunak, S., 1999. MatrixPlot: visualizing sequence constraints. Bioinformatics 15, 769−770.
  48. Grayson, J., Bassel-Duby, R., Williams, R.S., 1998. Collaborative interactions between MEF-2 and Spl in muscle-specifc gene regulation. J. Cell. Biochem., 70, 366−375.
  49. Gross, D.S., Garrard, W.T., 1988. Nuclease hypersensitive sites in chromatin. Annu. Rev. Biochem. 57, 159−197.
  50. Griinwald, D., Singer, R.H., Rout, M., 2011. Nuclear export dynamics of RNA-protein complexes. Nature 475, 333−341.
  51. Hager, G.L., McNally, J.G., Misteli, T., 2009. Transcription dynamics. Mol. Cell 35, 741 753.
  52. Halfon, M.S., Grad, Y., Church, G.M., Michelson, A.M., 2002. Computation-Based Discovery of Related Transcriptional Regulatory Modules and Motifs Using an Experimentally Validated Combinatorial Model. Genome Res 12, 1019−1028.
  53. Hallikas, O., Palin, K., Sinjushina, N., Rautiainen, R., Partanen, J., Ukkonen, E., Taipale, J., 2006. Genome-wide prediction of mammalian enhancers based on analysis of transcription-factor binding affinity. Cell 124, 47−59.
  54. , G.A., 2003. Transcription elongation by RNA polymerase II. Curr. Opin. Genet. Dev. 13, 119−126.
  55. Hartzog, G.A., Kaplan, C.D., 2011. Competing for the clamp: promoting RNA polymerase processivity and managing the transition from initiation to elongation. Mol. Cell 43, 161−163.
  56. He, X., Ling, X., Sinha, S., 2009. Alignment and prediction of cis-regulatory modules based on a probabilistic model of evolution. PLoS Comput. Biol. 5, el 299.
  57. Higo, K., Ugawa, Y., Iwamoto, M., Korenaga, T., 1999. Plant cis-acting regulatory DNA elements (PLACE) database: 1999. Nucleic Acids Res. 27, 297−300.
  58. Hu, J., Hu, H., Li, X., 2008. MOPAT: a graph-based method to predict recurrent cis-regulatory modules from known motifs. Nucleic Acids Res 36, 4488−4497.
  59. Johansson, O., Alkema, W., Wasserman, W.W., Lagergren, J., 2003. Identification of functional clusters of transcription factor binding motifs in genome sequences: the MSCAN algorithm. Bioinformatics, 19(Suppl. 1), i 169—i 176.
  60. Keich, U., Pevzner, P.A., 2002. Finding motifs in the twilight zone. Bioinformatics. 18(10), 1374−1381.
  61. Kel-Margoulis, O.V., Ivanova, T.G., Wingender, E., Kel, A.E., 2002. Automatic annotation of genomic regulatory sequences by searching for composite clusters. Pac Symp1. Biocomput 187−198.
  62. Kel, A., Konovalova, T., Waleev, T., Cheremushkin, E., Kel-Margoulis, O., Wingender, E., 2006. Composite Module Analyst: a fitness-based tool for identification of transcription factor binding site combinations. Bioinformatics, 22, 1190−1197.
  63. King, O.D., Roth, F. R, 2003. A non-parametric model for transcription factor binding sites. Nucleic Acids Res. 31, el 16.
  64. Klepper, K., Sandve, G.K., Abul, O., Johansen, J., Drablos, F., 2008. Assessment of composite motif discovery methods. BMC Bioinformatics, 9, 123−123.
  65. Kolbe, D., Taylor, J., Elnitski, L., Eswara, P., Li, J., Miller, W., Hardison, R., Chiaromonte, F., 2004. Regulatory potential scores from genome-wide three-way alignments of human, mouse, and rat. Genome Res. 14, 700−707.
  66. Krivan, W., Wasserman, W.W., 2001. A predictive model for regulatory sequences directing liver-specific transcription. Genome Res. 11, 1559−1566.
  67. Krogh, A., Larsson, B., von Heijne, G., Sonnhammer, E.L., 2001. Predicting transmembrane protein topology with a hidden markov model: application to complete genomes. Journal of Molecular Biology 305, 567−580.
  68. Krogh, A., Mian, I.S., Haussler, D., 1994. A Hidden Markov Model That Finds Genes in E. coli DNA. Nucl. Acids Res. 22, 4768−4778.
  69. Kulakovskiy, I.V., Makeev, V.J., 2010. Discovery of DNA motifs recognized by transcription factors through integration of different experimental sources. BIOPHYSICS 54, 667−674.
  70. , S., 2010. Gene regulation through RNA editing. Discov Med 10, 379−386.
  71. Madsen, C.S., Regan, C.P., Owens, G.K., 1997. Interaction of CArG Elements and a GC-rich Repressor Element in Transcriptional Regulation of the Smooth Muscle Myosin Heavy Chain Gene in Vascular Smooth Muscle Cells. J. Biol. Chem., 272, 29 842-f 29 851.
  72. Maeda, T., Gupta, M.P., Stewart, A.F.R., 2002. TEF-1 and MEF2 transcription factors interact to regulate muscle-specifc promoters. Biochem. Biophys. Res. Commun, 294, 791−797.
  73. Makeev, V.J., Lifanov, A.P., Nazina, A.G., Papatsenko, D.A., 2003. Distance preferences in the arrangement of binding motifs and hierarchical levels in organization of transcriptionregulatory information. Nucleic Acids Res 31, 6016−6026.
  74. Man, T.K., Stormo, G.D., 2001. Non-independence of Mnt repressor-operator interaction determined by a new quantitative multiple fluorescence relative affinity (QuMFRA) assay. Nucleic Acids Res. 29, 2471−2478.
  75. Mattick, J.S., Taft, R.J., Faulkner, G.J., 2010. A global view of genomic information-moving beyond the gene and the master regulator. Trends Genet. 26, 21−28.
  76. May, C., Brosseron, F., Chartowski, P., Schumbrutzki, C., Schoenebeck, B., Marcus, K., 2011. Instruments and methods in proteomics. Methods Mol. Biol. 696, 3−26.
  77. Moses, A.M., Chiang, D.Y., Kellis, M., Lander, E.S., Eisen, M.B., 2003. Position specific variation in the rate of evolution in transcription factor binding sites. BMC Evol. Biol. 3, 19.
  78. Moses, A.M., Chiang, D.Y., Pollard, D.A., Iyer, V.N., Eisen, M.B., 2004. MONKEY: identifying conserved transcription-factor binding sites in multiple alignments using a binding site-specific evolutionary model. Genome Biol. 5, R98.
  79. Moses, A.M., Pollard, D.A., Nix, D.A., Iyer, V.N., Li, X.-Y., Biggin, M.D., Eisen, M.B., 2006. Large-scale turnover of functional transcription factor binding sites in Drosophila. PLoS Comput. Biol 2, el30.
  80. Miihlemann, O., Eberle, A.B., Stalder, L., Zamudio Orozco, R., 2008. Recognition and elimination of nonsense mRNA. Biochim. Biophys. Acta 1779, 538−549.
  81. Navarro, P., Oldfield, A., Legoupi, J., Festuccia, N., Dubois, A., Attia, M., Schoorlemmer, J., Rougeulle, C., Chambers, I., Avner, P., 2010. Molecular coupling of Tsix regulation and pluripotency. Nature 468, 457−460.
  82. Nielsen, H., Brunak, S., Von Heijne, G., 1999. Machine Learning Approaches for the Prediction of Signal Peptides and Other Protein Sorting Signals. Protein Eng. 12, 3−9.
  83. Nishida, K., Frith, M.C., Nakai, K., 2009. Pseudocounts for transcription factor binding sites. Nucleic Acids Res. 37, 939−944.
  84. Noto, K., Craven, M., 2007. Learning probabilistic models of cis-regulatory modules that represent logical and spatial aspects. Bioinformatics 23, el56 -el62.
  85. O’Flanagan, R.A., Paillard, G., Lavery, R., Sengupta, A.M., 2005. Non-additivity in protein-DNA binding. Bioinformatics 21, 2254−2263.
  86. Papatsenko, D., Goltsev, Y., Levine, M., 2009. Organization of developmental enhancers in the Drosophila embryo. Nucleic Acids Res., 37, 5665−5677.
  87. Papatsenko, D.A., Makeev, V.J., Lifanov, A.P., Regnier, M., Nazina, A.G., Desplan, C., 2002. Extraction of functional binding sites from unique regulatory regions: the Drosophila early developmental enhancers. Genome Res. 12, 470−481.
  88. Paquet, E.R., Rey, G., Naef, F., 2008. Modeling an evolutionary conserved circadian cis-element. PLoS Comput. Biol. 4, e38.
  89. Parkinson, J., Blaxter, M., 2009. Expressed sequence tags: an overview. Methods Mol. Biol. 533, 1−12.
  90. Pierstorff, N., Bergman, C.M., Wiehe, T., 2006. Identifying cis-regulatory modules by combining comparative and compositional analysis of DNA. Bioinformatics 22, 2858−2864.
  91. , L.R., 1989. A tutorial on hidden markov models and selected applications in speech recognition. Proc. IEEE, 77, 257−286.
  92. Rajewsky, N., Vergassola, M., Gaul, U., Siggia, E.D., 2002. Computational detection of genomic cis-regulatory modules applied to body patterning in the early Drosophila embryo. BMC Bioinformatics 3, 30−30.
  93. , A., 1998. CpG methylation, chromatin structure and gene silencing-a three-way connection. EMBO J. 17, 4905−4908.
  94. Remenyi, A., Scholer, H.R., Wilmanns, M., 2004. Combinatorial control of gene expression. Nat. Struct. Mol. Biol. 11, 812−15
  95. Remenyi, A., Tomilin, A., Scholer, H.R., Wilmanns, M., 2002. Differential activity by DNA-induced quarternary structures of POU transcription factors. Biochem. Pharmacol. 64, 979−984.
  96. Rivera-Pomar, R., Jackie, H., 1996. From gradients to stripes in 105 Drosophila embryogenesis: filling in the gaps. Trends Genet. TIG, 12, 478−483.
  97. Sandelin, A., Wasserman, W.W., 2004. Constrained binding site diversity within families of transcription factors enhances pattern discovery bioinformatics. J. Mol. Biol. 338, 207−215.
  98. Sandelin, A., Wasserman, W.W., 2005. Prediction of nuclear hormone receptor response elements. Mol. Endocrinol. 19, 595−606.
  99. Sarafova, S., Siu, G., 2000. Precise arrangement of factor-binding sites is required for murine CD4 promoter function. Nucleic Acids Res. 28, 2664−2671.
  100. Schroeder, M.D., Pearce, M., Fak, J., Fan, H., Unnerstall, U., Emberly, E., Rajewsky, N., Siggia, E.D., Gaul, U., 2004. Transcriptional control in the segmentation gene network of Drosophila. PLoS Biol. 2, E271.
  101. , P., 2002. Evolution of development in closely related species of flies and worms. Nat. Rev. Genet. 3, 907−917.
  102. Sinha, S., He, X., 2007. MORPH: Probabilistic Alignment Combined with Hidden Markov Models of cis-Regulatory Modules. PLoS Comput Biol 3, e216.
  103. Sinha, S., van Nimwegen, E., Siggia, E.D., 2003. A probabilistic method to detect regulatory modules. Bioinformatics 19 Suppl 1, I292−301.
  104. Small, S., Blair, A., Levine, M., 1992. Regulation of even-skipped stripe 2 in the Drosophila embryo. EMBO J. 11, 4047−4057.
  105. Stanke, M., Schoffmann, O., Morgenstern, B., Waack, S., 2006. Gene prediction in eukaryotes with a generalized hidden Markov model that uses hints from external sources. BMC Bioinformatics 7, 62.
  106. Stark, A., Lin, M.F., Kheradpour, P., Pedersen, J.S., Parts, L., Carlson, J.W., et al., 2007. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature, 450,219−232.
  107. Stormo, G.D., Schneider, T.D., Gold, L., Ehrenfeucht, A., 1982. Use of the «Perceptron» algorithm to distinguish translational initiation sites in E. coli. Nucleic Acids Res. 10, 29 973 011.
  108. Tomancak, P., Berman, B. P, Beaton, A., Weiszmann, R., Kwan, E., Hartenstein, V., Celniker, S.E., Rubin, G.M., 2007. Global analysis of patterns of gene expression during Drosophila embryogenesis. Genome Biol., 8, R145.
  109. Tranche, E, Ringeisen, F., Blumenfeld, M., Yaniv, M., Pontoglio, M., 1997. Analysis of the distribution of binding sites for a tissue-specific transcription factor in the vertebrate genome. J. Mol. Biol. 266, 231−245.
  110. Tweedie, S., Ashburner, M., Falls, K., Leyland, P., McQuilton, P., Marygold, S., Millburn, G., Osumi-Sutherland, D., Schroeder, A., Seal, R., Zhang, H., 2009. FlyBase: enhancing Drosophila Gene Ontology annotations. Nucleic Acids Res., 37, D555-ID559.
  111. Wasserman, W.W., Fickett, J.W., 1998. Identification of regulatory regions which confer muscle-specific gene expression. J. Mol. Biol. 278, 167−181.
  112. Wasserman, W.W., Palumbo, M., Thompson, W., Fickett, J.W., Lawrence, C.E., 2000. Human-mouse genome comparisons to locate regulatory sites. Nat. Genet. 26, 225−228.
  113. , D., 2007. Using GenBank. Methods Mol. Biol. 406, 23−59.
  114. Whiteld, T.W., Wang, J., Collins, P.J., Partridge, E.C., Aldred, S.F., Trinklein, N.D., Myers, R.M., Weng, Z., 2012. Functional analysis of transcription factor binding sites in human promoters. Genome Biol. 13, R50.
  115. Wilczynski, B., Dojer, N., Patelak, M., Tiuryn, J., 2009. Finding evolutionarily conserved cis-regulatory modules with a universal set of motifs. BMC Bioinformatics 10, 82.
  116. Won, K.J., Agarwal, S., Shen, L., Shoemaker, R., Ren, B., Wang, W., 2009. An integrated approach to identifying cis-regulatory modules in the human genome. PLoS One. 4(5), e5501.
  117. Wong, W.S.W., Nielsen, R., 2007. Finding cis-regulatory modules in Drosophila using phylogenetic hidden Markov models. Bioinformatics 23, 2031−2037.
  118. , G.A., 2007. The evolutionary significance of cis-regulatory mutations. Nat. Rev. Genet. 8, 206−216.
  119. Yuh, C.H., Bolouri, H., Davidson, E.H., 1998. Genomic cis-regulatory logic: experimental and computational analysis of a sea urchin gene. Science 279, 1896−1902.
  120. Zhou, Q., Liu, J.S., 2004. Modeling within-motif dependence for transcription factor binding site predictions. Bioinformatics 20, 909−916.
  121. Zhou, Q., Wong, W.H., 2004. CisModule: de novo discovery of cis-regulatory modules by hierarchical mixture modeling. Proc. Natl. Acad. Sci. USA, 101(33), 12 114−9.
  122. Zhu, J., Zhang, M.Q., 1999. SCPD: a promoter database of the yeast Saccharomyces cerevisiae. Bioinformatics 15, 607−611.
  123. Л.И. Экспрессия генов. M.: «Наука», 2000. с. 829.
  124. М., Берг П. Гены и геномы. «Мир» т.2, 1998 г.
Заполнить форму текущей работой