Открытие роли ДНК в наследственности и наблюдения Фредерика Сенгера за вариациями между инсулинами животных в 1949 году [2] побудили ранних молекулярных биологов изучать таксономию с молекулярной точки зрения. [3] [4] Исследования 1960-х годов использовали методы гибридизации ДНК и перекрестной реактивности белков для измерения сходства между известными ортологичными белками, такими как гемоглобин [5] и цитохром c . [6] В 1965 году Эмиль Цукеркандль и Лайнус Полинг ввели концепцию молекулярных часов [7], предположив , что постоянные скорости замены аминокислот могут быть использованы для оценки времени с момента расхождения двух организмов . В то время как первоначальные филогении близко соответствовали ископаемым данным , наблюдения за тем, что некоторые гены, по-видимому, эволюционировали с разной скоростью, привели к разработке теорий молекулярной эволюции . [3] [4] Сравнение последовательностей ферредоксина , проведенное Маргарет Дейхофф в 1966 году , показало, что естественный отбор будет действовать в направлении сохранения и оптимизации последовательностей белков, необходимых для жизни. [8]
Механизмы
На протяжении многих поколений последовательности нуклеиновых кислот в геноме эволюционной линии могут постепенно меняться с течением времени из-за случайных мутаций и делеций . [9] [10] Последовательности также могут рекомбинировать или удаляться из-за хромосомных перестроек . Консервативные последовательности — это последовательности, которые сохраняются в геноме, несмотря на такие силы, и имеют более медленную скорость мутации, чем фоновая скорость мутации. [11]
Консервация может происходить в кодирующих и некодирующих последовательностях нуклеиновых кислот. Высококонсервативные последовательности ДНК, как полагают, имеют функциональную ценность, хотя роль многих высококонсервативных некодирующих последовательностей ДНК плохо изучена. [12] [13] Степень, в которой последовательность является консервативной, может зависеть от различных давлений отбора , ее устойчивости к мутациям, размера популяции и генетического дрейфа . Многие функциональные последовательности также являются модульными , содержащими области, которые могут подвергаться независимым давлениям отбора , такие как домены белков . [14]
Кодирующая последовательность
В кодирующих последовательностях последовательность нуклеиновой кислоты и аминокислот может сохраняться в разной степени, поскольку вырожденность генетического кода означает, что синонимичные мутации в кодирующей последовательности не влияют на последовательность аминокислот ее белкового продукта. [15]
Аминокислотные последовательности могут быть сохранены для поддержания структуры или функции белка или домена. Консервированные белки подвергаются меньшему количеству замен аминокислот или с большей вероятностью заменяют аминокислоты со схожими биохимическими свойствами . [16] В пределах последовательности аминокислоты, которые важны для фолдинга , структурной стабильности или которые образуют сайт связывания , могут быть более высококонсервативными. [17] [18]
Последовательность нуклеиновой кислоты гена, кодирующего белок, может также сохраняться другими селективными давлениями. Смещение использования кодона в некоторых организмах может ограничивать типы синонимичных мутаций в последовательности. Последовательности нуклеиновой кислоты, которые вызывают вторичную структуру в мРНК кодирующего гена, могут быть отобраны против, поскольку некоторые структуры могут негативно влиять на трансляцию, или сохраняться, когда мРНК также действует как функциональная некодирующая РНК. [19] [20]
Некодирование
Некодирующие последовательности, важные для регуляции генов , такие как сайты связывания или распознавания рибосом и факторы транскрипции , могут быть сохранены в геноме. Например, промотор консервативного гена или оперона также может быть сохранен. Как и в случае с белками, нуклеиновые кислоты, которые важны для структуры и функции некодирующей РНК (нкРНК), также могут быть сохранены. Однако сохранение последовательностей в нкРНК, как правило, плохое по сравнению с последовательностями, кодирующими белок, и пары оснований , которые способствуют структуре или функции, часто сохраняются вместо этого. [21] [22]
Консервативные последовательности могут быть идентифицированы с помощью поиска гомологии с использованием таких инструментов, как BLAST , HMMER , OrthologR, [25] и Infernal. [26] Инструменты поиска гомологии могут принимать в качестве входных данных отдельную последовательность нуклеиновой кислоты или белка или использовать статистические модели, созданные на основе множественных выравниваний последовательностей известных родственных последовательностей. Статистические модели, такие как profile-HMMs и модели ковариации РНК, которые также включают структурную информацию, [27] могут быть полезны при поиске более отдаленно связанных последовательностей. Затем входные последовательности выравниваются с базой данных последовательностей родственных особей или других видов. Затем полученные выравнивания оцениваются на основе количества совпадающих аминокислот или оснований и количества пробелов или делеций, созданных выравниванием. Приемлемые консервативные замены могут быть идентифицированы с использованием матриц замен, таких как PAM и BLOSUM . Предполагается, что высокооцененные выравнивания происходят из гомологичных последовательностей. Сохранение последовательности может быть затем выведено путем обнаружения очень похожих гомологов в широком филогенетическом диапазоне. [28]
Множественное выравнивание последовательностей
Для визуализации консервативных последовательностей можно использовать множественные выравнивания последовательностей. Формат CLUSTAL включает в себя простой текстовый ключ для аннотирования консервативных столбцов выравнивания, обозначающий консервативную последовательность (*), консервативные мутации (:), полуконсервативные мутации (.) и неконсервативные мутации ( ) [30] Логотипы последовательностей также могут отображать консервативную последовательность, представляя пропорции символов в каждой точке выравнивания по высоте. [29]
Выравнивание генома
Выравнивания всего генома (WGA) также могут использоваться для идентификации высококонсервативных регионов у разных видов. В настоящее время точность и масштабируемость инструментов WGA остаются ограниченными из-за вычислительной сложности работы с перестройками, повторными регионами и большим размером многих эукариотических геномов. [32] Однако WGA 30 или более близкородственных бактерий (прокариот) в настоящее время становятся все более осуществимыми. [33] [34]
Системы подсчета очков
Другие подходы используют измерения консервации, основанные на статистических тестах , которые пытаются идентифицировать последовательности, которые мутируют иначе, чем ожидаемая фоновая (нейтральная) скорость мутаций.
Структура GERP (Genomic Evolutionary Rate Profiling) оценивает сохранение генетических последовательностей у разных видов. Этот подход оценивает скорость нейтральной мутации в наборе видов из множественного выравнивания последовательностей, а затем определяет области последовательности, которые демонстрируют меньше мутаций, чем ожидалось. Затем этим областям присваиваются баллы на основе разницы между наблюдаемой скоростью мутаций и ожидаемой фоновой скоростью мутаций. Высокий балл GERP указывает на высококонсервативную последовательность. [35] [36]
LIST [37] [38] (Local Identity and Shared Taxa) основан на предположении, что вариации, наблюдаемые у видов, близкородственных человеку, более значимы при оценке сохранения по сравнению с вариациями у отдаленнородственных видов. Таким образом, LIST использует локальную идентичность выравнивания вокруг каждой позиции для идентификации соответствующих последовательностей в множественном выравнивании последовательностей (MSA), а затем оценивает сохранение на основе таксономических расстояний этих последовательностей до человека. В отличие от других инструментов, LIST игнорирует количество/частоту вариаций в MSA.
Aminode [39] объединяет множественные выравнивания с филогенетическим анализом для анализа изменений в гомологичных белках и создания графика, который указывает локальные скорости эволюционных изменений. Этот подход определяет эволюционно ограниченные регионы в белке, которые являются сегментами, которые подвергаются очищающему отбору и обычно имеют решающее значение для нормальной функции белка.
Другие подходы, такие как PhyloP и PhyloHMM, включают статистические филогенетические методы для сравнения вероятностных распределений скоростей замен, что позволяет обнаруживать как сохранение, так и ускоренную мутацию. Во-первых, фоновое распределение вероятностей генерируется для числа замен, которые, как ожидается, произойдут для столбца в множественном выравнивании последовательностей, на основе филогенетического дерева . Оцененные эволюционные связи между интересующими видами используются для расчета значимости любых замен (т. е. замена между двумя близкородственными видами может быть менее вероятной, чем между отдаленно родственными, и, следовательно, более значимой). Для обнаружения сохранения вычисляется распределение вероятностей для подмножества множественного выравнивания последовательностей и сравнивается с фоновым распределением с использованием статистического теста, такого как тест отношения правдоподобия или тест оценки . Затем значения P, полученные при сравнении двух распределений, используются для определения консервативных областей. PhyloHMM использует скрытые марковские модели для генерации распределений вероятностей. Пакет программного обеспечения PhyloP сравнивает распределения вероятностей, используя тест отношения правдоподобия или тест оценки , а также используя систему оценки, подобную GERP. [40] [41] [42]
Экстремальная охрана природы
Сверхконсервативные элементы
Ультраконсервативные элементы или UCE — это последовательности, которые очень похожи или идентичны в нескольких таксономических группах . Впервые они были обнаружены у позвоночных , [43] и впоследствии были идентифицированы в сильно различающихся таксонах. [44] Хотя происхождение и функция UCE плохо изучены, [45] они использовались для исследования глубоких временных расхождений у амниот , [46] насекомых , [47] и между животными и растениями . [48]
Наборы консервативных последовательностей часто используются для создания филогенетических деревьев , поскольку можно предположить, что организмы со схожими последовательностями тесно связаны. [52] Выбор последовательностей может варьироваться в зависимости от таксономического охвата исследования. Например, наиболее высококонсервативные гены, такие как 16S РНК и другие рибосомные последовательности, полезны для реконструкции глубоких филогенетических связей и идентификации бактериальных филумов в исследованиях метагеномики . [53] [54] Последовательности, которые сохраняются в пределах клады , но претерпевают некоторые мутации, такие как гены домашнего хозяйства , могут использоваться для изучения взаимоотношений видов. [55] [56] [57] Область внутреннего транскрибируемого спейсера (ITS), которая требуется для размещения консервативных генов рРНК, но претерпевает быструю эволюцию, обычно используется для классификации грибов и штаммов быстро эволюционирующих бактерий. [58] [59] [60] [61]
Медицинские исследования
Поскольку высококонсервативные последовательности часто имеют важные биологические функции, они могут быть полезны в качестве отправной точки для определения причины генетических заболеваний . Многие врожденные нарушения обмена веществ и лизосомные болезни накопления являются результатом изменений в отдельных консервативных генах, что приводит к отсутствующим или неисправным ферментам, которые являются основной причиной симптомов заболевания. Генетические заболевания можно предсказать, идентифицируя последовательности, которые консервативны между людьми и лабораторными организмами, такими как мыши [62] или плодовые мушки [63] , и изучая эффекты нокаутов этих генов. [64] Исследования ассоциаций по всему геному также можно использовать для определения вариаций в консервативных последовательностях, связанных с заболеванием или последствиями для здоровья. Было обнаружено более двух десятков новых потенциальных локусов восприимчивости к болезни Альцгеймера. [65] [66]
Функциональная аннотация
Идентификация консервативных последовательностей может быть использована для обнаружения и прогнозирования функциональных последовательностей, таких как гены. [67] Консервативные последовательности с известной функцией, такие как домены белков, также могут быть использованы для прогнозирования функции последовательности. Базы данных консервативных доменов белков, такие как Pfam и База данных консервативных доменов, могут быть использованы для аннотирования функциональных доменов в предсказанных генах, кодирующих белки. [68]
^ "Clustal FAQ #Symbols". Clustal . Архивировано из оригинала 24 октября 2016 года . Получено 8 декабря 2014 года .
^ Sanger, F. (24 сентября 1949 г.). «Видовые различия инсулинов». Nature . 164 (4169): 529. Bibcode :1949Natur.164..529S. doi : 10.1038/164529a0 . PMID 18141620. S2CID 4067991.
^ ab Marmur, J; Falkow, S; Mandel, M (октябрь 1963 г.). «Новые подходы к бактериальной таксономии». Annual Review of Microbiology . 17 (1): 329–372. doi :10.1146/annurev.mi.17.100163.001553. PMID 14147455.
^ ab Pace, NR; Sapp, J.; Goldenfeld, N. (17 января 2012 г.). «Филогения и далее: научное, историческое и концептуальное значение первого дерева жизни». Труды Национальной академии наук . 109 (4): 1011–1018. Bibcode : 2012PNAS..109.1011P. doi : 10.1073/pnas.1109716109 . PMC 3268332. PMID 22308526 .
^ Цукерландл, Эмиль ; Полинг, Линус Б. (1962). «Молекулярные заболевания, эволюция и генетическая гетерогенность». Горизонты в биохимии : 189–225.
^ Марголиаш, Э. (октябрь 1963 г.). «Первичная структура и эволюция цитохрома С». Труды Национальной академии наук . 50 (4): 672–679. Bibcode : 1963PNAS...50..672M. doi : 10.1073/pnas.50.4.672 . PMC 221244. PMID 14077496 .
^ Цукеркандл, Э.; Полинг, Л. Б. (1965). «Эволюционная дивергенция и конвергенция в белках». Эволюция генов и белков : 96–166. doi :10.1016/B978-1-4832-2734-4.50017-6. ISBN9781483227344.
^ Eck, RV; Dayhoff, MO (15 апреля 1966 г.). «Эволюция структуры ферредоксина на основе живых остатков примитивных аминокислотных последовательностей». Science . 152 (3720): 363–366. Bibcode :1966Sci...152..363E. doi :10.1126/science.152.3720.363. PMID 17775169. S2CID 23208558.
↑ Кимура, М. (17 февраля 1968 г.). «Скорость эволюции на молекулярном уровне». Nature . 217 (5129): 624–626. Bibcode :1968Natur.217..624K. doi :10.1038/217624a0. PMID 5637732. S2CID 4161261.
^ Кимура, М.; Охта, Т. (1974). «О некоторых принципах, управляющих молекулярной эволюцией». Proc Natl Acad Sci USA . 71 (7): 2848–2852. Bibcode : 1974PNAS...71.2848K. doi : 10.1073 /pnas.71.7.2848 . PMC 388569. PMID 4527913.
^ Asthana, Saurabh; Roytberg, Michael; Stamatoyannopoulos, John; Sunyaev, Shamil (28 декабря 2007 г.). Brudno, Michael (ред.). "Analysis of Sequence Conservation at Nucleotide Resolution". PLOS Computational Biology . 3 (12): e254. Bibcode : 2007PLSCB...3..254A. doi : 10.1371/journal.pcbi.0030254 . ISSN 1553-7358. PMC 2230682. PMID 18166073 .
^ Купер, GM; Браун, CD (1 февраля 2008 г.). «Квалификация связи между сохранением последовательности и молекулярной функцией». Genome Research . 18 (2): 201–205. doi : 10.1101/gr.7205808 . ISSN 1088-9051. PMID 18245453.
^ Gilson, Amy I.; Marshall-Christensen, Ahmee; Choi, Jeong-Mo; Shakhnovich, Eugene I. (2017). «Роль эволюционного отбора в динамике эволюции структуры белка». Biophysical Journal . 112 (7): 1350–1365. arXiv : 1606.05802 . Bibcode :2017BpJ...112.1350G. doi :10.1016/j.bpj.2017.02.029. PMC 5390048 . PMID 28402878.
^ Чжан, Цзяньчжи (2000). «Скорости консервативных и радикальных несинонимичных замен нуклеотидов в ядерных генах млекопитающих». Журнал молекулярной эволюции . 50 (1): 56–68. Bibcode : 2000JMolE..50...56Z. doi : 10.1007/s002399910007. ISSN 0022-2844. PMID 10654260. S2CID 15248867.
^ Sousounis, Konstantinos; Haney, Carl E; Cao, Jin; Sunchu, Bharath; Tsonis, Panagiotis A (2012). «Сохранение трехмерной структуры в негомологичных или неродственных белках». Human Genomics . 6 (1): 10. doi : 10.1186/1479-7364-6-10 . ISSN 1479-7364. PMC 3500211. PMID 23244440 .
^ Кайрис, Висвальдас; Фернандес, Мигель X. (2007). «SitCon: Визуализация остатков связывания и инструмент преобразования последовательности белка в функцию». Международный журнал квантовой химии . 107 (11): 2100–2110. Bibcode : 2007IJQC..107.2100K. doi : 10.1002/qua.21396. hdl : 10400.13/5004 . ISSN 0020-7608.
^ Chamary, JV; Hurst, Laurence D (2005). «Доказательства отбора синонимичных мутаций, влияющих на стабильность вторичной структуры мРНК у млекопитающих». Genome Biology . 6 (9): R75. doi : 10.1186/gb-2005-6-9-r75 . PMC 1242210. PMID 16168082 .
^ Wadler, CS; Vanderpool, CK (27 ноября 2007 г.). «Двойная функция бактериальной малой РНК: SgrS выполняет регуляцию, зависящую от спаривания оснований, и кодирует функциональный полипептид». Труды Национальной академии наук . 104 (51): 20454–20459. Bibcode : 2007PNAS..10420454W. doi : 10.1073/pnas.0708102104 . PMC 2154452. PMID 18042713 .
^ Фрейхульт, EK; Боллбек, JP; Гарднер, PP (6 декабря 2006 г.). «Изучение темной материи генома: критическая оценка эффективности методов поиска гомологии на некодирующих РНК». Genome Research . 17 (1): 117–125. doi :10.1101/gr.5890907. PMC 1716261 . PMID 17151342.
^ Маргулис, Э. Х. (1 декабря 2003 г.). «Идентификация и характеристика многовидовых консервативных последовательностей». Genome Research . 13 (12): 2507–2518. doi :10.1101/gr.1602203. ISSN 1088-9051. PMC 403793. PMID 14656959 .
^ Эдвардс, Джон Р.; Рупарель, Хамир; Джу, Цзинъюэ (2005). «Масс-спектрометрическое секвенирование ДНК». Mutation Research/Fundamental and Molecular Mechanisms of Mutagenesis . 573 (1–2): 3–12. Bibcode : 2005MRFMM.573....3E. doi : 10.1016/j.mrfmmm.2004.07.021. PMID 15829234.
^ Дрост, Хайк-Георг; Габель, Александр; Гроссе, Иво; Квинт, Марсель (1 мая 2015 г.). «Доказательства активного поддержания филотранскриптомных песочных узоров в эмбриогенезе животных и растений». Молекулярная биология и эволюция . 32 (5): 1221–1231. doi :10.1093/molbev/msv012. ISSN 0737-4038. PMC 4408408. PMID 25631928 .
^ Nawrocki, EP; Eddy, SR (4 сентября 2013 г.). «Infernal 1.1: 100-кратно более быстрый поиск гомологии РНК». Bioinformatics . 29 (22): 2933–2935. doi :10.1093/bioinformatics/btt509. PMC 3810854 . PMID 24008419.
^ Эдди, SR; Дурбин, R (11 июня 1994 г.). «Анализ последовательности РНК с использованием ковариационных моделей». Nucleic Acids Research . 22 (11): 2079–88. doi :10.1093/nar/22.11.2079. PMC 308124. PMID 8029015 .
^ Триведи, Ракеш; Нагараджарам, Хампапаталу Адимурти (2020). «Матрицы оценки замены для белков — обзор». Protein Science . 29 (11): 2150–2163. doi :10.1002/pro.3954. ISSN 0961-8368. PMC 7586916 . PMID 32954566.
^ ab "Weblogo". Калифорнийский университет в Беркли . Получено 30 декабря 2017 г.
^ "Clustal FAQ #Symbols". Clustal . Архивировано из оригинала 24 октября 2016 года . Получено 8 декабря 2014 года .
^ "ECR Browser". ECR Browser . Получено 9 января 2018 г. .
^ Rouli, L.; Merhej, V.; Fournier, P.-E.; Raoult, D. (сентябрь 2015 г.). «Бактериальный пангеном как новый инструмент для анализа патогенных бактерий». New Microbes and New Infections . 7 : 72–85. doi :10.1016/j.nmni.2015.06.005. PMC 4552756. PMID 26442149 .
^ Méric, Guillaume; Yahara, Koji; Mageiros, Leonardos; Pascoe, Ben; Maiden, Martin CJ; Jolley, Keith A.; Sheppard, Samuel K.; Bereswill, Stefan (27 марта 2014 г.). "A Reference Pan-Genome Approach to Comparative Bacterial Genomics: Identification of Novel Epidemiological Markers in Pathogenic Campylobacter". PLOS ONE . 9 (3): e92798. Bibcode : 2014PLoSO...992798M. doi : 10.1371/journal.pone.0092798 . PMC 3968026. PMID 24676150.
^ Купер, GM (17 июня 2005 г.). «Распределение и интенсивность ограничений в геномной последовательности млекопитающих». Genome Research . 15 (7): 901–913. doi :10.1101/gr.3577405. PMC 1172034. PMID 15965027 .
^ "Sidow Lab - GERP". Архивировано из оригинала 14 января 2017 года . Получено 23 апреля 2016 года .
^ Навар Малхис; Стивен Дж. М. Джонс; Йорг Гспонер (2019). «Улучшенные меры эволюционной консервации, использующие таксономические расстояния». Nature Communications . 10 (1): 1556. Bibcode : 2019NatCo..10.1556M. doi : 10.1038/s41467-019-09583-2. PMC 6450959. PMID 30952844.
^ Навар Малхис; Мэтью Якобсон; Стивен Дж. М. Джонс; Йорг Гспонер (2020). «LIST-S2: Таксономическая сортировка вредных миссенс-мутаций между видами». Nucleic Acids Research . 48 (W1): W154–W161. doi : 10.1093/nar/gkaa288 . PMC 7319545. PMID 32352516 .
^ Chang KT, Guo J, di Ronza A, Sardiello M (январь 2018 г.). «Аминод: идентификация эволюционных ограничений в протеоме человека». Sci. Rep . 8 (1): 1357. Bibcode : 2018NatSR...8.1357C. doi : 10.1038/s41598-018-19744-w. PMC 5778061. PMID 29358731.
^ Поллард, KS; Хубиш, MJ; Розенблум, KR; Сипель, A. (26 октября 2009 г.). «Обнаружение ненейтральных показателей замен в филогениях млекопитающих». Genome Research . 20 (1): 110–121. doi :10.1101/gr.097857.109. PMC 2798823 . PMID 19858363.
^ "PHAST: Домой".
^ Фань, Сяодань; Чжу, Цзюнь; Шадт, Эрик Э.; Лю, Цзюнь С. (2007). «Статистическая мощность фило-HMM для обнаружения эволюционно консервативных элементов». BMC Bioinformatics . 8 (1): 374. doi : 10.1186/1471-2105-8-374 . PMC 2194792. PMID 17919331 .
^ Bejerano, G. (28 мая 2004 г.). «Ультраконсервативные элементы в геноме человека». Science . 304 (5675): 1321–1325. Bibcode :2004Sci...304.1321B. CiteSeerX 10.1.1.380.9305 . doi :10.1126/science.1098119. PMID 15131266. S2CID 2790337.
^ Siepel, A. (1 августа 2005 г.). «Эволюционно консервативные элементы в геномах позвоночных, насекомых, червей и дрожжей». Genome Research . 15 (8): 1034–1050. doi :10.1101/gr.3715005. PMC 1182216. PMID 16024819 .
^ Harmston, N.; Baresic, A.; Lenhard, B. (11 ноября 2013 г.). «Тайна экстремальной некодирующей консервации». Philosophical Transactions of the Royal Society B: Biological Sciences . 368 (1632): 20130021. doi :10.1098/rstb.2013.0021. PMC 3826495 . PMID 24218634.
^ Faircloth, BC; McCormack, JE; Crawford, NG; Harvey, MG; Brumfield, RT; Glenn, TC (9 января 2012 г.). «Ультраконсервативные элементы закрепляют тысячи генетических маркеров, охватывающих несколько эволюционных временных шкал». Systematic Biology . 61 (5): 717–726. doi : 10.1093/sysbio/sys004 . PMID 22232343.
^ Фэрклот, Брант К.; Бранштеттер, Майкл Г.; Уайт, Нур Д.; Брэди, Шон Г. (май 2015 г.). «Целевое обогащение ультраконсервативных элементов от членистоногих обеспечивает геномную перспективу взаимоотношений среди перепончатокрылых». Ресурсы молекулярной экологии . 15 (3): 489–501. doi : 10.1111/1755-0998.12328. PMC 4407909. PMID 25207863.
^ Ренекер, Дж.; Лайонс, Э.; Конант, Дж. К.; Пирес, Дж. К.; Фрилинг, М.; Шью, К.-Р.; Коркин, Д. (10 апреля 2012 г.). «Длинные идентичные многовидовые элементы в геномах растений и животных». Труды Национальной академии наук . 109 (19): E1183–E1191. doi : 10.1073/pnas.1121356109 . PMC 3358895. PMID 22496592 .
^ Айзенбаргер, Томас А.; Карр, Кристофер Э.; Джонсон, Сара Стюарт; Финни, Майкл; Чёрч, Джордж М.; Гилберт, Уолтер; Зубер, Мария Т.; Рувкун, Гэри (14 октября 2008 г.). «Наиболее консервативные сегменты генома для обнаружения жизни на Земле и других планетах». Происхождение жизни и эволюция биосфер . 38 (6): 517–533. Bibcode : 2008OLEB...38..517I. doi : 10.1007/s11084-008-9148-z. PMID 18853276. S2CID 15707806.
^ Харрис, Дж. К. (12 февраля 2003 г.). «Генетическое ядро универсального предка». Genome Research . 13 (3): 407–412. doi :10.1101/gr.652803. PMC 430263. PMID 12618371 .
^ Ban, Nenad; Beckmann, Roland; Cate, Jamie HD; Dinman, Jonathan D; Dragon, François; Ellis, Steven R; Lafontaine, Denis LJ; Lindahl, Lasse; Liljas, Anders; Lipton, Jeffrey M; McAlear, Michael A; Moore, Peter B; Noller, Harry F; Ortega, Joaquin; Panse, Vikram Govind; Ramakrishnan, V; Spahn, Christian MT; Steitz, Thomas A; Tchorzewski, Marek; Tollervey, David; Warren, Alan J; Williamson, James R; Wilson, Daniel; Yonath, Ada; Yusupov, Marat (февраль 2014 г.). «Новая система наименования рибосомальных белков». Current Opinion in Structural Biology . 24 : 165–169. doi : 10.1016/j.sbi.2014.01.002. PMC 4358319. PMID 24524803 .
^ Gadagkar, Sudhindra R.; Rosenberg, Michael S.; Kumar, Sudhir (15 января 2005 г.). «Вывод филогении видов из нескольких генов: объединенное дерево последовательностей против консенсусного дерева генов». Журнал экспериментальной зоологии, часть B: Молекулярная и эволюционная эволюция . 304B (1): 64–74. Bibcode : 2005JEZB..304...64G. doi : 10.1002/jez.b.21026 . PMID 15593277.
^ Людвиг, В.; Шлейфер, К. Х. (октябрь 1994 г.). «Бактериальная филогения на основе анализа последовательности рРНК 16S и 23S». FEMS Microbiology Reviews . 15 (2–3): 155–73. doi : 10.1111/j.1574-6976.1994.tb00132.x . PMID 7524576.
^ Hug, Laura A.; Baker, Brett J.; Anantharaman, Karthik; Brown, Christopher T.; Probst, Alexander J.; Castelle, Cindy J.; Butterfield, Cristina N.; Hernsdorf, Alex W.; Amano, Yuki; Ise, Kotaro; Suzuki, Yohey; Dudek, Natasha; Relman, David A.; Finstad, Kari M.; Amundson, Ronald; Thomas, Brian C.; Banfield, Jillian F. (11 апреля 2016 г.). "Новый взгляд на древо жизни". Nature Microbiology . 1 (5): 16048. doi : 10.1038/nmicrobiol.2016.48 . PMID 27572647.
^ Чжан, Лицин; Ли, Вэнь-Сюн (февраль 2004 г.). «Гены домашнего хозяйства млекопитающих эволюционируют медленнее, чем тканеспецифические гены». Молекулярная биология и эволюция . 21 (2): 236–239. doi : 10.1093/molbev/msh010 . PMID 14595094.
^ Clermont, O.; Bonacorsi, S.; Bingen, E. (1 октября 2000 г.). «Быстрое и простое определение филогенетической группы Escherichia coli». Applied and Environmental Microbiology . 66 (10): 4555–4558. Bibcode :2000ApEnM..66.4555C. doi :10.1128/AEM.66.10.4555-4558.2000. PMC 92342 . PMID 11010916.
^ Куллберг, Морган; Нильссон, Мария А.; Арнасон, Ульфур; Харли, Эрик Х.; Янке, Аксель (август 2006 г.). «Гены домашнего хозяйства для филогенетического анализа родственных связей эутерий». Молекулярная биология и эволюция . 23 (8): 1493–1503. doi : 10.1093/molbev/msl027 . PMID 16751257.
^ Man, SM; Kaakoush, NO; Octavia, S.; Mitchell, H. (26 марта 2010 г.). «Внутренняя транскрибируемая спейсерная область, новый инструмент для использования в дифференциации видов и разграничении систематических отношений в пределах рода Campylobacter». Applied and Environmental Microbiology . 76 (10): 3071–3081. Bibcode :2010ApEnM..76.3071M. doi :10.1128/AEM.02551-09. PMC 2869123 . PMID 20348308.
^ Ranjard, L.; Poly, F.; Lata, J.-C.; Mougel, C.; Thioulouse, J.; Nazaret, S. (1 октября 2001 г.). «Характеристика бактериальных и грибковых почвенных сообществ с помощью автоматизированного анализа рибосомальных межгенных спейсеров по отпечаткам пальцев: биологическая и методологическая изменчивость». Applied and Environmental Microbiology . 67 (10): 4479–4487. Bibcode :2001ApEnM..67.4479R. doi :10.1128/AEM.67.10.4479-4487.2001. PMC 93193 . PMID 11571146.
^ Биде, Филипп; Барбю, Фредерик; Лаланд, Валери; Бургхоффер, Беатрис; Пети, Жан-Клод (июнь 1999 г.). «Разработка нового метода ПЦР-риботипирования на основе секвенирования генов рибосомальных РНК». Письма FEMS по микробиологии . 175 (2): 261–266. дои : 10.1111/j.1574-6968.1999.tb13629.x . ПМИД 10386377.
^ Ala, Ugo; Piro, Rosario Michael; Grassi, Elena; Damasco, Christian; Silengo, Lorenzo; Oti, Martin; Provero, Paolo; Di Cunto, Ferdinando; Tucker-Kellogg, Greg (28 марта 2008 г.). "Предсказание генов заболеваний человека с помощью анализа консервативной коэкспрессии человека и мыши". PLOS Computational Biology . 4 (3): e1000043. Bibcode :2008PLSCB...4E0043A. doi : 10.1371/journal.pcbi.1000043 . PMC 2268251 . PMID 18369433.
^ Pandey, UB; Nichols, CD (17 марта 2011 г.). «Модели заболеваний человека у Drosophila melanogaster и роль мухи в открытии терапевтических препаратов». Pharmacological Reviews . 63 (2): 411–436. doi :10.1124/pr.110.003293. PMC 3082451 . PMID 21415126.
^ Хуан, Хуэй; Винтер, Эйтан Э.; Ван, Хуацзюнь; Вайншток, Кит Г.; Син, Хеминг; Гудштадт, Лео; Стенсон, Питер Д.; Купер, Дэвид Н.; Смит, Дуглас; Альба, М. Мар; Понтинг, Крис П.; Фехтель, Ким (2004). «Эволюционная консервация и отбор ортологов генов болезней человека в геномах крыс и мышей». Genome Biology . 5 (7): R47. doi : 10.1186/gb-2004-5-7-r47 . PMC 463309 . PMID 15239832.
^ Ge, Dongliang; Fellay, Jacques; Thompson, Alexander J.; Simon, Jason S.; Shianna, Kevin V.; Urban, Thomas J.; Heinzen, Erin L.; Qiu, Ping; Bertelsen, Arthur H.; Muir, Andrew J.; Sulkowski, Mark; McHutchison, John G.; Goldstein, David B. (16 августа 2009 г.). «Генетическая вариация IL28B предсказывает исчезновение вируса, вызванное лечением гепатита C». Nature . 461 (7262): 399–401. Bibcode :2009Natur.461..399G. doi :10.1038/nature08309. PMID 19684573. S2CID 1707096.
^ Бертрам, Л. (2009). «Исследования ассоциаций по всему геному при болезни Альцгеймера». Молекулярная генетика человека . 18 (R2): R137–R145. doi :10.1093/hmg/ddp406. PMC 2758713. PMID 19808789 .
^ Келлис, Манолис; Паттерсон, Ник; Эндрицци, Мэтью; Биррен, Брюс; Ландер, Эрик С. (15 мая 2003 г.). «Секвенирование и сравнение видов дрожжей для идентификации генов и регуляторных элементов». Nature . 423 (6937): 241–254. Bibcode :2003Natur.423..241K. doi :10.1038/nature01644. PMID 12748633. S2CID 1530261.
^ Марчлер-Бауэр, А.; Лу, С.; Андерсон, Дж. Б.; Читсаз, Ф.; Дербишир, МК; ДеВизе-Скотт, К.; Фонг, Дж. Х.; Гир, LY; Гир, РК; Гонзалес, Н. Р.; Гвадз, М.; Гурвиц, ДИ; Джексон, Дж. Д.; Ке, З.; Ланчицкий, К. Дж.; Лу, Ф.; Марчлер, GH; Муллокандов, М.; Омельченко, М. В.; Робертсон, КЛ; Сонг, Дж. С.; Тханки, Н.; Ямашита, РА; Чжан, Д.; Чжан, Н.; Чжэн, К.; Брайант, Ш. (24 ноября 2010 г.). «CDD: база данных консервативных доменов для функциональной аннотации белков». Nucleic Acids Research . 39 (база данных): D225–D229. doi : 10.1093/nar/gkq1189. PMC 3013737. PMID 21109532 .