Молекулярные часы — это образный термин для метода, который использует скорость мутации биомолекул для определения времени в предыстории , когда две или более форм жизни разошлись . Биомолекулярные данные, используемые для таких расчетов, обычно представляют собой последовательности нуклеотидов для ДНК , РНК или последовательности аминокислот для белков .
Идея существования так называемых «молекулярных часов» была впервые приписана Эмилю Цукеркандлю и Лайнусу Полингу , которые в 1962 году заметили, что количество различий аминокислот в гемоглобине между различными линиями изменяется примерно линейно со временем, как это было оценено по ископаемым свидетельствам. [1] Они обобщили это наблюдение, чтобы утверждать, что скорость эволюционных изменений любого указанного белка была примерно постоянной с течением времени и в различных линиях (известная как гипотеза молекулярных часов ).
Феномен генетической эквидистантности был впервые отмечен в 1963 году Эмануэлем Марголиашем , который писал: «Похоже, что количество различий остатков между цитохромом c любых двух видов в основном обусловлено временем, прошедшим с момента первоначального разветвления линий эволюции, ведущих к этим двум видам. Если это верно, цитохром c всех млекопитающих должен одинаково отличаться от цитохрома c всех птиц. Поскольку рыбы расходятся с основным стеблем эволюции позвоночных раньше, чем птицы или млекопитающие, цитохром c как млекопитающих, так и птиц должен одинаково отличаться от цитохрома c рыб. Аналогично, цитохром c всех позвоночных должен одинаково отличаться от дрожжевого белка». [2] Например, разница между цитохромом c карпа и лягушки, черепахи, курицы, кролика и лошади является очень постоянной величиной от 13% до 14%. Аналогично, разница между цитохромом c бактерии и дрожжей, пшеницы, моли, тунца, голубя и лошади колеблется от 64% до 69%. Вместе с работами Эмиля Цукеркандля и Лайнуса Полинга, результат генетической равноудаленности непосредственно привел к формальному постулированию гипотезы молекулярных часов в начале 1960-х годов. [3]
Аналогичным образом, Винсент Сарич и Аллан Уилсон в 1967 году продемонстрировали, что молекулярные различия между современными приматами в белках альбумина показали, что приблизительно постоянные скорости изменений происходили во всех линиях, которые они оценивали. [4] Основная логика их анализа включала признание того, что если одна линия вида развивалась быстрее, чем линия сестринского вида с момента их общего предка, то молекулярные различия между видом внешней группы (более отдаленно связанным) и быстро эволюционирующим видом должны быть больше (поскольку в этой линии накопилось бы больше молекулярных изменений), чем молекулярные различия между видом внешней группы и медленно эволюционирующим видом. Этот метод известен как тест относительной скорости . В статье Сарича и Уилсона сообщалось, например, что иммунологические перекрестные реакции альбумина человека ( Homo sapiens ) и шимпанзе ( Pan troglodytes ) предполагали, что они примерно в равной степени отличаются от видов Ceboidea (обезьяны Нового Света) (в пределах экспериментальной ошибки). Это означало, что они оба накопили примерно равные изменения в альбумине с момента их общего предка. Эта закономерность была также обнаружена для всех сравнений приматов, которых они протестировали. При калибровке с несколькими хорошо документированными точками ветвления ископаемых (например, отсутствием ископаемых приматов современного вида, найденных до границы KT ), это привело Сарича и Уилсона к утверждению, что расхождение человека и шимпанзе, вероятно, произошло всего лишь ~4–6 миллионов лет назад. [5]
Наблюдение за часовой скоростью молекулярных изменений изначально было чисто феноменологическим . Позднее работа Мотоо Кимуры [6] разработала нейтральную теорию молекулярной эволюции , которая предсказала молекулярные часы. Пусть будет N особей, и для простоты расчета пусть особи будут гаплоидными (т. е. имеют одну копию каждого гена). Пусть скорость нейтральных мутаций (т. е. мутаций, не влияющих на приспособленность ) у новой особи будет . Вероятность того, что эта новая мутация зафиксируется в популяции, тогда равна 1/N, поскольку каждая копия гена так же хороша, как и любая другая. Каждое поколение, каждая особь может иметь новые мутации, поэтому в популяции в целом есть N новых нейтральных мутаций. Это означает, что каждое поколение новые нейтральные мутации будут закрепляться. Если большинство изменений, наблюдаемых в ходе молекулярной эволюции , нейтральны, то фиксации в популяции будут накапливаться с часовой скоростью, равной скорости нейтральных мутаций у особи.
Чтобы использовать молекулярные часы для оценки времени расхождения, молекулярные часы должны быть «откалиброваны». Это связано с тем, что молекулярные данные сами по себе не содержат никакой информации об абсолютном времени. Для вирусной филогенетики и исследований древней ДНК — двух областей эволюционной биологии, где можно отбирать последовательности в эволюционной шкале времени — даты промежуточных образцов могут быть использованы для калибровки молекулярных часов. Однако большинство филогений требуют, чтобы молекулярные часы были откалиброваны с использованием независимых свидетельств о датах, таких как ископаемая летопись. [7] Существует два общих метода калибровки молекулярных часов с использованием ископаемых: калибровка узлов и калибровка кончиков. [8]
Иногда называемая датировкой узлов, калибровка узлов представляет собой метод масштабирования филогенетических деревьев по времени путем указания временных ограничений для одного или нескольких узлов в дереве. Ранние методы калибровки часов использовали только одно ограничение ископаемого (например, непараметрическое сглаживание скорости), [9], но более новые методы (BEAST [10] и r8s [11] ) позволяют использовать несколько ископаемых для калибровки молекулярных часов. Самая старая окаменелость клады используется для ограничения минимально возможного возраста узла, представляющего самого последнего общего предка клады. Однако из-за неполной сохранности ископаемых и других факторов клады обычно старше своих самых старых ископаемых. [8] Чтобы учесть это, узлы могут быть старше минимального ограничения в анализах калибровки узлов. Однако определение того, насколько старше может быть узел, является сложной задачей. Существует ряд стратегий для получения максимальной границы возраста клады, включая те, которые основаны на моделях рождения-смерти, анализах стратиграфического распределения ископаемых или тафономическом контроле. [12] В качестве альтернативы, вместо максимума и минимума, можно использовать плотность вероятности для представления неопределенности относительно возраста клады. Эти плотности калибровки могут принимать форму стандартных плотностей вероятности (например, нормальных , логнормальных , экспоненциальных , гамма ), которые можно использовать для выражения неопределенности, связанной с оценками времени расхождения. [10] Определение формы и параметров распределения вероятности не является тривиальным, но существуют методы, которые используют не только самую старую окаменелость, но и большую выборку ископаемых летописей клад для эмпирической оценки плотностей калибровки. [13] Исследования показали, что увеличение количества ограничений ископаемых увеличивает точность оценки времени расхождения. [14]
Иногда называемая датированием кончика , калибровка кончика — это метод калибровки молекулярных часов, в котором окаменелости рассматриваются как таксоны и размещаются на кончиках дерева. Это достигается путем создания матрицы, которая включает молекулярный набор данных для существующих таксонов вместе с морфологическим набором данных как для вымерших, так и для существующих таксонов. [12] В отличие от калибровки узлов, этот метод реконструирует топологию дерева и размещает окаменелости одновременно. Молекулярные и морфологические модели работают вместе одновременно, позволяя морфологии информировать о размещении окаменелостей. [8] Калибровка кончика использует все соответствующие таксоны ископаемых во время калибровки часов, а не полагается только на самую старую окаменелость каждой клады. Этот метод не полагается на интерпретацию отрицательных свидетельств для вывода максимального возраста клады. [12]
Демографические изменения в популяциях могут быть обнаружены как колебания в исторической эффективной численности популяции коалесценции из выборки существующих генетических вариаций в популяции с использованием теории коалесценции. [15] [16] [17] Древние расширения популяции, которые хорошо документированы и датированы в геологической летописи, могут быть использованы для калибровки скорости молекулярной эволюции способом, аналогичным калибровке узла. Однако вместо калибровки по известному возрасту узла, калибровка расширения использует двухэпохальную модель постоянного размера популяции, за которым следует рост популяции, при этом время перехода между эпохами является интересующим параметром для калибровки. [18] [19] Калибровка расширения работает в более коротких, внутривидовых временных масштабах по сравнению с калибровкой узла, поскольку расширения могут быть обнаружены только после самого последнего общего предка рассматриваемого вида. Экспансивное датирование использовалось для того, чтобы показать, что скорость молекулярных часов может быть увеличена в короткие сроки [18] (< 1 млн лет) из-за неполной фиксации аллелей, как обсуждается ниже [20] [21]
Этот подход к калибровке кончиков идет на шаг дальше, одновременно оценивая размещение окаменелостей, топологию и эволюционную временную шкалу. В этом методе возраст окаменелости может информировать о ее филогенетическом положении в дополнение к морфологии. Позволяя всем аспектам реконструкции дерева происходить одновременно, риск предвзятых результатов снижается. [8] Этот подход был улучшен путем его сопряжения с различными моделями. Одним из текущих методов калибровки молекулярных часов является датирование по всем свидетельствам в паре с моделью окаменелого рождения-смерти (FBD) и моделью морфологической эволюции. [22] Модель FBD является новой в том, что она допускает «выбранных предков», которые являются ископаемыми таксонами, которые являются прямыми предками живущего таксона или линии . Это позволяет размещать окаменелости на ветке над существующим организмом, а не ограничиваться кончиками. [23]
Байесовские методы могут обеспечить более точные оценки времени расхождения, особенно если используются большие наборы данных, например, полученные с помощью филогеномики . [24]
Иногда только одну дату расхождения можно оценить по окаменелостям, а все остальные даты выводятся из нее. Другие наборы видов имеют обильные ископаемые остатки, что позволяет проверить гипотезу о постоянных скоростях расхождения. Последовательности ДНК, испытывающие низкие уровни отрицательного отбора, показали скорости расхождения 0,7–0,8% за млн лет у бактерий, млекопитающих, беспозвоночных и растений. [25] В том же исследовании геномные регионы, испытывающие очень высокий отрицательный или очищающий отбор (кодирующие рРНК), были значительно медленнее (1% за 50 млн лет).
В дополнение к такому изменению скорости в зависимости от положения в геноме, с начала 1990-х годов изменение среди таксонов также оказалось плодородной почвой для исследований, [26] даже в течение сравнительно коротких периодов эволюционного времени (например, пересмешники [27] ). У трубконосых морских птиц молекулярные часы в среднем идут в два раза медленнее, чем у многих других птиц, [28] возможно, из-за длительного времени генерации , а у многих черепах молекулярные часы идут в восемь раз медленнее, чем у мелких млекопитающих, или даже медленнее. [29] Эффекты небольшого размера популяции также, вероятно, затрудняют анализ молекулярных часов. Такие исследователи, как Франциско Дж. Айала, более фундаментально оспорили гипотезу молекулярных часов. [30] [31] [32] Согласно исследованию Айалы 1999 года, пять факторов в совокупности ограничивают применение моделей молекулярных часов:
Пользователи молекулярных часов разработали обходные решения, используя ряд статистических подходов, включая методы максимального правдоподобия и позднее байесовское моделирование . В частности, были предложены модели, которые учитывают вариацию скорости между линиями, чтобы получить более точные оценки времени расхождения. Эти модели называются расслабленными молекулярными часами [33], поскольку они представляют собой промежуточное положение между гипотезой «строгих» молекулярных часов и моделью многих скоростей Джозефа Фельзенштейна [34] и стали возможными благодаря методам MCMC , которые исследуют взвешенный диапазон топологий дерева и одновременно оценивают параметры выбранной модели замещения. Следует помнить, что даты расхождения, выведенные с помощью молекулярных часов, основаны на статистических выводах , а не на прямых доказательствах .
Молекулярные часы сталкиваются с особыми трудностями в очень коротких и очень длинных временных масштабах. В длинных временных масштабах проблема заключается в насыщении . Когда прошло достаточно времени, многие сайты претерпели более одного изменения, но невозможно обнаружить более одного. Это означает, что наблюдаемое количество изменений больше не линейно со временем, а вместо этого выравнивается. Даже на промежуточных генетических расстояниях, когда филогенетических данных все еще достаточно для оценки топологии, сигнал для общего масштаба дерева может быть слабым в сложных моделях правдоподобия, что приводит к крайне неопределенным оценкам молекулярных часов. [35]
В очень коротких временных масштабах многие различия между образцами не представляют собой фиксацию различных последовательностей в разных популяциях. Вместо этого они представляют собой альтернативные аллели , которые оба присутствовали как часть полиморфизма в общем предке. Включение различий, которые еще не стали фиксированными, приводит к потенциально драматической инфляции кажущейся скорости молекулярных часов в очень коротких временных масштабах. [21] [36]
Метод молекулярных часов является важным инструментом в молекулярной систематике , макроэволюции и филогенетических сравнительных методах . Оценка дат филогенетических событий, включая те, которые не задокументированы ископаемыми , такими как расхождения между ныне живущими таксонами , позволила изучать макроэволюционные процессы в организмах, которые имели ограниченные ископаемые записи. Филогенетические сравнительные методы в значительной степени опираются на калиброванные филогении.