Молекулярные часы — это образный термин, обозначающий метод, который использует скорость мутаций биомолекул для определения времени в предыстории , когда две или более формы жизни разошлись . Биомолекулярные данные, используемые для таких расчетов, обычно представляют собой нуклеотидные последовательности ДНК , РНК или аминокислотные последовательности белков . Ориентирами для определения скорости мутаций часто являются ископаемые или археологические даты. Молекулярные часы были впервые протестированы в 1962 году на вариантах белка гемоглобина различных животных и обычно используются в молекулярной эволюции для оценки времени видообразования или излучения . Их иногда называют генными часами или эволюционными часами .
Идея существования так называемых «молекулярных часов» была впервые приписана Эмилю Цукеркандлу и Лайнусу Полингу , которые в 1962 году заметили, что количество аминокислотных различий в гемоглобине между разными линиями меняется со временем примерно линейно , как оценивается по формуле ископаемые свидетельства. [1] Они обобщили это наблюдение, утверждая, что скорость эволюционных изменений любого конкретного белка была примерно постоянной во времени и в разных линиях (известная как гипотеза молекулярных часов ).
Феномен генетического равноудаления был впервые отмечен в 1963 году Эмануэлем Марголиашем , который писал: «Похоже, что количество различий в остатках между цитохромом с любых двух видов в основном обусловлено временем, прошедшим с тех пор, как линии эволюции, ведущие к этим двум видам, первоначально Если это верно, то цитохром с всех млекопитающих должен одинаково отличаться от цитохрома с всех птиц. Поскольку рыбы отделяются от основного ствола эволюции позвоночных раньше, чем птицы или млекопитающие, цитохром с как млекопитающих, так и птиц должен в равной степени отличаться от цитохрома с рыб. Точно так же цитохром с всех позвоночных должен одинаково отличаться от дрожжевого белка». [2] Например, разница между цитохромом с карпа и лягушки, черепахи, курицы, кролика и лошади очень постоянна и составляет от 13% до 14%. Аналогично разница между цитохромом с бактерии и дрожжей, пшеницы, моли, тунца, голубя и лошади колеблется от 64% до 69%. Вместе с работами Эмиля Цукеркандла и Лайнуса Полинга результат генетического равноудаления привел непосредственно к формальному постулированию гипотезы молекулярных часов в начале 1960-х годов. [3]
Точно так же Винсент Сарич и Аллан Уилсон в 1967 году продемонстрировали, что молекулярные различия между современными приматами в белках альбумина показывают, что во всех изученных ими линиях происходили примерно постоянные темпы изменений. [4] Основная логика их анализа заключалась в признании того, что если линия одного вида развивалась быстрее, чем линия сестринского вида с момента их общего предка, то молекулярные различия между видами из внешней группы (более отдаленно родственными) и более быстро развивающимися видами должны быть больше (поскольку в этой линии накопилось бы больше молекулярных изменений), чем молекулярные различия между видами внешней группы и более медленно развивающимися видами. Этот метод известен как тест относительной скорости . В статье Сарича и Уилсона сообщается, например, что иммунологические перекрестные реакции альбумина человека ( Homo sapiens ) и шимпанзе ( Pan troglodytes ) позволяют предположить, что они примерно одинаково отличаются от видов Ceboidea (обезьяны Нового Света) (в пределах экспериментальной ошибки). Это означало, что они оба накопили примерно одинаковые изменения альбумина со времени их общего предка. Эта закономерность была также обнаружена для всех сравнений приматов, которые они тестировали. При калибровке по нескольким хорошо задокументированным точкам ветвления окаменелостей (например, до границы КТ не было обнаружено окаменелостей приматов современного вида ) это привело Сарича и Уилсона к утверждению, что расхождение человека и шимпанзе, вероятно, произошло всего ~ 4–6 миллионов лет назад. . [5]
Наблюдение за часовой скоростью молекулярных изменений изначально было чисто феноменологическим . Позже работа Мотоо Кимуры [6] разработала нейтральную теорию молекулярной эволюции , предсказавшую существование молекулярных часов. Пусть существует N особей, и для простоты расчета предположим, что особи гаплоидны (т. е. имеют по одной копии каждого гена). Пусть частота нейтральных мутаций (т.е. мутаций, не влияющих на приспособленность ) у нового индивидуума равна . Вероятность того, что эта новая мутация закрепится в популяции, равна 1/N, поскольку каждая копия гена так же хороша, как и любая другая. В каждом поколении, у каждого индивидуума могут возникать новые мутации, поэтому в популяции в целом имеется N новых нейтральных мутаций. Это означает, что в каждом поколении будут закрепляться новые нейтральные мутации. Если большинство изменений, наблюдаемых в ходе молекулярной эволюции, нейтральны, то фиксации в популяции будут накапливаться со скоростью, равной скорости нейтральных мутаций у индивидуума.
Чтобы использовать молекулярные часы для оценки времени расхождения, молекулярные часы необходимо «откалибровать». Это связано с тем, что сами по себе молекулярные данные не содержат никакой информации об абсолютном времени. Для вирусной филогенетики и исследований древней ДНК — двух областей эволюционной биологии, где можно отбирать последовательности в эволюционном временном масштабе — даты промежуточных образцов можно использовать для калибровки молекулярных часов. Однако большинство филогений требуют, чтобы молекулярные часы были откалиброваны с использованием независимых данных о датах, таких как летопись окаменелостей . [7] Существует два основных метода калибровки молекулярных часов с использованием окаменелостей: калибровка узла и калибровка кончика. [8]
Калибровка узлов, которую иногда называют датировкой узлов, представляет собой метод масштабирования времени филогенетических деревьев путем указания временных ограничений для одного или нескольких узлов в дереве. Ранние методы калибровки часов использовали только одно ограничение окаменелостей (например, непараметрическое сглаживание скорости) [9] , но более новые методы (BEAST [10] и r8s [11] ) позволяют использовать несколько окаменелостей для калибровки молекулярных часов. Самая старая окаменелость клады используется для ограничения минимально возможного возраста узла, представляющего самого недавнего общего предка клады. Однако из-за неполной сохранности окаменелостей и других факторов клады обычно старше своих самых старых окаменелостей. [8] Чтобы учесть это, узлы могут быть старше минимального ограничения в анализе калибровки узлов. Однако определение того, насколько старше может быть узел, является сложной задачей. Существует ряд стратегий для определения максимальной границы возраста клады, в том числе основанные на моделях рождения-смерти, анализе стратиграфического распределения окаменелостей или тафономическом контроле. [12] Альтернативно, вместо максимума и минимума, плотность вероятности может использоваться для представления неопределенности относительно возраста клады. Эти калибровочные плотности могут принимать форму стандартных плотностей вероятности (например , нормальная , логнормальная , экспоненциальная , гамма ), которые можно использовать для выражения неопределенности, связанной с оценками времени расхождения. [10] Определение формы и параметров распределения вероятностей не является тривиальной задачей, но существуют методы, которые используют не только самую старую окаменелость, но и более крупную выборку летописи окаменелостей клад для эмпирической оценки калибровочной плотности. [13] Исследования показали, что увеличение количества ископаемых ограничений увеличивает точность оценки времени дивергенции. [14]
Калибровка кончиков, которую иногда называют датированием верхушек , представляет собой метод калибровки молекулярных часов, при котором окаменелости рассматриваются как таксоны и помещаются на верхушки дерева. Это достигается за счет создания матрицы, которая включает набор молекулярных данных для существующих таксонов , а также набор морфологических данных как для вымерших, так и для существующих таксонов. [12] В отличие от калибровки узлов, этот метод восстанавливает топологию дерева и одновременно размещает окаменелости. Молекулярные и морфологические модели работают одновременно, позволяя морфологии определять размещение окаменелостей. [8] Калибровка наконечника использует все соответствующие ископаемые таксоны во время калибровки часов, а не полагается только на самые старые ископаемые каждой клады. Этот метод не полагается на интерпретацию отрицательных данных для вывода о максимальном возрасте клад. [12]
Демографические изменения в популяциях можно обнаружить как колебания исторического эффективного размера слитной популяции на основе выборки существующих генетических вариаций в популяции с использованием теории слияния. [15] [16] [17] Расширение древней популяции, которое хорошо задокументировано и датировано геологическими записями, может быть использовано для калибровки скорости молекулярной эволюции аналогично калибровке узлов. Однако вместо калибровки по известному возрасту узла калибровка расширения использует двухэпохальную модель постоянного размера популяции с последующим ростом популяции, при этом время перехода между эпохами является параметром, представляющим интерес для калибровки. [18] [19] Калибровка расширения работает в более короткие внутривидовые сроки по сравнению с калибровкой узла, поскольку расширение может быть обнаружено только после самого последнего общего предка рассматриваемого вида. Датирование экспансии использовалось, чтобы показать, что частота молекулярных часов может увеличиваться в короткие сроки [18] (< 1 млн лет) из-за неполной фиксации аллелей, как обсуждается ниже [20] [21]
Этот подход к калибровке наконечников идет на шаг дальше, одновременно оценивая расположение окаменелостей, топологию и временные рамки эволюции. В этом методе возраст окаменелости может определять ее филогенетическое положение в дополнение к морфологии. Позволяя всем аспектам реконструкции дерева происходить одновременно, риск получения необъективных результатов снижается. [8] Этот подход был улучшен путем объединения его с различными моделями. Одним из современных методов калибровки молекулярных часов является датирование полных доказательств в сочетании с моделью окаменелого рождения-смерти (FBD) и моделью морфологической эволюции. [22] Модель FBD является новой, поскольку она позволяет использовать «выборочные предки», то есть ископаемые таксоны, являющиеся прямыми предками живого таксона или линии . Это позволяет размещать окаменелости на ветке над существующим организмом, а не ограничиваться кончиками. [23]
Байесовские методы могут обеспечить более адекватную оценку времени расхождения, особенно если используются большие наборы данных, например, полученные с помощью филогеномики . [24]
Иногда по окаменелостям можно оценить только одну дату расхождения, а все остальные даты можно вывести на основе нее. У других групп видов имеется большое количество окаменелостей, что позволяет проверить гипотезу о постоянной скорости дивергенции. Последовательности ДНК, подвергающиеся низкому уровню негативного отбора , показали скорость расхождения 0,7–0,8% на млн лет у бактерий, млекопитающих, беспозвоночных и растений. [25] В том же исследовании геномные области, подвергающиеся очень высокой негативной или очищающей селекции (кодирующей рРНК), работали значительно медленнее (1% за 50 млн лет).
В дополнение к такой изменчивости в зависимости от геномного положения, с начала 1990-х годов вариация среди таксонов также оказалась благодатной почвой для исследований [26] даже в течение сравнительно коротких периодов эволюционного времени (например, пересмешники [27] ). У трубконосых морских птиц молекулярные часы в среднем идут со скоростью в два раза медленнее, чем у многих других птиц [28] , возможно, из-за длительного периода генерации , а у многих черепах молекулярные часы работают со скоростью в восемь раз медленнее, чем у мелких млекопитающих, или еще медленнее. [29] Эффекты небольшого размера популяции также могут мешать анализу молекулярных часов. Такие исследователи, как Франсиско Дж. Айала, бросили более фундаментальный вызов гипотезе молекулярных часов. [30] [31] [32] Согласно исследованию Аялы 1999 года, пять факторов в совокупности ограничивают применение моделей молекулярных часов:
Пользователи молекулярных часов разработали обходные решения, используя ряд статистических подходов, включая методы максимального правдоподобия и позднее байесовское моделирование . В частности, были предложены модели, которые учитывают вариации скорости между линиями, чтобы получить более точную оценку времени дивергенции. Эти модели называются расслабленными молекулярными часами [33] , поскольку они представляют собой промежуточное положение между гипотезой «строгих» молекулярных часов и многочастотной моделью Джозефа Фельзенштейна [34] и становятся возможными благодаря методам MCMC , которые исследуют взвешенный диапазон деревьев. топологии и одновременно оценить параметры выбранной модели замещения. Следует помнить, что даты расхождения, установленные с помощью молекулярных часов, основаны на статистических выводах , а не на прямых доказательствах .
Молекулярные часы сталкиваются с особыми проблемами как в очень коротких, так и в очень длительных временных масштабах. В длительных временных масштабах проблема заключается в насыщении . По прошествии достаточного времени многие сайты претерпели не одно изменение, но обнаружить более одного невозможно. Это означает, что наблюдаемое количество изменений больше не линейно зависит от времени, а выравнивается. Даже на промежуточных генетических расстояниях, когда филогенетических данных все еще достаточно для оценки топологии, сигнал для общего масштаба дерева может быть слабым в рамках сложных моделей правдоподобия, что приводит к весьма неопределенным оценкам молекулярных часов. [35]
В очень коротких временных масштабах многие различия между образцами не представляют собой фиксацию разных последовательностей в разных популяциях. Вместо этого они представляют собой альтернативные аллели , которые оба присутствовали как часть полиморфизма у общего предка. Включение различий, которые еще не зафиксированы, приводит к потенциально драматическому увеличению кажущейся скорости молекулярных часов в очень коротких временных масштабах. [21] [36]
Метод молекулярных часов является важным инструментом в молекулярной систематике , макроэволюции и сравнительных филогенетических методах . Оценка дат филогенетических событий, в том числе тех, которые не задокументированы окаменелостями , таких как расхождения между живыми таксонами , позволила изучить макроэволюционные процессы в организмах, которые имели ограниченную летопись окаменелостей. Филогенетические сравнительные методы в значительной степени полагаются на калиброванные филогении.