Генетическое расстояние является мерой генетической дивергенции между видами или между популяциями внутри вида, независимо от того, измеряет ли расстояние время от общего предка или степень дифференциации. [2] Популяции со многими похожими аллелями имеют небольшие генетические расстояния. Это указывает на то, что они тесно связаны и имеют недавнего общего предка.
Генетическая дистанция полезна для реконструкции истории популяций, например, множественных экспансий человека из Африки . [3] Она также используется для понимания происхождения биоразнообразия . Например, генетические дистанции между различными породами одомашненных животных часто исследуются для того, чтобы определить, какие породы следует защищать для поддержания генетического разнообразия. [4]
Жизнь на Земле началась с очень простых одноклеточных организмов, которые эволюционировали в самые сложные многоклеточные организмы в течение более трех миллиардов лет. [5] Создание всеобъемлющего древа жизни , которое представляет все организмы, когда-либо жившие на Земле, важно для понимания эволюции жизни перед лицом всех проблем, с которыми сталкиваются живые организмы, чтобы справиться с аналогичными проблемами в будущем. Эволюционные биологи пытались создать эволюционные или филогенетические деревья, охватывающие как можно больше организмов на основе доступных ресурсов. Датирование ископаемых и молекулярные часы являются двумя способами создания эволюционной истории живых организмов. Ископаемая летопись случайна, неполна и не обеспечивает непрерывной цепочки событий, как фильм с пропущенными кадрами, не может рассказать весь сюжет фильма. [5]
Молекулярные часы, с другой стороны, представляют собой определенные последовательности ДНК , РНК или белков (аминокислот), которые используются для определения на молекулярном уровне сходств и различий между видами, для выяснения временной шкалы расхождения [6] и для отслеживания общего предка видов на основе скорости мутаций и изменений последовательностей, накапливаемых в этих определенных последовательностях. [6] Основным двигателем эволюции являются мутации или изменения в генах, и учет этих изменений с течением времени определяет приблизительное генетическое расстояние между видами. Эти определенные молекулярные часы довольно консервативны среди ряда видов и имеют постоянную скорость мутации, как часы, и калибруются на основе эволюционных событий (ископаемые записи). Например, ген альфа-глобина (составляющая гемоглобина) мутирует со скоростью 0,56 на пару оснований за миллиард лет. [6] Молекулярные часы могут заполнить эти пробелы, созданные отсутствующими ископаемыми записями.
В геноме организма каждый ген расположен в определенном месте, называемом локусом для этого гена. Аллельные вариации в этих локусах вызывают фенотипические вариации внутри вида (например, цвет волос, цвет глаз). Однако большинство аллелей не оказывают заметного влияния на фенотип. В пределах популяции новые аллели, созданные мутацией, либо вымирают, либо распространяются по всей популяции. Когда популяция разделяется на различные изолированные популяции (по географическим или экологическим факторам), мутации, которые происходят после разделения, будут присутствовать только в изолированной популяции. Случайные колебания частот аллелей также вызывают генетическую дифференциацию между популяциями. Этот процесс известен как генетический дрейф . Изучая различия между частотами аллелей между популяциями и вычисляя генетическое расстояние, мы можем оценить, как давно две популяции были разделены. [7]
Предположим, что последовательность ДНК или гипотетический ген имеет частоту мутаций одно основание за 10 миллионов лет. Используя эту последовательность ДНК, можно определить расхождение двух разных видов или генетическое расстояние между двумя разными видами, подсчитав количество различий пар оснований между ними. Например, на рисунке 2 разница в 4 основания в гипотетической последовательности между этими двумя видами будет означать, что они разошлись 40 миллионов лет назад, а их общий предок жил по крайней мере 20 миллионов лет назад до их расхождения. На основе молекулярных часов приведенное ниже уравнение можно использовать для расчета времени с момента расхождения. [8]
Количество мутаций ÷ Мутация в год (скорость мутаций) = время с момента расхождения
Недавние достижения в технологии секвенирования и доступность всеобъемлющих геномных баз данных и биоинформатических инструментов , которые способны хранить и обрабатывать колоссальные объемы данных, полученных с помощью передовой технологии секвенирования, значительно улучшили эволюционные исследования и понимание эволюционных взаимоотношений между видами. [9] [10]
Различные биомолекулярные маркеры, такие как ДНК, РНК и аминокислотные последовательности (белки), могут быть использованы для определения генетического расстояния. [11] [12]
Критерии выбора [13] подходящего биомаркера для генетической дистанции включают следующие три шага:
Выбор изменчивости зависит от предполагаемого результата. Например, очень высокий уровень изменчивости рекомендуется для демографических исследований и анализа происхождения , средний или высокий уровень изменчивости — для сравнения отдельных популяций, а умеренный или очень низкий уровень изменчивости рекомендуется для филогенетических исследований. [13] Геномная локализация и плоидность маркера также являются важным фактором. Например, число копий гена обратно пропорционально устойчивости, при этом гаплоидный геном ( митохондриальная ДНК ) более склонен к генетическому дрейфу , чем диплоидный геном ( ядерная ДНК ).
Выбор и примеры молекулярных маркеров для исследований эволюционной биологии. [13]
Эволюционные силы, такие как мутация, генетический дрейф, естественный отбор и поток генов , управляют процессом эволюции и генетическим разнообразием. Все эти силы играют важную роль в генетическом расстоянии внутри и между видами. [19]
Существуют различные статистические меры, направленные на количественную оценку генетических отклонений между популяциями или видами. Используя предположения, полученные в результате экспериментального анализа эволюционных сил, можно выбрать модель, которая более точно подходит для данного эксперимента, для изучения генетической группы. Кроме того, сравнение того, насколько хорошо различные метрики моделируют определенные особенности популяции, такие как изоляция, может выявить метрики, которые больше подходят для понимания недавно изученных групп [20 ]. Наиболее часто используемыми метриками генетического расстояния являются генетическое расстояние Нея [7], мера Кавалли-Сфорца и Эдвардса [21] и генетическое расстояние Рейнольдса, Вейра и Кокерхэма [22] .
Одной из самых основных и прямых мер расстояния является расстояние Джукса-Кантора . Эта мера строится на основе предположения, что не произошло ни одной вставки или делеции, все замены независимы и что каждая смена нуклеотида равновероятна. С этими предположениями мы можем получить следующее уравнение: [23]
где — расстояние Джукса-Кантора между двумя последовательностями A и B, а — различие между двумя последовательностями.
В 1972 году Масатоши Ней опубликовал то, что стало известно как стандартное генетическое расстояние Нея. Это расстояние имеет приятное свойство: если скорость генетических изменений (замена аминокислот) постоянна в течение года или поколения, то стандартное генетическое расстояние Нея ( D ) увеличивается пропорционально времени расхождения. Эта мера предполагает, что генетические различия вызваны мутацией и генетическим дрейфом . [7]
Это расстояние также может быть выражено в терминах среднего арифметического идентичности гена. Пусть будет вероятностью того, что два члена популяции имеют один и тот же аллель в определенном локусе, а будет соответствующей вероятностью в популяции . Также пусть будет вероятностью того, что член и член имеют один и тот же аллель. Теперь пусть , и представляют собой среднее арифметическое , и по всем локусам соответственно. Другими словами,
где — общее количество исследованных локусов. [24]
Стандартное расстояние Нея можно записать как [7]
В 1967 году Луиджи Лука Кавалли-Сфорца и А. В. Ф. Эдвардс опубликовали эту меру. Она предполагает, что генетические различия возникают только из-за генетического дрейфа . Одним из главных преимуществ этой меры является то, что популяции представлены в гиперсфере, масштаб которой составляет одну единицу на замену гена. Расстояние хорды в гиперпространственной сфере определяется как [2] [21]
Некоторые авторы опускают этот коэффициент , чтобы упростить формулу, но при этом теряется свойство масштаба, составляющее одну единицу на замену гена.
В 1983 году эта мера была опубликована Джоном Рейнольдсом, Брюсом Вейром и К. Кларком Кокерхэмом . Эта мера предполагает, что генетическая дифференциация происходит только путем генетического дрейфа без мутаций. Она оценивает коэффициент коэнцестрии , который обеспечивает меру генетической дивергенции по: [22]
Двухпараметрическая модель Кимуры (K2P) была разработана в 1980 году японским биологом Мотоо Кимурой. Она совместима с нейтральной теорией эволюции, которая также была разработана тем же автором. Как показано на рисунке 4, эта мера генетического расстояния учитывает тип происходящей мутации, а именно, является ли она переходом (т. е. пурин в пурин или пиримидин в пиримидин) или трансверсией (т. е. пурин в пиримидин или наоборот). С помощью этой информации можно вывести следующую формулу:
где P — это и Q — это , причем — это число преобразований типа транзиции, — это число преобразований типа трансверсии, а — это число сравниваемых участков нуклеотидов. [25]
Стоит отметить, что когда замещения типа перехода и трансверсии имеют равные шансы на возникновение и предполагается, что они равны , то приведенную выше формулу можно свести к модели Джукса-Кантора. Однако на практике обычно больше . [25]
Было показано, что хотя K2P хорошо работает при классификации отдаленно родственных видов, он не всегда является лучшим выбором для сравнения близкородственных видов. В этих случаях может быть лучше использовать p-расстояние. [26]
Трехпараметрическая модель Кимуры (K3P) была впервые опубликована в 1981 году. Эта мера предполагает три скорости замещения при мутации нуклеотидов, что можно увидеть на рисунке 5. Существует одна скорость для мутаций переходного типа, одна скорость для мутаций трансверсионного типа в соответствующие основания (например, G в C; тип трансверсии 1 на рисунке) и одна скорость для мутаций трансверсионного типа в несоответствующие основания (например, G в T; тип трансверсии 2 на рисунке).
При таких темпах замещения можно вывести следующую формулу:
где — вероятность мутации типа перехода, — вероятность мутации типа трансверсии к соответствующей базе, — вероятность мутации типа трансверсии к несоответствующей базе. Когда и предполагаются равными, это сводится к расстоянию параметра Кимуры 2. [27]
Было предложено множество других мер генетической дистанции с разным успехом.
Расстояние Нея D A было создано Масатоши Неем, японо-американским биологом в 1983 году. Это расстояние предполагает, что генетические различия возникают из-за мутации и генетического дрейфа , но эта мера расстояния, как известно, дает более надежные деревья популяций, чем другие расстояния, особенно для данных микросателлитной ДНК. Этот метод не идеален в случаях, когда естественный отбор играет значительную роль в генетике популяций. [28] [29]
: Расстояние DA Нея, генетическое расстояние между популяциями X и Y
: Локус или ген, изучаемый как сумма локусов или генов
и : Частоты аллеля u в популяциях X и Y соответственно
L: Общее количество исследованных локусов
Евклидово расстояние — это формула, полученная из «Начал» Евклида, набора из 13 книг, в котором подробно излагаются основы всей евклидовой математики. Основополагающие принципы, изложенные в этих работах, используются не только в евклидовых пространствах, но и расширяются Исааком Ньютоном и Готфридом Лейбницем в отдельных работах по созданию исчисления. [31] Формула евклидового расстояния используется для максимально простой передачи генетического различия между популяциями, при этом большее расстояние указывает на большее различие. [32] Как видно на рисунке 6, этот метод можно визуализировать графически, это связано с работой Рене Декарта, который создал основной принцип аналитической геометрии, или декартову систему координат. В интересном примере исторических повторений Рене Декарт был не единственным, кто открыл основной принцип аналитической геометрии, этот принцип был открыт в изолированном исследовании Пьером де Ферма, который оставил свою работу неопубликованной. [33] [34]
: Евклидово генетическое расстояние между популяциями X и Y
и : Частоты аллелей в локусе u в популяциях X и Y соответственно
Он был специально разработан для микросателлитных маркеров и основан на модели пошаговой мутации (SMM). Формула расстояния Гольдштейна смоделирована таким образом, что ожидаемое значение будет линейно увеличиваться со временем, это свойство сохраняется даже при нарушении предположений об одношаговых мутациях и симметричной скорости мутаций. Расстояние Гольдштейна выводится из модели среднего квадратичного расстояния, в которую Гольдштейн также внес свой вклад. [35]
Этот расчет представляет собой минимальное количество различий кодонов для каждого локуса . [36] Измерение основано на предположении, что генетические различия возникают из-за мутации и генетического дрейфа . [37]
: Минимальное количество различий кодонов на локус
и : Средняя вероятность того, что два члена популяции X имеют один и тот же аллель
: Средняя вероятность того, что члены популяций X и Y имеют один и тот же аллель
Подобно евклидову расстоянию, расстояние Чекановского включает в себя расчет расстояния между точками частоты аллеля, которые нанесены на ось, созданную . Однако Чекановский предполагает, что прямой путь недоступен, и суммирует стороны треугольника, образованного точками данных, вместо того, чтобы находить гипотенузу. Эта формула получила прозвище Манхэттенское расстояние, поскольку ее методология похожа на природу нью-йоркской норы. Манхэттен в основном построен на сетке, требующей, чтобы ресентенция делала повороты только на 90 градусов во время путешествия, что соответствует мышлению формулы.
и : Частоты аллелей в локусе u в популяциях X и Y соответственно
и : значение оси X частоты аллеля для популяций X и Y
и : значение оси Y частоты аллеля для популяций X и Y
Подобно расстоянию Чекановского, расстояние Роджера предполагает расчет расстояния между точками частоты аллеля. Однако этот метод берет прямое расстояние между точками.
[38]
и : Частоты аллелей в локусе u в популяциях X и Y соответственно
: Общее количество исследованных микросателлитных локусов
Хотя эти формулы просты и быстры в расчетах, предоставленная информация дает ограниченную информацию. Результаты этих формул не учитывают потенциальные эффекты числа изменений кодонов между популяциями или времени разделения между популяциями. [39]
Обычно используемой мерой генетического расстояния является индекс фиксации (F ST ), который варьируется от 0 до 1. Значение 0 указывает на то, что две популяции генетически идентичны (минимальное или нулевое генетическое разнообразие между двумя популяциями), тогда как значение 1 указывает на то, что две популяции генетически различны (максимальное генетическое разнообразие между двумя популяциями). Предполагается отсутствие мутаций. Например, большие популяции, между которыми наблюдается значительная миграция, как правило, мало дифференцированы, тогда как маленькие популяции, между которыми наблюдается небольшая миграция, как правило, сильно дифференцированы. F ST является удобной мерой этой дифференциации, и в результате F ST и связанная с ним статистика являются одними из наиболее широко используемых описательных статистик в популяционной и эволюционной генетике. Но F ST — это больше, чем описательная статистика и мера генетической дифференциации. F ST напрямую связан с дисперсией частоты аллелей среди популяций и, наоборот, со степенью сходства между особями внутри популяций. Если F ST мал, это означает, что частоты аллелей внутри каждой популяции очень похожи; если он большой, это означает, что частоты аллелей сильно различаются.
{{cite web}}
: |last=
имеет общее название ( помощь ){{cite journal}}
: CS1 maint: multiple names: authors list (link){{cite journal}}
: CS1 maint: multiple names: authors list (link){{cite journal}}
: CS1 maint: multiple names: authors list (link)