stringtranslate.com

Теория коалесценции

Теория коалесценции — это модель того, как аллели, отобранные из популяции , могли произойти от общего предка . В простейшем случае теория коалесценции не предполагает рекомбинации , естественного отбора , потока генов или структуры популяции , что означает, что каждый вариант с равной вероятностью мог быть передан от одного поколения к другому. Модель смотрит назад во времени, объединяя аллели в одну предковую копию в соответствии со случайным процессом в событиях коалесценции. Согласно этой модели, ожидаемое время между последовательными событиями коалесценции увеличивается почти экспоненциально назад во времени (с большой дисперсией ). Дисперсия в модели возникает как из-за случайной передачи аллелей от одного поколения к другому, так и из-за случайного возникновения мутаций в этих аллелях.

Математическая теория коалесценции была разработана независимо несколькими группами в начале 1980-х годов как естественное расширение классической теории и моделей популяционной генетики , [1] [2] [3] [4], но ее можно в первую очередь отнести к Джону Кингману . [5] Достижения в теории коалесценции включают рекомбинацию, отбор, перекрывающиеся поколения и практически любую произвольно сложную эволюционную или демографическую модель в популяционном генетическом анализе.

Модель может быть использована для создания множества теоретических генеалогий, а затем для сравнения наблюдаемых данных с этими симуляциями для проверки предположений о демографической истории популяции. Коалесцентная теория может быть использована для выводов о генетических параметрах популяции, таких как миграция, размер популяции и рекомбинация.

Теория

Время для слияния

Рассмотрим один локус гена, взятый из двух гаплоидных особей в популяции. Родословная этого образца прослеживается назад во времени до точки, где эти две линии объединяются в их самом последнем общем предке (MRCA). Теория объединения стремится оценить ожидание этого периода времени и его дисперсию.

Вероятность того, что две линии объединятся в непосредственно предшествующем поколении, является вероятностью того, что они разделяют родительскую последовательность ДНК . В популяции с постоянным эффективным размером популяции с 2 N e копиями каждого локуса, в предыдущем поколении имеется 2 N e «потенциальных родителей». В модели случайного спаривания вероятность того, что два аллеля происходят из одной и той же родительской копии, составляет 1/(2 N e ), и, соответственно, вероятность того, что они не объединятся, составляет 1 − 1/(2 N e ).

В каждом последующем предыдущем поколении вероятность слияния распределена геометрически , то есть это вероятность отсутствия слияния в t  − 1 предшествующих поколениях, умноженная на вероятность слияния в интересующем нас поколении:

При достаточно больших значениях N e это распределение хорошо аппроксимируется непрерывно определенным экспоненциальным распределением

Это удобно с математической точки зрения, поскольку стандартное экспоненциальное распределение имеет как ожидаемое значение , так и стандартное отклонение, равные 2 N e . Поэтому, хотя ожидаемое время до слияния равно 2 N e , фактическое время слияния имеет широкий диапазон вариаций. Обратите внимание, что время слияния — это число предшествующих поколений, в которых произошло слияние, а не календарное время, хотя оценку последнего можно сделать, умножив 2 N e на среднее время между поколениями. Приведенные выше расчеты в равной степени применимы к диплоидной популяции эффективного размера N e (другими словами, для нерекомбинирующего сегмента ДНК каждая хромосома может рассматриваться как эквивалент независимой гаплоидной особи; при отсутствии инбридинга сестринские хромосомы у одной особи не более тесно связаны, чем две хромосомы, случайно выбранные из популяции). Однако некоторые эффективно гаплоидные элементы ДНК, такие как митохондриальная ДНК , передаются только одним полом и, следовательно, имеют одну четверть эффективного размера эквивалентной диплоидной популяции ( N e /2)

Математический объект, который формально получается, если N e стремится к бесконечности, известен как слияние Кингмана. [1]

Нейтральная вариация

Теория коалесценции также может быть использована для моделирования количества вариаций в последовательностях ДНК, ожидаемых от генетического дрейфа и мутации. Это значение называется средней гетерозиготностью , представленной как . Средняя гетерозиготность рассчитывается как вероятность возникновения мутации в данном поколении, деленная на вероятность любого «события» в этом поколении (мутации или коалесценции). Вероятность того, что событие является мутацией, — это вероятность мутации в любой из двух линий: . Таким образом, средняя гетерозиготность равна

Для подавляющего большинства пар аллелей существует по крайней мере одно различие в последовательности нуклеотидов .

Расширения

Существуют многочисленные расширения модели коалесценции, такие как Λ-коалесценция, которая допускает возможность мультифуркаций. [6]

Графическое представление

Коалесценты можно визуализировать с помощью дендрограмм , которые показывают взаимосвязь ветвей популяции друг с другом. Точка, где встречаются две ветви, указывает на событие коалесценции.

Приложения

Картирование генов болезней

Полезность теории коалесценции в картировании заболеваний постепенно получает все большее признание; хотя применение теории все еще находится в зачаточном состоянии, есть ряд исследователей, которые активно разрабатывают алгоритмы для анализа генетических данных человека, использующие теорию коалесценции. [7] [8] [9]

Значительное количество человеческих заболеваний можно отнести к генетике, от простых менделевских болезней, таких как серповидноклеточная анемия и кистозный фиброз , до более сложных недугов, таких как рак и психические заболевания. Последние являются полигенными заболеваниями, контролируемыми несколькими генами, которые могут возникать на разных хромосомах, но заболевания, которые вызваны одной аномалией, относительно просто определить и отследить – хотя не так просто, чтобы это было достигнуто для всех болезней. Для понимания этих заболеваний и их процессов чрезвычайно полезно знать, где они расположены на хромосомах , и как они наследуются через поколения семьи, что можно сделать с помощью коалесцентного анализа. [2]

Генетические заболевания передаются из поколения в поколение, как и другие гены. Хотя любой ген может быть перемещен из одной хромосомы в другую во время гомологичной рекомбинации , маловероятно, что будет перемещен только один ген. Таким образом, другие гены, которые находятся достаточно близко к гену заболевания, чтобы быть связанными с ним, могут быть использованы для его отслеживания. [2]

Полигенные заболевания имеют генетическую основу, хотя они и не следуют менделевским моделям наследования, и они могут иметь относительно высокую распространенность в популяциях и иметь серьезные последствия для здоровья. Такие заболевания могут иметь неполную пенетрантность и, как правило, являются полигенными , что затрудняет их изучение. Эти признаки могут возникать из-за множества небольших мутаций, которые вместе оказывают серьезное и пагубное воздействие на здоровье человека. [3]

Методы картирования сцепления, включая теорию коалесцента, могут быть использованы для работы с этими заболеваниями, поскольку они используют семейные родословные, чтобы выяснить, какие маркеры сопровождают заболевание и как оно наследуется. По крайней мере, этот метод помогает сузить часть или части генома, в которых могут возникнуть вредные мутации. Осложнения в этих подходах включают эпистатические эффекты, полигенную природу мутаций и факторы окружающей среды. При этом гены, эффекты которых являются аддитивными, несут фиксированный риск развития заболевания, и когда они существуют в генотипе заболевания, их можно использовать для прогнозирования риска и картирования гена. [3] Как регулярные коалесценты, так и разрушенные коалесценты (которые допускают, что множественные мутации могли произойти в основополагающем событии, и что заболевание может иногда быть вызвано факторами окружающей среды) были использованы для понимания генов заболеваний. [2]

Были проведены исследования, связывающие возникновение заболеваний у разнояйцевых и однояйцевых близнецов, и результаты этих исследований могут быть использованы для информирования о коалесцентном моделировании. Поскольку однояйцевые близнецы разделяют весь свой геном, а разнояйцевые близнецы разделяют только половину своего генома, разницу в корреляции между однояйцевыми и разнояйцевыми близнецами можно использовать для определения того, является ли заболевание наследственным, и если да, то насколько сильно. [3]

Геномное распределение гетерозиготности

Карта полиморфизма одного нуклеотида (SNP) человека выявила большие региональные вариации гетерозиготности, более существенные, чем можно объяснить на основе ( распределенной Пуассоном ) случайной случайности. [10] Частично эти вариации можно объяснить на основе методов оценки, доступности геномных последовательностей и, возможно, стандартной модели генетической коалесцентной популяции. Влияние генетики популяции может иметь большое влияние на эту вариацию: некоторые локусы предположительно будут иметь сравнительно недавних общих предков, другие могут иметь гораздо более древние генеалогии, и поэтому региональное накопление SNP с течением времени может быть совершенно иным. Локальная плотность SNP вдоль хромосом, по-видимому, кластеризуется в соответствии с дисперсией к среднему степенному закону и подчиняется составному распределению Пуассона Твиди . [11] В этой модели региональные вариации на карте SNP объясняются накоплением множества небольших геномных сегментов посредством рекомбинации, где среднее количество SNP на сегмент будет гамма-распределено пропорционально гамма-распределенному времени до самого последнего общего предка для каждого сегмента. [12]

История

Коалесцентная теория является естественным расширением более классической концепции нейтральной эволюции популяционной генетики и является приближением к модели Фишера–Райта (или Райта–Фишера) для больших популяций. Она была открыта независимо несколькими исследователями в 1980-х годах. [13] [14] [15] [16]

Программное обеспечение

Существует большой массив программного обеспечения как для моделирования наборов данных в процессе объединения, так и для выведения таких параметров, как размер популяции и скорость миграции, из генетических данных.

Ссылки

  1. ^ Этеридж, Элисон (7 января 2011 г.). Некоторые математические модели из популяционной генетики: École D'Été de Probabilités de Saint-Flour, XXXIX-2009. Springer Science & Business Media. ISBN 978-3-642-16631-0.
  2. ^ abc Моррис, А., Уиттакер, Дж. и Болдинг, Д. (2002). Мелкомасштабное картирование локусов заболеваний с помощью моделирования генеалогий Shattered Coalescent. Американский журнал генетики человека, 70 (3), 686–707. doi :10.1086/339271
  3. ^ abc Rannala, B. (2001). Поиск генов, влияющих на восприимчивость к сложным заболеваниям в постгеномную эпоху. Американский журнал фармакогеномики , 1 (3), 203–221.

Источники

Статьи

Книги

Внешние ссылки