stringtranslate.com

Коалесцентная теория

Теория слияния — это модель того, как аллели, отобранные из популяции, могли произойти от общего предка . В простейшем случае теория слияния предполагает отсутствие рекомбинации , естественного отбора , потока генов или структуры популяции , а это означает, что каждый вариант с равной вероятностью передавался от одного поколения к другому. Модель смотрит назад во времени, объединяя аллели в единую наследственную копию в соответствии со случайным процессом в событиях слияния. Согласно этой модели, ожидаемое время между последовательными событиями слияния увеличивается почти экспоненциально назад во времени (с большой дисперсией ). Различия в модели возникают как из-за случайной передачи аллелей от одного поколения к другому, так и из-за случайного возникновения мутаций в этих аллелях.

Математическая теория слияния была разработана независимо несколькими группами в начале 1980-х годов как естественное расширение классической теории и моделей популяционной генетики , [1] [2] [3] [4] , но ее авторство в первую очередь можно приписать Джону Кингману . [5] Достижения в теории слияния включают рекомбинацию, отбор, перекрытие поколений и практически любую сколь угодно сложную эволюционную или демографическую модель в популяционном генетическом анализе.

Модель можно использовать для создания множества теоретических генеалогий, а затем сравнивать наблюдаемые данные с этими симуляциями, чтобы проверить предположения о демографической истории населения. Теорию слияния можно использовать для того, чтобы делать выводы о генетических параметрах популяции, таких как миграция, размер популяции и рекомбинация.

Теория

Время слияния

Рассмотрим один локус гена, взятый у двух гаплоидных особей в популяции. Родословная этого образца прослеживается в обратном направлении во времени до момента, когда эти две линии сливаются в своего самого недавнего общего предка (MRCA). Теория слияния стремится оценить ожидание этого периода времени и его дисперсию.

Вероятность того, что две линии сливаются в непосредственно предшествующем поколении, — это вероятность того, что они имеют общую родительскую последовательность ДНК . В популяции с постоянным эффективным размером популяции с 2 N e копиями каждого локуса в предыдущем поколении имеется 2 N e «потенциальных родителей». Таким образом, в рамках модели случайного спаривания вероятность того, что две аллели происходят от одной родительской копии, равна 1/(2 N e ) и, соответственно, вероятность того, что они не сливаются, равна 1 - 1/(2 N e ).

В каждом последующем предыдущем поколении вероятность слияния распределена геометрически , то есть это вероятность неслияния в t  - 1 предыдущих поколениях, умноженная на вероятность слияния в интересующем поколении:

При достаточно больших значениях N e это распределение хорошо аппроксимируется непрерывно определяемым экспоненциальным распределением

Это математически удобно, поскольку стандартное экспоненциальное распределение имеет как ожидаемое значение , так и стандартное отклонение, равное 2 N e . Таким образом, хотя ожидаемое время слияния составляет 2 N e , фактическое время слияния варьируется в широком диапазоне. Обратите внимание, что время слияния — это количество предыдущих поколений, в которых произошло слияние, а не календарное время, хотя оценку последнего можно сделать, умножив 2 N e на среднее время между поколениями. Приведенные выше расчеты в равной степени применимы к диплоидной популяции эффективного размера N e (другими словами, для нерекомбинирующего участка ДНК каждую хромосому можно рассматривать как эквивалент независимой гаплоидной особи; при отсутствии инбридинга сестринские хромосомы в один человек не более тесно связан, чем две хромосомы, случайно выбранные из популяции). Однако некоторые эффективно гаплоидные элементы ДНК, такие как митохондриальная ДНК , передаются только одним полом и, следовательно, имеют четверть эффективного размера эквивалентной диплоидной популяции ( N e /2).

Нейтральный вариант

Теорию слияния также можно использовать для моделирования количества изменений в последовательностях ДНК, ожидаемых в результате генетического дрейфа и мутаций. Эта величина называется средней гетерозиготностью и обозначается как . Средняя гетерозиготность рассчитывается как вероятность возникновения мутации в данном поколении, деленная на вероятность любого «события» в этом поколении (либо мутации, либо слияния). Вероятность того, что событие является мутацией, — это вероятность мутации в любой из двух линий: . Таким образом, средняя гетерозиготность равна

Для подавляющего большинства пар аллелей имеется хотя бы одно различие в нуклеотидной последовательности.

Расширения

Существуют многочисленные расширения коалесцентной модели, такие как Λ-коалесцентная модель, которая допускает возможность мультифуркаций [6] .

Графическое представление

Слияния можно визуализировать с помощью дендрограмм , которые показывают взаимоотношения ветвей популяции друг с другом. Точка встречи двух ветвей указывает на событие слияния.

Приложения

Картирование генов болезней

Полезность коалесцентной теории при картировании заболеваний постепенно получает все большее признание; хотя применение теории все еще находится в зачаточном состоянии, ряд исследователей активно разрабатывают алгоритмы анализа генетических данных человека, использующие теорию слияния. [7] [8] [9]

Значительное количество человеческих заболеваний можно объяснить генетикой: от простых менделевских заболеваний, таких как серповидно-клеточная анемия и муковисцидоз , до более сложных заболеваний, таких как рак и психические заболевания. Последние представляют собой полигенные заболевания, контролируемые множеством генов, которые могут встречаться на разных хромосомах, но заболевания, вызванные одной аномалией, относительно легко выявить и отследить – хотя и не настолько просто, чтобы это было достигнуто для всех болезней. Для понимания этих заболеваний и их процессов чрезвычайно полезно знать, где они расположены в хромосомах и как они наследуются из поколения в поколение, что может быть достигнуто с помощью коалесцентного анализа. [1]

Генетические заболевания передаются из поколения в поколение так же, как и другие гены. Хотя любой ген может быть перемещён из одной хромосомы в другую во время гомологичной рекомбинации , маловероятно, что будет сдвинут только один ген. Таким образом, для его отслеживания можно использовать другие гены, которые достаточно близки к гену заболевания и могут быть связаны с ним. [1]

Полигенные заболевания имеют генетическую основу, хотя они и не соответствуют менделевским моделям наследования, и могут иметь относительно высокую распространенность в популяциях и иметь серьезные последствия для здоровья. Такие заболевания могут иметь неполную пенетрантность и склонны к полигенности , что усложняет их изучение. Эти черты могут возникнуть из-за множества небольших мутаций, которые в совокупности оказывают серьезное и пагубное воздействие на здоровье человека. [2]

Методы картирования связей, в том числе теорию слияния, можно применить к этим заболеваниям, поскольку они используют семейные родословные, чтобы выяснить, какие маркеры сопровождают заболевание и как оно наследуется. По крайней мере, этот метод помогает сузить часть или части генома, в которых могут возникнуть вредные мутации. Осложнения этих подходов включают эпистатические эффекты, полигенную природу мутаций и факторы окружающей среды. Тем не менее, гены, эффекты которых являются аддитивными, несут фиксированный риск развития заболевания, и когда они существуют в генотипе заболевания, их можно использовать для прогнозирования риска и картирования гена. [2] Как обычное слияние, так и разрушенное слияние (что позволяет предположить, что в исходном событии могли произойти множественные мутации и что болезнь может иногда быть вызвана факторами окружающей среды) были использованы для понимания генов болезней. [1]

Были проведены исследования, связывающие возникновение заболеваний у разнояйцевых и однояйцевых близнецов, и результаты этих исследований могут быть использованы для моделирования слияния. Поскольку однояйцевые близнецы имеют общий весь свой геном, а разнояйцевые - только половину генома, разницу в корреляции между однояйцевыми и разнояйцевыми близнецами можно использовать, чтобы определить, передается ли заболевание по наследству, и если да, то насколько сильно. [2]

Геномное распределение гетерозиготности

Карта однонуклеотидного полиморфизма человека (SNP) выявила большие региональные различия в гетерозиготности, большие, чем можно объяснить на основе ( распределенной Пуассона ) случайной случайности. [10] Частично эти различия можно объяснить на основе методов оценки, наличия геномных последовательностей и, возможно, стандартной генетической модели объединенной популяции. Влияние популяционной генетики может иметь большое влияние на эту вариацию: некоторые локусы, по-видимому, будут иметь сравнительно недавних общих предков, другие могут иметь гораздо более древние генеалогии, и поэтому региональное накопление SNP с течением времени может быть совершенно различным. Локальная плотность SNP вдоль хромосом, по-видимому, группируется в соответствии с законом отклонения от средней степени и подчиняется сложному распределению Пуассона Твиди . [11] В этой модели региональные вариации в карте SNP будут объясняться накоплением множества небольших геномных сегментов посредством рекомбинации, где среднее количество SNP на сегмент будет гамма-распределено пропорционально времени гамма-распределения до самого последнего общий предок для каждого сегмента. [12]

История

Теория слияния является естественным продолжением более классической концепции нейтральной эволюции популяционной генетики и приближением к модели Фишера-Райта (или Райта-Фишера) для больших популяций. Он был открыт независимо несколькими исследователями в 1980-х годах. [13] [14] [15] [16]

Программное обеспечение

Существует большое количество программного обеспечения как для моделирования наборов данных в процессе объединения, так и для определения таких параметров, как размер популяции и темпы миграции, на основе генетических данных.

Рекомендации

  1. ^ abc Моррис А., Уиттакер Дж. и Болдинг Д. (2002). Мелкомасштабное картирование локусов заболеваний посредством раздробленного слитного моделирования генеалогий. Американский журнал генетики человека, 70 (3), 686–707. дои : 10.1086/339271
  2. ^ abc Раннала, Б. (2001). Поиск генов, влияющих на восприимчивость к сложным заболеваниям в постгеномную эпоху. Американский журнал фармакогеномики , 1 (3), 203–221.

Источники

Статьи

Книги

Внешние ссылки