stringtranslate.com

Принцип Харди–Вайнберга

Пропорции Харди–Вайнберга для двух аллелей : горизонтальная ось показывает две частоты аллелей p и q , а вертикальная ось показывает ожидаемые частоты генотипов . Каждая линия показывает один из трех возможных генотипов.

В популяционной генетике принцип Харди–Вайнберга , также известный как равновесие , модель , теорема или закон Харди–Вайнберга , утверждает, что частоты аллелей и генотипов в популяции будут оставаться постоянными из поколения в поколение при отсутствии других эволюционных влияний. Эти влияния включают генетический дрейф , выбор партнера , ассортативное спаривание , естественный отбор , половой отбор , мутацию , поток генов , мейотический драйв , генетический автостоп , бутылочное горлышко популяции , эффект основателя , инбридинг и аутбридинговая депрессия .

В простейшем случае одного локуса с двумя аллелями , обозначенными A и a с частотами f (A) = p и f (a) = q , соответственно, ожидаемые частоты генотипа при случайном спаривании составляют f (AA) = p 2 для гомозигот AA , f (aa) = q 2 для гомозигот aa и f (Aa) = 2 pq для гетерозигот . При отсутствии отбора, мутации, генетического дрейфа или других сил частоты аллелей p и q постоянны между поколениями, поэтому достигается равновесие.

Принцип назван в честь Г. Х. Харди и Вильгельма Вайнберга , которые впервые продемонстрировали его математически. Статья Харди была сосредоточена на развенчании мнения о том, что доминантный аллель будет автоматически иметь тенденцию к увеличению частоты (представление, возможно, основанное на неверно истолкованном вопросе на лекции [1] ). Сегодня тесты на частоты генотипов Харди–Вайнберга используются в основном для проверки стратификации населения и других форм неслучайного спаривания.

Вывод

Рассмотрим популяцию однодомных диплоидов , где каждый организм производит мужские и женские гаметы с одинаковой частотой и имеет два аллеля в каждом локусе гена. Мы предполагаем, что популяция настолько велика, что ее можно рассматривать как бесконечную. Организмы размножаются путем случайного объединения гамет (модель популяции «генофонда»). Локус в этой популяции имеет два аллеля, A и a, которые встречаются с начальными частотами f 0 (A) = p и f 0 (a) = q , соответственно. [примечание 1] Частоты аллелей в каждом поколении получаются путем объединения аллелей из каждого генотипа одного и того же поколения в соответствии с ожидаемым вкладом гомозиготного и гетерозиготного генотипов, которые равны 1 и 1/2 соответственно:

Длина p , q соответствует частотам аллелей (здесь p = 0,6, q = 0,4 ). Тогда площадь прямоугольника представляет частоты генотипов (таким образом, AA : Aa : aa = 0,36 : 0,48 : 0,16 ).

Различные способы формирования генотипов для следующего поколения можно отобразить в решетке Пеннета , где доля каждого генотипа равна произведению частот аллелей строк и столбцов текущего поколения.

Сумма записей равна p 2 + 2 pq + q 2 = 1 , поскольку частоты генотипов должны в сумме давать единицу.

Еще раз обратите внимание, что при p + q = 1 биномиальное разложение ( p + q ) 2 = p 2 + 2 pq + q 2 = 1 дает те же самые соотношения.

Суммируя элементы решетка Пеннета или биномиального разложения, мы получаем ожидаемые пропорции генотипов среди потомков после одного поколения:

Эти частоты определяют равновесие Харди–Вайнберга. Следует отметить, что частоты генотипов после первого поколения не обязательно должны быть равны частотам генотипов из начального поколения, например, f 1 (AA) ≠ f 0 (AA) . Однако частоты генотипов для всех будущих времен будут равны частотам Харди–Вайнберга, например, f t (AA) = f 1 (AA) для t > 1. Это следует из того, что частоты генотипов следующего поколения зависят только от частот аллелей текущего поколения, которые, как рассчитано по уравнениям ( 1 ) и ( 2 ), сохраняются из начального поколения:

Для более общего случая раздельнополых диплоидов [организмы бывают либо мужского, либо женского пола], которые размножаются путем случайного спаривания особей, необходимо рассчитать частоты генотипов из девяти возможных спариваний между каждым родительским генотипом ( AA , Aa и aa ) в любом поле, взвешенные по ожидаемым вкладам генотипа каждого такого спаривания. [2] Эквивалентно, рассматриваются шесть уникальных диплоидно-диплоидных комбинаций:

и строит квадрат Паннета для каждого, чтобы вычислить его вклад в генотипы следующего поколения. Эти вклады взвешиваются в соответствии с вероятностью каждой комбинации диплоид-диплоид, которая следует мультиномиальному распределению с k = 3. Например, вероятность комбинации спаривания (AA,aa) составляет 2 f t (AA) f t (aa) , и она может привести только к генотипу Aa : [0,1,0] . В целом, результирующие частоты генотипов рассчитываются как:

Как и прежде, можно показать, что частоты аллелей в момент времени t + 1 равны частотам в момент времени t , и поэтому постоянны во времени. Аналогично частоты генотипов зависят только от частот аллелей, и поэтому после момента времени t  = 1 также постоянны во времени.

Если в однодомных или двудомных организмах изначально неравные пропорции аллелей или генотипов у обоих полов, можно показать, что постоянные пропорции получаются после одного поколения случайного спаривания. Если двудомные организмы гетерогаметны и локус гена расположен на X-хромосоме , можно показать, что если частоты аллелей изначально неравные у двух полов [ например , XX самки и XY самцы, как у людей], f ′(a) в гетерогаметном поле «преследует» f (a) в гомогаметном поле предыдущего поколения, пока не будет достигнуто равновесие на средневзвешенном значении двух начальных частот.

Отклонения от равновесия Харди–Вайнберга

Семь предположений, лежащих в основе равновесия Харди–Вайнберга, следующие: [3]

Нарушения предположений Харди–Вайнберга могут вызывать отклонения от ожиданий. То, как это влияет на популяцию, зависит от нарушаемых предположений.

Если популяция нарушает одно из следующих четырех предположений, в ней могут сохраняться пропорции Харди–Вайнберга в каждом поколении, но частоты аллелей будут меняться со временем.

В реальных данных генотипа отклонения от равновесия Харди–Вайнберга могут быть признаком ошибки генотипирования. [4] [5] [6]

Сцепление с полом

Если ген A сцеплен с полом , то гетерогаметный пол ( например , самцы млекопитающих; самки птиц) имеет только одну копию гена (и называется гемизиготным), тогда как гомогаметный пол ( например , самки человека ) имеет две копии. Частоты генотипов в равновесии составляют p и q для гетерогаметного пола, но p 2 , 2 pq и q 2 для гомогаметного пола.

Например, у людей дальтонизм на красный и зеленый цвета является рецессивным признаком, сцепленным с Х-хромосомой. У западноевропейских мужчин этот признак встречается примерно у 1 из 12 ( q  = 0,083), тогда как у женщин он встречается примерно у 1 из 200 (0,005 по сравнению с q 2  = 0,007), что очень близко к пропорциям Харди–Вайнберга.

Если популяция объединяется с самцами и самками с разной частотой аллелей в каждой субпопуляции (самцы или самки), частота аллелей мужской популяции в следующем поколении будет соответствовать частоте аллелей женской популяции, поскольку каждый сын получает свою X-хромосому от матери. Популяция очень быстро сходится к равновесию.

Обобщения

Простой вывод, представленный выше, можно обобщить для случаев с более чем двумя аллелями и полиплоидии .

Обобщение для более чем двух аллелей

Решетка Паннета для случая с тремя аллелями (слева) и случая с четырьмя аллелями (справа). Белые области — гомозиготы. Цветные области — гетерозиготы.

Рассмотрим дополнительную частоту аллеля,  r . Случай двух аллелей представляет собой биномиальное разложение ( p  +  q ) 2 , а случай трех аллелей представляет собой триномиальное разложение ( p  +  q  +  r ) 2 .

В более общем плане рассмотрим аллели A 1 , ..., A n , заданные частотами аллелей от p 1 до p n ;

даю для всех гомозигот :

и для всех гетерозигот :

Обобщение полиплоидии

Принцип Харди–Вайнберга можно также обобщить на полиплоидные системы, то есть на организмы, которые имеют более двух копий каждой хромосомы. Рассмотрим снова только два аллеля. Диплоидный случай — это биномиальное расширение :

и поэтому полиплоидный случай представляет собой биномиальное расширение:

где с — плоидность , например, при тетраплоидии ( с = 4):

То, является ли организм «истинным» тетраплоидом или амфидиплоидом, определит, сколько времени потребуется популяции для достижения равновесия Харди–Вайнберга.

Полное обобщение

Для отдельных аллелей в -плоидах частоты генотипов в равновесии Харди-Вайнберга задаются отдельными членами в полиномиальном разложении :

Тесты значимости отклонения

Тестирование отклонения от HWP обычно выполняется с помощью теста хи-квадрат Пирсона , используя наблюдаемые частоты генотипов, полученные из данных, и ожидаемые частоты генотипов, полученные с помощью HWP. Для систем, где есть большое количество аллелей, это может привести к данным со многими пустыми возможными генотипами и низким количеством генотипов, поскольку в выборке часто недостаточно особей, чтобы адекватно представить все классы генотипов. Если это так, то асимптотическое предположение о распределении хи-квадрат больше не будет выполняться, и может потребоваться использовать форму точного теста Фишера , для решения которого требуется компьютер . Совсем недавно был предложен ряд методов MCMC для тестирования отклонений от HWP (Guo & Thompson, 1992; Wigginton et al. 2005)

Пример критерия хи-квадрат для отклонения

Эти данные взяты из работы EB Ford (1971) по алой тигровой моли , для которой были зарегистрированы фенотипы выборки популяции. Предполагается, что различие генотипа и фенотипа пренебрежимо мало. Нулевая гипотеза заключается в том, что популяция находится в пропорциях Харди–Вайнберга, а альтернативная гипотеза заключается в том, что популяция не находится в пропорциях Харди–Вайнберга.

Исходя из этого, можно рассчитать частоты аллелей:

и

Итак, ожидание Харди-Вайнберга таково:

Тест хи-квадрат Пирсона утверждает:

Существует 1 степень свободы (степени свободы для теста на пропорции Харди–Вайнберга равны # генотипов − # аллелей). Уровень значимости 5% для 1 степени свободы равен 3,84, и поскольку значение χ2 меньше этого, нулевая гипотеза о том, что популяция находится в частотах Харди–Вайнберга, не отвергается.

Точный тест Фишера (тест вероятности)

Точный тест Фишера может быть применен для проверки пропорций Харди–Вайнберга. Поскольку тест обусловлен частотами аллелей, p и q , задачу можно рассматривать как проверку надлежащего числа гетерозигот. Таким образом, гипотеза пропорций Харди–Вайнберга отвергается, если число гетерозигот слишком велико или слишком мало. Условные вероятности для гетерозиготы, учитывая частоты аллелей, приведены в Emigh (1980) как

где n 11 , n 12 , n 22 — наблюдаемые числа трех генотипов, AA, Aa и aa соответственно, а n 1 — число аллелей A, где .

Пример Используя один из примеров из Emigh (1980), [7] мы можем рассмотреть случай, когда n  = 100, а p  = 0,34. Возможные наблюдаемые гетерозиготы и их точный уровень значимости приведены в Таблице 4.

Используя эту таблицу, необходимо найти уровень значимости теста на основе наблюдаемого числа гетерозигот. Например, если наблюдалось 20 гетерозигот, уровень значимости теста составляет 0,007. Как это типично для точного теста Фишера для малых выборок, градация уровней значимости довольно грубая.

Однако такую ​​таблицу необходимо создавать для каждого эксперимента, поскольку таблицы зависят как от n, так и от p .

Тесты на эквивалентность

Тесты эквивалентности разрабатываются для того, чтобы установить достаточно хорошее согласие наблюдаемых частот генотипов и равновесия Харди-Вайнберга. Пусть обозначает семейство распределений генотипов в предположении равновесия Харди-Вайнберга. Расстояние между распределением генотипа и равновесием Харди-Вайнберга определяется как , где — некоторое расстояние. Задача теста эквивалентности задается как и , где — параметр толерантности. Если гипотезу можно отвергнуть, то популяция с высокой вероятностью близка к равновесию Харди-Вайнберга. Тесты эквивалентности для биаллельного случая разработаны, среди прочего, в Wellek (2004). [8] Тесты эквивалентности для случая множественных аллелей предложены в Ostrovski (2020). [9]

Коэффициент инбридинга

Коэффициент инбридинга (см. также F -статистику ) равен единице минус наблюдаемая частота гетерозигот по сравнению с ожидаемой из равновесия Харди-Вайнберга.

где ожидаемое значение из равновесия Харди–Вайнберга определяется как

Например, для приведенных выше данных Ford:

Для двух аллелей критерий согласия хи-квадрат для пропорций Харди–Вайнберга эквивалентен тесту на инбридинг,  .

Коэффициент инбридинга нестабилен, поскольку ожидаемое значение приближается к нулю, и, таким образом, бесполезен для редких и очень распространенных аллелей. Для: ; не определено.

История

Менделевская генетика была заново открыта в 1900 году. Однако она оставалась несколько спорной в течение нескольких лет, поскольку тогда не было известно, как она может вызывать непрерывные характеристики. Удни Юл (1902) выступал против менделизма, поскольку он считал, что доминантные аллели будут увеличиваться в популяции. [10] Американец Уильям Э. Касл (1903) показал, что без отбора частоты генотипов останутся стабильными. [11] Карл Пирсон (1903) нашел одно положение равновесия со значениями p  =  q  = 0,5. [12] Реджинальд Паннетт , неспособный противостоять точке зрения Юла, представил проблему GH Hardy , британскому математику , с которым он играл в крикет . Харди был чистым математиком и относился к прикладной математике с некоторым презрением; его взгляд на использование математики биологами отражен в его статье 1908 года, где он описывает это как «очень простое»: [13]

Редактору журнала Science: Я не хочу вмешиваться в обсуждение вопросов, в которых я не являюсь экспертом, и я должен был ожидать, что очень простая мысль, которую я хочу высказать, будет знакома биологам. Однако некоторые замечания г-на Удни Юла, на которые г-н Р. К. Паннетт обратил мое внимание, предполагают, что это все же стоит сделать...
Предположим, что Aa — это пара менделевских признаков, где A — доминантный, и что в любом данном поколении число чистых доминантов (AA), гетерозигот (Aa) и чистых рецессивов (aa) равно p :2 q : r . Наконец, предположим, что числа достаточно велики, так что спаривание можно считать случайным, что полы равномерно распределены между тремя разновидностями, и что все они одинаково плодовиты. Немного математики типа таблицы умножения достаточно, чтобы показать, что в следующем поколении числа будут равны ( p  +  q ) 2 :2( p  +  q )( q  +  r ):( q  +  r ) 2 , или, скажем , p 1 :2 q 1 : r 1 .
Интересный вопрос: при каких обстоятельствах это распределение будет таким же, как и в предыдущем поколении? Легко видеть, что условием для этого является q 2  =  pr . И поскольку q 1 2  =  p 1 r 1 , то какими бы ни были значения p , q , и r , распределение в любом случае останется неизменным после второго поколения

Таким образом, этот принцип был известен в англоязычном мире как закон Харди до 1943 года, когда Курт Штерн указал, что он был впервые независимо сформулирован в 1908 году немецким врачом Вильгельмом Вайнбергом . [14] [15] В 1903 году Уильям Касл также вывел соотношения для особого случая равных частот аллелей, и его иногда (но редко) называют законом Харди–Вайнберга–Касла.

Вывод уравнений Харди

Утверждение Харди начинается с рекуррентного соотношения для частот p , 2 q и r . Эти рекуррентные соотношения следуют из фундаментальных понятий вероятности, в частности, независимости и условной вероятности . Например, рассмотрим вероятность того, что потомок поколения будет гомозиготным доминантным. Аллели наследуются независимо от каждого родителя. Доминантный аллель может быть унаследован от гомозиготного доминантного родителя с вероятностью 1 или от гетерозиготного родителя с вероятностью 0,5. Чтобы представить это рассуждение в уравнении, пусть представляет собой наследование доминантного аллеля от родителя. Кроме того, пусть и представляют собой потенциальные родительские генотипы в предыдущем поколении.

Те же рассуждения, примененные к другим генотипам, дают два оставшихся рекуррентных соотношения. Равновесие возникает, когда каждая пропорция постоянна между последующими поколениями. Более формально, популяция находится в равновесии в поколении, когда

, , и

Решая эти уравнения, можно определить необходимые и достаточные условия для возникновения равновесия. Опять же, рассмотрим частоту гомозиготных доминантных животных. Равновесие подразумевает

Сначала рассмотрим случай, когда , и заметим, что это подразумевает, что и . Теперь рассмотрим оставшийся случай, когда :

где окончательное равенство выполняется, поскольку пропорции аллелей должны в сумме давать единицу. В обоих случаях . Можно показать, что два других условия равновесия подразумевают одно и то же уравнение. Вместе решения трех уравнений равновесия подразумевают достаточность условия Харди для равновесия. Поскольку условие всегда выполняется для второго поколения, все последующие поколения имеют те же самые пропорции.

Числовой пример

Оценка распределения генотипов

Пример вычисления распределения генотипа, заданный исходными уравнениями Харди, поучителен. Распределение фенотипа из Таблицы 3 выше будет использовано для вычисления начального распределения генотипа Харди. Обратите внимание, что значения p и q, используемые Харди, не совпадают с использованными выше.

В качестве проверки распределения вычислите

и

Для следующего поколения уравнения Харди дают

Опять же, для проверки распределения вычисляем

и

которые являются ожидаемыми значениями. Читатель может продемонстрировать, что последующее использование значений второго поколения для третьего поколения даст идентичные результаты.

Оценка несущей частоты

Принцип Харди–Вайнберга также можно использовать для оценки частоты носителей аутосомно-рецессивного заболевания в популяции на основе частоты страданий.

Предположим, что предполагаемое количество детей рождается с муковисцидозом , это примерно соответствует частоте гомозиготных особей, наблюдаемых в популяциях Северной Европы. Мы можем использовать уравнения Харди–Вайнберга для оценки частоты носителей, частоты гетерозиготных особей, .

Так как p мало , то можно принять его равным 1.

Поэтому мы оцениваем частоту носительства как , что примерно соответствует частоте, наблюдаемой в популяциях Северной Европы.

Это можно упростить, записав, что несущая частота примерно в два раза больше квадратного корня частоты рождения.

Графическое представление

Диаграмма де Финетти, представляющая распределение частот генотипов

Можно графически представить распределение частот генотипов для биаллельного локуса в популяции с помощью диаграммы де Финетти . Она использует треугольный график (также известный как трилинейный, трехосный или тернарный график ) для представления распределения трех частот генотипов по отношению друг к другу. Он отличается от многих других подобных графиков тем, что направление одной из осей было изменено на противоположное. [16] Изогнутая линия на диаграмме является параболой Харди–Вайнберга и представляет состояние, в котором аллели находятся в равновесии Харди–Вайнберга. На таких графиках можно представить эффекты естественного отбора и его влияние на частоту аллелей. [17] Диаграмма де Финетти была разработана и широко использовалась А. В. Ф. Эдвардсом в его книге «Основы математической генетики » . [18]

Смотрите также

Примечания

  1. ^ Термин «частота» обычно относится к числу или количеству, но в данном контексте он является синонимом вероятности .

Ссылки

Цитаты

  1. ^ Эдвардс, AWF (2008). «GH Hardy (1908) и равновесие Харди–Вайнберга». Genetics . 179 (3): 1143–1150. doi :10.1534/genetics.104.92940. ISSN  0016-6731. PMC  2475721 . PMID  18645201.
  2. ^ Карр, д-р Стивен М. «Харди–Вайнберг у раздельнополых организмов» . www.mun.ca.
  3. ^ Hartl DL, Clarke AG (2007) Принципы популяционной генетики. Сандерленд, Массачусетс: Sinauer
  4. ^ Хоскинг, Луиза; Ламсден, Шина; Льюис, Карен; Йео, Астрид; Маккарти, Линда; Бансал, Аруна; Райли, Джон; Первис, Ян; Сюй, Чун-Фан (май 2004 г.). «Обнаружение ошибок генотипирования с помощью тестирования равновесия Харди–Вайнберга». European Journal of Human Genetics . 12 (5): 395–399. doi : 10.1038/sj.ejhg.5201164 . ISSN  1018-4813. PMID  14872201.
  5. ^ Pompanon, François; Bonin, Aurélie; Bellemain, Eva; Taberlet, Pierre (ноябрь 2005 г.). «Ошибки генотипирования: причины, последствия и решения». Nature Reviews Genetics . 6 (11): 847–859. doi :10.1038/nrg1707. ISSN  1471-0064. PMID  16304600. S2CID  14031116.
  6. ^ Кокс, Дэвид Г.; Крафт, Питер (2006). «Количественная оценка мощности тестирования равновесия Харди–Вайнберга для обнаружения ошибок генотипирования». Human Heredity . 61 (1): 10–14. doi :10.1159/000091787. ISSN  0001-5652. PMID  16514241. S2CID  37599930.
  7. ^ ab Эмиг, Тед Х. (1980). «Сравнение тестов на равновесие Харди–Вайнберга». Биометрия . 36 (4): 627–642. doi :10.2307/2556115. JSTOR  2556115. PMID  25856832.
  8. ^ Wellek, Stefan (сентябрь 2004 г.). «Тесты для установления совместимости наблюдаемого распределения генотипов с равновесием Харди–Вайнберга в случае биаллельного локуса». Biometrics . 60 (3): 694–703. doi :10.1111/j.0006-341X.2004.00219.x. PMID  15339292. S2CID  12028776.Официальная веб-ссылка (требуется подписка)
  9. ^ Островский, Владимир (февраль 2020 г.). «Новые тесты эквивалентности для равновесия Харди–Вайнберга и множественных аллелей». Статистика . 3 : 34–39. doi : 10.3390/stats3010004 .Официальная ссылка
  10. Йоль, 1902 г.
  11. Замок, 1903 г.
  12. ^ Пирсон, 1903
  13. Харди, 1908 г.
  14. ^ Кроу, Джеймс Ф. (1999). «Харди, Вайнберг и языковые препятствия». Генетика . 152 (3): 821–825. doi :10.1093/genetics/152.3.821. PMC 1460671. PMID 10388804  . 
  15. ^ Стерн, Курт (1962). «Вильгельм Вайнберг». Генетика . 47 : 1–5.
  16. ^ Каннингс, К.; Эдвардс, А. В. Ф. (1968). «Естественный отбор и диаграмма де Финетти». Annals of Human Genetics . 31 (4): 421–428. doi :10.1111/j.1469-1809.1968.tb00575.x. PMID  5673165. S2CID  8863631.
  17. ^ См. , например, Ineichen & Batschelet 1975.
  18. ^ Эдвардс, 1977

Источники

Внешние ссылки