stringtranslate.com

Принцип Харди – Вайнберга

Пропорции Харди-Вайнберга для двух аллелей : горизонтальная ось показывает частоты двух аллелей p и q , а вертикальная ось показывает ожидаемые частоты генотипов . В каждой строке показан один из трех возможных генотипов.

В популяционной генетике принцип Харди -Вайнберга , также известный как равновесие , модель , теорема или закон Харди-Вайнберга , гласит, что частоты аллелей и генотипов в популяции будут оставаться постоянными от поколения к поколению в отсутствие других эволюционных влияний. Эти влияния включают генетический дрейф , выбор партнера , ассортативное спаривание , естественный отбор , половой отбор , мутации , поток генов , мейотический драйв , генетический автостоп , узкое место в популяции , эффект основателя , депрессию инбридинга и аутбридинга .

В простейшем случае одного локуса с двумя аллелями , обозначенными A и a, с частотами f (A) = p и f (a) = q соответственно, ожидаемые частоты генотипов при случайном спаривании составляют f (AA) = p 2 для Гомозиготы АА , f (aa) = q 2 для гомозигот аа и f (Aa) = 2 pq для гетерозигот . В отсутствие отбора, мутаций, генетического дрейфа или других сил частоты аллелей p и q постоянны между поколениями, поэтому достигается равновесие.

Принцип назван в честь Г.Х. Харди и Вильгельма Вайнберга , которые впервые продемонстрировали его математически. Статья Харди была сосредоточена на опровержении мнения о том, что доминантная аллель автоматически имеет тенденцию к увеличению частоты (точка зрения, возможно, основана на неверно истолкованном вопросе на лекции [1] ). Сегодня тесты на частоту генотипов Харди-Вайнберга используются в первую очередь для проверки стратификации популяции и других форм неслучайного спаривания.

Вывод

Рассмотрим популяцию однодомных диплоидов , где каждый организм производит мужские и женские гаметы с одинаковой частотой и имеет по две аллели в каждом локусе гена. Мы предполагаем, что популяция настолько велика, что ее можно считать бесконечной. Организмы размножаются путем случайного объединения гамет (модель популяции «генофонд»). Локус в этой популяции имеет два аллеля, A и a, которые встречаются с начальными частотами f 0 (A) = p и f 0 (a) = q соответственно. [примечание 1] Частоты аллелей в каждом поколении получаются путем объединения аллелей из каждого генотипа одного и того же поколения в соответствии с ожидаемым вкладом гомозиготных и гетерозиготных генотипов, которые составляют 1 и 1/2 соответственно:

Длина p , q соответствует частотам аллелей (здесь p = 0,6, q = 0,4 ). Тогда площадь прямоугольника представляет частоты генотипов (таким образом, AA: Aa: aa = 0,36: 0,48: 0,16 ).

Различные способы формирования генотипов для следующего поколения можно показать в квадрате Пеннета , где доля каждого генотипа равна произведению частот аллелей строки и столбца из текущего поколения.

Сумма записей равна p 2 + 2 pq + q 2 = 1 , поскольку сумма частот генотипов должна равняться единице.

Обратите внимание еще раз, что поскольку p + q = 1 , биномиальное разложение ( p + q ) 2 = p 2 + 2 pq + q 2 = 1 дает те же самые соотношения.

Суммируя элементы квадрата Пеннета или биномиального разложения, мы получаем ожидаемые пропорции генотипов среди потомков после одного поколения:

Эти частоты определяют равновесие Харди – Вайнберга. Следует отметить, что частоты генотипов после первого поколения не обязательно должны равняться частотам генотипов из начального поколения, например f 1 (AA) ≠ f 0 (AA) . Однако частоты генотипов для всех будущих времен будут равны частотам Харди-Вайнберга, например, f t (AA) = f 1 (AA) для t > 1 . Это следует из того, что частоты генотипов следующего поколения зависят только от частот аллелей текущего поколения, которые, рассчитанные по уравнениям ( 1 ) и ( 2 ), сохраняются от исходного поколения:

Для более общего случая раздельнополых диплоидов (организмы бывают мужского или женского пола), которые размножаются путем случайного спаривания особей, необходимо вычислить частоты генотипов из девяти возможных спариваний между каждым родительским генотипом ( АА , Аа и аа ) в любого пола, взвешенные по ожидаемому вкладу генотипа от каждого такого спаривания. [2] Эквивалентно можно рассматривать шесть уникальных комбинаций диплоид-диплоид:

и строит для каждого квадрат Пеннета, чтобы рассчитать его вклад в генотипы следующего поколения. Эти вклады взвешиваются в соответствии с вероятностью каждой комбинации диплоид-диплоид, которая следует полиномиальному распределению с k = 3 . Например, вероятность спаривания комбинации (АА,аа) равна 2 f t (AA) f t (aa) , и в результате она может привести только к генотипу Aa : [0,1,0] . В целом, результирующие частоты генотипов рассчитываются как:

Как и раньше, можно показать, что частоты аллелей в момент времени t + 1 равны частотам аллелей в момент времени t и, следовательно, постоянны во времени. Аналогично, частоты генотипов зависят только от частот аллелей, и поэтому после времени t  = 1 также постоянны во времени.

Если у однодомных или раздельнополых организмов пропорции аллелей или генотипов изначально неравны для обоих полов, можно показать, что постоянные пропорции достигаются после одного поколения случайного спаривания. Если раздельнополые организмы гетерогаметны и локус гена расположен на Х-хромосоме , можно показать, что если частоты аллелей изначально неравны у обоих полов [ например , XX самок и XY самцов, как у человека], f '( а) в гетерогаметном поле «гоняется» f (а) за гомогаметным полом предыдущего поколения, пока не будет достигнуто равновесие при средневзвешенном значении двух начальных частот.

Отклонения от равновесия Харди – Вайнберга

Семь предположений, лежащих в основе равновесия Харди – Вайнберга, заключаются в следующем: [3]

Нарушения предположений Харди – Вайнберга могут вызвать отклонения от ожиданий. То, как это повлияет на популяцию, зависит от допущений, которые нарушаются.

Если популяция нарушает одно из следующих четырех предположений, популяция может продолжать иметь пропорции Харди-Вайнберга в каждом поколении, но частоты аллелей со временем будут меняться.

В реальных данных о генотипах отклонения от равновесия Харди-Вайнберга могут быть признаком ошибки генотипирования. [4] [5] [6]

Секс-связь

Если ген А сцеплен с полом , гетерогаметный пол ( например , самцы млекопитающих; самки птиц) имеют только одну копию гена (и называются гемизиготными), тогда как гомогаметный пол ( например , самки человека ) имеет две копии. Частоты генотипов в состоянии равновесия равны p и q для гетерогаметного пола, но p 2 , 2 pq и q 2 для гомогаметного пола.

Например, у людей красно-зеленая дальтонизм является Х-сцепленным рецессивным признаком. У западноевропейских мужчин этот признак затрагивает примерно 1 из 12 ( q  = 0,083), тогда как он затрагивает примерно 1 из 200 женщин (0,005 по сравнению с q 2  = 0,007), что очень близко к пропорциям Харди-Вайнберга.

Если популяцию объединить с мужчинами и женщинами с разной частотой аллелей в каждой субпопуляции (мужчины или женщины), частота аллелей мужской популяции в следующем поколении будет такой же, как и у женской популяции, поскольку каждый сын получает свою Х-хромосому от его мать. Популяция очень быстро приходит к равновесию.

Обобщения

Простой вывод, приведенный выше, можно обобщить для более чем двух аллелей и полиплоидии .

Генерализация более чем двух аллелей

Квадрат Пеннета для трехаллельного случая (слева) и четырехаллельного случая (справа). Белые участки — гомозиготы. Окрашенные участки — гетерозиготы.

Рассмотрим дополнительную частоту аллеля  r . Случай с двумя аллелями — это биномиальное расширение ( p  +  q ) 2 , и, таким образом, случай с тремя аллелями — это триномиальное расширение ( p  +  q  +  r ) 2 .

В более общем плане рассмотрим аллели A 1 , ..., An, определяемые частотами аллелей от p 1 до p n ;

давая для всех гомозигот :

и для всех гетерозигот :

Обобщение полиплоидии

Принцип Харди-Вайнберга также можно распространить на полиплоидные системы, то есть на организмы, имеющие более двух копий каждой хромосомы. Рассмотрим снова только два аллеля. Диплоидный случай представляет собой биномиальное разложение :

и, следовательно, полиплоидный случай представляет собой биномиальное разложение:

где сплоидность , например с тетраплоидом ( с = 4):

Является ли организм «настоящим» тетраплоидом или амфидиплоидом, будет определять, сколько времени потребуется популяции, чтобы достичь равновесия Харди-Вайнберга.

Полное обобщение

Для различных аллелей в -плоидах частоты генотипов в равновесии Харди-Вайнберга задаются отдельными членами полиномиального разложения :

Критерии значимости отклонения

Тестирование отклонений от HWP обычно выполняется с использованием критерия хи-квадрат Пирсона с использованием наблюдаемых частот генотипов, полученных на основе данных, и ожидаемых частот генотипов, полученных с использованием HWP. Для систем с большим количеством аллелей это может привести к получению данных со многими пустыми возможными генотипами и низким количеством генотипов, поскольку в выборке часто недостаточно людей, чтобы адекватно представить все классы генотипов. Если это так, то асимптотическое предположение о распределении хи-квадрат больше не будет выполняться, и может возникнуть необходимость использовать форму точного теста Фишера , для решения которого требуется компьютер . Совсем недавно был предложен ряд методов MCMC для проверки отклонений от HWP (Guo & Thompson, 1992; Wigginton et al., 2005).

Пример теста хи-квадрат на отклонение

Эти данные взяты из EB Ford (1971) по алой тигровой бабочке , для которой были зарегистрированы фенотипы выборки популяции. Генотип-фенотипические различия считаются пренебрежимо малыми. Нулевая гипотеза состоит в том, что численность населения соответствует пропорциям Харди-Вайнберга, а альтернативная гипотеза состоит в том, что численность населения не соответствует пропорциям Харди-Вайнберга.

Отсюда можно рассчитать частоты аллелей:

и

Итак, ожидание Харди-Вайнберга таково:

Критерий хи-квадрат Пирсона гласит:

Существует 1 степень свободы (степени свободы для теста на пропорции Харди-Вайнберга составляют # генотипов − # аллелей). Уровень значимости 5% для 1 степени свободы составляет 3,84, и поскольку значение χ 2 меньше этого, нулевая гипотеза о том, что популяция находится в частотах Харди-Вайнберга, не отвергается.

Точный критерий Фишера (критерий вероятности)

Точный критерий Фишера можно применить для проверки пропорций Харди – Вайнберга. Поскольку тест зависит от частот аллелей p и q , проблему можно рассматривать как проверку надлежащего числа гетерозигот. Таким образом, гипотеза о пропорциях Харди-Вайнберга отвергается, если число гетерозигот слишком велико или слишком мало. Условные вероятности гетерозиготы с учетом частот аллелей приведены в Emigh (1980) как

где n 11 , n 12 , n 22 — наблюдаемые числа трех генотипов, АА, Аа и аа соответственно, а n 1 — число аллелей А, где .

Пример. Используя один из примеров Эмига (1980), [7], мы можем рассмотреть случай, когда n  = 100 и p  = 0,34. Возможные наблюдаемые гетерозиготы и их точный уровень значимости приведены в таблице 4.

Используя эту таблицу, необходимо найти уровень значимости теста на основе наблюдаемого количества гетерозигот. Например, если наблюдалось 20 гетерозигот, уровень значимости теста составит 0,007. Как это типично для точного критерия Фишера для небольших выборок, градация уровней значимости довольно грубая.

Однако подобную таблицу необходимо создавать для каждого эксперимента, поскольку таблицы зависят как от n , так и от p .

Тесты на эквивалентность

Критерии эквивалентности разработаны для того, чтобы установить достаточно хорошее соответствие наблюдаемых частот генотипов и равновесия Харди Вайнберга. Обозначим через семейство распределений генотипов в предположении равновесия Харди Вайнберга. Расстояние между распределением генотипов и равновесием Харди Вайнберга определяется как , где – некоторое расстояние. Задача проверки эквивалентности определяется формулами и , где – параметр допуска. Если гипотезу можно отвергнуть, то популяция с высокой вероятностью близка к равновесию Харди Вайнберга. Критерии эквивалентности для двуаллельного случая разработаны, среди прочего, в Wellek (2004). [8] Тесты эквивалентности для случая нескольких аллелей предложены Островским (2020). [9]

Коэффициент инбридинга

Коэффициент инбридинга (см. также F -статистику ) равен единице минус наблюдаемая частота гетерозигот по сравнению с ожидаемой из равновесия Харди – Вайнберга.

где ожидаемое значение равновесия Харди – Вайнберга определяется выражением

Например, для данных Форда выше:

Для двух аллелей критерий соответствия хи-квадрат для пропорций Харди-Вайнберга эквивалентен тесту на инбридинг  .

Коэффициент инбридинга нестабильен, поскольку ожидаемое значение приближается к нулю, и поэтому бесполезен для редких и очень распространенных аллелей. Для: ; является неопределенным.

История

Менделевская генетика была вновь открыта в 1900 году. Однако в течение нескольких лет она оставалась несколько спорной, поскольку тогда не было известно, как она может вызывать непрерывные характеристики. Удный Юл (1902) выступал против менделизма, поскольку считал, что доминантные аллели будут увеличиваться в популяции. [10] Американец Уильям Э. Касл (1903) показал, что без отбора частоты генотипов оставались бы стабильными. [11] Карл Пирсон (1903) нашел одно положение равновесия со значениями p  =  q  = 0,5. [12] Реджинальд Паннетт , не в силах опровергнуть точку зрения Юла, представил задачу Г.Х. Харди , британскому математику , с которым он играл в крикет . Харди был чистым математиком и с некоторым презрением относился к прикладной математике ; его взгляд на использование биологами математики встречается в его статье 1908 года, где он описывает это как «очень простое»: [13]

Редактору журнала Science: Я не хочу вмешиваться в дискуссию по вопросам, в которых у меня нет экспертных знаний, и я должен был ожидать, что очень простой момент, который я хочу изложить, был знаком биологам. Однако некоторые замечания г-на Удни Юла, на которые г-н Р.К. Паннетт обратил мое внимание, позволяют предположить, что, возможно, все же стоит сделать это...
Предположим, что Аа — пара менделевских признаков, причем А — доминантный, и что в любом данном поколении число чистых доминантов (АА), гетерозигот (Аа) и чистых рецессивов (аа) равно p :2 q : r . Наконец, предположим, что их численность довольно велика, так что спаривание можно считать случайным, что полы равномерно распределены среди трех разновидностей и что все они одинаково плодовиты. Немного математики типа таблицы умножения достаточно, чтобы показать, что в следующем поколении числа будут иметь вид ( p  +  q ) 2 :2( p  +  q )( q  +  r ):( q  +  r ) 2 , или скажем, как p 1 :2 q 1 : r 1 .
Интересный вопрос: при каких обстоятельствах это распределение будет таким же, как в предыдущем поколении? Легко видеть, что условием для этого является q 2  =  pr . А поскольку q 1 2  =  p 1 r 1 , какими бы ни были значения p , q и r , распределение в любом случае продолжится неизменным после второго поколения .

Таким образом, этот принцип был известен как закон Харди в англоязычном мире до 1943 года, когда Курт Штерн указал, что он был впервые сформулирован независимо в 1908 году немецким врачом Вильгельмом Вайнбергом . [14] [15] Уильям Касл в 1903 году также вывел соотношения для особого случая равных частот аллелей, и это иногда (но редко) называют законом Харди-Вайнберга-Касла.

Вывод уравнений Харди

Утверждение Харди начинается с рекуррентного соотношения для частот p , 2 q и r . Эти рекуррентные отношения следуют из фундаментальных концепций вероятности, в частности независимости и условной вероятности . Например, рассмотрим вероятность того, что потомок этого поколения будет гомозиготно-доминантным. Аллели наследуются независимо от каждого родителя. Доминантный аллель может быть унаследован от гомозиготного доминантного родителя с вероятностью 1 или от гетерозиготного родителя с вероятностью 0,5. Чтобы представить это рассуждение в уравнении, представим наследование доминантной аллели от родителя. Кроме того, пусть и представляют потенциальные родительские генотипы в предыдущем поколении.

Те же рассуждения, примененные к другим генотипам, приводят к двум оставшимся рекуррентным отношениям. Равновесие возникает, когда каждая пропорция постоянна между последующими поколениями. Более формально, популяция находится в равновесии при рождении, когда

, , и

Решив эти уравнения, можно определить необходимые и достаточные условия возникновения равновесия. Опять же, рассмотрим частоту гомозиготных доминантных животных. Равновесие подразумевает

Сначала рассмотрим случай, когда , и заметим, что из этого следует, что и . Теперь рассмотрим оставшийся случай, где :

где окончательное равенство сохраняется, поскольку сумма пропорций аллелей должна равняться единице. В обоих случаях, . Можно показать, что два других условия равновесия влекут за собой то же уравнение. Вместе решения трех уравнений равновесия предполагают достаточность условия Харди для равновесия. Поскольку это условие всегда выполняется для второго поколения, все последующие поколения имеют одинаковые пропорции.

Численный пример

Оценка распределения генотипов

Поучителен пример расчета распределения генотипов, заданный оригинальными уравнениями Харди. Распределение фенотипов из таблицы 3 выше будет использоваться для расчета начального распределения генотипов Харди. Обратите внимание, что значения p и q , используемые Харди, не совпадают с использованными выше.

В качестве проверки распределения вычислите

и

Для следующего поколения уравнения Харди дают

Опять же, в качестве проверки распределения, вычислите

и

каковы ожидаемые значения. Читатель может продемонстрировать, что последующее использование значений второго поколения для третьего поколения даст идентичные результаты.

Оценка несущей частоты

Принцип Харди-Вайнберга также можно использовать для оценки частоты носителей аутосомно -рецессивного заболевания в популяции на основе частоты страданий.

Предположим, что по оценкам дети рождаются с муковисцидозом , это примерно такая же частота гомозиготных особей, наблюдаемая в популяциях Северной Европы. Мы можем использовать уравнения Харди-Вайнберга для оценки частоты носителей, частоты гетерозиготных особей .

Так как оно мало, мы можем принять p , , равным 1.

Поэтому мы оцениваем уровень носительства как , что примерно соответствует частоте, наблюдаемой в популяциях Северной Европы.

Это можно упростить до значения, что несущая частота примерно в два раза превышает квадратный корень из частоты рождения.

Графическое представление

Диаграмма де Финетти , представляющая распределение частот генотипов.

Графически представить распределение частот генотипов биаллельного локуса внутри популяции можно с помощью диаграммы де Финетти . При этом используется треугольный график (также известный как трилинейный, трехосный или троичный график ) для представления распределения частот трех генотипов по отношению друг к другу. Он отличается от многих других подобных графиков тем, что направление одной из осей изменено на противоположное. [16] Кривая линия на диаграмме представляет собой параболу Харди-Вайнберга и представляет состояние, в котором аллели находятся в равновесии Харди-Вайнберга. На таких графиках можно отобразить эффекты естественного отбора и его влияние на частоту аллелей. [17] Диаграмма де Финетти была разработана и широко использована А. Ф. Эдвардсом в его книге «Основы математической генетики» . [18]

Смотрите также

Примечания

  1. ^ Термин « частота» обычно относится к числу или количеству, но в данном контексте он является синонимом вероятности .

Рекомендации

Цитаты

  1. ^ Эдвардс, AWF (2008). «GH Hardy (1908) и равновесие Харди – Вайнберга». Генетика . 179 (3): 1143–1150. дои : 10.1534/генетика.104.92940. ISSN  0016-6731. ПМЦ  2475721 . ПМИД  18645201.
  2. ^ Карр, доктор Стивен М. «Харди-Вайнберг в раздельнополых организмах». www.mun.ca.
  3. ^ Хартл Д.Л., Кларк А.Г. (2007) Принципы популяционной генетики. Сандерленд, Массачусетс: Синауэр
  4. ^ Хоскинг, Луиза; Ламсден, Шина; Льюис, Карен; Эй, Астрид; Маккарти, Линда; Бансал, Аруна; Райли, Джон; Первис, Ян; Сюй, Чун-Фан (май 2004 г.). «Обнаружение ошибок генотипирования с помощью тестирования равновесия Харди – Вайнберга». Европейский журнал генетики человека . 12 (5): 395–399. дои : 10.1038/sj.ejhg.5201164 . ISSN  1018-4813. ПМИД  14872201.
  5. ^ Помпанон, Франсуа; Бонен, Орели; Бельмен, Ева; Таберле, Пьер (ноябрь 2005 г.). «Ошибки генотипирования: причины, последствия и пути решения». Обзоры природы Генетика . 6 (11): 847–859. дои : 10.1038/nrg1707. ISSN  1471-0064. PMID  16304600. S2CID  14031116.
  6. ^ Кокс, Дэвид Г.; Крафт, Питер (2006). «Количественная оценка эффективности тестирования равновесия Харди-Вайнберга для обнаружения ошибки генотипирования». Человеческая наследственность . 61 (1): 10–14. дои : 10.1159/000091787. ISSN  0001-5652. PMID  16514241. S2CID  37599930.
  7. ^ аб Эмиг, Тед Х. (1980). «Сравнение тестов на равновесие Харди – Вайнберга». Биометрия . 36 (4): 627–642. дои : 10.2307/2556115. JSTOR  2556115. PMID  25856832.
  8. ^ Веллек, Стефан (сентябрь 2004 г.). «Тесты для установления совместимости наблюдаемого распределения генотипов с равновесием Харди – Вайнберга в случае двуаллельного локуса». Биометрия . 60 (3): 694–703. дои : 10.1111/j.0006-341X.2004.00219.x. PMID  15339292. S2CID  12028776.Официальная веб-ссылка (требуется подписка)
  9. Островский, Владимир (февраль 2020 г.). «Новые тесты эквивалентности равновесия Харди – Вайнберга и множественных аллелей». Статистика . 3 : 34–39. дои : 10.3390/stats3010004 .Официальная веб-ссылка
  10. ^ Юл, 1902 г.
  11. ^ Замок, 1903 г.
  12. ^ Пирсон, 1903 г.
  13. ^ Харди, 1908 г.
  14. ^ Ворона, Джеймс Ф. (1999). «Харди, Вайнберг и языковые препятствия». Генетика . 152 (3): 821–825. doi : 10.1093/генетика/152.3.821. ПМЦ 1460671 . ПМИД  10388804. 
  15. ^ Стерн, Курт (1962). «Вильгельм Вайнберг». Генетика . 47 : 1–5.
  16. ^ Каннингс, К.; Эдвардс, AWF (1968). «Естественный отбор и диаграмма де Финетти». Анналы генетики человека . 31 (4): 421–428. doi :10.1111/j.1469-1809.1968.tb00575.x. PMID  5673165. S2CID  8863631.
  17. ^ См., например, Ineichen & Batschelet, 1975.
  18. ^ Эдвардс, 1977

Источники

Внешние ссылки