Эффективный размер популяции ( N e ) — это размер идеализированной популяции, который будет испытывать ту же скорость генетического дрейфа или увеличения инбридинга, что и в реальной популяции. Идеализированные популяции основаны на нереалистичных, но удобных предположениях, включая случайное спаривание, одновременное рождение каждого нового поколения, постоянный размер популяции. Для большинства представляющих интерес величин и большинства реальных групп населения N e меньше, чем численность переписной совокупности N реальной популяции. [1] Одна и та же популяция может иметь несколько эффективных размеров популяции для разных интересующих свойств, включая генетический дрейф и инбридинг.
Эффективный размер популяции чаще всего измеряется по времени слияния . В идеализированной диплоидной популяции без отбора ни в каком локусе ожидание времени слияния поколений равно удвоенному размеру переписной популяции. Эффективный размер популяции измеряется как внутривидовое генетическое разнообразие, деленное на четырехкратную частоту мутаций , поскольку в такой идеализированной популяции гетерозиготность равна . В популяции с отбором во многих локусах и обильным неравновесием по сцеплению эффективный размер объединенной популяции может вообще не отражать размер переписной популяции или может отражать ее логарифм.
Понятие эффективной численности популяции было введено в область популяционной генетики в 1931 американским генетиком Сьюэллом Райтом . [2] [3]
В зависимости от интересующей численности эффективная численность популяции может быть определена несколькими способами. Рональд Фишер и Сьюэлл Райт первоначально определили это как «количество размножающихся особей в идеализированной популяции , которые демонстрировали бы такую же степень дисперсии частот аллелей при случайном генетическом дрейфе или ту же степень инбридинга , что и рассматриваемая популяция». В более общем смысле эффективный размер популяции можно определить как количество особей в идеализированной популяции, у которых значение любой заданной генетической величины популяции равно значению этой величины в интересующей популяции. Двумя популяционными генетическими величинами, определенными Райтом, были увеличение дисперсии в одном поколении между повторяющимися популяциями (эффективный размер популяции дисперсии) и изменение коэффициента инбридинга в одном поколении (эффективный размер популяции инбридинга) . Эти два показателя тесно связаны между собой и получены на основе F-статистики , но они не идентичны. [4]
Сегодня эффективный размер популяции обычно оценивается эмпирически с учетом времени пребывания или слияния , которое оценивается как внутривидовое генетическое разнообразие, деленное на скорость мутаций , что дает эффективный размер слияния популяции . [5] Другой важный эффективный размер популяции — это эффективный размер популяции отбора 1/s критический , где s критический — критическое значение коэффициента отбора , при котором отбор становится более важным, чем генетический дрейф . [6]
В популяциях дрозофилы размером 16 переписи эффективный размер популяции дисперсии был измерен как равный 11,5. [7] Это измерение было достигнуто путем изучения изменений частоты нейтрального аллеля от одного поколения к другому в более чем 100 повторных популяциях.
Для объединенных эффективных размеров популяций обзор публикаций по 102 видам животных и растений, в основном диких животных, дал 192 отношения N e / N. В обзорных исследованиях использовалось семь различных методов оценки. Соответственно, соотношения варьировались в широком диапазоне от 10 -6 для тихоокеанских устриц до 0,994 для человека, в среднем 0,34 для исследованных видов. На основе этих данных они впоследствии оценили более полные соотношения, учитывающие колебания численности населения, различия в размерах семей и неравное соотношение полов. Эти соотношения в среднем составляют всего 0,10-0,11. [8]
Генеалогический анализ людей-охотников-собирателей ( эскимосов ) определил соотношение численности эффективной и переписной популяции для гаплоидных (митохондриальная ДНК, ДНК Y-хромосомы) и диплоидных (аутосомная ДНК) локусов отдельно: отношение эффективной популяции к переписной. размер оценивался как 0,6–0,7 для аутосомной и Х-хромосомной ДНК, 0,7–0,9 для митохондриальной ДНК и 0,5 для Y-хромосомной ДНК. [9]
В идеализированной популяционной модели Райта-Фишера условная дисперсия частоты аллеля с учетом частоты аллеля в предыдущем поколении равна
Пусть обозначает ту же самую, обычно большую, дисперсию в фактической рассматриваемой совокупности. Эффективный размер популяции дисперсии определяется как размер идеализированной популяции с той же дисперсией. Это находится путем замены и решения, что дает
В следующих примерах одно или несколько предположений о строго идеализированной популяции смягчаются, в то время как другие предположения сохраняются. Затем рассчитывается эффективный размер дисперсии более мягкой модели популяции по отношению к строгой модели.
Размер популяции меняется с течением времени. Предположим, что существует t непересекающихся поколений , тогда эффективный размер популяции определяется средним гармоническим размером популяции: [10]
Например, предположим, что размер популяции составлял N = 10, 100, 50, 80, 20, 500 для шести поколений ( t = 6). Тогда эффективный размер популяции представляет собой среднее гармоническое из них, что дает:
Обратите внимание, что это меньше среднего арифметического размера популяции, которое в этом примере составляет 126,7. В среднем гармоническом, как правило, доминирует наименьшее узкое место , через которое проходит популяция.
Если популяция раздельнополая , то есть самооплодотворения нет , то
или в более общем смысле,
где D представляет раздельнополость и может принимать значение 0 (не раздельнополый) или 1 (раздельнополый).
Когда N велико, N e приблизительно равно N , поэтому это обычно тривиально и часто игнорируется:
Чтобы размер популяции оставался постоянным, каждая особь должна передать в следующее поколение в среднем две гаметы . Идеализированная популяция предполагает, что это соответствует распределению Пуассона , так что дисперсия числа внесенных гамет k равна среднему числу внесенных гамет, т. е. 2:
Однако в природных популяциях дисперсия часто превышает эту величину. Подавляющее большинство особей может не иметь потомства, а следующее поколение происходит лишь от небольшого числа особей, поэтому
Тогда эффективный размер популяции будет меньше и будет определяться следующим образом:
Обратите внимание, что если дисперсия k меньше 2, N e больше N . В крайнем случае, когда в популяции нет различий в размере семьи, в лабораторной популяции, в которой число потомков искусственно контролируется, V k = 0 и N e = 2 N .
Когда соотношение полов в популяции отличается от соотношения Фишера 1:1, эффективный размер популяции определяется следующим образом:
Где N m — количество самцов, а N f — количество самок. Например, с 80 мужчинами и 20 женщинами (абсолютная численность населения 100 человек):
Опять же, это приводит к тому, что N e становится меньше N .
Альтернативно, эффективный размер популяции можно определить, отметив, как средний коэффициент инбридинга меняется от одного поколения к другому, а затем определив N e как размер идеализированной популяции, которая имеет такое же изменение среднего коэффициента инбридинга, что и рассматриваемая популяция. . Презентация следует за Кемпторном (1957). [11]
Для идеализированной популяции коэффициенты инбридинга подчиняются рекуррентному уравнению
Используя панмиктический индекс (1 − F ) вместо коэффициента инбридинга, получаем приближенное рекуррентное уравнение
Разница в каждом поколении
Эффективный размер инбридинга можно найти, решив
Это
хотя исследователи редко используют это уравнение напрямую.
Когда организмы живут дольше одного сезона размножения, эффективные размеры популяции должны учитывать таблицы смертности вида.
Предположим, что это гаплоидная популяция с дискретной возрастной структурой. Примером может быть организм, который может пережить несколько отдельных сезонов размножения. Далее определим следующие характеристики возрастной структуры:
Время генерации рассчитывается как
Тогда эффективный размер популяции инбридинга равен [12]
Аналогичным образом можно рассчитать эффективное число инбридинга для диплоидной популяции с дискретной возрастной структурой. Впервые это было дано Джонсоном [13] , но обозначения больше напоминают Эмига и Поллака. [14]
Предположим, что для таблицы смертности используются те же основные параметры, что и для гаплоидного случая, но с различием между мужчинами и женщинами, например, N 0 ƒ и N 0 m для количества новорожденных самок и самцов соответственно (обратите внимание на нижний регистр ƒ для самок, по сравнению с заглавной буквой F для инбридинга).
Эффективное число инбридинга равно
Согласно нейтральной теории молекулярной эволюции , нейтральный аллель сохраняется в популяции на протяжении поколений Ne, где Ne — эффективный размер популяции. Идеализированная диплоидная популяция будет иметь попарное нуклеотидное разнообразие , равное 4 Ne, где – частота мутаций. Таким образом, эффективный размер популяции пребывания может быть оценен эмпирически путем деления разнообразия нуклеотидов на скорость мутаций. [5]
Эффективный размер слияния может иметь мало отношения к количеству особей, физически присутствующих в популяции. [15] Измеренные размеры эффективной коалесцентной популяции различаются между генами в одной и той же популяции: низкие в областях генома с низкой рекомбинацией и высокие в областях генома с высокой рекомбинацией. [16] [17] Время пребывания пропорционально N в нейтральной теории, но для аллелей, находящихся в стадии отбора, время пребывания пропорционально log(N). Генетический автостоп может привести к тому, что время пребывания нейтральных мутаций будет пропорционально log(N): это может объяснить взаимосвязь между измеренным эффективным размером популяции и скоростью локальной рекомбинации. [ нужна цитата ]
В идеализированной модели Райта-Фишера судьба аллели, начиная с промежуточной частоты, в значительной степени определяется отбором, если коэффициент отбора s ≫ 1/N, и в значительной степени определяется нейтральным генетическим дрейфом, если s ≪ 1/N. В реальных популяциях пороговое значение s может вместо этого зависеть от скорости локальной рекомбинации. [6] [18] Этот предел отбора в реальной популяции можно отразить в игрушечном моделировании Райта-Фишера посредством соответствующего выбора Ne. По прогнозам, популяции с разными эффективными размерами отбора разовьют совершенно разные архитектуры генома. [19] [20]