Эффективный размер популяции ( N e ) — это размер идеализированной популяции , которая будет испытывать ту же скорость генетического дрейфа, что и реальная популяция. Эффективный размер популяции обычно меньше, чем размер популяции переписи N , отчасти потому, что случайные события не позволяют некоторым особям размножаться, а отчасти из-за фонового отбора и генетического автостопа . Идеализированные популяции основаны на нереалистичных, но удобных предположениях, включая случайное спаривание, редкость естественного отбора, так что каждый ген эволюционирует независимо , и постоянный размер популяции. [1]
Одна и та же реальная популяция может иметь разный эффективный размер популяции для разных свойств, представляющих интерес, таких как генетический дрейф в течение одного поколения по сравнению с дрейфом в течение многих поколений, и разный эффективный размер популяции в разных местах генома. Эффективный размер популяции чаще всего измеряется относительно времени коалесценции . В идеализированной диплоидной популяции без отбора в любом локусе ожидание времени коалесценции в поколениях равно удвоенному размеру популяции переписи. Эффективный размер популяции измеряется на основе генетических данных как внутривидовое генетическое разнообразие, деленное на четырехкратную частоту мутаций , поскольку в такой идеализированной популяции гетерозиготность равна . В популяции с отбором во многих локусах и обильным неравновесием по сцеплению эффективный размер популяции коалесценции может вообще не отражать размер популяции переписи или может отражать его логарифм.
Понятие эффективной численности популяции было введено в область популяционной генетики в 1931 году американским генетиком Сьюэллом Райтом . [2] [3] Некоторые версии эффективной численности популяции используются в охране дикой природы.
В зависимости от интересующей величины эффективный размер популяции может быть определен несколькими способами. Рональд Фишер и Сьюэлл Райт первоначально определили его как «количество размножающихся особей в идеализированной популяции , которые показали бы ту же величину дисперсии частот аллелей при случайном генетическом дрейфе или ту же величину инбридинга , что и рассматриваемая популяция». В более общем смысле эффективный размер популяции может быть определен как количество особей в идеализированной популяции, которая имеет значение любой заданной генетической величины популяции, равное значению этой величины в интересующей популяции. Две генетические величины популяции, определенные Райтом, были однопоколенным увеличением дисперсии между репликационными популяциями (дисперсия эффективного размера популяции) и однопоколенным изменением коэффициента инбридинга (инбридинг эффективного размера популяции) . Эти две тесно связаны и выведены из F-статистики , но они не идентичны. [4]
Сегодня эффективный размер популяции обычно оценивается эмпирически по отношению ко времени пребывания или коалесценции , которое оценивается как внутривидовое генетическое разнообразие, деленное на скорость мутаций , что дает эффективный размер коалесценции . [5] Другим важным эффективным размером популяции является селекционный эффективный размер популяции 1/s critical , где s critical — критическое значение коэффициента отбора, при котором отбор становится важнее генетического дрейфа . [6]
В популяциях Drosophila численностью 16 особей эффективный размер популяции дисперсии был измерен равным 11,5. [7] Это измерение было достигнуто путем изучения изменений частоты нейтрального аллеля от одного поколения к другому в более чем 100 повторных популяциях.
Для коалесцентных эффективных размеров популяции обзор публикаций по 102 в основном диким видам животных и растений дал 192 отношения N e / N. В обследованных исследованиях использовались семь различных методов оценки. Соответственно, отношения варьировались в широких пределах от 10 -6 для тихоокеанских устриц до 0,994 для людей, со средним значением 0,34 по исследованным видам. Основываясь на этих данных, они впоследствии оценили более всеобъемлющие отношения, учитывающие колебания в размере популяции, дисперсию в размере семьи и неравное соотношение полов. Эти отношения в среднем составляют всего 0,10-0,11. [8]
Генеалогический анализ людей-охотников-собирателей ( эскимосов ) определил соотношение эффективной численности популяции к переписной для гаплоидных (митохондриальная ДНК, ДНК Y-хромосомы) и диплоидных (аутосомная ДНК) локусов отдельно: соотношение эффективной численности популяции к переписной было оценено как 0,6–0,7 для аутосомной и X-хромосомной ДНК, 0,7–0,9 для митохондриальной ДНК и 0,5 для ДНК Y-хромосомы. [9]
В идеализированной модели популяции Райта-Фишера условная дисперсия частоты аллеля , учитывая частоту аллеля в предыдущем поколении, равна
Пусть обозначает ту же самую, обычно большую, дисперсию в фактической рассматриваемой популяции. Эффективный размер популяции дисперсии определяется как размер идеализированной популяции с той же дисперсией. Это находится путем подстановки и решения для , что дает
В следующих примерах одно или несколько предположений строго идеализированной популяции смягчаются, в то время как другие предположения сохраняются. Затем рассчитывается дисперсия эффективного размера популяции более смягченной модели популяции относительно строгой модели.
Размер популяции меняется со временем. Предположим, что есть t неперекрывающихся поколений , тогда эффективный размер популяции определяется гармоническим средним размеров популяции: [10]
Например, предположим, что размер популяции был N = 10, 100, 50, 80, 20, 500 для шести поколений ( t = 6). Тогда эффективный размер популяции является гармоническим средним этих значений, что дает:
Обратите внимание, что это меньше, чем арифметическое среднее размера популяции, которое в этом примере равно 126,7. Гармоническое среднее имеет тенденцию доминировать по наименьшему узкому месту , через которое проходит популяция.
Если популяция раздельнополая , т.е. самооплодотворение отсутствует, то
или в более общем смысле,
где D представляет собой двудомность и может принимать значение 0 (для не двудомного растения) или 1 для двудомного растения.
Когда N велико, N e приблизительно равно N , поэтому это обычно тривиально и часто игнорируется:
Если размер популяции должен оставаться постоянным, каждая особь должна в среднем отдавать две гаметы следующему поколению. Идеализированная популяция предполагает, что это следует распределению Пуассона, так что дисперсия числа отданных гамет, k , равна среднему числу отданных гамет, т. е. 2:
Однако в естественных популяциях дисперсия часто больше. Подавляющее большинство особей может не иметь потомства, и следующее поколение происходит только от небольшого числа особей, поэтому
Эффективная численность популяции тогда меньше и определяется по формуле:
Обратите внимание, что если дисперсия k меньше 2, то N e больше N. В крайнем случае популяции, не испытывающей никаких изменений в размере семьи, в лабораторной популяции, в которой количество потомков контролируется искусственно, V k = 0 и N e = 2 N.
Когда соотношение полов в популяции отличается от фишеровского 1:1, эффективная численность популяции определяется по формуле:
Где N m — количество мужчин, а N f — количество женщин. Например, при 80 мужчинах и 20 женщинах (абсолютный размер популяции 100):
Опять же, это приводит к тому, что N e меньше N .
В качестве альтернативы эффективный размер популяции можно определить, отметив, как средний коэффициент инбридинга изменяется от поколения к поколению, а затем определив N e как размер идеализированной популяции, которая имеет такое же изменение среднего коэффициента инбридинга, как и рассматриваемая популяция. Представление следует Кемпторну (1957). [11]
Для идеализированной популяции коэффициенты инбридинга следуют рекуррентному уравнению
Используя панмиктический индекс (1 − F ) вместо коэффициента инбридинга, мы получаем приближенное рекуррентное уравнение
Разница на поколение составляет
Эффективный размер инбридинга можно найти, решив
Это
хотя исследователи редко используют это уравнение напрямую.
Если организмы живут дольше одного сезона размножения, эффективные размеры популяции должны учитывать таблицы продолжительности жизни для данного вида.
Предположим, что существует гаплоидная популяция с дискретной возрастной структурой. Примером может служить организм, способный пережить несколько дискретных сезонов размножения. Далее определите следующие характеристики возрастной структуры:
Время генерации рассчитывается как
Тогда эффективный размер популяции при инбридинге составит [12]
Аналогично, эффективное число инбридинга может быть рассчитано для диплоидной популяции с дискретной возрастной структурой. Впервые это было дано Джонсоном, [13], но обозначение больше напоминает Эмига и Поллака. [14]
Предположим, что для таблицы смертности используются те же основные параметры, что и для гаплоидного случая, но с разграничением между самцами и самками, например, N 0 ƒ и N 0 m для числа новорожденных самок и самцов соответственно (обратите внимание на строчную букву ƒ для самок по сравнению с заглавной буквой F для инбридинга).
Эффективное число инбридинга составляет
Согласно нейтральной теории молекулярной эволюции , нейтральный аллель сохраняется в популяции в течение Ne поколений, где Ne — эффективный размер популяции. Идеализированная диплоидная популяция будет иметь попарное нуклеотидное разнообразие, равное 4 Ne, где — скорость мутации. Эффективный размер популяции пребывания, таким образом, можно оценить эмпирически, разделив нуклеотидное разнообразие на скорость мутации. [5]
Эффективный размер коалесценции может иметь мало отношения к числу особей, физически присутствующих в популяции. [15] Измеренные эффективные размеры популяции коалесценции различаются между генами в одной и той же популяции, будучи низкими в областях генома с низкой рекомбинацией и высокими в областях генома с высокой рекомбинацией. [16] [17] Время пребывания пропорционально N в нейтральной теории, но для аллелей, находящихся под отбором, время пребывания пропорционально log(N). Генетический автостоп может привести к тому, что нейтральные мутации будут иметь время пребывания, пропорциональное log(N): это может объяснить связь между измеренным эффективным размером популяции и локальной скоростью рекомбинации. [ необходима цитата ]
В идеализированной модели Райта-Фишера судьба аллеля, начиная с промежуточной частоты, в значительной степени определяется отбором, если коэффициент отбора s ≫ 1/N, и в значительной степени определяется нейтральным генетическим дрейфом, если s ≪ 1/N. В реальных популяциях пороговое значение s может зависеть вместо этого от локальных скоростей рекомбинации. [6] [18] Этот предел отбора в реальной популяции может быть зафиксирован в игрушечной симуляции Райта-Фишера посредством соответствующего выбора Ne. Популяции с различными эффективными для отбора размерами популяций, как прогнозируется, будут развивать совершенно разные архитектуры генома. [19] [20]