Количественная генетика изучает количественные признаки , представляющие собой непрерывно изменяющиеся фенотипы , такие как рост или масса, в отличие от фенотипов и продуктов генов, которые можно идентифицировать дискретно , например, цвет глаз или наличие определенного биохимического вещества.
Обе эти ветви генетики используют частоты различных аллелей гена в размножающихся популяциях (гамодемы) и объединяют их с концепциями простого менделевского наследования для анализа закономерностей наследования в поколениях и линиях потомков. В то время как популяционная генетика может фокусироваться на конкретных генах и их последующих метаболических продуктах, количественная генетика больше фокусируется на внешних фенотипах и делает только резюме базовой генетики.
Из-за непрерывного распределения фенотипических значений количественная генетика должна использовать множество других статистических методов (таких как размер эффекта , среднее значение и дисперсия ), чтобы связать фенотипы (атрибуты) с генотипами. Некоторые фенотипы могут быть проанализированы либо как дискретные категории, либо как непрерывные фенотипы, в зависимости от определения точек отсечения или от метрики, используемой для их количественной оценки. [1] : 27–69 Сам Мендель должен был обсудить этот вопрос в своей знаменитой статье, [2] особенно в отношении его атрибута гороха высокий/карликовый , который на самом деле был получен путем добавления точки отсечения к «длине стебля». [3] [4] Анализ локусов количественных признаков , или QTL, [5] [6] [7] является более поздним дополнением к количественной генетике, связывающим ее более непосредственно с молекулярной генетикой .
В диплоидных организмах среднее генотипическое «значение» (значение локуса) может определяться «эффектом» аллеля вместе с эффектом доминирования , а также тем, как гены взаимодействуют с генами в других локусах ( эпистаз ). Основатель количественной генетики — сэр Рональд Фишер — многое из этого понимал, когда предложил первую математику этой ветви генетики. [8]
Будучи статистиком, он определил эффекты генов как отклонения от центрального значения, что позволило использовать статистические концепции, такие как среднее значение и дисперсия, которые используют эту идею. [9] Центральным значением, которое он выбрал для гена, была средняя точка между двумя противоположными гомозиготами в одном локусе. Отклонение оттуда к «большему» гомозиготному генотипу можно назвать « +a »; и поэтому это « -a » от той же самой средней точки к «меньшему» гомозиготному генотипу. Это эффект «аллеля», упомянутый выше. Отклонение гетерозиготы от той же самой средней точки можно назвать « d », это эффект «доминирования», упомянутый выше. [10] Диаграмма иллюстрирует эту идею. Однако в действительности мы измеряем фенотипы, и рисунок также показывает, как наблюдаемые фенотипы соотносятся с эффектами генов. Формальные определения этих эффектов признают этот фенотипический фокус. [11] [12] Эпистаз рассматривался статистически как взаимодействие (т.е. несоответствия), [13] но эпигенетика предполагает, что может потребоваться новый подход.
Если 0 < d < a , доминирование считается частичным или неполным — тогда как d = a указывает на полное или классическое доминирование. Ранее d > a было известно как «сверхдоминирование». [14]
Атрибут гороха Менделя «длина стебля» дает нам хороший пример. [3] Мендель заявил, что высокие чистопородные родители имели длину стебля от 6 до 7 футов (183 – 213 см), что дает медиану 198 см (= P1). Низкорослые родители имели длину стебля от 0,75 до 1,25 футов (23 – 46 см), с округленной медианой 34 см (= P2). Их гибрид имел длину от 6 до 7,5 футов (183–229 см), с медианой 206 см (= F1). Среднее значение P1 и P2 составляет 116 см, что является фенотипическим значением средней точки гомозиготы (mp). Влияние аллеля ( a ) равно [P1-mp] = 82 см = -[P2-mp]. Эффект доминирования ( d ) равен [F1-mp] = 90 см. [15] Этот исторический пример наглядно иллюстрирует, как связаны значения фенотипа и эффекты генов.
Для получения средних значений, дисперсий и других статистических данных требуются как величины , так и их появления . Эффекты генов (выше) обеспечивают основу для величин : а частоты контрастных аллелей в пуле гамет оплодотворения предоставляют информацию о появлениях .
Обычно частота аллеля, вызывающего «больше» в фенотипе (включая доминирование), обозначается символом p , в то время как частота контрастирующего аллеля — q . Первоначальное предположение, сделанное при установлении алгебры, состояло в том, что родительская популяция была бесконечной, а спаривание — случайным, что было сделано просто для облегчения вывода. Последующее математическое развитие также подразумевало, что распределение частот в эффективном пуле гамет было равномерным: не было локальных возмущений, где p и q варьировались. Рассматривая диаграммный анализ полового размножения, это то же самое, что объявить, что p P = p g = p ; и аналогично для q . [14] Эта система спаривания, зависящая от этих предположений, стала известна как «панмиксия».
Панмиксия редко встречается в природе, [16] : 152–180 [17], поскольку распределение гамет может быть ограничено, например, ограничениями рассеивания или поведением, или случайной выборкой (теми локальными возмущениями, которые упоминались выше). Хорошо известно, что в природе существует огромная потеря гамет, поэтому на диаграмме потенциальный пул гамет изображен отдельно от фактического пула гамет. Только последний устанавливает окончательные частоты для зигот: это истинная «гамодема» («гамо» относится к гаметам, а «дема» происходит от греческого слова «популяция»). Но, согласно предположениям Фишера, гамодема может быть эффективно расширена обратно к потенциальному пулу гамет и даже обратно к родительской базовой популяции («исходной» популяции). Случайная выборка, возникающая при отборе небольших «фактических» пулов гамет из большого «потенциального» пула гамет, известна как генетический дрейф и рассматривается далее.
Хотя панмиксия может и не быть широко распространенной, потенциал для нее существует, хотя он может быть только эфемерным из-за этих локальных возмущений. Было показано, например, что F2, полученный в результате случайного оплодотворения особей F1 ( аллогамный F2), после гибридизации, является источником новой потенциально панмиктической популяции. [18] [19] Было также показано, что если бы панмиктическое случайное оплодотворение происходило непрерывно, оно поддерживало бы те же самые частоты аллелей и генотипов в каждом последующем панмиктическом половом поколении — это и есть равновесие Харди Вайнберга . [13] : 34–39 [20] [21] [22] [23] Однако, как только генетический дрейф был инициирован локальной случайной выборкой гамет, равновесие прекратилось бы.
Обычно считается, что мужские и женские гаметы в фактическом оплодотворяющем пуле имеют одинаковые частоты для соответствующих им аллелей. (Исключения были рассмотрены.) Это означает, что когда p мужских гамет, несущих аллель A , случайным образом оплодотворяют p женских гамет, несущих тот же аллель, результирующая зигота имеет генотип AA , и при случайном оплодотворении комбинация происходит с частотой p x p (= p 2 ). Аналогично, зигота aa встречается с частотой q 2 . Гетерозиготы ( Aa ) могут возникать двумя способами: когда p мужских ( аллель A ) случайным образом оплодотворяют q женских ( аллель a ) гамет, и наоборот . Результирующая частота для гетерозиготных зигот составляет, таким образом, 2pq . [13] : 32 Обратите внимание, что такая популяция никогда не бывает более чем наполовину гетерозиготной, этот максимум достигается при p = q = 0,5.
Подводя итог, можно сказать, что при случайном оплодотворении частоты зигот (генотипов) представляют собой квадратичное расширение гаметических (аллельных) частот: . («=1» означает, что частоты выражены в дробной форме, а не в процентах; и что в предлагаемой структуре нет никаких пропусков.)
Обратите внимание, что «случайное оплодотворение» и «панмиксия» не являются синонимами.
Эксперименты Менделя с горохом были построены путем установления чистопородных родителей с «противоположными» фенотипами для каждого признака. [3] Это означало, что каждый противоположный родитель был гомозиготен только по своему соответствующему аллелю. В нашем примере «высокий против карлика» высокий родитель будет иметь генотип TT с p = 1 (и q = 0 ); в то время как карликовый родитель будет иметь генотип tt с q = 1 (и p = 0 ). После контролируемого скрещивания их гибрид — Tt , с p = q = 1/2 . Однако частота этой гетерозиготы = 1 , поскольку это F1 искусственного скрещивания: оно не возникло в результате случайного оплодотворения. [24] Поколение F2 было получено путем естественного самоопыления F1 (с контролем за загрязнением насекомыми), что привело к p = q = 1/2 поддерживается. Такой F2 называется «автогамным». Однако частоты генотипов (0,25 TT , 0,5 Tt , 0,25 tt ) возникли в результате системы спаривания, сильно отличающейся от случайного оплодотворения, и поэтому использование квадратичного расширения было исключено. Полученные числовые значения были такими же, как и для случайного оплодотворения, только потому, что это особый случай изначального скрещивания гомозиготных противоположных родителей. [25] Мы можем заметить, что из-за доминирования T- [частота (0,25 + 0,5)] над tt [частота 0,25] соотношение 3:1 все еще получается.
Скрещивание, подобное скрещиванию Менделя, где чистопородные (в основном гомозиготные) противоположные родители скрещиваются контролируемым образом для получения F1, является особым случаем гибридной структуры. F1 часто рассматривается как «полностью гетерозиготный» для рассматриваемого гена. Однако это чрезмерное упрощение и не применяется в целом — например, когда отдельные родители не являются гомозиготными или когда популяции скрещиваются между собой, образуя гибридные рои . [24] Общие свойства внутривидовых гибридов (F1) и F2 (как «автогамных», так и «аллогамных») рассматриваются в следующем разделе.
Заметив, что горох является естественным самоопыляемым, мы не можем продолжать использовать его в качестве примера для иллюстрации свойств случайного оплодотворения. Самооплодотворение («самоопыление») является основной альтернативой случайному оплодотворению, особенно в растениях. Большинство злаков Земли являются естественными самоопыляемыми (например, рис, пшеница, ячмень), а также бобовые. Учитывая миллионы особей каждого из них на Земле в любое время, очевидно, что самооплодотворение по крайней мере так же значимо, как и случайное оплодотворение. Самооплодотворение является наиболее интенсивной формой инбридинга , которая возникает всякий раз, когда существует ограниченная независимость в генетическом происхождении гамет. Такое снижение независимости возникает, если родители уже связаны родством, и/или из-за генетического дрейфа или других пространственных ограничений на распространение гамет. Анализ пути показывает, что это равносильно одному и тому же. [26] [27] Исходя из этого, коэффициент инбридинга (часто обозначаемый как F или f ) количественно определяет эффект инбридинга по любой причине. Существует несколько формальных определений f , и некоторые из них рассматриваются в последующих разделах. В настоящее время отметим, что для долгосрочного самооплодотворяющегося вида f = 1 . Однако естественные самооплодотворяющиеся популяции не являются отдельными « чистыми линиями », а представляют собой смеси таких линий. Это становится особенно очевидным при рассмотрении более одного гена одновременно. Поэтому частоты аллелей ( p и q ), отличные от 1 или 0 , по-прежнему актуальны в этих случаях (см. раздел «Скрещивание Менделя»). Однако частоты генотипов принимают другую форму.
В целом, частоты генотипов становятся для АА и для Аа и для аа . [13] : 65
Обратите внимание, что частота гетерозиготы уменьшается пропорционально f . Когда f = 1 , эти три частоты становятся соответственно p , 0 и q. Наоборот, когда f = 0 , они сводятся к квадратичному расширению случайного оплодотворения, показанному ранее.
Среднее значение популяции смещает центральную опорную точку от гомозиготной средней точки ( mp ) к среднему значению популяции, размножающейся половым путем. Это важно не только для перемещения фокуса в естественный мир, но и для использования меры центральной тенденции, используемой статистикой/биометрией. В частности, квадрат этого среднего значения является поправочным коэффициентом, который используется для получения генотипических дисперсий позже. [9]
Для каждого генотипа в свою очередь его аллельный эффект умножается на частоту его генотипа; и продукты накапливаются по всем генотипам в модели. Обычно следует некоторое алгебраическое упрощение, чтобы достичь краткого результата.
Вклад AA равен , вклад Aa равен , а вклад aa равен . Собирая вместе два члена a и накапливая по всем, получаем: . Упрощение достигается за счет того, что , и вспоминая, что , тем самым сводя правый член к .
Таким образом, краткий результат таков . [14] : 110
Это определяет среднее значение популяции как «смещение» от гомозиготной средней точки (напомним, что a и d определяются как отклонения от этой средней точки). На рисунке изображен G при всех значениях p для нескольких значений d , включая один случай небольшого сверхдоминирования. Обратите внимание, что G часто бывает отрицательным, тем самым подчеркивая, что он сам по себе является отклонением (от mp ).
Наконец, чтобы получить фактическое среднее значение популяции в «фенотипическом пространстве», к этому смещению добавляется значение средней точки: .
Пример возникает из данных о длине початка кукурузы. [28] : 103 Предположим на данный момент, что представлен только один ген, a = 5,45 см, d = 0,12 см [фактически «0», на самом деле], mp = 12,05 см. Далее предположим, что p = 0,6 и q = 0,4 в этой примерной популяции, тогда:
G = 5,45 (0,6 − 0,4) + (0,48)0,12 = 1,15 см (округленно); и
P = 1,15 + 12,05 = 13,20 см (округленно).
Вклад AA равен , тогда как вклад aa равен . [Частоты см. выше.] Объединение этих двух членов a приводит к очень простому конечному результату:
. Как и прежде, .
Часто «G (f=1) » сокращается до «G 1 ».
Горох Менделя может предоставить нам аллельные эффекты и среднюю точку (см. ранее); а смешанная самоопыляемая популяция с p = 0,6 и q = 0,4 дает примеры частот. Таким образом:
G (f=1) = 82 (0,6 − .04) = 59,6 см (округленно); и
P (f=1) = 59,6 + 116 = 175,6 см (округленно).
Общая формула включает коэффициент инбридинга f и может затем приспособиться к любой ситуации. Процедура точно такая же, как и раньше, с использованием взвешенных частот генотипов, данных ранее. После перевода в наши символы и дальнейшей перестановки: [13] : 77–78
Здесь G 0 — это G , который был дан ранее. (Часто, когда речь идет об инбридинге, «G 0 » предпочтительнее, чем «G».)
Предположим, что пример с кукурузой [приведенный ранее] был ограничен холмом (узким прибрежным лугом) и имел частичный инбридинг в пределах f = 0,25 , тогда, используя третью версию (выше) G f :
G 0,25 = 1,15 − 0,25 (0,48) 0,12 = 1,136 см (округленно), где P 0,25 = 13,194 см (округленно).
В этом примере инбридинг едва ли оказывает какое-либо влияние, поскольку в этом атрибуте фактически не было доминирования ( d → 0). Изучение всех трех версий G f показывает, что это привело бы к незначительному изменению в среднем значении популяции. Однако там, где доминирование было заметным, изменения были бы значительными.
Генетический дрейф был введен при обсуждении вероятности того, что панмиксия широко распространена как естественный шаблон оплодотворения. [См. раздел о частотах аллелей и генотипов.] Здесь выборка гамет из потенциальной гамодемы обсуждается более подробно. Выборка включает случайное оплодотворение между парами случайных гамет, каждая из которых может содержать либо аллель A , либо a . Таким образом, выборка является биномиальной. [13] : 382–395 [14] : 49–63 [29] : 35 [30] : 55 Каждый «пакет» выборки включает 2N аллелей и в результате производит N зигот («потомство» или «линию»). В течение репродуктивного периода эта выборка повторяется снова и снова, так что конечный результат представляет собой смесь выборочных потомков. Результатом является рассеянное случайное оплодотворение . Эти события и общий конечный результат рассматриваются здесь с помощью иллюстративного примера.
Частоты аллелей «базы» примера соответствуют частотам потенциальной гамодемы : частота A равна p g = 0,75 , в то время как частота a равна q g = 0,25 . [ Белая метка « 1 » на диаграмме.] Пять примеров фактических гамодем биномиально выбраны из этой базы ( s = количество образцов = 5), и каждый образец обозначен «индексом» k : при k = 1 .... s последовательно. (Это «пакеты» выборки, упомянутые в предыдущем абзаце.) Количество гамет, участвующих в оплодотворении, варьируется от образца к образцу и указано как 2N k [на белой метке « 2 » на диаграмме]. Общее (Σ) количество отобранных гамет составляет 52 [ белая метка « 3 » на диаграмме]. Поскольку каждый образец имеет свой собственный размер, необходимы веса для получения средних значений (и других статистических данных) при получении общих результатов. Они указаны на белой метке « 4 » на диаграмме.
После завершения этих пяти событий биномиальной выборки, полученные фактические гамодемы содержали разные частоты аллелей — ( p k и q k ). [Они приведены на белой метке " 5 " на диаграмме.] Этот результат на самом деле является самим генетическим дрейфом. Обратите внимание, что два образца (k = 1 и 5) случайно имеют те же частоты, что и базовый ( потенциальный ) гамодема. Другой (k = 3) случайно имеет p и q "перевернуты". Образец (k = 2) случайно является "экстремальным" случаем с p k = 0,9 и q k = 0,1 ; в то время как оставшийся образец (k = 4) находится "в середине диапазона" по своим частотам аллелей. Все эти результаты возникли только "случайно", посредством биномиальной выборки. Однако, возникнув, они установили все последующие свойства потомков.
Поскольку выборка предполагает случайность, вероятности ( ∫ k ) получения каждого из этих образцов становятся интересными. Эти биномиальные вероятности зависят от начальных частот ( p g и q g ) и размера выборки ( 2N k ). Их получение утомительно, [13] : 382–395 [30] : 55, но они представляют значительный интерес. [См. белую метку " 6 " на диаграмме.] Два образца (k = 1, 5) с частотами аллелей, такими же, как в потенциальной гамодеме , имели более высокие "шансы" появления, чем другие образцы. Однако их биномиальные вероятности различались из-за разных размеров выборки (2N k ). "Обратный" образец (k = 3) имел очень низкую вероятность появления, что, возможно, подтверждает то, что можно было ожидать. Однако "экстремальная" частота аллелей гамодема (k = 2) не была "редкой"; и выборка "середины диапазона" (k=4) была редкой. Эти же вероятности применимы и к потомству этих оплодотворений.
Здесь можно начать подводить итоги . Общие частоты аллелей в потомстве представлены средневзвешенными значениями соответствующих частот отдельных образцов. То есть: и . (Обратите внимание, что k заменено на • для общего результата — обычная практика.) [9] Результаты для примера: p • = 0,631 и q • = 0,369 [ черная метка " 5 " на диаграмме]. Эти значения существенно отличаются от исходных ( p g и q g ) [ белая метка " 1 "]. Частоты аллелей выборки также имеют дисперсию, а также среднее значение. Это было получено с использованием метода суммы квадратов (SS) [31] [См. справа от черной метки " 5 " на диаграмме]. [Дальнейшее обсуждение этой дисперсии происходит в разделе ниже, посвященном обширному генетическому дрейфу.]
Частоты генотипов пяти образцов потомства получены из обычного квадратичного расширения их соответствующих частот аллелей ( случайное оплодотворение ). Результаты приведены на белой метке диаграммы " 7 " для гомозигот и на белой метке " 8 " для гетерозигот. Перегруппировка таким образом подготавливает путь для мониторинга уровней инбридинга. Это можно сделать либо путем изучения уровня общей гомозиготности [( p 2 k + q 2 k ) = ( 1 − 2p k q k )], либо путем изучения уровня гетерозиготности ( 2p k q k ), поскольку они являются комплементарными. [32] Обратите внимание, что образцы k = 1, 3, 5 все имели одинаковый уровень гетерозиготности, несмотря на то, что один из них является "зеркальным отражением" других относительно частот аллелей. Случай «экстремальной» частоты аллелей (k= 2 ) имел наибольшую гомозиготность (наименьшую гетерозиготность) среди всех образцов. Случай «середины диапазона» (k= 4 ) имел наименьшую гомозиготность (наибольшую гетерозиготность): фактически они оба были равны по 0,50.
Общее резюме может быть продолжено путем получения средневзвешенного значения соответствующих частот генотипов для основной массы потомства. Таким образом, для AA это , для Aa это и для aa это . Примеры результатов приведены на черной метке " 7 " для гомозигот и на черной метке " 8 " для гетерозигот. Обратите внимание, что среднее значение гетерозиготности составляет 0,3588 , что используется в следующем разделе для изучения инбридинга, возникающего в результате этого генетического дрейфа.
Следующий интерес представляет дисперсия, которая относится к «разбросу» средних значений популяции потомков . Они получены как [см. раздел о среднем значении популяции] для каждого образца потомства по очереди, используя примеры эффектов генов, приведенные на белой метке « 9 » на диаграмме. Затем каждый из них также получен [на белой метке « 10 » на диаграмме]. Обратите внимание, что «лучшая» линия (k = 2) имела самую высокую частоту аллеля для аллеля «больше» ( A ) (она также имела самый высокий уровень гомозиготности). Худшее потомство (k = 3) имело самую высокую частоту для аллеля «меньше» ( a ), что объясняет его плохие результаты. Эта «плохая» линия была менее гомозиготной, чем «лучшая» линия; и она разделяла тот же уровень гомозиготности, что и две вторые по качеству линии (k = 1, 5). Линия потомства с аллелями "больше" и "меньше", присутствующими с одинаковой частотой (k = 4), имела среднее значение ниже общего среднего (см. следующий абзац) и имела самый низкий уровень гомозиготности. Эти результаты показывают тот факт, что аллели, наиболее распространенные в "генофонде" (также называемом "зародышевой плазмой"), определяют производительность, а не уровень гомозиготности как таковой. Только биномиальная выборка влияет на эту дисперсию.
Теперь можно сделать общий вывод, получив и . Пример результата для P • составляет 36,94 ( черная метка " 10 " на диаграмме). Это позже используется для количественной оценки инбридинговой депрессии в целом, из выборки гамет. [См. следующий раздел.] Однако напомним, что некоторые "недепрессированные" средства потомства уже были идентифицированы (k = 1, 2, 5). Это загадка инбридинга — хотя может быть "депрессия" в целом, обычно есть превосходные линии среди выборок гамодемы.
В общую сводку были включены средние частоты аллелей в смеси линий потомства ( p • и q • ). Теперь их можно использовать для построения гипотетического панмиктического эквивалента. [13] : 382–395 [14] : 49–63 [29] : 35 Это можно рассматривать как «справочник» для оценки изменений, вызванных выборкой гамет. Пример добавляет такой панмиктический справа от диаграммы. Частота AA , таким образом, составляет (p • ) 2 = 0,3979. Это меньше, чем найдено в рассеянной массе (0,4513 на черной метке « 7 »). Аналогично, для aa , (q • ) 2 = 0,1303 — снова меньше, чем эквивалент в массе потомства (0,1898). Очевидно, что генетический дрейф увеличил общий уровень гомозиготности на величину (0,6411 − 0,5342) = 0,1069. В дополнительном подходе вместо этого можно было бы использовать гетерозиготность. Панмиктический эквивалент для Aa составляет 2 p • q • = 0,4658, что выше , чем в выборочной массе (0,3588) [ черная метка " 8 "]. Выборка привела к снижению гетерозиготности на 0,1070, что незначительно отличается от более ранней оценки из-за ошибок округления.
Коэффициент инбридинга ( f ) был введен в раннем разделе о самооплодотворении. Здесь рассматривается его формальное определение: f — вероятность того, что два «одинаковых» аллеля (то есть A и A или a и a ), которые оплодотворяются вместе, имеют общее предковое происхождение — или (более формально) f — вероятность того, что два гомологичных аллеля являются автозиготными. [14] [27] Рассмотрим любую случайную гамету в потенциальной гамодеме, у которой есть партнер по сингамии, ограниченный биномиальной выборкой. Вероятность того, что эта вторая гамета является гомологичной автозиготной первой, равна 1/(2N) , что является обратной величиной размера гамодемы. Для пяти примеров потомков эти величины равны 0,1, 0,0833, 0,1, 0,0833 и 0,125 соответственно, а их средневзвешенное значение равно 0,0961 . Это коэффициент инбридинга для выборки потомков примера, при условии, что он не смещен относительно полного биномиального распределения. Однако пример, основанный на s = 5 , скорее всего, будет смещенным по сравнению с соответствующим полным биномиальным распределением, основанным на числе выборки ( s ), стремящемся к бесконечности ( s → ∞ ). Другое выведенное определение f для полного распределения заключается в том, что f также равно росту гомозиготности, который равен падению гетерозиготности. [33] Для примера эти изменения частоты составляют 0,1069 и 0,1070 соответственно. Этот результат отличается от приведенного выше, указывая на то, что в примере присутствует смещение относительно полного базового распределения. Для самого примера эти последние значения являются лучшими для использования, а именно f • = 0,10695 .
Среднее значение популяции эквивалентного панмиктического эквивалента определяется как [a (p • -q • ) + 2 p • q • d] + mp . Используя пример эффектов гена ( белая метка " 9 " на диаграмме), это среднее значение равно 37,87. Эквивалентное среднее значение в рассеянной массе равно 36,94 ( черная метка " 10 "), что подавлено на величину 0,93 . Это инбридинговая депрессия от этого генетического дрейфа. Однако, как отмечалось ранее, три потомства не были подавлены (k = 1, 2, 5) и имели средние значения даже больше, чем у панмиктического эквивалента. Это линии, которые селекционер растений ищет в программе отбора линий. [34]
Если число биномиальных выборок велико ( s → ∞ ), то p • → p g и q • → q g . Можно задаться вопросом, возникнет ли панмиксия эффективно снова при этих обстоятельствах. Однако выборка частот аллелей все равно произошла , в результате чего σ 2 p, q ≠ 0 . [35] Фактически, когда s → ∞ , , что является дисперсией всего биномиального распределения . [13] : 382–395 [14] : 49–63 Более того, «уравнения Валунда» показывают, что частоты гомозигот по потомству могут быть получены как суммы их соответствующих средних значений ( p 2 • или q 2 • ) плюс σ 2 p, q . [13] : 382–395 Аналогично, частота гетерозигот в массе равна (2 p • q • ) минус удвоенная σ 2 p , q . Дисперсия , возникающая из - за биномиальной выборки, явно присутствует. Таким образом, даже когда s → ∞ , частоты генотипов в массе потомства все еще показывают повышенную гомозиготность и пониженную гетерозиготность , все еще существует дисперсия средних значений потомства , и все еще инбридинг и инбридинговая депрессия . То есть, панмиксия не восстанавливается после того, как была утрачена из-за генетического дрейфа (биномиальная выборка). Однако новая потенциальная панмиксия может быть инициирована через аллогамный F2 после гибридизации. [36]
Предыдущее обсуждение генетического дрейфа рассматривало только один цикл (поколение) процесса. Когда выборка продолжается в течение последовательных поколений, заметные изменения происходят в σ 2 p , q и f . Кроме того, необходим еще один «индекс» для отслеживания «времени»: t = 1 .... y , где y = количество рассматриваемых «лет» (поколений). Методология часто заключается в добавлении текущего биномиального приращения ( Δ = « de novo ») к тому, что произошло ранее. [13] Здесь рассматривается все биномиальное распределение. [Более подробную пользу из сокращенного примера извлечь не получится.]
Ранее эта дисперсия (σ 2 p,q [35] ) рассматривалась как:
С расширением во времени это также является результатом первого цикла, и так (для краткости). В цикле 2 эта дисперсия генерируется снова — на этот раз становясь дисперсией de novo ( ) — и накапливается до того, что уже присутствовало — дисперсии «переноса». Дисперсия второго цикла ( ) является взвешенной суммой этих двух компонентов, причем веса для de novo и = для «переноса».
Таким образом,
Расширение для обобщения на любое время t после значительного упрощения становится: [13] : 328 -
Поскольку именно это изменение частот аллелей вызвало «разброс» средних значений потомков ( дисперсию ), изменение σ2t на протяжении поколений указывает на изменение уровня дисперсии .
Метод проверки коэффициента инбридинга аналогичен методу, используемому для σ 2 p,q . Те же веса, что и раньше, используются соответственно для de novo f ( Δ f ) [напомним, что это 1/(2N) ] и переноса f . Следовательно, , что аналогично уравнению (1) в предыдущем подразделе.
В целом, после перестройки [13] Графики слева показывают уровни инбридинга на протяжении двадцати поколений, возникающие в результате генетического дрейфа для различных фактических размеров гамодемы (2N).
Дальнейшие перестановки этого общего уравнения выявляют некоторые интересные соотношения.
(A) После некоторого упрощения, [13] . Левая сторона — это разница между текущим и предыдущим уровнями инбридинга: изменение инбридинга ( δf t ). Обратите внимание, что это изменение инбридинга ( δf t ) равно инбридингу de novo ( Δf ) только для первого цикла — когда f t-1 равен нулю .
(B) Следует отметить (1-f t-1 ) , который является «индексом неинбридинга ». Он известен как панмиктический индекс . [13] [14] .
(C) Дополнительные полезные соотношения возникают с участием панмиктического индекса . [13] [14] . (D) Ключевая связь возникает между σ 2 p,q и f . Во-первых... [13] Во-вторых, предполагая, что f 0 = 0 , правая часть этого уравнения сводится к разделу в скобках уравнения (2) в конце последнего подраздела. То есть, если изначально нет инбридинга, ! Более того, если это затем переставить, . То есть, когда начальный инбридинг равен нулю, две основные точки зрения биномиальной выборки гамет (генетического дрейфа) напрямую взаимопревращаются.
Легко упустить из виду, что случайное оплодотворение включает самооплодотворение. Сьюэлл Райт показал, что доля 1/N случайных оплодотворений на самом деле является самооплодотворением , а остаток (N-1)/N является перекрестным оплодотворением . После анализа пути и упрощения было обнаружено, что новый взгляд на случайное оплодотворение инбридинга выглядит следующим образом: . [27] [37] После дальнейшей перегруппировки были подтверждены более ранние результаты биномиальной выборки, а также некоторые новые договоренности. Два из них были потенциально очень полезными, а именно: (A) ; и (B) .
Признание того, что самоопыление может по сути быть частью случайного оплодотворения, приводит к некоторым проблемам относительно использования предыдущего случайного оплодотворения «коэффициента инбридинга». Очевидно, что он не подходит для любого вида, неспособного к самооплодотворению , включая растения с механизмами самонесовместимости, двудомные растения и двуполых животных . Уравнение Райта было позже изменено, чтобы предоставить версию случайного оплодотворения, которая включала только перекрестное оплодотворение без самооплодотворения . Пропорция 1/N, ранее обусловленная самоопылением, теперь определяла перенос генного дрейфа инбридинга, возникающего из предыдущего цикла. Новая версия выглядит так: [13] : 166 .
Графики справа показывают различия между стандартным случайным оплодотворением RF и случайным оплодотворением, скорректированным для "только перекрестного оплодотворения" CF. Как можно видеть, проблема нетривиальна для небольших размеров выборки гамодема.
Теперь необходимо отметить, что не только «панмиксия» не является синонимом «случайного оплодотворения», но и «случайное оплодотворение» не является синонимом «перекрестного оплодотворения».
В подразделе «Выборка гамодемов – Генетический дрейф» была прослеживается серия выборок гамет, результатом которых стало увеличение гомозиготности за счет гетерозиготности. С этой точки зрения, рост гомозиготности был обусловлен выборками гамет. Уровни гомозиготности можно рассматривать также в соответствии с тем, возникли ли гомозиготы аллозиготно или аутозиготно. Напомним, что аутозиготные аллели имеют одинаковое аллельное происхождение, вероятность (частота) которого по определению является коэффициентом инбридинга ( f ) . Доля возникающих аллозиготно , следовательно, равна (1-f) . Для гамет, несущих A , которые присутствуют с общей частотой p , общая частота тех, которые являются аутозиготными, равна, следовательно, ( f p ). Аналогично, для гамет, несущих a , аутозиготная частота равна ( f q ). [38] Эти две точки зрения относительно частот генотипов должны быть связаны для установления согласованности.
Следуя, во-первых, точке зрения авто/алло , рассмотрим аллозиготный компонент. Это происходит с частотой (1-f) , и аллели объединяются в соответствии с квадратичным расширением случайного оплодотворения . Таким образом: Рассмотрим далее автозиготный компонент. Поскольку эти аллели являются автозиготными , они эффективно являются самоопылениями и производят либо генотипы AA , либо aa , но не гетерозиготы. Поэтому они производят гомозиготы "AA" плюс гомозиготы "aa" . Сложение этих двух компонентов дает: для гомозиготы AA ; для гомозиготы aa ; и для гетерозиготы Aa . [13] : 65 [14] Это то же самое уравнение, что было представлено ранее в разделе "Самооплодотворение - альтернатива". Причина снижения гетерозиготности здесь ясна. Гетерозиготы могут возникнуть только из аллозиготного компонента, и его частота в выборке составляет всего лишь (1-f) : следовательно, это также должен быть фактор, контролирующий частоту гетерозигот.
Во-вторых, пересматривается точка зрения выборки . Ранее было отмечено, что снижение гетерозигот было . Это снижение распределяется равномерно по отношению к каждой гомозиготе; и добавляется к их базовым ожиданиям случайного оплодотворения . Таким образом, частоты генотипов составляют: для гомозиготы "AA" ; для гомозиготы "aa" ; и для гетерозиготы.
В-третьих, необходимо установить согласованность между двумя предыдущими точками зрения. Сразу очевидно [из соответствующих уравнений выше], что частота гетерозигот одинакова в обеих точках зрения. Однако такой прямой результат не сразу очевиден для гомозигот. Начните с рассмотрения окончательного уравнения гомозиготы AA в параграфе auto/allo выше:- . Раскройте скобки и затем снова соберите [в результирующем] два новых члена с общим множителем f в них. Результат: . Затем для заключенного в скобки " p 2 0 ", a (1-q) заменяется на a p , результат становится . После этой замены остается простой вопрос умножения, упрощения и наблюдения за знаками. Конечный результат - , что в точности соответствует результату для AA в параграфе выборки . Таким образом, две точки зрения согласованы для гомозиготы AA . Аналогичным образом можно показать согласованность точек зрения aa . Обе точки зрения одинаковы для всех классов генотипов.
В предыдущих разделах дисперсионное случайное оплодотворение ( генетический дрейф ) было рассмотрено всесторонне, а самооплодотворение и гибридизация были изучены в разной степени. Диаграмма слева изображает первые два из них, а также другой «пространственно основанный» шаблон: острова . Это шаблон случайного оплодотворения, включающий в себя рассеянные гамодемы , с добавлением «перекрытий», в которых происходит недисперсионное случайное оплодотворение. При шаблоне островов индивидуальные размеры гамодем ( 2N ) являются наблюдаемыми, а перекрытия ( m ) минимальны. Это один из массивов возможностей Сьюэлла Райта. [37] В дополнение к «пространственно» основанным шаблонам оплодотворения, существуют и другие, основанные либо на «фенотипических», либо на «родственных» критериях. Фенотипические основы включают ассортативное оплодотворение (между схожими фенотипами) и неассортативное оплодотворение (между противоположными фенотипами). Модели родства включают скрещивание сибсов , кузенов и обратное скрещивание — и рассматриваются в отдельном разделе. Самооплодотворение может рассматриваться как с пространственной, так и с родственной точки зрения.
Размножающаяся популяция состоит из s небольших дисперсных случайных гамодем оплодотворения размера выборки ( k = 1 ... s ) с « перекрытиями » пропорции, в которой происходит недисперсное случайное оплодотворение . Дисперсионная пропорция , таким образом, равна . Основная популяция состоит из средневзвешенных размеров выборки, частот аллелей и генотипов и средних значений потомства, как это было сделано для генетического дрейфа в предыдущем разделе. Однако размер каждой выборки гамет уменьшается, чтобы учесть перекрытия , таким образом находя эффективное для .
Для краткости аргументация следует далее с опущенными нижними индексами. Напомним, что это в общем случае. [Здесь и далее 2N относится к ранее определенному размеру выборки, а не к какой-либо версии «с поправкой на острова».]
После упрощения [37] обратите внимание, что при m = 0 это сводится к предыдущему Δ f . Обратная величина этого дает оценку « эффективного для », упомянутого выше.
Этот Δf также подставляется в предыдущий коэффициент инбридинга , чтобы получить [37], где t — индекс по поколениям, как и прежде.
Эффективную пропорцию перекрытия можно получить также [37] как
Графики справа показывают инбридинг для размера гамодемы 2N = 50 для обычного рассеянного случайного оплодотворения (RF) (m = 0) и для четырех уровней перекрытия (m = 0,0625, 0,125, 0,25, 0,5) случайного оплодотворения островов . Действительно, наблюдалось снижение инбридинга в результате недисперсного случайного оплодотворения в перекрытиях. Это особенно заметно, поскольку m → 0,50 . Сьюэлл Райт предположил, что это значение должно быть пределом для использования этого подхода. [37]
Генная модель рассматривает путь наследования с точки зрения «входов» (аллели/гаметы) и «выходов» (генотипы/зиготы), при этом оплодотворение является «процессом», преобразующим одно в другое. Альтернативная точка зрения концентрируется на самом «процессе» и рассматривает генотипы зиготы как возникающие в результате перетасовки аллелей. В частности, она рассматривает результаты так, как если бы один аллель «заменил» другой во время перетасовки, вместе с остатком, который отклоняется от этой точки зрения. Это стало неотъемлемой частью метода Фишера [8] в дополнение к его использованию частот и эффектов для генерации его генетической статистики. [14] Далее следует дискурсивный вывод альтернативы замены аллелей . [14] : 113
Предположим, что обычное случайное оплодотворение гамет в «базовой» гамодеме, состоящей из p гамет ( A ) и q гамет ( a ), заменяется оплодотворением «потоком» гамет, содержащих один аллель ( A или a , но не оба). Зиготические результаты можно интерпретировать в терминах аллеля «потока», «заменившего» альтернативный аллель в базовой «базовой» гамодеме. Диаграмма помогает следовать этой точке зрения: верхняя часть изображает замену A , в то время как нижняя часть показывает замену a . («Аллель RF» диаграммы — это аллель в «базовой» гамодеме.)
Рассмотрим сначала верхнюю часть. Поскольку основание A присутствует с частотой p , заменитель A оплодотворяет его с частотой p , что приводит к образованию зиготы AA с аллельным эффектом a . Его вклад в результат, таким образом, равен произведению . Аналогично, когда заменитель оплодотворяет основание a (что приводит к Aa с частотой q и гетерозиготным эффектом d ), вклад равен . Общий результат замены на A , таким образом, равен . Теперь он ориентирован на среднее значение популяции [см. предыдущий раздел], выражая его как отклонение от этого среднего значения :
После некоторого алгебраического упрощения это становится - эффектом замещения A.
Параллельное рассуждение можно применить к нижней части диаграммы, учитывая различия в частотах и эффектах генов. Результатом является эффект замены a , который равен Общим множителем в скобках является средний эффект замены аллеля , [14] : 113 и равен Его также можно вывести более прямым способом, но результат тот же. [39]
В последующих разделах эти эффекты замены помогают определить генотипы генной модели как состоящие из раздела, предсказанного этими новыми эффектами ( ожидания замены ), и остатка ( отклонения замены ) между этими ожиданиями и предыдущими эффектами генной модели. Ожидания также называются селекционными ценностями , а отклонения также называются отклонениями доминирования .
В конечном итоге дисперсия, возникающая из ожиданий замены, становится так называемой Аддитивной генетической дисперсией (σ 2 A ) [14] (также Генной дисперсией [40] ) — в то время как дисперсия, возникающая из отклонений замены, становится так называемой Доминантной дисперсией (σ 2 D ) . Примечательно, что ни один из этих терминов не отражает истинного значения этих дисперсий. «Генная дисперсия» менее сомнительна, чем аддитивная генетическая дисперсия , и больше соответствует собственному названию Фишера для этого раздела. [8] [29] : 33 Менее вводящее в заблуждение название для дисперсии отклонений доминирования — «квазидоминантная дисперсия» [см. следующие разделы для дальнейшего обсуждения]. Эти последние термины являются здесь предпочтительными.
Эффекты генной модели ( a , d и -a ) вскоре становятся важными при выводе отклонений от замены , которые впервые обсуждались в предыдущем разделе Замена аллелей . Однако их необходимо переопределить, прежде чем они станут полезными в этом упражнении. Во-первых, их необходимо перецентрировать вокруг среднего значения популяции ( G ), а во-вторых, их необходимо перегруппировать как функции β , среднего эффекта замены аллелей .
Рассмотрим сначала рецентрализацию. Рецентрализованный эффект для AA равен a• = a - G , что после упрощения становится a• = 2 q (a- p d) . Аналогичный эффект для Aa равен d• = d - G = a( q - p ) + d(1-2 pq ) , после упрощения. Наконец, рецентрализованный эффект для aa равен (-a)• = -2 p (a+ q d) . [14] : 116–119
Во-вторых, рассмотрим перестановку этих перецентрализованных эффектов как функции β . Вспоминая из раздела «Замена аллелей», что β = [a +(qp)d], перестановка дает a = [β -(qp)d] . После подстановки этого вместо a в a• и упрощения окончательная версия становится a•• = 2q(β-qd) . Аналогично, d• становится d•• = β(qp) + 2pqd ; и (-a)• становится (-a)•• = -2p(β+pd) . [14] : 118
Генотипы зиготы являются целью всей этой подготовки. Гомозиготный генотип AA является объединением двух эффектов замещения A , по одному от каждого пола. Его ожидание замещения , таким образом, равно β AA = 2β A = 2 q β (см . предыдущие разделы). Аналогично, ожидание замещения Aa равно β Aa = β A + β a = ( q - p )β ; и для aa , β aa = 2β a = -2 p β . Эти ожидания замещения генотипов также называются селекционными ценностями . [14] : 114–116
Отклонения от замены — это различия между этими ожиданиями и эффектами генов после их двухэтапного переопределения в предыдущем разделе. Следовательно, d AA = a•• - β AA = -2 q 2 d после упрощения. Аналогично, d Aa = d•• - β Aa = 2 pq d после упрощения. Наконец, d aa = (-a)•• - β aa = -2 p 2 d после упрощения. [14] : 116–119 Обратите внимание, что все эти отклонения от замены в конечном итоге являются функциями эффекта гена d — что объясняет использование ["d" плюс нижний индекс] в качестве их символов. Однако было бы серьезным логическим несоответствием рассматривать их как объясняющие доминирование (гетерозиготность) во всей модели гена: они являются просто функциями "d", а не аудитом "d" в системе. Они являются производными: отклонениями от ожиданий замещения !
«Ожидания замены» в конечном итоге приводят к σ 2 A (так называемой «аддитивной» генетической дисперсии); а «отклонения замены» приводят к σ 2 D (так называемой «доминантной» генетической дисперсии). Однако следует помнить, что средний эффект замены (β) также содержит «d» [см. предыдущие разделы], что указывает на то, что доминирование также встроено в «аддитивную» дисперсию [см. следующие разделы о генотипической дисперсии для их выводов]. Помните также [см. предыдущий абзац], что «отклонения замены» не объясняют доминирование в системе (будучи не более чем отклонениями от ожиданий замены ), но которые алгебраически состоят из функций «d». Более подходящими названиями для этих соответствующих дисперсий могут быть σ 2 B (дисперсия «ожиданий разведения») и σ 2 δ (дисперсия «отклонений разведения»). Однако, как отмечалось ранее, в данном случае предпочтительными будут термины «Генный» (σ 2 A ) и «Квазидоминантный» (σ 2 D ) соответственно.
Существует два основных подхода к определению и разделению генотипической дисперсии . Один основан на эффектах генной модели , [40] в то время как другой основан на эффектах замены генотипа [14]. Они алгебраически взаимообратимы друг с другом. [36] В этом разделе рассматривается базовый вывод случайного оплодотворения , при этом эффекты инбридинга и дисперсии оставлены в стороне. Это будет рассмотрено позже, чтобы прийти к более общему решению. Пока эта моногенная обработка не будет заменена мультигенной , и пока эпистаз не будет разрешен в свете открытий эпигенетики , генотипическая дисперсия имеет только рассмотренные здесь компоненты.
Удобно следовать биометрическому подходу, который основан на коррекции нескорректированной суммы квадратов (USS) путем вычитания поправочного коэффициента (CF) . Поскольку все эффекты были исследованы через частоты, USS может быть получен как сумма произведений частоты каждого генотипа на квадрат его генного эффекта . CF в этом случае является средним квадратом. Результатом является SS, который, опять же из-за использования частот, также немедленно является дисперсией . [ 9]
, и .
После частичного упрощения последняя строка соответствует терминологии Мезера. [40] : 212 [41] [42]
Здесь σ 2 a — гомозиготная или аллельная дисперсия, а σ 2 d — гетерозиготная или доминантная дисперсия. Дисперсия отклонений замены ( σ 2 D ) также присутствует. (Взвешенная_ковариация) ad [43] далее сокращенно обозначается как " cov ad ".
Эти компоненты нанесены на график для всех значений p на прилагаемом рисунке. Обратите внимание, что cov ad отрицателен для p > 0,5 .
Большинство этих компонентов затронуты изменением центрального фокуса от гомозиготной средней точки ( mp ) к популяционному среднему ( G ), последнее является основой Фактора коррекции . Дисперсии ков -ад и отклонения замены являются просто артефактами этого сдвига. Дисперсии аллеля и доминирования являются подлинными генетическими разделами исходной генной модели и являются единственными эугенетическими компонентами. Даже тогда алгебраическая формула для аллельной дисперсии зависит от присутствия G : только дисперсия доминирования (т. е. σ2d ) не затронута сдвигом от mp к G. [36] Эти идеи обычно не принимаются во внимание .
Дальнейший сбор терминов [в формате Mather] приводит к , где . Это полезно позже в анализе Diallel, который является экспериментальным проектом для оценки этих генетических статистических данных. [44]
Если после последних приведенных перестановок первые три члена объединить вместе, переставить еще раз и упростить, то результатом будет дисперсия ожидания подстановки Фишера .
То есть:
Обратите особое внимание на то, что σ 2 A не является σ 2 a . Первое — это дисперсия ожиданий замены , а второе — аллельная дисперсия. [45] Обратите также внимание на то, что σ 2 D ( дисперсия отклонений замены ) не является σ 2 d ( дисперсия доминирования ), и помните, что это артефакт, возникающий из-за использования G для поправочного коэффициента. [См. «синий абзац» выше.] Теперь это будет называться дисперсией «квазидоминирования».
Также обратите внимание, что σ 2 D < σ 2 d («2pq» всегда дробь); и обратите внимание, что (1) σ 2 D = 2pq σ 2 d , и что (2) σ 2 d = σ 2 D / (2pq) . То есть: подтверждается, что σ 2 D не количественно определяет дисперсию доминирования в модели. Это делает σ 2 d . Однако дисперсию доминирования (σ 2 d ) можно легко оценить из σ 2 D, если доступно 2pq .
Из рисунка эти результаты можно визуализировать как накопление σ 2 a , σ 2 d и cov ad для получения σ 2 A , оставляя σ 2 D по-прежнему разделенным. На рисунке также ясно, что σ 2 D < σ 2 d , как и ожидалось из уравнений.
Общий результат (в формате Фишера) таков: Фишеровские компоненты только что были выведены, но их вывод через сами эффекты замещения также приведен в следующем разделе.
Ссылка на несколько предыдущих разделов о замене аллелей показывает, что два конечных эффекта — это ожидания замены генотипа и отклонения замены генотипа . Обратите внимание, что каждый из них уже определен как отклонения от среднего значения популяции случайного оплодотворения ( G ). Таким образом, для каждого генотипа в свою очередь получается произведение частоты и квадрата соответствующего эффекта, и они накапливаются для получения непосредственно SS и σ2 . [ 46 ] Подробности следуют ниже.
σ 2 A = p 2 β AA 2 + 2 pq β Aa 2 + q 2 β aa 2 , что упрощается до σ 2 A = 2 pq β 2 — генная дисперсия.
σ 2 D = p 2 d AA 2 + 2 pq d Aa 2 + q d aa 2 , что упрощается до σ 2 D = (2 pq ) 2 d 2 —дисперсии квазидоминирования.
При накоплении этих результатов σ 2 G = σ 2 A + σ 2 D . Эти компоненты визуализированы на графиках справа. Средний эффект замены аллеля также представлен на графике, но символом является «α» (как принято в цитатах), а не «β» (как используется здесь).
Однако еще раз обратимся к более ранним обсуждениям об истинных значениях и идентичностях этих компонентов. Сам Фишер не использовал эти современные термины для своих компонентов. Дисперсию ожиданий замены он назвал «генетической» дисперсией; а дисперсию отклонений замены он рассматривал просто как неназванный остаток между «генотипической» дисперсией (его название для нее) и его «генетической» дисперсией. [8] [29] : 33 [47] [48] [Терминология и вывод, используемые в этой статье, полностью соответствуют собственным Фишера.] Термин Мазера для дисперсии ожиданий — «генетический» [40] — очевидно, произошел от термина Фишера и избегает использования «генетический» (который стал слишком обобщенным в использовании, чтобы иметь ценность в настоящем контексте). Неясно происхождение современных вводящих в заблуждение терминов «аддитивная» и «доминантная» дисперсии.
Обратите внимание, что этот подход аллель-замены определял компоненты по отдельности, а затем суммировал их для получения окончательной генотипической дисперсии. Наоборот, подход генной модели вывел всю ситуацию (компоненты и общую сумму) как одно упражнение. Бонусами, вытекающими из этого, были (a) откровения о реальной структуре σ 2 A и (b) реальные значения и относительные размеры σ 2 d и σ 2 D (см. предыдущий подраздел). Также очевидно, что анализ «Mather» более информативен, и что анализ «Fisher» всегда может быть построен из него. Однако обратное преобразование невозможно, поскольку информация о cov ad будет отсутствовать.
В разделе о генетическом дрейфе и в других разделах, где обсуждается инбридинг, основным результатом выборки частоты аллелей была дисперсия средних значений потомства. Эта коллекция средних значений имеет свое собственное среднее значение, а также дисперсию: дисперсию между линиями . (Это дисперсия самого признака, а не частот аллелей .) По мере того, как дисперсия развивается дальше в последующих поколениях, эта дисперсия между линиями, как ожидается, будет увеличиваться. И наоборот, по мере роста гомозиготности, как ожидается, будет уменьшаться дисперсия внутри линий. Поэтому возникает вопрос, меняется ли общая дисперсия, и если да, то в каком направлении. На сегодняшний день эти вопросы были представлены в терминах генной (σ 2 A ) и квазидоминантной (σ 2 D ) дисперсии, а не компонентов генной модели. Это будет сделано и здесь.
Решающее обзорное уравнение взято из Sewall Wright, [13] : 99, 130 [37] и представляет собой схему инбредной генотипической дисперсии , основанную на взвешенном среднем значении ее экстремумов , причем веса являются квадратичными по отношению к коэффициенту инбридинга . Это уравнение имеет вид:
где — коэффициент инбридинга, — генотипическая дисперсия при f=0 , — генотипическая дисперсия при f=1 , — среднее по популяции при f=0 , — среднее по популяции при f=1 .
Компонент [в уравнении выше] описывает снижение дисперсии в линиях потомства. Компонент рассматривает увеличение дисперсии среди линий потомства. Наконец, компонент рассматривается (в следующей строке) для рассмотрения дисперсии квазидоминирования . [13] : 99 и 130 Эти компоненты могут быть расширены далее, тем самым раскрывая дополнительное понимание. Таким образом:-
Во-первых, σ 2 G(0) [в уравнении выше] был расширен, чтобы показать его два подкомпонента [см. раздел «Генотипическая дисперсия»]. Затем σ 2 G(1) был преобразован в 4pqa 2 и выведен в следующем разделе. Замена третьего компонента — это разница между двумя «крайними значениями инбридинга» среднего значения популяции [см. раздел «Среднее значение популяции»]. [36]
Подводя итог: внутристрочные компоненты — это и ; а межстрочные компоненты — это и . [36]
Перестановка дает следующее: Версия в последней строке обсуждается более подробно в следующем разделе.
Сходным образом,
Графики слева показывают эти три генные дисперсии вместе с тремя квазидоминантными дисперсиями по всем значениям f для p = 0,5 (при котором квазидоминантная дисперсия максимальна). Графики справа показывают генотипические разбиения дисперсии (представляющие собой суммы соответствующих генных и квазидоминантных разбиений), изменяющиеся на протяжении десяти поколений с примером f = 0,10 .
Отвечая, во-первых, на вопросы, поставленные в начале об общих дисперсиях [ Σ на графиках]: генная дисперсия линейно растет с коэффициентом инбридинга , достигая максимума на удвоенном начальном уровне. Дисперсия квазидоминирования снижается со скоростью (1 − f 2 ) до тех пор, пока не достигнет нуля. При низких уровнях f снижение происходит очень постепенно, но оно ускоряется с более высокими уровнями f .
Во-вторых, обратите внимание на другие тенденции. Вероятно, интуитивно понятно, что дисперсии внутри линий снижаются до нуля при продолжающемся инбридинге, и это действительно так (обе с одинаковой линейной скоростью (1-f) ). Дисперсии между линиями увеличиваются с инбридингом до f = 0,5 , генная дисперсия со скоростью 2f , а дисперсия квазидоминирования со скоростью (f − f 2 ) . Однако при f > 0,5 тенденции меняются. Генная дисперсия между линиями продолжает линейно расти, пока не сравняется с общей генной дисперсией . Но дисперсия квазидоминирования между линиями теперь снижается до нуля , потому что (f − f 2 ) также снижается при f > 0,5 . [36]
Вспомним, что когда f=1 , гетерозиготность равна нулю, внутрилинейная дисперсия равна нулю, и вся генотипическая дисперсия, таким образом, является межлинейной дисперсией и истощением доминантной дисперсии. Другими словами, σ 2 G(1) является дисперсией среди полностью инбредных средних линий. Вспомним далее [из раздела «Среднее после самооплодотворения»], что такие средние (фактически G 1 ) равны G = a(pq) . Подстановка (1-q) вместо p дает G 1 = a (1 − 2q) = a − 2aq . [14] : 265 Следовательно, σ 2 G(1) на самом деле является σ 2 (a-2aq) . Теперь, в общем, дисперсия разности (xy) равна [ σ 2 x + σ 2 y − 2 cov xy ] . [49] : 100 [50] : 232 Следовательно, σ 2 G(1) = [ σ 2 a + σ 2 2aq − 2 cov (a, 2aq) ] . Но a (аллельный эффект ) и q ( частота аллеля ) независимы — поэтому эта ковариация равна нулю. Более того, a является константой от одной строки к другой, поэтому σ 2 a также равно нулю. Кроме того, 2a является другой константой (k), поэтому σ 2 2aq имеет тип σ 2 k X . В общем, дисперсия σ 2 k X равна k 2 σ 2 X . [50] : 232 Сопоставление всего этого показывает, что σ 2 (a-2aq) = (2a) 2 σ 2 q . Вспомним [из раздела «Продолжение генетического дрейфа»], что σ 2 q = pq f . При f=1 здесь, в рамках этого настоящего вывода, это становится pq 1 (то есть pq ), и это подставляется в предыдущее.
Конечный результат: σ 2 G(1) = σ 2 (a-2aq) = 4a 2 pq = 2(2pq a 2 ) = 2 σ 2 a .
Отсюда немедленно следует, что f σ 2 G(1) = f 2 σ 2 a . [Это последнее f происходит из исходного уравнения Сьюэлла-Райта : это не f , просто установленная на «1» в выводе, сделанном двумя строками выше.]
В предыдущих разделах было обнаружено, что внутрилинейная генная дисперсия основана на генной дисперсии, полученной путем замены (σ 2 A ) , но межлинейная генная дисперсия основана на аллельной дисперсии генной модели (σ 2 a ) . Эти две величины нельзя просто сложить, чтобы получить общую генную дисперсию . Одним из подходов к избежанию этой проблемы было повторное рассмотрение вывода среднего эффекта замены аллеля и построение версии (β f ) , которая включает эффекты дисперсии. Кроу и Кимура достигли этого [13] : 130–131, используя повторно центрированные аллельные эффекты ( a•, d•, (-a)• ), обсуждавшиеся ранее ["Эффекты генов переопределены"]. Однако впоследствии было обнаружено, что это немного недооценивает общую генную дисперсию , и новый вывод на основе дисперсии привел к уточненной версии. [36]
Усовершенствованная версия выглядит так: β f = { a 2 + [(1− f ) / (1 + f )] 2(q − p ) ad + [(1- f ) / (1 + f )] (q − p ) 2 d 2 } (1/2)
Следовательно, σ 2 A(f) = (1 + f ) 2pq β f 2 теперь точно согласуется с [ (1-f) σ 2 A(0) + 2f σ 2 a(0) ] .
Общая генная дисперсия сама по себе представляет внутренний интерес. Но до усовершенствований Гордона [36] она также имела другое важное применение. Не существовало никаких существующих оценщиков для «дисперсного» квазидоминирования. Она была оценена как разница между инбридинговой генотипической дисперсией Сьюэлла Райта [37] и общей «дисперсной» генной дисперсией [см. предыдущий подраздел]. Однако появилась аномалия, поскольку общая дисперсия квазидоминирования, по-видимому, увеличивалась на ранних стадиях инбридинга, несмотря на снижение гетерозиготности. [14] : 128 : 266
Уточнения в предыдущем подразделе исправили эту аномалию. [36] В то же время было получено прямое решение для общей дисперсии квазидоминирования , что позволило избежать необходимости в методе «вычитания» предыдущих времен. Кроме того, впервые были получены прямые решения для межлинейных и внутрилинейных разделов дисперсии квазидоминирования . [Они были представлены в разделе «Дисперсия и генотипическая дисперсия».]
Дисперсия окружающей среды — это фенотипическая изменчивость, которую нельзя приписать генетике. Это звучит просто, но экспериментальный дизайн, необходимый для разделения этих двух факторов, требует очень тщательного планирования. Даже «внешнюю» среду можно разделить на пространственные и временные компоненты («Места» и «Годы»); или на такие разделы, как «помет» или «семья», «культура» или «история». Эти компоненты очень зависят от фактической экспериментальной модели, используемой для проведения исследования. Такие вопросы очень важны при проведении самого исследования, но в этой статье о количественной генетике этого обзора может быть достаточно.
Однако это подходящее место для резюме:
Фенотипическая дисперсия = генотипическая дисперсия + средовая дисперсия + взаимодействие генотипа и среды + экспериментальная "ошибочная" дисперсия
т. е. σ 2 P = σ 2 G + σ 2 E + σ 2 GE + σ 2
или σ 2 P = σ 2 A + σ 2 D + σ 2 I + σ 2 E + σ 2 GE + σ 2
после разбиения генотипической дисперсии (G) на компонентные дисперсии «генная» (A), «квазидоминантная» (D) и «эпистатическая» (I). [51]
Изменения окружающей среды будут отображены в других разделах, таких как «Наследуемость» и «Коррелированные атрибуты».
Наследуемость признака — это доля общей (фенотипической) дисперсии (σ 2 P ), которая может быть отнесена к генетической дисперсии , будь то полная генотипическая дисперсия или некоторый ее компонент. Она количественно определяет степень, в которой фенотипическая изменчивость обусловлена генетикой: но точное значение зависит от того, какое разделение генетической дисперсии используется в числителе пропорции. [52] Исследовательские оценки наследуемости имеют стандартные ошибки, как и все оценочные статистики. [53]
Если дисперсия числителя представляет собой всю генотипическую дисперсию ( σ 2 G ), то наследуемость известна как наследуемость в «широком смысле» ( H 2 ). Она количественно определяет степень, в которой изменчивость признака определяется генетикой в целом. [См. раздел о генотипической дисперсии.]
Если в числителе используется только генная дисперсия ( σ 2 A ), то наследуемость можно назвать «узким смыслом» (h 2 ). Она количественно определяет степень, в которой фенотипическая дисперсия определяется дисперсией ожиданий замены Фишера . Фишер предположил, что эта наследуемость в узком смысле может быть уместна при рассмотрении результатов естественного отбора, фокусируясь, как это и происходит, на изменчивости, то есть на «адаптации». [29] Он предложил ее в отношении количественной оценки дарвиновской эволюции.
Вспоминая, что аллельная дисперсия ( σ 2 a ) и дисперсия доминирования ( σ 2 d ) являются эугенетическими компонентами генной модели [см. раздел Генотипическая дисперсия], и что σ 2 D ( отклонения от замены или дисперсия «квазидоминирования» ) и cov ad обусловлены изменением от гомозиготной средней точки ( mp ) к популяционному среднему ( G ), можно увидеть, что реальные значения этих наследуемости неясны. Наследуемость и имеет однозначное значение.
Наследуемость в узком смысле также использовалась для прогнозирования результатов искусственного отбора в целом . В последнем случае, однако, наследуемость в широком смысле может быть более подходящей, поскольку изменяется весь атрибут, а не только адаптивная способность. Как правило, прогресс от отбора происходит тем быстрее, чем выше наследуемость. [См. раздел «Отбор».] У животных наследуемость репродуктивных признаков обычно низкая, в то время как наследуемость устойчивости к болезням и продуктивности умеренно низкая или умеренная, а наследуемость телосложения высокая.
Повторяемость (r 2 ) — это доля фенотипической дисперсии, приписываемая различиям в повторных измерениях одного и того же субъекта, возникающая из более поздних записей. Она используется, в частности, для долгоживущих видов. Это значение может быть определено только для признаков, которые проявляются несколько раз в течение жизни организма, таких как масса тела взрослого человека, скорость метаболизма или размер помета. Индивидуальная масса тела при рождении, например, не будет иметь значения повторяемости: но она будет иметь значение наследуемости. Обычно, но не всегда, повторяемость указывает на верхний уровень наследуемости. [54]
г 2 = (с 2 Г + с 2 ПЭ )/с 2 П
где s 2 PE = взаимодействие фенотипа и окружающей среды = повторяемость.
Однако вышеупомянутая концепция повторяемости проблематична для признаков, которые обязательно сильно меняются между измерениями. Например, масса тела значительно увеличивается у многих организмов между рождением и взрослой жизнью. Тем не менее, в пределах заданного возрастного диапазона (или стадии жизненного цикла) можно проводить повторные измерения, и повторяемость будет иметь смысл в пределах этой стадии.
С точки зрения наследственности, отношения — это особи, которые унаследовали гены от одного или нескольких общих предков. Поэтому их «отношения» можно количественно оценить на основе вероятности того, что каждый из них унаследовал копию аллеля от общего предка. В предыдущих разделах коэффициент инбридинга определялся как «вероятность того, что два одинаковых аллеля ( A и A или a и a ) имеют общее происхождение» — или, более формально, «вероятность того, что два гомологичных аллеля являются аутозиготными». Ранее акцент делался на вероятности наличия у особи двух таких аллелей, и коэффициент был оформлен соответствующим образом. Очевидно, однако, что эта вероятность аутозиготности для особи должна также быть вероятностью того, что каждый из ее двух родителей имел этот аутозиготный аллель. В этой переориентированной форме вероятность называется коэффициентом ко-предка для двух особей i и j ( f ij ). В этой форме его можно использовать для количественной оценки отношений между двумя людьми, и он также может быть известен как коэффициент родства или коэффициент кровного родства . [13] : 132–143 [14] : 82–92
Родословные — это диаграммы семейных связей между индивидуумами и их предками, а также, возможно, между другими членами группы, которые разделяют с ними генетическое наследство. Они являются картами взаимоотношений. Таким образом, родословную можно проанализировать, чтобы выявить коэффициенты инбридинга и сородичества. Такие родословные на самом деле являются неформальными изображениями диаграмм путей , используемых в анализе путей , который был изобретен Сьюэллом Райтом, когда он сформулировал свои исследования по инбридингу. [55] : 266–298 Используя соседнюю диаграмму, вероятность того, что индивидуумы «B» и «C» получили аутозиготные аллели от предка «A», составляет 1/2 (один из двух диплоидных аллелей). Это инбридинг «de novo» ( Δf Ped ) на этом этапе. Однако другой аллель мог иметь «переходную» аутозиготность от предыдущих поколений, поэтому вероятность этого события равна ( de novo дополнение , умноженное на инбридинг предка A ), то есть (1 − Δf Ped ) f A = (1/2) f A . Таким образом, общая вероятность аутозиготности в B и C после раздвоения родословной является суммой этих двух компонентов, а именно (1/2) + (1/2)f A = (1/2) (1+f A ) . Это можно рассматривать как вероятность того, что две случайные гаметы от предка A несут аутозиготные аллели, и в этом контексте это называется коэффициентом родства ( f AA ). [13] : 132–143 [14] : 82–92 Он часто встречается в следующих параграфах.
Следуя по пути «B», вероятность того, что любой аутозиготный аллель «передастся» каждому последующему родителю, снова составляет (1/2) на каждом шаге (включая последний шаг «целевому» X ). Общая вероятность передачи по «пути B» составляет, таким образом, (1/2) 3 . Степень, в которую возводится (1/2), можно рассматривать как «количество промежуточных звеньев на пути между A и X », n B = 3 . Аналогично, для «пути C» n C = 2 , а «вероятность передачи» составляет (1/2) 2 . Таким образом, объединенная вероятность аутозиготного переноса от A к X составляет [ f AA (1/2) (n B ) (1/2) (n C ) ] . Напоминая, что f AA = (1/2) (1+f A ) , f X = f PQ = (1/2) (n B + n C + 1) (1 + f A ) . В этом примере, предположим, что f A = 0, f X = 0,0156 (округленно) = f PQ , одна из мер «связанности» между P и Q .
В этом разделе степени ( 1/2 ) использовались для представления "вероятности автозиготности". Позже этот же метод будет использоваться для представления пропорций генофондов предков, которые наследуются по родословной [раздел "Родство между родственниками"].
В следующих разделах, посвященных скрещиванию сибсов и подобным темам, будет полезен ряд «правил усреднения». Они вытекают из анализа пути . [55] Правила показывают, что любой коэффициент совместного происхождения может быть получен как среднее значение перекрестных совместных предков между соответствующими комбинациями прародителей и родителей. Таким образом, ссылаясь на соседнюю диаграмму, перекрестный множитель 1 заключается в том, что f PQ = среднее значение ( f AC , f AD , f BC , f BD ) = (1/4) [f AC + f AD + f BC + f BD ] = f Y . Аналогичным образом перекрестный множитель 2 утверждает, что f PC = (1/2) [ f AC + f BC ] — в то время как перекрестный множитель 3 утверждает, что f PD = (1/2) [ f AD + f BD ] . Возвращаясь к первому множителю, теперь можно увидеть, что он также равен f PQ = (1/2) [ f PC + f PD ] , который после подстановки множителей 2 и 3 принимает свою первоначальную форму.
В большинстве последующих разделов прародительское поколение обозначается как (t-2) , родительское поколение как (t-1) , а «целевое» поколение как t .
Диаграмма справа показывает, что полное скрещивание сибсов является прямым применением кросс-множителя 1 с небольшим изменением, которое родители A и B повторяют (вместо C и D ), чтобы указать, что у особей P1 и P2 оба родителя общие, то есть они являются полными братьями и сестрами . Особь Y является результатом скрещивания двух полных братьев и сестер. Следовательно, f Y = f P1,P2 = (1/4) [ f AA + 2 f AB + f BB ] . Напомним, что f AA и f BB были определены ранее (в анализе родословной) как коэффициенты родительства , равные (1/2)[1+f A ] и (1/2)[1+f B ] соответственно, в настоящем контексте. Осознайте, что в этом облике бабушки и дедушки A и B представляют поколение (t-2) . Таким образом, если предположить, что в любом поколении все уровни инбридинга одинаковы, то эти два коэффициента родства представляют собой (1/2) [1 + f (t-2) ] .
Теперь рассмотрим f AB . Вспомним, что это также f P1 или f P2 , и поэтому представляет их поколение - f (t-1) . Собирая все вместе, f t = (1/4) [ 2 f AA + 2 f AB ] = (1/4) [ 1 + f (t-2) + 2 f (t-1) ] . Это коэффициент инбридинга для скрещивания Full-Sib . [13] : 132–143 [14] : 82–92 График слева показывает скорость этого инбридинга в течение двадцати повторяющихся поколений. «Повторение» означает, что потомство после цикла t становится родителями скрещивания, которые генерируют цикл ( t+1 ), и так далее последовательно. Графики также показывают инбридинг для случайного оплодотворения 2N=20 для сравнения. Напомним, что этот коэффициент инбридинга для потомства Y также является коэффициентом совместного происхождения для его родителей и, следовательно, мерой родства двух братьев и сестер Fill .
Вывод скрещивания полусибсов происходит немного по-другому, чем для полных сибсов. На соседней диаграмме два полусиба в поколении (t-1) имеют только одного общего родителя — родителя «A» в поколении (t-2). Снова используется кросс-множитель 1 , что дает f Y = f (P1,P2) = (1/4) [ f AA + f AC + f BA + f BC ] . На этот раз есть только один коэффициент происхождения , но три коэффициента совместного происхождения на уровне (t-2) (один из них — f BC — является «фиктивным» и не представляет собой фактическую особь в поколении (t-1)). Как и прежде, коэффициент происхождения равен (1/2)[1+f A ] , и три совместных происхождения каждый представляет f (t-1) . Вспоминая, что f A представляет f (t-2) , окончательное объединение и упрощение терминов дает f Y = f t = (1/8) [ 1 + f (t-2) + 6 f (t-1) ] . [13] : 132–143 [14] : 82–92 Графики слева включают этот инбридинг полусибсов (HS) на протяжении двадцати последовательных поколений.
Как и прежде, это также количественно определяет родство двух полусибсов в поколении (t-1) в его альтернативной форме f (P1, P2) .
Диаграмма родословной для самоопыления представлена справа. Она настолько проста, что не требует никаких правил перекрестного умножения. Она использует только базовое сопоставление коэффициента инбридинга и его альтернативы — коэффициента со-предка ; с последующим признанием того, что в этом случае последний также является коэффициентом родительства . Таким образом, f Y = f (P1, P1) = f t = (1/2) [ 1 + f (t-1) ] . [13] : 132–143 [14] : 82–92 Это самая высокая скорость инбридинга среди всех типов, как можно увидеть на графиках выше. Кривая самоопыления на самом деле является графиком коэффициента родительства .
Они выводятся с помощью методов, аналогичных тем, которые применяются для братьев и сестер. [13] : 132–143 [14] : 82–92 Как и прежде, точка зрения на общее происхождение коэффициента инбридинга обеспечивает меру «родства» между родителями P1 и P2 в этих выражениях кузенов.
Родословная для двоюродных братьев и сестер (FC) приведена справа. Простое уравнение: f Y = f t = f P1,P2 = (1/4) [ f 1D + f 12 + f CD + f C2 ] . После подстановки соответствующих коэффициентов инбридинга, сбора членов и упрощения это становится f t = (1/4) [ 3 f (t-1) + (1/4) [2 f (t-2) + f (t-3) + 1 ]] , что является версией для итерации — полезной для наблюдения за общей моделью и для компьютерного программирования. «Окончательная» версия: f t = (1/16) [ 12 f (t-1) + 2 f (t-2) + f (t-3) + 1 ] .
Родословная троюродных братьев и сестер (SC) находится слева. Родители в родословной, не связанные с общим предком, обозначены цифрами вместо букв. Здесь простое уравнение имеет вид f Y = f t = f P1,P2 = (1/4) [ f 3F + f 34 + f EF + f E4 ] . После проработки соответствующей алгебры это становится f t = (1/4) [ 3 f (t-1) + (1/4) [3 f (t-2) + (1/4) [2 f (t-3) + f (t-4) + 1 ]]] , что является итерационной версией. «Окончательная» версия имеет вид f t = (1/64) [ 48 f (t-1) + 12 f (t-2) + 2 f (t-3) + f (t-4) + 1 ] .
Чтобы визуализировать шаблон в уравнениях полных кузенов , начните ряд с уравнения полных сибсов , переписанного в итеративной форме: f t = (1/4)[2 f (t-1) + f (t-2) + 1 ] . Обратите внимание, что это «основной план» последнего члена в каждой из итеративных форм кузенов: с небольшой разницей в том, что индексы поколения увеличиваются на «1» на каждом «уровне» кузена. Теперь определим уровень кузена как k = 1 (для двоюродных братьев и сестер), = 2 (для троюродных братьев и сестер), = 3 (для троюродных братьев и сестер) и т. д. и т. п.; и = 0 (для полных сибсов, которые являются «кузенами нулевого уровня»). Последний член теперь можно записать как: (1/4) [ 2 f (t-(1+k)) + f (t-(2+k)) + 1] . Перед этим последним членом сложены один или несколько итерационных приращений в форме (1/4) [ 3 f (tj) + ... , где j - индекс итерации , который принимает значения от 1 до k в последовательных итерациях по мере необходимости. Собирая все это вместе, получаем общую формулу для всех возможных уровней полных кузенов , включая полных сибсов . Для полных кузенов k -го уровня f{k} t = Ιter j = 1 k { (1/4) [ 3 f (tj) + } j + (1/4) [ 2 f (t-(1+k)) + f (t-(2+k)) + 1] . В начале итерации все f (t- x ) устанавливаются в «0», и каждое имеет свое значение, подставленное по мере его вычисления через поколения. Графики справа показывают последовательное инбридинг для нескольких уровней полных кузенов.
Для троюродных братьев и сестер (FHC) родословная находится слева. Обратите внимание, что есть только один общий предок (индивид A ). Также, как и для троюродных братьев и сестер , родители, не связанные с общим предком, обозначены цифрами. Здесь простое уравнение имеет вид f Y = f t = f P1,P2 = (1/4) [ f 3D + f 34 + f CD + f C4 ] . После проработки соответствующей алгебры это становится f t = (1/4) [ 3 f (t-1) + (1/8) [6 f (t-2) + f (t-3) + 1 ]] , что является итерационной версией. «Окончательная» версия имеет вид f t = (1/32) [ 24 f (t-1) + 6 f (t-2) + f (t-3) + 1 ] . Алгоритм итерации аналогичен алгоритму для полных кузенов , за исключением того, что последний член равен (1/8) [ 6 f (t-(1+k)) + f (t-(2+k)) + 1 ] . Обратите внимание, что этот последний член в основном похож на уравнение полусибса, параллельно шаблону для полных кузенов и полных сибсов. Другими словами, полусибсы являются полукузенами "нулевого уровня".
Существует тенденция рассматривать кузенное скрещивание с точки зрения человека, возможно, из-за широкого интереса к генеалогии. Использование родословных для выведения инбридинга, возможно, усиливает этот взгляд «семейной истории». Однако такие виды интеркроссинга встречаются и в естественных популяциях — особенно тех, которые ведут оседлый образ жизни или имеют «ареал размножения», который они посещают из сезона в сезон. Например, группа потомков гарема с доминирующим самцом может содержать элементы сибскрещивания, кузенскрипции и обратного скрещивания, а также генетический дрейф, особенно «островного» типа. В дополнение к этому, случайный «ауткросс» добавляет элемент гибридизации в смесь. Это не панмиксия.
После гибридизации между A и R , F1 (особь B ) скрещивается обратно ( BC1 ) с исходным родителем ( R ) для получения поколения BC1 (особь C ). [Обычно используется одна и та же метка для акта выполнения обратного скрещивания и для поколения, произведенного им. Акт обратного скрещивания здесь выделен курсивом .] Родитель R является рекуррентным родителем. Изображены два последовательных обратных скрещивания, причем особь D является поколением BC2 . Этим поколениям также были присвоены индексы t , как указано. Как и прежде, f D = f t = f CR = (1/2) [ f RB + f RR ] с использованием ранее данного кросс-множителя 2. Только что определенное f RB является тем, которое включает поколение (t-1) с (t-2) . Однако есть еще один такой f RB, полностью содержащийся в поколении (t-2) , и именно он используется сейчас: как совместное происхождение родителей особи C в поколении (t-1) . Как таковой, он также является коэффициентом инбридинга C , и, следовательно, равен f (t-1) . Оставшийся f RR является коэффициентом происхождения рекуррентного родителя , и, следовательно, равен (1/2) [1 + f R ] . Собираем все это вместе: f t = (1/2) [ (1/2) [ 1 + f R ] + f (t-1) ] = (1/4) [ 1 + f R + 2 f (t-1) ] . Графики справа иллюстрируют возвратное инбридинг более двадцати возвратных скрещиваний для трех различных уровней (фиксированного) инбридинга у рекуррентного родителя.
Эта процедура обычно используется в программах разведения животных и растений. Часто после создания гибрида (особенно если особи недолговечны), рекуррентному родителю требуется отдельное «линейное разведение» для его поддержания в качестве будущего рекуррентного родителя в обратном скрещивании. Это поддержание может осуществляться посредством самоопыления, или посредством скрещивания полных сибсов или полусибсов, или посредством ограниченных случайно оплодотворенных популяций, в зависимости от репродуктивных возможностей вида. Конечно, этот постепенный рост f R переносится в f t обратного скрещивания. Результатом является более плавная кривая, поднимающаяся к асимптотам, чем показано на настоящих графиках, потому что f R не находится на фиксированном уровне с самого начала.
В разделе «Анализ родословной» использовалось для представления вероятностей аутозиготного аллельного происхождения на протяжении n поколений вниз по ветвям родословной. Эта формула возникла из-за правил, налагаемых половым размножением: (i) два родителя вносят практически равные доли аутосомных генов, и (ii) последовательное разбавление для каждого поколения между зиготой и «фокусным» уровнем родительства. Эти же правила применимы и к любой другой точке зрения на происхождение в двуполой репродуктивной системе. Одной из таких является доля любого генофонда предков (также известного как «зародышевая плазма»), которая содержится в генотипе любой зиготы.
Таким образом, доля генофонда предков в генотипе равна: где n = число половых поколений между зиготой и фокусным предком.
Например, каждый родитель определяет генофонд, вносящий вклад в его потомство, в то время как каждый прадед и прабабушка вносит вклад в своего прапрапра-потомка.
Общий генофонд зиготы ( Γ ), конечно же, представляет собой сумму половых вкладов в ее происхождение.
Индивиды, произошедшие от общего предкового генофонда, очевидно, связаны. Это не означает, что они идентичны по своим генам (аллелям), потому что на каждом уровне предка сегрегация и сортировка будут происходить при производстве гамет. Но они будут происходить из одного и того же пула аллелей, доступных для этих мейозов и последующих оплодотворений. [Эта идея впервые встретилась в разделах, посвященных анализу родословной и связям.] Вклады генофонда [см. раздел выше] их ближайшего общего предкового генофонда ( предкового узла ) могут, таким образом, использоваться для определения их связи. Это приводит к интуитивному определению связи, которое хорошо согласуется с известными понятиями «родства», найденными в семейной истории; и позволяет сравнивать «степень родства» для сложных моделей связей, возникающих из такой генеалогии.
Единственные необходимые изменения (для каждого индивида по очереди) находятся в Γ и обусловлены переходом к «общему общему предку» вместо «индивидуального полного предка». Для этого определим Ρ (вместо Γ ); m = количество общих предков в узле (т.е. m = только 1 или 2); и «индивидуальный индекс» k . Таким образом:
где, как и прежде, n = число половых поколений между особью и предковым узлом.
Примером служат два двоюродных брата и сестры. Их ближайший общий предковый узел — это их бабушки и дедушки, которые дали начало их двум родителям-братьям, и у них есть оба этих бабушки и дедушки общие. [См. более раннюю родословную.] В этом случае m=2 и n=2 , поэтому для каждого из них
В этом простом случае каждый кузен имеет одинаковое число Ρ.
Второй пример может быть между двумя двоюродными братьями и сестрами, но один ( k=1 ) имеет три поколения назад к предковому узлу (n=3), а другой ( k=2 ) только два (n=2) [т.е. троюродные и двоюродные отношения]. Для обоих m=2 (они двоюродные братья и сестры).
и
Обратите внимание, что у каждого кузена разный Ρ k .
В любой парной оценке взаимоотношений существует один Ρ k для каждой особи: остается усреднить их, чтобы объединить в один «коэффициент взаимоотношений». Поскольку каждый Ρ является частью общего генофонда , подходящим средним для них является геометрическое среднее [56] [57] : 34–55 Это среднее является их коэффициентом взаимоотношений генофонда — «GRC».
Для первого примера (два двоюродных брата и сестры) их GRC = 0,5; для второго случая (двоюродный брат и сестра) их GRC = 0,3536.
Все эти отношения (GRC) являются приложениями анализа пути. [55] : 214–298 Ниже приводится краткое изложение некоторых уровней отношений (GRC).
Они, подобно генотипическим вариациям, могут быть получены либо с помощью подхода генной модели («Mather»), либо с помощью подхода аллельной замены («Fisher»). Здесь каждый метод демонстрируется для альтернативных случаев.
Их можно рассматривать либо как ковариацию между любым потомком и любым из его родителей ( PO ), либо как ковариацию между любым потомком и «средним родительским» значением обоих его родителей ( MPO ).
Это можно вывести как сумму перекрестных произведений между родительскими генными эффектами и половиной ожиданий потомства с использованием подхода аллельного замещения. Половина ожиданий потомства учитывает тот факт, что рассматривается только один из двух родителей . Соответствующие родительские генные эффекты, таким образом, являются переопределенными генными эффектами второго этапа, используемыми для определения генотипических дисперсий ранее, то есть: a″ = 2q(a − qd) и d″ = (qp)a + 2pqd , а также (-a)″ = -2p(a + pd) [см. раздел «Переопределенные генные эффекты»]. Аналогично, соответствующие эффекты потомства для ожиданий замены аллелей составляют половину более ранних значений разведения , последние из которых следующие: a AA = 2qa и a Aa = (qp)a , а также a aa = -2pa [см. раздел «Замена генотипа – Ожидания и отклонения»].
Поскольку все эти эффекты уже определены как отклонения от генотипического среднего, сумма перекрестного продукта с использованием { частота генотипа * родительский генный эффект * полуразмножающееся значение } немедленно дает ковариацию ожиданий замены аллелей между любым родителем и его потомством. После тщательного сбора терминов и упрощения это становится cov(PO) A = pqa 2 = 1/2 s 2 A . [13] : 132–141 [14] : 134–147
К сожалению, отклонения аллель-замена обычно упускаются из виду, но они, тем не менее, не "перестали существовать"! Напомним, что эти отклонения: d AA = -2q 2 d , и d Aa = 2pq d , а также d aa = -2p 2 d [см. раздел "Замена генотипа – Ожидания и отклонения"]. Следовательно, сумма перекрестного произведения с использованием { частота генотипа * родительский ген-эффект * отклонения-полузамещения } также немедленно дает ковариацию отклонений аллель-замены между любым родителем и его потомством. Еще раз, после тщательного сбора терминов и упрощения, это становится cov(PO) D = 2p 2 q 2 d 2 = 1/2 с 2 Д .
Отсюда следует, что: cov(PO) = cov(PO) A + cov(PO) D = 1/2 с 2 А + 1/2 s 2 D , когда доминирование не упускается из виду!
Поскольку существует множество комбинаций родительских генотипов, необходимо учитывать множество различных средних значений родителей и потомков, а также различные частоты получения каждой родительской пары. В этом случае наиболее целесообразен подход на основе генной модели. Поэтому нескорректированная сумма перекрестных произведений (USCP) — с использованием всех произведений { частота родительской пары * средний родительский генный эффект * среднее значение генотипа потомка } — корректируется путем вычитания {общего генотипического среднего} 2 в качестве поправочного коэффициента (CF) . После перемножения всех различных комбинаций, тщательного сбора членов, упрощения, разложения на множители и сокращения, где это применимо, это становится:
cov(MPO) = pq [a + (qp)d] 2 = pq а 2 = 1/2 s 2 A , при этом в данном случае не было упущено ни одно доминирование, поскольку оно было использовано при определении a . [13] : 132–141 [14] : 134–147
Наиболее очевидным применением является эксперимент, который содержит всех родителей и их потомков, с взаимными скрещиваниями или без них, предпочтительно реплицированный без смещения, позволяющий оценить все соответствующие средние значения, дисперсии и ковариации вместе с их стандартными ошибками. Эти оценочные статистики затем могут быть использованы для оценки генетических дисперсий. Удвоенная разница между оценками двух форм (скорректированной) ковариации родитель-потомок дает оценку s 2 D ; а удвоенная cov(MPO) оценивает s 2 A . При соответствующем экспериментальном дизайне и анализе [9] [49] [50] стандартные ошибки могут быть получены и для этой генетической статистики. Это основное ядро эксперимента, известного как анализ Диаллеля , версия которого по Мазеру, Джинксу и Хейману обсуждается в другом разделе.
Второе применение включает использование регрессионного анализа , который оценивает из статистики ординату (оценка Y), производную (коэффициент регрессии) и константу (отрезок Y) исчисления. [9] [49] [58] [59] Коэффициент регрессии оценивает скорость изменения функции, предсказывающей Y из X , на основе минимизации остатков между подобранной кривой и наблюдаемыми данными (MINRES). Никакой альтернативный метод оценки такой функции не удовлетворяет этому основному требованию MINRES. В общем случае коэффициент регрессии оценивается как отношение ковариации (XY) к дисперсии определителя (X) . На практике размер выборки обычно одинаков как для X, так и для Y, поэтому это можно записать как SCP(XY) / SS(X) , где все термины были определены ранее. [9] [58] [59] В настоящем контексте родители рассматриваются как «определяющая переменная» (X), а потомство как «определяемая переменная» (Y), а коэффициент регрессии как «функциональная связь» (ß PO ) между ними. Принимая cov(MPO) = 1/2 s 2 A как cov(XY) , и s 2 P / 2 (дисперсия среднего значения двух родителей — средний родитель) как s 2 X , можно увидеть, что ß MPO = [ 1/2 с 2 А ] / [ 1/2 s 2 P ] = h 2 . [60] Далее, используя cov(PO) = [ 1/2 с 2 А + 1/2 s 2 D ] как cov(XY) , и s 2 P как s 2 X , видно, что 2 ß PO = [ 2 ( 1/2 с 2 А + 1/2 s 2 D )] / s 2 P = H 2 .
Анализ эпистаза ранее был предпринят с помощью подхода дисперсии взаимодействия типа s 2 AA и s 2 AD , а также s 2 DD . Это было интегрировано с этими текущими ковариациями в попытке предоставить оценщики дисперсий эпистаза. Однако результаты эпигенетики показывают, что это может быть неподходящим способом определения эпистаза.
Ковариация между полусибсами ( HS ) легко определяется с помощью методов аллельной замены; но, опять же, вклад доминирования исторически опускался. Однако, как и в случае с ковариацией средний родитель/потомок, ковариация между полными сибсами ( FS ) требует подхода «родительской комбинации», тем самым требуя использования метода скорректированного перекрестного произведения генной модели; и вклад доминирования исторически не упускался из виду. Превосходство выводов генной модели здесь столь же очевидно, как и для генотипических дисперсий.
Сумма перекрестных произведений {частота общего родителя * ценность полусестринства одного полусиба * ценность полусестринства любого другого полусиба в той же группе общего родителя} немедленно дает одну из требуемых ковариаций, поскольку используемые эффекты [ ценности размножения — представляющие ожидания замены аллелей] уже определены как отклонения от генотипического среднего [см. раздел «Замена аллелей — Ожидания и отклонения»]. После упрощения это становится: cov(HS) A = 1/2 pq a 2 = 1/4 s 2 A . [13] : 132–141 [14] : 134–147 Однако существуют также отклонения от замены , определяющие сумму перекрестных произведений {частота общего родителя * отклонение от половины замены одного полусиба * отклонение от половины замены любого другого полусиба в той же группе общего родителя} , что в конечном итоге приводит к: cov(HS) D = p 2 q 2 d 2 = 1/4 s 2 D. Сложение двух компонентов дает:
cov(HS) = cov(HS) A + cov(HS) D = 1/4 с 2 А + 1/4 с 2 Д .
Как объяснялось во введении, используется метод, аналогичный тому, который используется для ковариации средний родитель/потомок. Поэтому нескорректированная сумма перекрестных произведений (USCP) с использованием всех произведений — { частота родительской пары * квадрат среднего генотипа потомка } — корректируется путем вычитания {общего генотипического среднего} 2 в качестве поправочного коэффициента (CF) . В этом случае умножение всех комбинаций, тщательный сбор членов, упрощение, факторизация и сокращение очень затянуты. В конечном итоге это становится:
cov(FS) = pq a 2 + p 2 q 2 d 2 = 1/2 с 2 А + 1/4 s 2 D , при этом ни одно доминирование не было упущено из виду. [13] : 132–141 [14] : 134–147
Наиболее полезным применением здесь для генетической статистики является корреляция между полусибсами . Напомним, что коэффициент корреляции ( r ) представляет собой отношение ковариации к дисперсии [см., например, раздел «Связанные атрибуты»]. Следовательно, r HS = cov(HS) / s 2 все HS вместе = [ 1/4 с 2 А + 1/4 с 2 Д ] / с 2 П = 1/4 H 2 . [61] Корреляция между полными братьями и сестрами не имеет большой пользы, поскольку r FS = cov(FS) / s 2 все FS вместе = [ 1/2 с 2 А + 1/4 s 2 D ] / s 2 P . Предположение, что оно «приблизительно» ( 1/2 h 2 ) — плохой совет.
Конечно, корреляции между братьями и сестрами сами по себе представляют интерес, независимо от какой-либо пользы, которую они могут иметь для оценки наследуемости или генотипических различий.
Стоит отметить, что [ cov(FS) − cov(HS)] = 1/4 s 2 A. Эксперименты, состоящие из семейств FS и HS, могли бы использовать это, используя внутриклассовую корреляцию для приравнивания компонентов дисперсии эксперимента к этим ковариациям [см. раздел «Коэффициент родства как внутриклассовая корреляция» для обоснования этого].
Предыдущие комментарии относительно эпистаза применимы и здесь [см. раздел «Применение (родитель-потомок)».
Отбор действует на атрибут (фенотип), так что особи, которые равны или превышают порог отбора (z P ), становятся эффективными родителями для следующего поколения. Доля , которую они представляют в базовой популяции, является давлением отбора . Чем меньше доля, тем сильнее давление. Среднее значение выбранной группы (P s ) превосходит среднее значение базовой популяции (P 0 ) на разницу, называемую дифференциалом отбора (S) . Все эти величины являются фенотипическими. Для «связи» с базовыми генами используется наследуемость (h 2 ) , выполняющая роль коэффициента детерминации в биометрическом смысле. Ожидаемое генетическое изменение — по-прежнему выраженное в фенотипических единицах измерения — называется генетическим прогрессом (ΔG) и получается путем произведения дифференциала отбора (S) и его коэффициента детерминации (h 2 ) . Ожидаемое среднее значение потомства (P 1 ) находится путем добавления генетического прогресса (ΔG) к базовому среднему (P 0 ) . Графики справа показывают, как (начальный) генетический прогресс больше при более сильном давлении отбора (меньшей вероятности ). Они также показывают, как прогресс от последовательных циклов отбора (даже при том же давлении отбора) неуклонно снижается, поскольку фенотипическая дисперсия и наследуемость уменьшаются самим отбором. Это будет обсуждаться далее.
Таким образом . [14] : 1710–181 и . [14] : 1710–181
Обычно используется узкосмысловая наследуемость (h 2 ), которая связывается с генной дисперсией ( σ 2 A ) . Однако, если это уместно, можно использовать широкосмысловую наследуемость (H 2 ) , которая будет связана с генотипической дисперсией (σ 2 G ) ; и даже, возможно, можно рассмотреть аллельную наследуемость [h 2 eu = (σ 2 a ) / (σ 2 P ) ] , связанную с ( σ 2 a ). [См. раздел о наследуемости.]
Чтобы применить эти концепции до того, как отбор фактически произойдет, и, таким образом, предсказать результат альтернатив (например, выбор порога отбора ), эти фенотипические статистики пересматриваются в отношении свойств нормального распределения, особенно тех, которые касаются усечения верхнего хвоста распределения. При таком рассмотрении стандартизированный дифференциал отбора (i)″ и стандартизированный порог отбора (z)″ используются вместо предыдущих «фенотипических» версий. Также необходимо фенотипическое стандартное отклонение (σ P(0) ) . Это описано в следующем разделе.
Следовательно, ΔG = (i σ P ) h 2 , где (i σ P(0) ) = S ранее. [14] : 1710–181
В тексте выше отмечено, что последовательные ΔG снижаются, поскольку «вход» [ фенотипическая дисперсия ( σ 2 P ) ] уменьшается предыдущим отбором. [14] : 1710–181 Наследуемость также снижается. Графики слева показывают эти снижения в течение десяти циклов повторного отбора, в течение которых утверждается то же давление отбора. Накопленный генетический прогресс ( ΣΔG ) фактически достиг своей асимптоты к поколению 6 в этом примере. Это снижение зависит частично от свойств усечения нормального распределения и частично от наследуемости вместе с детерминацией мейоза ( b 2 ) . Последние два пункта количественно определяют степень, в которой усечение «компенсируется» новой вариацией, возникающей в результате сегрегации и сортировки во время мейоза. [14] : 1710–181 [27] Это будет обсуждаться позже, но здесь отметим упрощенный результат для недисперсного случайного оплодотворения (f = 0) .
Таким образом: σ 2 P(1) = σ 2 P(0) [1 − i ( iz) 1/2 h 2 ] , где i ( iz) = K = коэффициент усечения и 1/2 h 2 = R = коэффициент воспроизводства [14] : 1710–181 [27] Это можно также записать как σ 2 P(1) = σ 2 P(0) [1 − KR ] , что облегчает более подробный анализ задач отбора.
Здесь i и z уже определены, 1/2 — это определение мейоза ( b 2 ) для f=0 , а оставшийся символ — это наследуемость. Они обсуждаются далее в следующих разделах. Также обратите внимание, что в более общем смысле R = b 2 h 2 . Если используется общее определение мейоза ( b 2 ) , результаты предшествующего инбридинга могут быть включены в выбор. Уравнение фенотипической дисперсии тогда становится следующим:
σ 2 P(1) знак равно σ 2 P(0) [1 - я ( из) б 2 час 2 ] .
Фенотипическая дисперсия , усеченная выбранной группой ( σ 2 P(S) ), просто равна σ 2 P(0) [1 − K] , а содержащаяся в ней генная дисперсия равна (h 2 0 σ 2 P(S) ). Предполагая, что отбор не изменил средовую дисперсию, генная дисперсия для потомства может быть аппроксимирована как σ 2 A(1) = (σ 2 P(1) − σ 2 E ) . Отсюда h 2 1 = (σ 2 A(1) / σ 2 P(1) ) . Аналогичные оценки можно сделать для σ 2 G(1) и H 2 1 или для σ 2 a(1) и h 2 eu(1) при необходимости.
Следующая перестановка полезна для рассмотрения отбора по нескольким атрибутам (признакам). Она начинается с расширения наследуемости на ее компоненты дисперсии. ΔG = i σ P ( σ 2 A / σ 2 P ) . σ P и σ 2 P частично сокращаются, оставляя один σ P . Затем σ 2 A внутри наследуемости можно расширить как ( σ A × σ A ), что приводит к :
ΔG = i σ A ( σ A / σ P ) = i σ A h .
Соответствующие перестановки могут быть сделаны с использованием альтернативных наследуемостей, давая ΔG = i σ G H или ΔG = i σ a h eu .
Этот традиционный взгляд на адаптацию в количественной генетике дает модель того, как выбранный фенотип изменяется с течением времени, как функция дифференциала отбора и наследуемости. Однако он не дает представления (и не зависит от) ни об одной из генетических деталей - в частности, о количестве вовлеченных локусов, их частотах аллелей и размерах эффекта, а также об изменениях частоты, вызванных отбором. Это, напротив, является фокусом работы по полигенной адаптации [62] в области популяционной генетики . Недавние исследования показали, что такие черты, как рост, развились у людей за последние несколько тысяч лет в результате небольших сдвигов частоты аллелей в тысячах вариантов, которые влияют на рост. [63] [64] [65]
Вся базовая популяция очерчена нормальной кривой [59] : 78–89 справа. Вдоль оси Z отложено каждое значение атрибута от наименьшего к наибольшему, а высота от этой оси до самой кривой — частота значения на оси ниже. Уравнение для нахождения этих частот для «нормальной» кривой (кривой «общего опыта») приведено в эллипсе. Обратите внимание, что оно включает среднее значение ( μ ) и дисперсию ( σ2 ). Двигаясь бесконечно мало вдоль оси z, частоты соседних значений могут быть «сложены» рядом с предыдущими, тем самым накапливая область, которая представляет вероятность получения всех значений в пределах стека. [Это интегрирование из исчисления.] Отбор фокусируется на такой области вероятности, являющейся затененной областью от порога отбора (z) до конца верхнего хвоста кривой. Это давление отбора . Выбранная группа (эффективные родители следующего поколения) включает все значения фенотипа от z до «конца» хвоста. [66] Среднее значение выбранной группы равно μ s , а разница между ним и базовым средним ( μ ) представляет собой дифференциал отбора (S) . Выполняя частичные интегрирования по интересующим участкам кривой и немного перестраивая алгебру, можно показать, что «дифференциал отбора» равен S = [ y (σ / Prob.)] , где y — частота значения на «пороге отбора» z ( ордината z ). [13] : 226–230 Перестановка этого соотношения дает S / σ = y / Prob. , левая часть которого, по сути, представляет собой дифференциал отбора, деленный на стандартное отклонение — то есть стандартизированный дифференциал отбора (i) . Правая сторона отношения обеспечивает «оценку» для i — ординаты порога отбора, деленной на давление отбора . Таблицы нормального распределения [49] : 547–548 могут быть использованы, но также доступны таблицы самого i . [67] : 123–124 Последняя ссылка также дает значения i , скорректированные для небольших популяций (400 и менее), [67] : 111–122 где «квазибесконечность» не может быть принята (но предполагалась в схеме «Нормального распределения» выше). Стандартизированный дифференциал отбора ( i ) также известен как интенсивность отбора . [14] : 174, 186
Наконец, может оказаться полезной перекрестная ссылка с отличающейся терминологией в предыдущем подразделе: μ (здесь) = "P 0 " (там), μ S = "P S " и σ 2 = "σ 2 P ".
Определение мейоза (b 2 ) является коэффициентом определения мейоза, который является делением клеток, посредством которого родители генерируют гаметы. Следуя принципам стандартизированной частичной регрессии , чей анализ пути является графически ориентированной версией, Сьюэлл Райт проанализировал пути потока генов во время полового размножения и установил «силы вклада» ( коэффициенты определения ) различных компонентов в общий результат. [27] [37] Анализ пути включает в себя частичные корреляции , а также частичные коэффициенты регрессии (последние являются коэффициентами пути ). Линии с одним наконечником стрелки являются направленными детерминированными путями , а линии с двойными наконечниками стрелок являются корреляционными связями . Отслеживание различных маршрутов в соответствии с правилами анализа пути имитирует алгебру стандартизированной частичной регрессии. [55]
Диаграмма путей слева представляет этот анализ полового размножения. Из его интересных элементов, важным в контексте отбора является мейоз . Именно здесь происходят сегрегация и сортировка — процессы, которые частично улучшают усечение фенотипической дисперсии, возникающей в результате отбора. Коэффициенты путей b — это пути мейоза. Те, что обозначены a, — это пути оплодотворения. Корреляция между гаметами от одного родителя ( g ) — это мейотическая корреляция . Корреляция между родителями в пределах одного поколения — r A. Корреляция между гаметами от разных родителей ( f ) впоследствии стала известна как коэффициент инбридинга . [13] : 64 Штрихи (') указывают поколение (t-1) , а нештрихи указывают поколение t . Здесь приведены некоторые важные результаты настоящего анализа. Сьюэлл Райт интерпретировал многие из них в терминах коэффициентов инбридинга. [27] [37]
Определение мейоза ( b 2 ) 1/2 (1+g) и равно 1/2 (1 + f (t-1) ) , что подразумевает, что g = f (t-1) . [68] При недисперсном случайном оплодотворении f (t-1) ) = 0, что дает b 2 = 1/2 , как используется в разделе выбора выше. Однако, зная его предысторию, другие схемы оплодотворения могут быть использованы по мере необходимости. Другое определение также включает инбридинг — определение оплодотворения ( a 2 ) равно 1 / [ 2 ( 1 + f t ) ] . Еще одна корреляция — это индикатор инбридинга — r A = 2 f t / ( 1 + f (t-1) ) , также известный как коэффициент родства . [Не путайте это с коэффициентом родства — альтернативным названием коэффициента совместного происхождения . См. введение в раздел «Родство».] Этот r A повторно встречается в подразделе о дисперсии и отборе.
Эти связи с инбридингом раскрывают интересные аспекты полового размножения, которые не очевидны сразу. Графики справа отображают коэффициенты детерминации мейоза и сингамии (оплодотворения) в зависимости от коэффициента инбридинга. Там показано, что по мере увеличения инбридинга мейоз становится более важным (коэффициент увеличивается), в то время как сингамия становится менее важной. Общая роль воспроизводства [произведение предыдущих двух коэффициентов — r 2 ] остается прежней. [69] Это увеличение b 2 особенно актуально для отбора, поскольку оно означает, что селекционное усечение фенотипической дисперсии компенсируется в меньшей степени во время последовательности отборов, когда оно сопровождается инбридингом (что часто имеет место).
В предыдущих разделах дисперсия рассматривалась как «помощник» отбора , и стало очевидно, что они хорошо работают вместе. В количественной генетике отбор обычно изучается в этом «биометрическом» стиле, но изменения в средних значениях (отслеживаемые ΔG) отражают изменения в частотах аллелей и генотипов под этой поверхностью. Отсылка к разделу «Генетический дрейф» заставляет вспомнить, что он также влияет на изменения в частотах аллелей и генотипов и связанных с ними средних значениях; и что это сопутствующий аспект рассматриваемой здесь дисперсии («другая сторона одной медали»). Однако эти две силы изменения частоты редко действуют сообща и часто могут действовать противоположно друг другу. Одна (отбор) является «направленной», поскольку обусловлена давлением отбора, действующим на фенотип: другая (генетический дрейф) обусловлена «случайностью» при оплодотворении (биномиальные вероятности образцов гамет). Если два стремятся к одной и той же частоте аллеля, их «совпадение» — это вероятность получения этой выборки частот в генетическом дрейфе: вероятность того, что они «конфликтуют», однако, является суммой вероятностей всех альтернативных выборок частот . В крайних случаях одна выборка сингамии может отменить то, чего достиг отбор, и вероятности того, что это произойдет, доступны. Важно иметь это в виду. Однако генетический дрейф, приводящий к частотам выборки, аналогичным частотам цели отбора, не приводит к столь радикальному результату — вместо этого замедляя прогресс в достижении целей отбора.
При совместном наблюдении двух (или более) атрибутов ( например, высоты и массы) можно заметить, что они изменяются вместе по мере изменения генов или окружающей среды. Эта ковариация измеряется ковариацией , которая может быть представлена как « cov » или как θ . [43] Она будет положительной, если они изменяются вместе в одном направлении; или отрицательной, если они изменяются вместе, но в противоположном направлении. Если два атрибута изменяются независимо друг от друга, ковариация будет равна нулю. Степень ассоциации между атрибутами количественно определяется коэффициентом корреляции (символ r или ρ ). В общем, коэффициент корреляции представляет собой отношение ковариации к геометрическому среднему [70] двух дисперсий атрибутов. [59] : 196–198 Наблюдения обычно происходят на уровне фенотипа, но в исследованиях они могут также происходить на уровне «эффективного гаплотипа» (эффективного продукта гена) [см. рисунок справа]. Ковариация и корреляция могут быть, таким образом, «фенотипическими» или «молекулярными», или любым другим обозначением, которое допускает модель анализа. Фенотипическая ковариация является «самым внешним» слоем и соответствует «обычной» ковариации в биометрии/статистике. Однако ее можно разделить любой подходящей исследовательской моделью таким же образом, как и фенотипическую дисперсию. Для каждого раздела ковариации существует соответствующий раздел корреляции. Некоторые из этих разделов приведены ниже. Первый нижний индекс (G, A и т. д.) указывает на раздел. Индексы второго уровня (X, Y) являются «местопоставителями» для любых двух атрибутов.
Первый пример — неразделенный фенотип.
Далее следуют генетические разбиения (а) «генотипический» (общий генотип), (б) «генный» (ожидания замещения) и (в) «аллельный» (гомозигота).
(а)
(б)
(с)
При правильном проведении эксперимента можно также получить негенетическое (средовое) разделение.
Существует несколько различных способов возникновения фенотипической корреляции. Дизайн исследования, размер выборки, выборочная статистика и другие факторы могут влиять на способность различать их с большей или меньшей статистической уверенностью. Каждый из них имеет различную научную значимость и относится к различным областям работы.
Один фенотип может напрямую влиять на другой фенотип, влияя на развитие, обмен веществ или поведение.
Общий ген или фактор транскрипции в биологических путях двух фенотипов может привести к корреляции.
Метаболические пути от гена к фенотипу сложны и разнообразны, но причины корреляции между признаками лежат именно в них.
На несколько фенотипов могут влиять одни и те же факторы. Например, существует множество фенотипических признаков, коррелирующих с возрастом, поэтому рост, вес, потребление калорий, эндокринная функция и многое другое имеют корреляцию. Исследование, ищущее другие общие факторы, должно сначала исключить их.
Различия между подгруппами в популяции, между популяциями или селективные предубеждения могут означать, что некоторые комбинации генов представлены сверх ожидаемого. Хотя гены могут не оказывать значительного влияния друг на друга, между ними все равно может быть корреляция, особенно когда определенным генотипам не разрешается смешиваться. Популяции, находящиеся в процессе генетической дивергенции или уже претерпевшие ее, могут иметь различные характерные фенотипы, [71] что означает, что при совместном рассмотрении появляется корреляция. Фенотипические качества у людей, которые в основном зависят от происхождения, также вызывают корреляции этого типа. Это также можно наблюдать у пород собак, где несколько физических особенностей составляют отличительность данной породы и, следовательно, коррелируют. [72] Ассортативное спаривание , которое представляет собой сексуально селективное давление с целью спаривания с похожим фенотипом, может привести к тому, что генотипы останутся коррелированными больше, чем можно было бы ожидать. [73]
{{cite book}}
: |journal=
проигнорировано ( помощь )