Наследуемость — это статистика, используемая в области селекции и генетики , которая оценивает степень вариации фенотипического признака в популяции , которая обусловлена генетической вариацией между особями в этой популяции. [1] Понятие наследуемости можно выразить в форме следующего вопроса: «Какова доля вариации данного признака в популяции, которая не объясняется средой или случайностью?» [2]
Другие причины измеренной вариации признака характеризуются как факторы окружающей среды , включая ошибку наблюдения . В исследованиях наследуемости человека они часто распределяются на факторы «общей среды» и «несовместной среды» на основе того, приводят ли они к тому, что люди, воспитывающиеся в одном доме, становятся более или менее похожими на людей, которые не воспитывались в одном доме.
Наследуемость оценивается путем сравнения индивидуальных фенотипических вариаций среди родственных особей в популяции, путем изучения связи между индивидуальными фенотипическими и генотипическими данными, [3] [4] или даже путем моделирования данных на уровне сводки из исследований ассоциаций по всему геному (GWAS). [5] Наследуемость является важным понятием в количественной генетике , особенно в селективном разведении и генетике поведения (например, исследования близнецов ). Это источник большой путаницы из-за того, что его техническое определение отличается от его общепринятого народного определения. Поэтому его использование создает неверное впечатление, что поведенческие черты «унаследованы» или специфически передаются через гены. [6] Поведенческие генетики также проводят анализы наследуемости, основанные на предположении, что гены и окружающая среда вносят отдельный, аддитивный вклад в поведенческие черты. [7]
Наследуемость измеряет долю изменчивости фенотипа, которую можно отнести к генетической изменчивости . Это не то же самое, что сказать, что эта доля индивидуального фенотипа обусловлена генетикой. Например, неверно говорить, что поскольку наследуемость черт личности составляет около 0,6, это означает, что 60% вашей личности унаследовано от ваших родителей, а 40% — от окружающей среды. Кроме того, наследуемость может измениться без каких-либо генетических изменений, например, когда окружающая среда начинает вносить больший вклад в изменчивость. В качестве примера рассмотрим, что и гены , и окружающая среда имеют потенциал влиять на интеллект. Наследуемость может увеличиться, если генетическая изменчивость увеличится, заставив людей демонстрировать больше фенотипической изменчивости, например, показывать разные уровни интеллекта. С другой стороны, наследуемость может также увеличиться, если изменчивость окружающей среды уменьшится, заставив людей демонстрировать меньше фенотипической изменчивости, например, показывать более схожие уровни интеллекта. Наследуемость увеличивается, когда генетика вносит больший вклад в изменчивость или потому что негенетические факторы вносят меньший вклад; важен относительный вклад. Наследуемость специфична для конкретной популяции в конкретной среде. Высокая наследуемость признака, следовательно, не обязательно означает, что признак не очень восприимчив к влиянию окружающей среды. [8] Наследуемость также может меняться в результате изменений в окружающей среде, миграции, инбридинга или способа, которым сама наследуемость измеряется в изучаемой популяции. [9] Наследуемость признака не следует интерпретировать как меру степени, в которой этот признак генетически детерминирован у особи. [10] [11]
Степень зависимости фенотипа от окружающей среды также может быть функцией вовлеченных генов. Вопросы наследуемости сложны, поскольку гены могут канализировать фенотип, делая его выражение почти неизбежным во всех встречающихся средах. Индивиды с одним и тем же генотипом также могут проявлять разные фенотипы через механизм, называемый фенотипической пластичностью , что в некоторых случаях затрудняет измерение наследуемости. Недавние исследования в области молекулярной биологии выявили изменения в транскрипционной активности отдельных генов, связанные с изменениями окружающей среды. Однако существует большое количество генов, транскрипция которых не зависит от окружающей среды. [12]
Оценки наследуемости используют статистический анализ , чтобы помочь выявить причины различий между особями. Поскольку наследуемость связана с дисперсией, она обязательно является учетом различий между особями в популяции. Наследуемость может быть одномерной — исследуя один признак — или многомерной — исследуя генетические и экологические ассоциации между несколькими признаками одновременно. Это позволяет проверить генетическое перекрытие между различными фенотипами: например, цветом волос и цветом глаз . Окружающая среда и генетика также могут взаимодействовать, и анализ наследуемости может проверять и изучать эти взаимодействия (модели GxE).
Предпосылкой для анализа наследуемости является то, что существует некоторая популяционная вариация, которую нужно учитывать. Этот последний пункт подчеркивает тот факт, что наследуемость не может учитывать влияние факторов, которые являются инвариантными в популяции. Факторы могут быть инвариантными, если они отсутствуют и не существуют в популяции, например, никто не имеет доступа к определенному антибиотику , или потому что они вездесущи, например, если все пьют кофе . На практике все поведенческие черты человека различаются, и почти все черты показывают некоторую наследуемость. [13]
Любой конкретный фенотип можно смоделировать как сумму генетических и экологических эффектов: [14]
Аналогично фенотипическая дисперсия признака – Var (P) – представляет собой сумму следующих эффектов:
В запланированном эксперименте Cov( G , E ) можно контролировать и удерживать на уровне 0. В этом случае наследуемость определяется как [15]
H 2 — это наследуемость в широком смысле. Она отражает все генетические вклады в фенотипическую дисперсию популяции, включая аддитивные, доминантные и эпистатические (мультигенные взаимодействия), а также материнские и отцовские эффекты , когда на особей напрямую влияет фенотип их родителей, например, в случае с выработкой молока у млекопитающих.
Особенно важным компонентом генетической дисперсии является аддитивная дисперсия, Var(A), которая является дисперсией, обусловленной средними эффектами (аддитивными эффектами) аллелей . Поскольку каждый родитель передает один аллель на локус каждому потомку, сходство родителей и потомков зависит от среднего эффекта отдельных аллелей. Аддитивная дисперсия представляет собой, таким образом, генетический компонент дисперсии, ответственный за сходство родителей и потомков. Аддитивная генетическая часть фенотипической дисперсии известна как узкосмысловая наследуемость и определяется как
Заглавная буква H 2 используется для обозначения широкого смысла, а строчная буква h 2 — узкого смысла.
Для признаков, которые не являются непрерывными, а дихотомическими, таких как дополнительный палец ноги или определенные заболевания, вклад различных аллелей можно рассматривать как сумму, которая после порогового значения проявляется как признак, давая модель порога ответственности , в которой можно оценить наследуемость и смоделировать отбор.
Аддитивная дисперсия важна для отбора . Если оказывается селективное давление, например, улучшение поголовья скота, реакция признака напрямую связана с узкосмысловой наследуемостью. Среднее значение признака увеличится в следующем поколении в зависимости от того, насколько среднее значение выбранных родителей отличается от среднего значения популяции, из которой были выбраны выбранные родители. Наблюдаемая реакция на отбор приводит к оценке узкосмысловой наследуемости (называемой реализованной наследуемостью ). Это принцип, лежащий в основе искусственного отбора или разведения.
Простейшая генетическая модель включает один локус с двумя аллелями (b и B), влияющими на один количественный фенотип.
Число аллелей B может быть равно 0, 1 или 2. Для любого генотипа ( B i , B j ), где B i и B j равны 0 или 1, ожидаемый фенотип можно записать как сумму общего среднего значения, линейного эффекта и отклонения доминирования (можно рассматривать член доминирования как взаимодействие между B i и B j ) :
Аддитивная генетическая дисперсия в этом локусе представляет собой средневзвешенное значение квадратов аддитивных эффектов:
где
Аналогичная зависимость существует и для дисперсии отклонений доминирования:
где
Линейная регрессия фенотипа на генотип показана на рисунке 1.
Оценки общей наследуемости человеческих черт предполагают отсутствие эпистаза, что было названо «предположением аддитивности». Хотя некоторые исследователи ссылались на такие оценки в поддержку существования « отсутствующей наследуемости », не учтенной известными генетическими локусами, предположение аддитивности может сделать эти оценки недействительными. [16] Также есть некоторые эмпирические доказательства того, что предположение аддитивности часто нарушается в поведенческих генетических исследованиях подросткового интеллекта и академических достижений . [17]
Поскольку только P может наблюдаться или измеряться напрямую, наследуемость должна оцениваться на основе сходств, наблюдаемых у субъектов, различающихся по уровню генетического или экологического сходства. Статистический анализ, необходимый для оценки генетических и экологических компонентов дисперсии, зависит от характеристик выборки. Вкратце, более точные оценки получаются с использованием данных от индивидуумов с сильно различающимися уровнями генетического родства, таких как близнецы , братья и сестры, родители и потомки, а не от более отдаленно связанных (и, следовательно, менее похожих) субъектов. Стандартная ошибка для оценок наследуемости улучшается при больших размерах выборки.
В нечеловеческих популяциях часто возможно собирать информацию контролируемым образом. Например, среди сельскохозяйственных животных легко организовать так, чтобы бык производил потомство от большого количества коров и контролировал окружающую среду. Такой экспериментальный контроль , как правило, невозможен при сборе человеческих данных, полагаясь на естественные отношения и окружающую среду.
В классической количественной генетике существовало две школы мысли относительно оценки наследуемости.
Одна из школ мысли была разработана Сьюэллом Райтом в Чикагском университете и в дальнейшем популяризирована CC Li ( Чикагский университет ) и JL Lush ( Университет штата Айова ). Она основана на анализе корреляций и, как следствие, регрессии. Анализ путей был разработан Сьюэллом Райтом как способ оценки наследуемости.
Второй был первоначально разработан RA Fisher и расширен в Университете Эдинбурга , Университете штата Айова и Университете штата Северная Каролина , а также в других школах. Он основан на дисперсионном анализе селекционных исследований с использованием внутриклассовой корреляции родственников. В этих анализах используются различные методы оценки компонентов дисперсии (и, следовательно, наследуемости) из ANOVA .
Сегодня наследуемость можно оценить на основе общих родословных с использованием линейных смешанных моделей , а также на основе геномного родства, оцененного с помощью генетических маркеров.
Исследования наследуемости человека часто используют дизайны исследований усыновления, часто с идентичными близнецами , которые были разделены в раннем возрасте и выросли в разных условиях. Такие люди имеют идентичные генотипы и могут быть использованы для разделения эффектов генотипа и окружающей среды. Ограничением этого дизайна является общая пренатальная среда и относительно небольшое количество близнецов, выросших отдельно. Вторым и более распространенным дизайном является исследование близнецов , в котором сходство идентичных и разнояйцевых близнецов используется для оценки наследуемости. Эти исследования могут быть ограничены тем фактом, что идентичные близнецы не полностью генетически идентичны , что потенциально приводит к недооценке наследуемости.
В наблюдательных исследованиях или из-за эффектов, вызывающих воспоминания (где геном вызывает среду своим воздействием на нее), G и E могут ковариировать: корреляция ген-среда . В зависимости от методов, используемых для оценки наследуемости, корреляции между генетическими факторами и общей или не общей средой могут быть или не быть смешаны с наследуемостью. [18]
Первая школа оценки использует регрессию и корреляцию для оценки наследуемости.
При сравнении родственников мы обнаруживаем, что в целом,
где r можно рассматривать как коэффициент родства , b — коэффициент регрессии, а t — коэффициент корреляции.
Наследуемость можно оценить, сравнив родительские и потомственные черты (как на рис. 2). Наклон линии (0,57) приблизительно соответствует наследуемости черты, когда значения потомства регрессируют против среднего признака у родителей. Если используется только одно родительское значение, то наследуемость в два раза больше наклона. (Это источник термина « регрессия », поскольку значения потомства всегда имеют тенденцию регрессировать к среднему значению для популяции, т. е . наклон всегда меньше единицы). Этот эффект регрессии также лежит в основе метода ДеФриса–Фалкера для анализа близнецов, выбранных для одного пораженного члена. [19]
Базовый подход к наследуемости может быть реализован с использованием дизайна полных сибсов: сравнение сходства между братьями и сестрами, которые имеют как биологическую мать, так и отца. [20] Когда есть только аддитивное действие генов, эта фенотипическая корреляция братьев и сестер является индексом близости — суммой половины аддитивной генетической дисперсии плюс полный эффект общей среды. Таким образом, он устанавливает верхний предел аддитивной наследуемости в два раза больше фенотипической корреляции полных сибсов. Дизайны полусибсов сравнивают фенотипические черты братьев и сестер, которые имеют одного общего родителя, с другими группами братьев и сестер.
Наследуемость признаков у людей чаще всего оценивается путем сравнения сходств между близнецами. «Преимущество исследований близнецов заключается в том, что общая дисперсия может быть разделена на генетические, общие или общие экологические и уникальные экологические компоненты, что позволяет точно оценить наследуемость». [21] Разнояйцевые или дизиготные (ДЗ) близнецы в среднем разделяют половину своих генов (при условии отсутствия ассортативного спаривания для данного признака), и поэтому идентичные или монозиготные (МЗ) близнецы в среднем в два раза генетически схожи, чем ДЗ близнецы. Таким образом, грубая оценка наследуемости примерно вдвое больше разницы в корреляции между МЗ и ДЗ близнецами, т. е. формула Фалконера H 2 =2(r(MZ)-r(DZ)).
Эффект общей среды, c 2 , способствует сходству между братьями и сестрами из-за общности среды, в которой они воспитываются. Общая среда аппроксимируется корреляцией DZ минус половина наследуемости, которая является степенью, в которой близнецы DZ разделяют одни и те же гены, c 2 =DZ-1/2 h 2 . Уникальная дисперсия среды, e 2 , отражает степень, в которой однояйцевые близнецы, выросшие вместе, являются непохожими, e 2 =1-r(MZ).
Второй набор методов оценки наследуемости включает дисперсионный анализ (ANOVA) и оценку компонентов дисперсии.
Мы используем базовое обсуждение Кемпторна. [14] Рассматривая только самые основные генетические модели, мы можем рассмотреть количественный вклад одного локуса с генотипом G i как
где — эффект генотипа G i , а — эффект окружающей среды.
Рассмотрим эксперимент с группой отцов и их потомством от случайных самок. Поскольку потомство получает половину генов от отца и половину от (случайной) матери, уравнение потомства имеет вид
Рассмотрим эксперимент выше. У нас есть две группы потомства, которые мы можем сравнить. Первая сравнивает различное потомство для отдельного отца (называемое внутри группы отцов ). Дисперсия будет включать термины для генетической дисперсии (поскольку они не все получили один и тот же генотип) и дисперсии окружающей среды. Это считается ошибкой .
Вторая группа потомства — это сравнения средних значений полусибсов друг с другом (называемая группой среди отцов ). В дополнение к ошибке, как в группах внутри отцов, у нас есть дополнительный член из-за различий между различными средними значениями полусибсов. Внутриклассовая корреляция — это
поскольку воздействия окружающей среды независимы друг от друга.
В эксперименте с производителями и потомством на одного производителя мы можем рассчитать следующий дисперсионный анализ, используя в качестве генетической дисперсии и в качестве дисперсии окружающей среды:
Термин — внутриклассовая корреляция между полусибсами. Мы можем легко вычислить . Ожидаемый средний квадрат рассчитывается из взаимоотношений особей (например, все потомки одного отца — полусибсыны) и понимания внутриклассовых корреляций.
Использование ANOVA для расчета наследуемости часто не учитывает наличие взаимодействий генов и окружающей среды , поскольку ANOVA имеет гораздо меньшую статистическую мощность для проверки эффектов взаимодействия, чем для прямых эффектов. [22]
Для модели с аддитивными и доминирующими членами, но не с другими, уравнение для одного локуса имеет вид
где
— аддитивный эффект i- го аллеля, — аддитивный эффект j -го аллеля, — отклонение доминирования для ij -го генотипа, — окружающая среда.
Эксперименты можно проводить с аналогичной настройкой, приведенной в Таблице 1. Используя различные группы взаимоотношений, мы можем оценить различные внутриклассовые корреляции. Используя в качестве аддитивной генетической дисперсии и в качестве дисперсии отклонения доминирования, внутриклассовые корреляции становятся линейными функциями этих параметров. В общем,
где и находятся как
P[ аллели, выбранные случайным образом из пары родства, идентичны по происхождению ], и
P[ генотипы , выбранные случайным образом из пары родства, идентичны по происхождению ].
Некоторые общие соотношения и их коэффициенты приведены в таблице 2.
В литературе описано множество подходов с использованием линейных смешанных моделей. С помощью этих методов фенотипическая дисперсия разделяется на генетические, экологические и экспериментальные дисперсии для оценки наследуемости. Экологическая дисперсия может быть явно смоделирована путем изучения индивидуумов в широком диапазоне сред, хотя вывод генетической дисперсии из фенотипической и экологической дисперсии может привести к недооценке наследуемости из-за проблемы охвата всего спектра влияния среды, влияющего на признак. Другие методы расчета наследуемости используют данные из исследований ассоциаций по всему геному для оценки влияния на признак генетических факторов, что отражается в скорости и влиянии предположительно связанных генетических локусов (обычно однонуклеотидных полиморфизмов ) на признак. Однако это может привести к недооценке наследуемости. Это несоответствие называется «отсутствующей наследуемостью» и отражает проблему точного моделирования как генетической, так и экологической дисперсии в моделях наследуемости. [23]
При наличии большой, сложной родословной или другого вышеупомянутого типа данных наследуемость и другие количественные генетические параметры можно оценить с помощью ограниченного максимального правдоподобия (REML) или байесовских методов . Необработанные данные обычно содержат три или более точек данных для каждой особи: код для отца, код для матери и одно или несколько значений признаков. Различные значения признаков могут быть для разных признаков или для разных временных точек измерения.
Популярная в настоящее время методология опирается на высокую степень уверенности в идентификации отца и матери; не принято рассматривать идентификацию отца вероятностно. Обычно это не проблема, поскольку методология редко применяется к диким популяциям (хотя она использовалась для нескольких популяций диких копытных и птиц), а отцы неизменно известны с очень высокой степенью уверенности в программах разведения. Существуют также алгоритмы, которые учитывают неопределенное отцовство.
Родословные можно просматривать с помощью таких программ, как Pedigree Viewer [1], и анализировать с помощью таких программ, как ASReml , VCE [2], WOMBAT [3], MCMCglmm в среде R [4] или семейства программ BLUPF90 [5].
Модели родословной полезны для распутывания таких запутанных явлений, как обратная причинно-следственная связь , материнские эффекты , такие как пренатальная среда, и запутанных явлений генетического доминирования , общей среды и материнских генных эффектов. [24] [9]
Когда доступны данные о генотипе по всему геному и фенотипы из больших выборок популяции, можно оценить связи между индивидуумами на основе их генотипов и использовать линейную смешанную модель для оценки дисперсии, объясняемой генетическими маркерами. Это дает оценку геномной наследуемости на основе дисперсии, зафиксированной общими генетическими вариантами. [4] Существует несколько методов, которые вносят различные корректировки для частоты аллелей и неравновесия сцепления . В частности, метод, называемый High-Definition Likelihood (HDL), может оценить геномную наследуемость, используя только сводную статистику GWAS, [5] что упрощает включение большого размера выборки, доступной в различных метаанализах GWAS.
При селекции растений и животных ожидаемый ответ на отбор признака с известной узконаправленной наследуемостью можно оценить с помощью уравнения селекционера : [25]
В этом уравнении ответ на отбор (R) определяется как реализованная средняя разница между родительским поколением и следующим поколением, а дифференциал отбора (S) определяется как средняя разница между родительским поколением и выбранными родителями. [14] : 1957 [26]
Например, представьте, что селекционер растений участвует в проекте по селективному разведению с целью увеличения количества зерен в початке кукурузы. Ради аргумента предположим, что средний початок кукурузы в родительском поколении имеет 100 зерен. Предположим также, что выбранные родители производят кукурузу со средним количеством зерен в початке 120. Если h 2 равно 0,5, то следующее поколение будет производить кукурузу со средним количеством зерен 0,5(120-100) = 10 дополнительных зерен в початке. Таким образом, общее количество зерен в початке кукурузы будет равно в среднем 110.
Наблюдение за реакцией на отбор в эксперименте по искусственному отбору позволит рассчитать реализованную наследуемость, как показано на рис. 4.
Наследуемость в приведенном выше уравнении равна отношению только в том случае, если генотип и шум окружающей среды следуют гауссовому распределению .
Известные критики оценок наследуемости, такие как Стивен Роуз [27] , Джей Джозеф [ 28] и Ричард Бенталл , в основном сосредоточены на оценках наследуемости в поведенческих и социальных науках . Бенталл утверждал, что такие оценки наследуемости обычно рассчитываются контринтуитивно, чтобы получить численно высокие оценки, что наследуемость неверно истолковывается как генетическая детерминация , и что эта предполагаемая предвзятость отвлекает от других факторов, которые исследователи сочли более важными с точки зрения причин, таких как насилие в детстве, вызывающее более поздний психоз. [29] [30] Оценки наследуемости также по своей сути ограничены, поскольку они не передают никакой информации относительно того, играют ли гены или окружающая среда большую роль в развитии изучаемого признака. По этой причине Дэвид Мур и Дэвид Шенк описывают термин «наследуемость» в контексте генетики поведения как «... один из самых вводящих в заблуждение в истории науки» и утверждают, что он не имеет никакой ценности, за исключением очень редких случаев. [31] При изучении сложных человеческих черт невозможно использовать анализ наследуемости для определения относительного вклада генов и окружающей среды, поскольку такие черты являются результатом взаимодействия множества причин. [32] В частности, Фельдман и Левонтин подчеркивают, что наследуемость сама по себе является функцией вариации окружающей среды. [33] Однако некоторые исследователи утверждают, что их можно разделить. [34]
Спор относительно оценок наследуемости в значительной степени связан с их основой в исследованиях близнецов . Недостаточный успех молекулярно-генетических исследований в подтверждении выводов таких популяционно-генетических исследований является проблемой отсутствующей наследуемости . [35] Эрик Туркхаймер утверждал, что новые молекулярные методы подтвердили традиционную интерпретацию исследований близнецов, [35] хотя в основном остается неясным, как объяснить связи между генами и поведением. [36] По мнению Туркхаймера, и гены, и окружающая среда наследуются, генетический вклад варьируется в зависимости от окружающей среды, а фокус на наследуемости отвлекает от других важных факторов. [37] Однако в целом наследуемость является широко применимой концепцией. [9]
{{cite book}}
: CS1 maint: location missing publisher (link)...все сложные человеческие черты являются результатом сочетания причин. Если эти причины взаимодействуют, невозможно присвоить количественные значения доле черты, обусловленной каждой из них, так же как мы не можем сказать, какая часть площади прямоугольника обусловлена, по отдельности, каждым из его двух измерений. Таким образом, при анализе сложных человеческих фенотипов... мы не можем фактически найти «относительную важность генов и окружающей среды в определении фенотипа».