stringtranslate.com

F-статистика

В популяционной генетике F - статистика (также известная как индексы фиксации ) описывает статистически ожидаемый уровень гетерозиготности в популяции; более конкретно, ожидаемую степень (обычно) снижения гетерозиготности по сравнению с ожиданием Харди-Вайнберга .

F -статистику также можно рассматривать как меру корреляции между генами, взятыми с разных уровней (иерархически) подразделенной популяции. Эта корреляция находится под влиянием нескольких эволюционных процессов, таких как генетический дрейф , эффект основателя , бутылочное горлышко , генетический автостоп , мейотический драйв , мутация , поток генов , инбридинг , естественный отбор или эффект Валунда , но изначально она была разработана для измерения количества аллельной фиксации вследствие генетического дрейфа .

Концепция F -статистики была разработана в 1920-х годах американским генетиком Сьюэллом Райтом [1] [2] , который интересовался инбридингом у крупного рогатого скота . Однако, поскольку полное доминирование приводит к тому, что фенотипы гомозиготных доминантов и гетерозигот одинаковы, только с появлением молекулярной генетики в 1960-х годах стало возможным измерение гетерозиготности в популяциях.

F можно использовать для определения эффективной численности популяции . [ необходимо дополнительное объяснение ]

Определения и уравнения

Меры F IS , F ST и F IT связаны с количеством гетерозиготности на различных уровнях структуры популяции. Вместе они называются F -статистикой и выводятся из F , коэффициента инбридинга . В простой двухаллельной системе с инбридингом генотипические частоты следующие:

Значение для находится путем решения уравнения для использования гетерозигот в вышеуказанной инбредной популяции. Это становится единицей минус наблюдаемая частота гетерозигот в популяции, деленная на ожидаемую частоту гетерозигот в равновесии Харди-Вайнберга :

где ожидаемая частота при равновесии Харди–Вайнберга определяется как

где и являются частотами аллелей и , соответственно. Это также вероятность того, что в любом локусе два аллеля от случайного индивида популяции идентичны по происхождению .

Например, рассмотрим данные Э. Б. Форда (1971) по одной популяции алой тигровой моли :

Исходя из этого, можно рассчитать частоты аллелей и получить ожидание :

Различные F-статистики рассматривают разные уровни структуры популяции. F IT — это коэффициент инбридинга особи ( I ) по отношению к общей популяции ( T ), как указано выше; F IS — это коэффициент инбридинга особи ( I ) по отношению к субпопуляции ( S ), использующий указанное выше для субпопуляций и усредняющий их; а F ST — это эффект субпопуляций ( S ) по сравнению с общей популяцией ( T ), который рассчитывается путем решения уравнения:

как показано в следующем разделе.

Раздел по структуре населения

можно разделить на вызванные эффектом Валунда и вызванные инбридингом .

Рассмотрим популяцию, имеющую двухуровневую структуру : один от индивидуума (I) к субпопуляции (S) и один от субпопуляции к общему числу (T). Тогда общее число , известное здесь как , можно разделить на и :

Это может быть далее разделено для подструктуры населения, и оно расширяется в соответствии с правилами биномиального расширения , так что для I разделов:

Индекс фиксации

Переформулирование определения было бы отношением среднего числа различий между парами хромосом, отобранных у диплоидных особей, к среднему числу, полученному при случайной выборке хромосом из популяции (исключая группировку на особь). Можно изменить это определение и рассмотреть группировку на субпопуляцию, а не на особь. Популяционные генетики использовали эту идею для измерения степени структуры в популяции.

К сожалению, существует большое количество определений для , что приводит к некоторой путанице в научной литературе. Общее определение следующее:

где дисперсия вычисляется по субпопуляциям и представляет собой ожидаемую частоту гетерозигот.

Индекс фиксации в человеческих популяциях

Хорошо известно, что генетическое разнообразие среди человеческих популяций невелико, [3] хотя распределение генетического разнообразия было оценено лишь приблизительно. Ранние исследования утверждали, что 85–90% генетической изменчивости обнаружено у людей, проживающих в одних и тех же популяциях в пределах континентов (внутриконтинентальные популяции), и только дополнительные 10–15% обнаружены между популяциями разных континентов (континентальные популяции). [4] [5] [6] [7] [8] Более поздние исследования, основанные на сотнях тысяч однонуклеотидных полиморфизмов (SNP), предположили, что генетическое разнообразие между континентальными популяциями еще меньше и составляет от 3 до 7% [9] [10] [11] [12] [13] [14] Более позднее исследование, основанное на трех миллионах SNP, показало, что 12% генетической изменчивости обнаружено между континентальными популяциями и только 1% внутри них. [15] Большинство этих исследований использовали статистику F ST [16] или тесно связанную статистику. [17] [18]

Смотрите также

Ссылки

  1. ^ Райт, С. (1950). «Генетическая структура популяций». Nature . 166 (4215): 247–9. Bibcode : 1950Natur.166..247W. doi : 10.1038/166247a0. PMID  15439261. S2CID  36311175.
  2. ^ Кулиг, К (1985). «Использование экстренных токсикологических скринингов». Американский журнал неотложной медицины . 3 (6): 573–4. doi :10.1016/0735-6757(85)90177-9. LCCN  67025533. PMID  4063030.
  3. ^ Холсингер, Кент Э.; Вейр, Брюс С. (2009). «Генетика в географически структурированных популяциях: определение, оценка и интерпретация FST». Nature Reviews Genetics . 10 (9): 639–50. doi :10.1038/nrg2611. PMC 4687486. PMID 19687804  . 
  4. ^ Левонтин (1972). «Распределение человеческого разнообразия». Эволюционная биология . Том 6. С. 381–98. doi :10.1007/978-1-4684-9063-3_14. ISBN 978-1-4684-9065-7.
  5. ^ Боукок, Энн М.; Кидд, Джудит Р.; Маунтин, Джоанна Л.; Герберт, Джоан М.; Каротенуто, Лучано; Кидд, Кеннет К.; Кавалли-Сфорца, Лука (1991). «Дрейф, смешение и отбор в эволюции человека: исследование с использованием полиморфизмов ДНК». Труды Национальной академии наук . 88 (3): 839–43. Bibcode : 1991PNAS...88..839B. doi : 10.1073/pnas.88.3.839 . JSTOR  2356081. PMC 50909. PMID  1992475. 
  6. ^ Барбуджани, Гвидо; Маганьи, Арианна; Минч, Эрик; Кавалли-Сфорца, Л. Лука (1997). «Распределение разнообразия ДНК человека». Труды Национальной академии наук Соединенных Штатов Америки . 94 (9): 4516–9. Bibcode : 1997PNAS...94.4516B. doi : 10.1073 /pnas.94.9.4516 . JSTOR  42042. PMC 20754. PMID  9114021. 
  7. ^ Jorde, LB; Watkins, WS; Bamshad, MJ; Dixon, ME; Ricker, CE; Seielstad, MT; Batzer, MA (2000). «Распределение генетического разнообразия человека: сравнение данных митохондриальной, аутосомной и Y-хромосомной ДНК». Американский журнал генетики человека . 66 (3): 979–88. doi :10.1086/302825. PMC 1288178. PMID 10712212  . 
  8. ^ Jorde, Lynn B; Wooding, Stephen P (2004). «Генетическая изменчивость, классификация и «раса»». Nature Genetics . 36 (11s): S28-33. doi : 10.1038/ng1435 . PMID  15508000.
  9. ^ Махасиримонгкол, Суракамет; Чантратита, Васун; Промсо, Сомиинг; Пасомсаб, Экават; и др. (2006). «Сходство частоты аллелей и паттерна неравновесия сцепления однонуклеотидных полиморфизмов в локусах генов, связанных с наркотиками, между тайскими и северо-восточноазиатскими популяциями: последствия для маркировки выбора SNP у тайцев». Журнал генетики человека . 51 (10): 896–904. doi : 10.1007/s10038-006-0041-1 . PMID  16957813.
  10. ^ Ханнелиус, Ульф; Салмела, Элина; Лаппалайнен, Туули; Гийо, Жиль; Линдгрен, Сесилия М; Фон Дёбельн, Ульрика; Лахермо, Пяйви; Кере, Юха (2008). «Субструктура населения в Финляндии и Швеции, выявленная с помощью пространственных координат и небольшого числа несвязанных аутосомных SNP». BMC Genetics . 9 : 54. doi : 10.1186/1471-2156-9-54 . PMC 2527025. PMID  18713460 . 
  11. ^ Лао, Оскар; Лу, Тимоти Т.; Нотнагель, Майкл; Юнге, Олаф; и др. (2008). «Корреляция между генетической и географической структурой в Европе». Current Biology . 18 (16): 1241–8. Bibcode : 2008CBio...18.1241L. doi : 10.1016/j.cub.2008.07.049 . PMID  18691889.
  12. ^ Бисвас, Шамик; Шейнфельдт, Лора Б.; Эйки, Джошуа М. (2009). «Геномный анализ закономерностей и детерминант мелкомасштабной популяционной структуры у людей». Американский журнал генетики человека . 84 (5): 641–650. doi :10.1016/j.ajhg.2009.04.015. PMC 2681007. PMID 19442770  . 
  13. ^ Нелис, Мари; Эско, Тыну; Мяги, Ридик; Цимприх, Фриц; и др. (2009). Флейшер, Роберт С. (ред.). «Генетическая структура европейцев: взгляд с северо-востока». PLOS ONE . 4 (5): e5472. Bibcode : 2009PLoSO...4.5472N. doi : 10.1371 /journal.pone.0005472 . PMC 2675054. PMID  19424496. 
  14. ^ Райх, Дэвид; Тангарадж, Кумарасами; Паттерсон, Ник; Прайс, Элкес Л.; и др. (2009). «Реконструкция истории населения Индии». Nature . 461 (7263): 489–94. Bibcode :2009Natur.461..489R. doi :10.1038/nature08365. PMC 2842210 . PMID  19779445. 
  15. ^ Elhaik, E (2012). "Эмпирические распределения FST из крупномасштабных данных о полиморфизме человека". PLOS ONE . 7 (11): e49837. Bibcode : 2012PLoSO...749837E. doi : 10.1371 /journal.pone.0049837 . PMC 3504095. PMID  23185452. 
  16. ^ Райт, Сьюэлл (1965). «Интерпретация структуры популяции с помощью F-статистики с особым учетом систем спаривания». Эволюция . 19 (3): 395–420. doi :10.2307/2406450. JSTOR  2406450.
  17. ^ Шалев, BA; Дворин, A.; Герман, R.; Кац, Z.; Борнштейн, S. (1991). «Длительное разведение гусей для производства яиц и веса печени». British Poultry Science . 32 (4): 703–9. doi :10.1080/00071669108417396. PMID  1933444.
  18. ^ Excoffier, L; Smouse, PE; Quattro, JM (1992). «Анализ молекулярной дисперсии, выведенной из метрических расстояний среди гаплотипов ДНК: применение к данным рестрикции митохондриальной ДНК человека». Genetics . 131 (2): 479–91. doi :10.1093/genetics/131.2.479. PMC 1205020 . PMID  1644282. 

Внешние ссылки