Статистически ожидаемый уровень гетерозиготности в популяции
В популяционной генетике F - статистика (также известная как индексы фиксации ) описывает статистически ожидаемый уровень гетерозиготности в популяции; более конкретно, ожидаемую степень (обычно) снижения гетерозиготности по сравнению с ожиданием Харди-Вайнберга .
Меры F IS , F ST и F IT связаны с количеством гетерозиготности на различных уровнях структуры популяции. Вместе они называются F -статистикой и выводятся из F , коэффициента инбридинга . В простой двухаллельной системе с инбридингом генотипические частоты следующие:
Значение для находится путем решения уравнения для использования гетерозигот в вышеуказанной инбредной популяции. Это становится единицей минус наблюдаемая частота гетерозигот в популяции, деленная на ожидаемую частоту гетерозигот в равновесии Харди-Вайнберга :
где ожидаемая частота в равновесии Харди–Вайнберга определяется как
где и являются частотами аллелей и , соответственно. Это также вероятность того, что в любом локусе два аллеля от случайного индивида популяции идентичны по происхождению .
Исходя из этого, можно рассчитать частоты аллелей и получить ожидание :
Различные F-статистики рассматривают разные уровни структуры популяции. F IT — это коэффициент инбридинга особи ( I ) по отношению к общей популяции ( T ), как указано выше; F IS — это коэффициент инбридинга особи ( I ) по отношению к субпопуляции ( S ), использующий указанное выше для субпопуляций и усредняющий их; а F ST — это эффект субпопуляций ( S ) по сравнению с общей популяцией ( T ), который рассчитывается путем решения уравнения:
как показано в следующем разделе.
Раздел по структуре населения
Рассмотрим популяцию, имеющую двухуровневую структуру : один от индивидуума (I) к субпопуляции (S) и один от субпопуляции к общему числу (T). Тогда общее число , известное здесь как , можно разделить на и :
Это может быть далее разделено для подструктуры населения, и оно расширяется в соответствии с правилами биномиального разложения , так что для I разделов:
Индекс фиксации
Переформулирование определения было бы отношением среднего числа различий между парами хромосом, отобранных у диплоидных особей, к среднему числу, полученному при случайной выборке хромосом из популяции (исключая группировку на особь). Можно изменить это определение и рассмотреть группировку на субпопуляцию, а не на особь. Популяционные генетики использовали эту идею для измерения степени структуры в популяции.
К сожалению, существует большое количество определений для , что приводит к некоторой путанице в научной литературе. Общее определение следующее:
где дисперсия вычисляется по субпопуляциям и представляет собой ожидаемую частоту гетерозигот.
Индекс фиксации в человеческих популяциях
Хорошо известно, что генетическое разнообразие среди человеческих популяций невелико, [3] хотя распределение генетического разнообразия было оценено лишь приблизительно. Ранние исследования утверждали, что 85–90% генетической изменчивости обнаружено у людей, проживающих в одних и тех же популяциях в пределах континентов (внутриконтинентальные популяции), и только дополнительные 10–15% обнаружены между популяциями разных континентов (континентальные популяции). [4] [5] [6] [7] [8] Более поздние исследования, основанные на сотнях тысяч однонуклеотидных полиморфизмов (SNP), предположили, что генетическое разнообразие между континентальными популяциями еще меньше и составляет от 3 до 7% [9] [10] [11] [12] [13] [14] Более позднее исследование, основанное на трех миллионах SNP, показало, что 12% генетической изменчивости обнаружено между континентальными популяциями и только 1% внутри них. [15] Большинство этих исследований использовали статистику F ST [16] или тесно связанную статистику. [17] [18]
^ Райт, С. (1950). «Генетическая структура популяций». Nature . 166 (4215): 247–9. Bibcode : 1950Natur.166..247W. doi : 10.1038/166247a0. PMID 15439261. S2CID 36311175.
^ Кулиг, К (1985). «Использование экстренных токсикологических скринингов». Американский журнал неотложной медицины . 3 (6): 573–4. doi :10.1016/0735-6757(85)90177-9. LCCN 67025533. PMID 4063030.
^ Холсингер, Кент Э.; Вейр, Брюс С. (2009). «Генетика в географически структурированных популяциях: определение, оценка и интерпретация FST». Nature Reviews Genetics . 10 (9): 639–50. doi :10.1038/nrg2611. PMC 4687486. PMID 19687804 .
^ Левонтин (1972). «Распределение человеческого разнообразия». Эволюционная биология . Том 6. С. 381–98. doi :10.1007/978-1-4684-9063-3_14. ISBN978-1-4684-9065-7.
^ Боукок, Энн М.; Кидд, Джудит Р.; Маунтин, Джоанна Л.; Герберт, Джоан М.; Каротенуто, Лучано; Кидд, Кеннет К.; Кавалли-Сфорца, Лука (1991). «Дрейф, смешение и отбор в эволюции человека: исследование с использованием полиморфизмов ДНК». Труды Национальной академии наук . 88 (3): 839–43. Bibcode : 1991PNAS...88..839B. doi : 10.1073/pnas.88.3.839 . JSTOR 2356081. PMC 50909. PMID 1992475.
^ Барбуджани, Гвидо; Маганьи, Арианна; Минч, Эрик; Кавалли-Сфорца, Л. Лука (1997). «Распределение разнообразия ДНК человека». Труды Национальной академии наук Соединенных Штатов Америки . 94 (9): 4516–9. Бибкод : 1997PNAS...94.4516B. дои : 10.1073/pnas.94.9.4516 . JSTOR 42042. PMC 20754 . ПМИД 9114021.
^ Jorde, LB; Watkins, WS; Bamshad, MJ; Dixon, ME; Ricker, CE; Seielstad, MT; Batzer, MA (2000). «Распределение генетического разнообразия человека: сравнение данных митохондриальной, аутосомной и Y-хромосомной ДНК». Американский журнал генетики человека . 66 (3): 979–88. doi :10.1086/302825. PMC 1288178. PMID 10712212 .
^ Jorde, Lynn B; Wooding, Stephen P (2004). «Генетическая изменчивость, классификация и «раса»». Nature Genetics . 36 (11s): S28-33. doi : 10.1038/ng1435 . PMID 15508000.
^ Махасиримонгкол, Суракамет; Чантратита, Васун; Промсо, Сомиинг; Пасомсаб, Экават; и др. (2006). «Сходство частоты аллелей и паттерна неравновесия сцепления однонуклеотидных полиморфизмов в локусах генов, связанных с наркотиками, между тайскими и северо-восточноазиатскими популяциями: последствия для маркировки выбора SNP у тайцев». Журнал генетики человека . 51 (10): 896–904. doi : 10.1007/s10038-006-0041-1 . PMID 16957813.
^ Ханнелиус, Ульф; Салмела, Элина; Лаппалайнен, Туули; Гийо, Жиль; Линдгрен, Сесилия М; Фон Дёбельн, Ульрика; Лахермо, Пяйви; Кере, Юха (2008). «Субструктура населения в Финляндии и Швеции, выявленная с помощью пространственных координат и небольшого числа несвязанных аутосомных SNP». BMC Genetics . 9 : 54. doi : 10.1186/1471-2156-9-54 . PMC 2527025. PMID 18713460 .
^ Лао, Оскар; Лу, Тимоти Т.; Нотнагель, Майкл; Юнге, Олаф; и др. (2008). «Корреляция между генетической и географической структурой в Европе». Современная биология . 18 (16): 1241–8. Бибкод : 2008CBio...18.1241L. дои : 10.1016/j.cub.2008.07.049 . ПМИД 18691889.
^ Бисвас, Шамик; Шейнфельдт, Лора Б.; Эйки, Джошуа М. (2009). «Геномный анализ закономерностей и детерминант мелкомасштабной популяционной структуры у людей». Американский журнал генетики человека . 84 (5): 641–650. doi :10.1016/j.ajhg.2009.04.015. PMC 2681007. PMID 19442770 .
^ Нелис, Мари; Эско, Тыну; Мяги, Ридик; Цимприх, Фриц; и др. (2009). Флейшер, Роберт С. (ред.). «Генетическая структура европейцев: взгляд с северо-востока». PLOS ONE . 4 (5): e5472. Bibcode : 2009PLoSO...4.5472N. doi : 10.1371 /journal.pone.0005472 . PMC 2675054. PMID 19424496.
^ Райх, Дэвид; Тангарадж, Кумарасами; Паттерсон, Ник; Прайс, Элкес Л.; и др. (2009). «Реконструкция истории населения Индии». Nature . 461 (7263): 489–94. Bibcode :2009Natur.461..489R. doi :10.1038/nature08365. PMC 2842210 . PMID 19779445.
^ Elhaik, E (2012). "Эмпирические распределения FST из крупномасштабных данных о полиморфизме человека". PLOS ONE . 7 (11): e49837. Bibcode : 2012PLoSO...749837E. doi : 10.1371 /journal.pone.0049837 . PMC 3504095. PMID 23185452.
^ Райт, Сьюэлл (1965). «Интерпретация структуры популяции с помощью F-статистики с особым учетом систем спаривания». Эволюция . 19 (3): 395–420. doi :10.2307/2406450. JSTOR 2406450.
^ Шалев, BA; Дворин, A.; Герман, R.; Кац, Z.; Борнштейн, S. (1991). «Длительное разведение гусей для производства яиц и веса печени». British Poultry Science . 32 (4): 703–9. doi :10.1080/00071669108417396. PMID 1933444.
^ Excoffier, L; Smouse, PE; Quattro, JM (1992). «Анализ молекулярной дисперсии, выведенной из метрических расстояний среди гаплотипов ДНК: применение к данным рестрикции митохондриальной ДНК человека». Genetics . 131 (2): 479–91. doi :10.1093/genetics/131.2.479. PMC 1205020 . PMID 1644282.
Внешние ссылки
Простое руководство Шейна по F-статистике
Анализ генетической структуры популяций
Эффект Валунда, F-статистика Райта Архивировано 27.05.2005 на Wayback Machine
Рабочий пример расчета F-статистики по генотипическим данным