В геномике исследование ассоциаций по всему геному ( исследование GWA или GWAS ) представляет собой наблюдательное исследование набора генетических вариантов по всему геному у разных людей с целью выяснить, связан ли какой-либо вариант с признаком. Исследования GWA обычно фокусируются на ассоциациях между однонуклеотидными полиморфизмами (SNP) и признаками, такими как основные заболевания человека, но в равной степени могут применяться к любым другим генетическим вариантам и любым другим организмам.
Применительно к человеческим данным исследования GWA сравнивают ДНК участников, имеющих различные фенотипы для определенного признака или заболевания. Этими участниками могут быть люди с заболеванием (случаи) и похожие люди без заболевания (контроль), или это могут быть люди с различными фенотипами для определенного признака, например, артериального давления. Этот подход известен как подход «сначала фенотип», при котором участники классифицируются сначала по их клиническим проявлениям, в отличие от подхода «сначала генотип» . Каждый человек предоставляет образец ДНК, из которого с помощью массивов SNP считываются миллионы генетических вариантов . Если есть существенные статистические доказательства того, что один тип варианта (один аллель ) чаще встречается у людей с заболеванием, говорят, что этот вариант связан с заболеванием. Затем считается, что связанные SNP обозначают область генома человека, которая может влиять на риск заболевания.
Исследования GWA изучают весь геном, в отличие от методов, которые специально тестируют небольшое количество заранее определенных генетических регионов. Таким образом, GWAS является подходом, не ориентированным на кандидатов , в отличие от исследований, ориентированных на кандидатов, специфичных для генов . Исследования GWA идентифицируют SNP и другие варианты в ДНК, связанные с заболеванием, но они не могут сами по себе определить, какие гены являются причинными. [1] [2] [3]
Первый успешный GWAS, опубликованный в 2002 году, изучал инфаркт миокарда. [4] Этот дизайн исследования затем был реализован в знаменательном исследовании GWA 2005, изучавшем пациентов с возрастной макулярной дегенерацией , и обнаружил два SNP со значительно измененной частотой аллелей по сравнению со здоровыми контрольными лицами. [5] По состоянию на 2017 год [обновлять]более 3000 исследований GWA на людях изучили более 1800 заболеваний и признаков, и были обнаружены тысячи ассоциаций SNP. [6] За исключением случаев редких генетических заболеваний , эти ассоциации очень слабы, но хотя каждая отдельная ассоциация может не объяснять большую часть риска, они дают представление о критических генах и путях и могут быть важны при рассмотрении в совокупности .
Фон
Любые два человеческих генома отличаются миллионами различных способов. Существуют небольшие вариации в отдельных нуклеотидах геномов ( SNP ), а также множество более крупных вариаций, таких как делеции , вставки и вариации числа копий . Любое из них может вызвать изменения в чертах характера или фенотипе человека , которые могут быть любыми: от риска заболевания до физических свойств, таких как рост. [8] Около 2000 года, до введения исследований GWA, основным методом исследования были исследования наследования генетического сцепления в семьях. Этот подход оказался весьма полезным в отношении нарушений одного гена . [9] [8] [10] Однако для распространенных и сложных заболеваний результаты исследований генетического сцепления оказалось трудно воспроизвести. [8] [10] Предложенной альтернативой исследованиям сцепления было исследование генетической ассоциации . Этот тип исследования спрашивает, встречается ли аллель генетического варианта чаще, чем ожидалось, у людей с интересующим фенотипом (например, с изучаемым заболеванием). Ранние расчеты статистической мощности показали, что этот подход может быть лучше, чем исследования сцепления, при обнаружении слабых генетических эффектов. [11]
В дополнение к концептуальной структуре несколько дополнительных факторов способствовали исследованиям GWA. Одним из них было появление биобанков , которые являются хранилищами человеческого генетического материала, что значительно снизило стоимость и сложность сбора достаточного количества биологических образцов для исследования. [12] Другим был Международный проект HapMap , который с 2003 года идентифицировал большинство общих SNP, исследованных в исследовании GWA. [13] Структура гаплоблоков, идентифицированная проектом HapMap, также позволила сосредоточиться на подмножестве SNP, которые описывали бы большую часть вариации. Также важной предпосылкой была разработка методов генотипирования всех этих SNP с использованием массивов генотипирования . [14]
Методы
Наиболее распространенным подходом исследований GWA является установка случай-контроль , которая сравнивает две большие группы людей, одну здоровую контрольную группу и одну группу случаев, пораженных заболеванием. Все люди в каждой группе, как правило, генотипированы по общеизвестным SNP. Точное количество SNP зависит от технологии генотипирования, но обычно составляет один миллион или больше. [7] Для каждого из этих SNP затем исследуется, значительно ли изменилась частота аллеля между случаем и контрольной группой. [16] В таких установках основной единицей для сообщения о размерах эффекта является отношение шансов . Отношение шансов представляет собой отношение двух шансов, которые в контексте исследований GWA являются шансами случая для людей, имеющих определенный аллель, и шансами случая для людей, не имеющих этого же аллеля.
Пример : предположим, что есть два аллеля, T и C. Количество людей в группе случая, имеющих аллель T, представлено как «A», а количество людей в контрольной группе, имеющих аллель T, представлено как «B». Аналогично, количество людей в группе случая, имеющих аллель C, представлено как «X», а количество людей в контрольной группе, имеющих аллель C, представлено как «Y». В этом случае отношение шансов для аллеля T равно A:B (что означает «A к B» в стандартной терминологии шансов), деленное на X:Y, что в математической нотации просто равно (A/B)/(X/Y).
Когда частота аллеля в группе случая намного выше, чем в контрольной группе, отношение шансов выше 1, и наоборот для более низкой частоты аллеля. Кроме того, значение P для значимости отношения шансов обычно рассчитывается с использованием простого теста хи-квадрат . Целью исследования GWA является поиск отношений шансов, которые значительно отличаются от 1, поскольку это показывает, что SNP связан с заболеванием. [16] Поскольку тестируется так много вариантов, стандартной практикой является требование, чтобы значение P было ниже5 × 10−8 , чтобы считать вариант значимым.
Вариации подхода случай-контроль . Распространенной альтернативой исследованиям случай-контроль GWA является анализ количественных фенотипических данных, например, роста или концентраций биомаркеров или даже экспрессии генов . Аналогичным образом, можно использовать альтернативную статистику, разработанную для моделей доминирования или рецессивной пенетрантности. [16] Расчеты обычно выполняются с использованием программного обеспечения для биоинформатики, такого как SNPTEST и PLINK, которые также включают поддержку многих из этих альтернативных статистик. [15] [17] GWAS фокусируется на влиянии отдельных SNP. Однако также возможно, что сложные взаимодействия между двумя или более SNP ( эпистаз ) могут способствовать возникновению сложных заболеваний. Из-за потенциально экспоненциального числа взаимодействий обнаружение статистически значимых взаимодействий в данных GWAS является как вычислительно, так и статистически сложным. Эта задача решалась в существующих публикациях, в которых используются алгоритмы, вдохновленные интеллектуальным анализом данных. [18] Более того, исследователи пытаются интегрировать данные GWA с другими биологическими данными, такими как сеть белок-белковых взаимодействий, чтобы извлечь более информативные результаты. [19] [20] Несмотря на ранее воспринимаемую проблему, связанную с огромным количеством комбинаций SNP, недавнее исследование успешно раскрыло полные эпистатические карты с разрешением на уровне генов у растений/Arabidopsis thaliana [21]
Ключевым шагом в большинстве исследований GWA является импутация генотипов в SNP, не находящихся на чипе генотипа, используемом в исследовании. [23] Этот процесс значительно увеличивает количество SNP, которые можно проверить на ассоциацию, увеличивает мощность исследования и облегчает метаанализ GWAS по отдельным когортам. Импутация генотипа выполняется статистическими методами, которые вменяют генотипические данные в набор референтной панели гаплотипов, которые обычно были плотно генотипированы с использованием секвенирования всего генома. Эти методы используют преимущество обмена гаплотипами между людьми на коротких участках последовательности для вменения аллелей. Существующие программные пакеты для вменения генотипа включают IMPUTE2, [24] Minimac, Beagle [25] и MaCH. [26]
В дополнение к расчету ассоциации, обычно учитывают любые переменные, которые могут потенциально исказить результаты. Пол, возраст и происхождение являются распространенными примерами исказительных переменных. Более того, также известно, что многие генетические вариации связаны с географическими и историческими популяциями, в которых мутации впервые возникли. [27] Из-за этой ассоциации исследования должны учитывать географическое и этническое происхождение участников, контролируя то, что называется стратификацией населения . Если бы они этого не делали, исследования могли бы давать ложноположительные результаты. [28]
После расчета коэффициентов шансов и P-значений для всех SNP, распространенным подходом является создание манхэттенского графика . В контексте исследований GWA этот график показывает отрицательный логарифм P-значения как функцию геномного местоположения. Таким образом, SNP с наиболее значимой ассоциацией выделяются на графике, обычно в виде стеков точек из-за структуры гаплоблоков. Важно, что порог P-значения для значимости корректируется для множественных проблем тестирования . Точный порог варьируется в зависимости от исследования, [29], но общепринятый порог значимости для всего генома составляет5 × 10 −8, чтобы быть значимым на фоне сотен тысяч или миллионов протестированных SNP. [7] [16] [30] Исследования GWA обычно выполняют первый анализ в когорте открытия, за которым следует валидация наиболее значимых SNP в независимой когорте проверки. [31]
Результаты
Были предприняты попытки создания всеобъемлющих каталогов однонуклеотидных полиморфизмов, которые были выявлены в ходе исследований GWA. [33] По состоянию на 2009 год число однонуклеотидных полиморфизмов, связанных с заболеваниями, исчислялось тысячами. [34]
Первое исследование GWA, проведенное в 2005 году, сравнило 96 пациентов с возрастной макулярной дегенерацией (ВМД) с 50 здоровыми контрольными лицами. [35] Оно выявило два SNP со значительно измененной аллельной частотой между двумя группами. Эти SNP были расположены в гене, кодирующем фактор комплемента H , что стало неожиданным открытием в исследовании ВМД. Результаты этих первых исследований GWA впоследствии побудили к дальнейшим функциональным исследованиям в направлении терапевтической манипуляции системой комплемента при ВМД. [36]
С момента этих первых знаковых исследований GWA наблюдались две общие тенденции. [38] Одна из них заключалась в увеличении размеров выборки. В 2018 году несколько исследований ассоциаций на уровне генома достигли общего размера выборки более 1 миллиона участников, включая 1,1 миллиона в исследовании уровня образования на уровне генома [39], за которым в 2022 году последует еще одно с 3 миллионами человек [40] и исследование бессонницы , включающее 1,3 миллиона человек. [41] Причина заключается в стремлении к надежному обнаружению однонуклеотидных полиморфизмов риска, которые имеют меньшие размеры эффекта и более низкую частоту аллелей. Другая тенденция заключалась в использовании более узко определенных фенотипов, таких как липиды крови , проинсулин или аналогичные биомаркеры. [42] [43] Их называют промежуточными фенотипами , и их анализ может представлять ценность для функциональных исследований биомаркеров. [44]
Вариация GWAS использует участников, которые являются родственниками первой степени родства людей с заболеванием. Этот тип исследования был назван исследованием ассоциаций по всему геному по доверенности ( GWAX ). [45]
Центральным пунктом дебатов по исследованиям GWA было то, что большинство вариаций SNP, обнаруженных в исследованиях GWA, связаны только с небольшим повышением риска заболевания и имеют лишь небольшую прогностическую ценность. Медианное отношение шансов составляет 1,33 на риск-SNP, и только несколько показывают отношение шансов выше 3,0. [1] [46] Эти величины считаются малыми, поскольку они не объясняют большую часть наследственной изменчивости. Эта наследственная изменчивость оценивается на основе исследований наследуемости, основанных на монозиготных близнецах. [47] Например, известно, что 40% дисперсии при депрессии можно объяснить наследственными различиями, но исследования GWA учитывают только меньшую часть этой дисперсии. [47]
Клинические применения и примеры
Задача для будущего успешного исследования GWA заключается в том, чтобы применить результаты таким образом, чтобы ускорить разработку лекарств и диагностических средств, включая лучшую интеграцию генетических исследований в процесс разработки лекарств и сосредоточение внимания на роли генетической изменчивости в поддержании здоровья в качестве плана для разработки новых лекарств и диагностических средств . [48] Несколько исследований рассматривали использование маркеров риска-SNP как средства прямого повышения точности прогноза . Некоторые обнаружили, что точность прогноза улучшается, [49] в то время как другие сообщают только о незначительных преимуществах от такого использования. [50] Как правило, проблема с этим прямым подходом заключается в небольших величинах наблюдаемых эффектов. Небольшой эффект в конечном итоге приводит к плохому разделению случаев и контролей и, таким образом, лишь небольшому улучшению точности прогноза. Альтернативным применением является, таким образом, потенциал исследований GWA для выяснения патофизиологии . [51]
Лечение гепатита С
Один из таких успехов связан с идентификацией генетического варианта, связанного с ответом на лечение вируса гепатита С. Для генотипа 1 гепатита С, леченного пегилированным интерфероном-альфа-2a или пегилированным интерфероном-альфа-2b в сочетании с рибавирином , исследование GWA [52] показало, что SNP вблизи человеческого гена IL28B , кодирующего интерферон лямбда 3, связаны со значительными различиями в ответе на лечение. Более поздний отчет показал, что те же самые генетические варианты также связаны с естественным очищением генотипа 1 вируса гепатита С. [53] Эти основные выводы способствовали разработке персонализированной медицины и позволили врачам настраивать медицинские решения на основе генотипа пациента. [54]
eQTL, ЛПНП и сердечно-сосудистые заболевания
Цель выяснения патофизиологии также привела к повышенному интересу к связи между риск-SNP и экспрессией генов близлежащих генов, так называемым исследованиям количественных признаков экспрессии (eQTL). [55] Причина в том, что исследования GWAS идентифицируют риск-SNP, но не гены риска, и спецификация генов на один шаг ближе к действующим лекарственным целям . В результате основные исследования GWA к 2011 году, как правило, включали обширный анализ eQTL. [56] [57] [58] Одним из самых сильных эффектов eQTL, наблюдаемых для идентифицированного GWA риск-SNP, является локус SORT1. [42] Функциональные последующие исследования этого локуса с использованием малых интерферирующих РНК и мышей с нокаутированным геном пролили свет на метаболизм липопротеинов низкой плотности , которые имеют важные клинические последствия для сердечно-сосудистых заболеваний . [42] [59] [60]
Мерцательная аритмия
Например, метаанализ, проведенный в 2018 году, выявил открытие 70 новых локусов, связанных с фибрилляцией предсердий . Были выявлены различные варианты, связанные с генами, кодирующими факторы транскрипции , такими как TBX3 и TBX5 , NKX2-5 или PITX2 , которые участвуют в регуляции сердечной проводимости, модуляции ионных каналов и развитии сердца. Также были выявлены новые гены, участвующие в тахикардии ( CASQ2 ) или связанные с изменением коммуникации клеток сердечной мышцы ( PKP2 ). [61]
Шизофрения
Исследования с использованием вычислительной модели высокоточного прогнозирования взаимодействия белков (HiPPIP), которая обнаружила 504 новых взаимодействия белок-белок (PPI), связанных с генами, связанными с шизофренией . [62] [63] [64] Хотя доказательства, подтверждающие генетическую основу шизофрении, не являются спорными, одно исследование показало, что 25 генов-кандидатов шизофрении, обнаруженных с помощью GWAS, имели слабую связь с шизофренией, что демонстрирует, что одного GWAS может быть недостаточно для идентификации генов-кандидатов. [65]
Заявки на сохранение
Исследования GWA на уровне популяции могут быть использованы для идентификации адаптивных генов, чтобы помочь оценить способность видов адаптироваться к изменяющимся условиям окружающей среды по мере потепления глобального климата . [66] Это может помочь определить риск исчезновения видов и, следовательно, может стать важным инструментом для планирования сохранения . Использование исследований GWA для определения адаптивных генов может помочь прояснить связь между нейтральным и адаптивным генетическим разнообразием .
Сельскохозяйственное применение
Фазы роста растений и компоненты урожайности
Исследования GWA выступают в качестве важного инструмента в селекции растений. Благодаря большим данным генотипирования и фенотипирования, GWAS являются мощными в анализе сложных режимов наследования признаков, которые являются важными компонентами урожайности, такими как количество зерен на колос, вес каждого зерна и структура растения. В исследовании GWAS на яровой пшенице GWAS выявили сильную корреляцию производства зерна с данными о трубке, биомассой и количеством зерен на колос. [67] Исследование GWA также является успешным в изучении генетической архитектуры сложных признаков у риса. [68]
Возбудители болезней растений
Появление фитопатогенов создало серьезную угрозу для здоровья растений и биоразнообразия. В связи с этим идентификация диких типов, обладающих естественной устойчивостью к определенным патогенам, может иметь жизненно важное значение. Кроме того, нам необходимо предсказать, какие аллели связаны с устойчивостью. Исследования GWA являются мощным инструментом для выявления взаимосвязей определенных вариантов и устойчивости к фитопатогену , что полезно для разработки новых устойчивых к патогенам сортов. [69]
Курица
Первое исследование GWA на курах было проведено Абаштом и Ламонтом [70] в 2007 году. Это GWA использовалось для изучения признака упитанности в популяции F2, обнаруженной ранее. Значительно связанные SNP были обнаружены на 10 хромосомах (1, 2, 3, 4, 7, 8, 10, 12, 15 и 27).
Ограничения
Исследования GWA имеют несколько проблем и ограничений, которые можно устранить с помощью надлежащего контроля качества и настройки исследования. Отсутствие четко определенных групп случаев и контроля, недостаточный размер выборки, контроль стратификации населения являются распространенными проблемами. [2] Что касается статистической проблемы множественного тестирования, было отмечено, что «подход GWA может быть проблематичным, поскольку огромное количество выполненных статистических тестов представляет беспрецедентный потенциал для ложноположительных результатов». [2] Вот почему все современные GWAS используют очень низкий порог p-значения. В дополнение к легко исправимым проблемам, таким как эти, всплыли некоторые более тонкие, но важные проблемы. Примером этого является громкое исследование GWA, в котором изучались люди с очень большой продолжительностью жизни для выявления SNP, связанных с долголетием. [71] Публикация подверглась пристальному вниманию из-за несоответствия между типом массива генотипирования в группе случаев и контрольной группе, что привело к ложному выделению нескольких SNP как связанных с долголетием. [72] Исследование было впоследствии отозвано , [73] но позже была опубликована измененная рукопись. [74] Теперь многие GWAS контролируют массив генотипирования. Если между группами существуют существенные различия по типу массива генотипирования, как и в случае с любым фактором, влияющим на результаты, исследования GWA могут привести к ложноположительному результату. Другим следствием является то, что такие исследования не способны обнаружить вклад очень редких мутаций, не включенных в массив или не подлежащих вменению. [75]
Кроме того, исследования GWA выявляют возможные варианты риска для популяции, на основе которой проводится их анализ, и поскольку большинство исследований GWA исторически исходят из европейских баз данных, отсутствует трансляция выявленных вариантов риска для других неевропейских популяций. [76] Например, исследования GWA для таких заболеваний, как болезнь Альцгеймера , проводились в основном среди популяций европеоидной расы, что не дает адекватного представления о других этнических популяциях, включая афроамериканцев или жителей Восточной Азии . Альтернативные предлагаемые стратегии включают анализ сцепления . [77] [78] Совсем недавно быстро снижающаяся стоимость полного секвенирования генома также предоставила реалистичную альтернативу исследованиям GWA на основе массива генотипирования . Высокопроизводительное секвенирование действительно имеет потенциал обойти некоторые недостатки несеквенирующего GWA. [79] Ассортативное скрещивание по перекрестным признакам может завышать оценки генетического фенотипического сходства. [80]
Тонкое картирование
Генотипирующие массивы, разработанные для GWAS, полагаются на неравновесное сцепление для обеспечения покрытия всего генома путем генотипирования подмножества вариантов. Из-за этого сообщаемые ассоциированные варианты вряд ли будут фактическими причинными вариантами. Ассоциированные регионы могут содержать сотни вариантов, охватывающих большие регионы и охватывающих множество различных генов, что затрудняет биологическую интерпретацию локусов GWAS. Тонкое картирование — это процесс уточнения этих списков ассоциированных вариантов до достоверного набора, который с наибольшей вероятностью будет включать причинный вариант.
Для точного картирования требуется, чтобы все варианты в ассоциированном регионе были генотипированы или импутированы (плотное покрытие), очень строгий контроль качества, приводящий к высококачественным генотипам, и большие размеры выборки, достаточные для разделения высококоррелированных сигналов. Существует несколько различных методов для выполнения точного картирования, и все методы дают апостериорную вероятность того, что вариант в этом локусе является причинным. Поскольку требования часто трудно выполнить, все еще есть ограниченные примеры более общего применения этих методов.
Инструмент WGAViewer, разработанный для помощи в интерпретации результатов, полученных в ходе исследования ассоциаций по всему геному
Ссылки
^ ab Manolio TA (июль 2010 г.). «Исследования ассоциаций по всему геному и оценка риска заболеваний». The New England Journal of Medicine . 363 (2): 166–76. doi : 10.1056/NEJMra0905980 . PMID 20647212.
^ abc Pearson TA, Manolio TA (март 2008 г.). «Как интерпретировать исследование ассоциаций на уровне генома». JAMA . 299 (11): 1335–44. doi :10.1001/jama.299.11.1335. PMID 18349094.
^ Ozaki K, Ohnishi Y, Iida A, Sekine A, Yamada R, Tsunoda T и др. (декабрь 2002 г.). «Функциональные однонуклеотидные полиморфизмы в гене лимфотоксина-альфа, связанные с восприимчивостью к инфаркту миокарда». Nature Genetics . 32 (4): 650–4. doi :10.1038/ng1047. PMID 12426569. S2CID 21414260.
^ Klein RJ, Zeiss C, Chew EY, Tsai JY, Sackler RS, Haynes C и др. (апрель 2005 г.). «Полиморфизм фактора комплемента H при возрастной макулярной дегенерации». Science . 308 (5720): 385–9. Bibcode :2005Sci...308..385K. doi :10.1126/science.1109557. PMC 1512523 . PMID 15761122.
^ "GWAS Catalog: The NHGRI-EBI Catalog of published genome-wide association studies". Европейская лаборатория молекулярной биологии . Получено 18 апреля 2017 г.
^ abc Bush WS, Moore JH (2012). Lewitter F, Kann M (ред.). "Глава 11: Исследования ассоциаций по всему геному". PLOS Computational Biology . 8 (12): e1002822. Bibcode : 2012PLSCB...8E2822B. doi : 10.1371/journal.pcbi.1002822 . PMC 3531285. PMID 23300413 .
^ abc Strachan T, Read A (2011). Молекулярная генетика человека (4-е изд.). Garland Science. стр. 467–495. ISBN978-0-8153-4149-9.
^ "Online Mendelian Inheritance in Man". Архивировано из оригинала 5 декабря 2011 г. Получено 6 декабря 2011 г.
^ ab Altmüller J, Palmer LJ, Fischer G, Scherb H, Wjst M (ноябрь 2001 г.). «Геномное сканирование сложных заболеваний человека: трудно найти истинную связь». American Journal of Human Genetics . 69 (5): 936–50. doi :10.1086/324069. PMC 1274370 . PMID 11565063.
^ Риш Н., Мерикангас К. (сентябрь 1996 г.). «Будущее генетических исследований сложных заболеваний человека». Science . 273 (5281): 1516–7. Bibcode :1996Sci...273.1516R. doi :10.1126/science.273.5281.1516. PMID 8801636. S2CID 5228523.
^ Грили ХТ (2007). «Непростые этические и правовые основы крупномасштабных геномных биобанков». Ежегодный обзор геномики и генетики человека . 8 : 343–64. doi : 10.1146/annurev.genom.7.080505.115721 . PMID 17550341.
^ Международный проект HapMap, Gibbs RA, Belmont JW, Hardenbol P, Willis TD, Yu F, Yang H, Ch'Ang LY, Huang W (декабрь 2003 г.). "Международный проект HapMap" (PDF) . Nature . 426 (6968): 789–96. Bibcode : 2003Natur.426..789G. doi : 10.1038/nature02168. hdl : 2027.42/62838 . PMID 14685227. S2CID 4387110.
^ Schena M, Shalon D, Davis RW, Brown PO (октябрь 1995 г.). «Количественный мониторинг паттернов экспрессии генов с помощью комплементарного ДНК-микрочипа». Science . 270 (5235): 467–70. Bibcode :1995Sci...270..467S. doi :10.1126/science.270.5235.467. PMID 7569999. S2CID 6720459.
^ abcd Wellcome Trust Case Control Consortium, Burton PR (июнь 2007 г.). «Исследование ассоциаций по всему геному 14 000 случаев семи распространенных заболеваний и 3 000 общих контролей». Nature . 447 (7145): 661–78. Bibcode :2007Natur.447..661B. doi :10.1038/nature05911. PMC 2719288 . PMID 17554300.
^ abcd Clarke GM, Anderson CA, Pettersson FH, Cardon LR, Morris AP, Zondervan KT (февраль 2011 г.). «Базовый статистический анализ в генетических исследованиях случай-контроль». Nature Protocols . 6 (2): 121–33. doi :10.1038/nprot.2010.182. PMC 3154648 . PMID 21293453.
^ Purcell S, Neale B, Todd-Brown K, Thomas L, Ferreira MA, Bender D и др. (сентябрь 2007 г.). «PLINK: набор инструментов для анализа связей на уровне всего генома и популяционного сцепления». American Journal of Human Genetics . 81 (3): 559–75. doi :10.1086/519795. PMC 1950838 . PMID 17701901.
^ Llinares-López F, Grimm DG, Bodenham DA, Gieraths U, Sugiyama M, Rowan B, Borgwardt K (июнь 2015 г.). "Обнаружение интервалов генетической гетерогенности, связанных со сложными признаками, на уровне генома". Bioinformatics . 31 (12): i240-9. doi :10.1093/bioinformatics/btv263. PMC 4559912 . PMID 26072488.
^ Ayati M, Erten S, Chance MR, Koyutürk M (декабрь 2015 г.). "MOBAS: идентификация связанных с заболеваниями белковых подсетей с использованием оценки на основе модульности". EURASIP Journal on Bioinformatics & Systems Biology . 2015 (1): 7. doi : 10.1186/s13637-015-0025-6 . PMC 5270451. PMID 28194175.
^ Ayati M, Koyutürk M (1 января 2015 г.). «Оценка ассоциации коллективных заболеваний множественных геномных локусов». Труды 6-й конференции ACM по биоинформатике, вычислительной биологии и информатике здравоохранения . BCB '15. Нью-Йорк, штат Нью-Йорк, США: ACM. стр. 376–385. doi :10.1145/2808719.2808758. ISBN978-1-4503-3853-0. S2CID 5942777.
^ Carré C, Carluer JB, Chaux C, Estoup-Streiff C, Roche N, Hosy E, Mas A, Krouk G (март 2024 г.). "GWAS следующего поколения: полные двумерные эпистатические карты взаимодействия восстанавливают часть недостающей наследуемости и улучшают фенотипическое предсказание". Геномная биология. doi:10.1186/s13059-024-03202-0. PMID 38523316. S2CID 146570
^ ab Carré C, Carluer JB, Chaux C, Estoup-Streiff C, Roche N, Hosy E, Mas A, Krouk G (25 марта 2024 г.). "Next-Gen GWAS: полные двумерные эпистатические карты взаимодействия восстанавливают часть недостающей наследуемости и улучшают фенотипическое предсказание". Genome Biology . 25 (1): 76. doi : 10.1186/s13059-024-03202-0 . ISSN 1474-760X. PMC 10962106 . PMID 38523316.
^ Marchini J, Howie B (июль 2010 г.). «Вменение генотипа для исследований ассоциаций на уровне генома». Nature Reviews Genetics . 11 (7): 499–511. doi :10.1038/nrg2796. PMID 20517342. S2CID 1465707.
^ Howie B, Marchini J, Stephens M (ноябрь 2011 г.). «Вменение генотипа с тысячами геномов». G3 . 1 (6): 457–70. doi :10.1534/g3.111.001198. PMC 3276165 . PMID 22384356.
^ Browning BL, Browning SR (февраль 2009 г.). «Унифицированный подход к вменению генотипа и выводу фазы гаплотипа для больших наборов данных троек и неродственных индивидуумов». American Journal of Human Genetics . 84 (2): 210–23. doi :10.1016/j.ajhg.2009.01.005. PMC 2668004 . PMID 19200528.
^ Li Y, Willer CJ, Ding J, Scheet P, Abecasis GR (декабрь 2010 г.). «MaCH: использование данных о последовательностях и генотипах для оценки гаплотипов и ненаблюдаемых генотипов». Genetic Epidemiology . 34 (8): 816–34. doi :10.1002/gepi.20533. PMC 3175618 . PMID 21058334.
^ Novembre J, Johnson T, Bryc K, Kutalik Z, Boyko AR, Auton A, Indap A, King KS, Bergmann S, Nelson MR, Stephens M, Bustamante CD (ноябрь 2008 г.). «Гены отражают географию в Европе». Nature . 456 (7218): 98–101. Bibcode :2008Natur.456...98N. doi :10.1038/nature07331. PMC 2735096 . PMID 18758442.
^ Charney E (январь 2017 г.). «Гены, поведение и генетика поведения». Wiley Interdisciplinary Reviews. Cognitive Science . 8 (1–2): e1405. doi :10.1002/wcs.1405. hdl : 10161/13337 . PMID 27906529.
^ Wittkowski KM, Sonakya V, Bigio B, Tonn MK, Shic F, Ascano M, Nasca C, Gold-Von Simson G (январь 2014 г.). «Новый подход вычислительной биостатистики подразумевает нарушение дефосфорилирования рецепторов факторов роста, связанное с тяжестью аутизма». Трансляционная психиатрия . 4 (1): e354. doi :10.1038/tp.2013.124. PMC 3905234 . PMID 24473445.
^ Barsh GS, Copenhaver GP, Gibson G, Williams SM (июль 2012 г.). «Руководство по исследованиям ассоциаций на уровне генома». PLOS Genetics . 8 (7): e1002812. doi : 10.1371 / journal.pgen.1002812 . PMC 3390399. PMID 22792080.
^ Смит SM, Дуо G, Чен W, Ханайик T, Альфаро-Альмагро F, Шарп K, Эллиотт LT (2021). «Расширенный набор исследований ассоциаций по всему геному фенотипов визуализации мозга в биобанке Великобритании». Nat Neurosci . 24 (5): 737–745. doi : 10.1038/s41593-021-00826-4 . PMC 7610742 . PMID 33875891.
^ Sanna S, Li B, Mulas A, Sidore C, Kang HM, Jackson AU и др. (июль 2011 г.). Gibson G (ред.). «Точное картирование пяти локусов, связанных с холестерином липопротеинов низкой плотности, обнаруживает варианты, которые удваивают объясненную наследуемость». PLOS Genetics . 7 (7): e1002198. doi : 10.1371/journal.pgen.1002198 . PMC 3145627 . PMID 21829380.
^ Hindorff LA, Sethupathy P, Junkins HA, Ramos EM, Mehta JP, Collins FS, Manolio TA (июнь 2009 г.). «Потенциальные этиологические и функциональные последствия локусов ассоциаций генома для заболеваний и признаков человека». Труды Национальной академии наук Соединенных Штатов Америки . 106 (23): 9362–7. Bibcode : 2009PNAS..106.9362H. doi : 10.1073/pnas.0903103106 . PMC 2687147. PMID 19474294 .
^ Джонсон AD, О'Доннелл CJ (январь 2009 г.). "База данных открытого доступа по результатам ассоциаций по всему геному". BMC Medical Genetics . 10 : 6. doi : 10.1186/1471-2350-10-6 . PMC 2639349 . PMID 19161620.
^ Haines JL, Hauser MA, Schmidt S, Scott WK, Olson LM, Gallins P, Spencer KL, Kwan SY, Noureddine M, Gilbert JR, Schnetz-Boutaud N, Agarwal A, Postel EA, Pericak-Vance MA (апрель 2005 г.). «Вариант фактора комплемента H увеличивает риск возрастной макулярной дегенерации». Science . 308 (5720): 419–21. Bibcode :2005Sci...308..419H. doi : 10.1126/science.1110359 . PMID 15761120. S2CID 32716116.
^ Fridkis-Hareli M, Storek M, Mazsaroff I, Risitano AM, Lundberg AS, Horvath CJ, Holers VM (октябрь 2011 г.). «Проектирование и разработка TT30, нового ингибитора C3/C5-конвертазы, нацеленного на C3d, для лечения заболеваний, опосредованных альтернативным путем комплемента человека». Blood . 118 (17): 4705–13. doi :10.1182/blood-2011-06-359646. PMC 3208285 . PMID 21860027.
^ "Сегодня опубликовано самое крупное исследование генетики распространенных заболеваний" (пресс-релиз). Wellcome Trust Case Control Consortium. 6 июня 2007 г. Архивировано из оригинала 4 июня 2008 г. Получено 19 июня 2008 г.
^ Ioannidis JP, Thomas G, Daly MJ (май 2009). «Проверка, расширение и уточнение сигналов ассоциаций по всему геному». Nature Reviews Genetics . 10 (5): 318–29. doi :10.1038/nrg2544. PMC 7877552. PMID 19373277. S2CID 6463743 .
^ Lee JJ, Wedow R, Okbay A, Kong E, Maghzian O, Zacher M, Nguyen-Viet TA, Bowers P, Sidorenko J, Karlsson Linnér R и др. (июль 2018 г.). «Открытие генов и полигенное предсказание на основе общегеномного ассоциативного исследования образовательных достижений у 1,1 миллиона человек». Nature Genetics . 50 (8): 1112–1121. doi :10.1038/s41588-018-0147-3. PMC 6393768 . PMID 30038396.
^ Okbay A, Wu Y, Wang N, Jayashankar H, Bennett M, Nehzati SM и др. (апрель 2022 г.). «Полигенное прогнозирование уровня образования внутри и между семьями на основе анализа ассоциаций по всему геному у 3 миллионов человек». Nature Genetics . 54 (4): 437–449. doi :10.1038/s41588-022-01016-z. hdl : 11368/3026010 . PMC 9005349 . PMID 35361970.
^ Jansen PR, Watanabe K, Stringer S, Skene N, Bryois J, Hammerschlag AR и др. (март 2019 г.). «Геномный анализ бессонницы у 1 331 010 человек выявляет новые локусы риска и функциональные пути». Nature Genetics . 51 (3): 394–403. bioRxiv 10.1101/214973 . doi : 10.1038/s41588-018-0333-3 . hdl : 1871.1/08af5d9e-8621-41f1-97c5-e77a1063495f . PMID 30804565.
^ abc Kathiresan S, Willer CJ, Peloso GM, Demissie S, Musunuru K, Schadt EE и др. (январь 2009 г.). «Общие варианты в 30 локусах способствуют полигенной дислипидемии». Природная генетика . 41 (1): 56–65. дои : 10.1038/ng.291. ПМЦ 2881676 . ПМИД 19060906.
^ Strawbridge RJ, Dupuis J , Prokopenko I, Barker A, Ahlqvist E, Rybin D и др. (октябрь 2011 г.). «Genome-wide association определяет девять распространенных вариантов, связанных с уровнями проинсулина натощак, и дает новое представление о патофизиологии диабета 2 типа». Diabetes . 60 (10): 2624–34. doi :10.2337/db11-0415. PMC 3178302 . PMID 21873549.
^ Danesh J, Pepys MB (ноябрь 2009 г.). «С-реактивный белок и ишемическая болезнь сердца: есть ли причинно-следственная связь?». Circulation . 120 (21): 2036–9. doi : 10.1161/CIRCULATIONAHA.109.907212 . PMID 19901186.
^ Liu JZ, Erlich Y, Pickrell JK (март 2017 г.). «Картирование ассоциаций случай-контроль по доверенности с использованием семейной истории болезни». Nature Genetics . 49 (3): 325–331. doi :10.1038/ng.3766. PMID 28092683. S2CID 5598845.
^ Ku CS, Loy EY, Pawitan Y, Chia KS (апрель 2010 г.). «Погоня за исследованиями ассоциаций по всему геному: где мы сейчас?». Журнал генетики человека . 55 (4): 195–206. doi : 10.1038/jhg.2010.19 . PMID 20300123.
^ ab Maher B (ноябрь 2008 г.). «Персональные геномы: случай отсутствующей наследуемости». Nature . 456 (7218): 18–21. doi : 10.1038/456018a . PMID 18987709.
^ Иадонато СП, Катце М.Г. (сентябрь 2009 г.). «Геномика: вирус гепатита С становится личным». Природа . 461 (7262): 357–8. Бибкод : 2009Natur.461..357I. дои : 10.1038/461357a . PMID 19759611. S2CID 7602652.
^ Muehlschlegel JD, Liu KY, Perry TE, Fox AA, Collard CD, Shernan SK, Body SC (сентябрь 2010 г.). «Вариант хромосомы 9p21 предсказывает смертность после операции аортокоронарного шунтирования». Circulation . 122 (11 Suppl): S60–5. doi :10.1161/CIRCULATIONAHA.109.924233. PMC 2943860 . PMID 20837927.
^ Paynter NP, Chasman DI, Paré G, Buring JE, Cook NR, Miletich JP, Ridker PM (февраль 2010 г.). «Связь между оценкой генетического риска на основе литературы и сердечно-сосудистыми событиями у женщин». JAMA . 303 (7): 631–7. doi :10.1001/jama.2010.119. PMC 2845522 . PMID 20159871.
^ Couzin-Frankel J (июнь 2010 г.). «Гены основных заболеваний сердца оказываются неуловимыми». Science . 328 (5983): 1220–1. Bibcode :2010Sci...328.1220C. doi :10.1126/science.328.5983.1220. PMID 20522751.
^ Ge D, Fellay J, Thompson AJ, Simon JS, Shianna KV, Urban TJ, Heinzen EL, Qiu P, Bertelsen AH, Muir AJ, Sulkowski M, McHutchison JG, Goldstein DB (сентябрь 2009 г.). «Генетическая вариация IL28B предсказывает клиренс вируса, вызванный лечением гепатита C». Nature . 461 (7262): 399–401. Bibcode :2009Natur.461..399G. doi :10.1038/nature08309. PMID 19684573. S2CID 1707096.
^ Thomas DL, Thio CL, Martin MP, Qi Y, Ge D, O'Huigin C, Kidd J, Kidd K, Khakoo SI, Alexander G, Goedert JJ, Kirk GD, Donfield SM, Rosen HR, Tobler LH, Busch MP, McHutchison JG, Goldstein DB, Carrington M (октябрь 2009 г.). «Генетическая изменчивость IL28B и спонтанное очищение от вируса гепатита C». Nature . 461 (7265): 798–801. Bibcode :2009Natur.461..798T. doi :10.1038/nature08463. PMC 3172006 . PMID 19759533.
^ Lu YF, Goldstein DB, Angrist M, Cavalleri G (июль 2014 г.). «Персонализированная медицина и генетическое разнообразие человека». Cold Spring Harbor Perspectives in Medicine . 4 (9): a008581. doi :10.1101/cshperspect.a008581. PMC 4143101. PMID 25059740 .
^ Фолкерсен Л, Вант Хофт Ф, Черногубова Е, Агард Х.Э., Ханссон Г.К., Хедин Ю, Лиска Дж, Сювенен AC, Паулссон-Берн Г, Паулссон-Берн Г, Франко-Сереседа А, Хамстен А, Габриэльсен А, Эрикссон П (август 2010 г.). «Связь вариантов генетического риска с экспрессией проксимальных генов определяет новые гены предрасположенности к сердечно-сосудистым заболеваниям». Кровообращение: сердечно-сосудистая генетика . 3 (4): 365–73. doi : 10.1161/CIRCGENETICS.110.948935 . ПМИД 20562444.
^ Bown MJ, Jones GT, Harrison SC, Wright BJ, Bumpstead S, Baas AF и др. (ноябрь 2011 г.). «Аневризма брюшной аорты связана с вариантом белка 1, связанного с рецептором липопротеина низкой плотности». American Journal of Human Genetics . 89 (5): 619–27. doi :10.1016/j.ajhg.2011.10.002. PMC 3213391 . PMID 22055160.
^ Консорциум по генетике ишемической болезни сердца (C4D) (март 2011 г.). «Исследование ассоциаций по всему геному у европейцев и жителей Южной Азии выявило пять новых локусов для ишемической болезни сердца». Nature Genetics . 43 (4): 339–44. doi :10.1038/ng.782. PMID 21378988. S2CID 39712343.{{cite journal}}: CS1 maint: числовые имена: список авторов ( ссылка )[ постоянная мертвая ссылка ]
^ Джонсон Т., Гонт ТР., Ньюхаус С.Дж., Падманабхан С., Томашевски М., Кумари М. и др. (декабрь 2011 г.). «Локусы артериального давления, идентифицированные с помощью геноцентрического массива». Американский журнал генетики человека . 89 (6): 688–700. doi :10.1016/j.ajhg.2011.10.013. PMC 3234370. PMID 22100073 .
^ Dubé JB, Johansen CT, Hegele RA (июнь 2011 г.). «Сортилин: необычный подозреваемый в метаболизме холестерина: от идентификации GWAS до биохимических анализов in vivo, сортилин был идентифицирован как новый медиатор метаболизма липопротеинов человека». BioEssays . 33 (6): 430–7. doi :10.1002/bies.201100003. PMID 21462369.
^ Bauer RC, Stylianou IM, Rader DJ (апрель 2011 г.). «Функциональная проверка новых путей метаболизма липопротеинов, выявленных генетикой человека». Current Opinion in Lipidology . 22 (2): 123–8. doi :10.1097/MOL.0b013e32834469b3. PMID 21311327. S2CID 24020035.
^ Roselli C, Chafin M, Weng L (2018). «Многоэтническое геномное исследование ассоциации фибрилляции предсердий». Nature Genetics . 50 (9): 1225–1233. doi :10.1038/s41588-018-0133-9. PMC 6136836 . PMID 29892015.
^ Ganapathiraju MK, Thahir M, Handen A, Sarkar SN, Sweet RA, Nimgaonkar VL, Loscher CE, Bauer EM, Chaparala S (27 апреля 2016 г.). «Интерактом шизофрении с 504 новыми белок-белковыми взаимодействиями». npj Schizophrenia . 2 : 16012. doi : 10.1038/npjschz.2016.12. PMC 4898894. PMID 27336055 .
^ «Новое исследование шизофрении фокусируется на белок-белковых взаимодействиях». psychcentral.com . 3 мая 2016 г. Архивировано из оригинала 11 января 2020 г. Получено 22 апреля 2023 г.
^ Ganapathiraju M, Chaparala S, Lo C (апрель 2018 г.). "F200. Выяснение роли ресничек в нейропсихиатрических заболеваниях с помощью анализа интерактома". Schizophrenia Bulletin . 44 (suppl_1): S298-9. doi :10.1093/schbul/sby017.731. PMC 5887623 .
^ Джонсон EC, Бордер R, Мелрой-Грейф WE, де Леув CA, Эрингер MA, Келлер MC (ноябрь 2017 г.). «Нет доказательств того, что гены-кандидаты шизофрении больше связаны с шизофренией, чем некандидатные гены». Биологическая психиатрия . 82 (10): 702–708. doi :10.1016/j.biopsych.2017.06.033. PMC 5643230. PMID 28823710 .
^ Willi Y, Kristensen TN, Sgrò CM, Weeks AR, Ørsted M, Hoffmann AA (январь 2022 г.). «Генетика сохранения как инструмент управления: пять наиболее поддерживаемых парадигм для содействия управлению видами, находящимися под угрозой исчезновения». Труды Национальной академии наук Соединенных Штатов Америки . 119 (1): e2105076119. Bibcode : 2022PNAS..11905076W. doi : 10.1073/pnas.2105076119 . PMC 8740573. PMID 34930821 .
^ Туруспеков Y, Байбулатова A, Ермекбаев K, Тохетова L, Чудинов V, Середа G и др. (Ноябрь 2017 г.). "GWAS для стадий роста растений и компонентов урожайности яровой пшеницы (Triticum aestivum L.), собранной в трех регионах Казахстана". BMC Plant Biology . 17 (Suppl 1): 190. doi : 10.1186/s12870-017-1131-2 . PMC 5688510 . PMID 29143598.
^ Zhao K, Tung CW, Eizenga GC, Wright MH, Ali ML, Price AH и др. (сентябрь 2011 г.). «Картирование ассоциаций по всему геному выявляет богатую генетическую архитектуру сложных признаков у Oryza sativa». Nature Communications . 2 (1): 467. Bibcode :2011NatCo...2..467Z. doi :10.1038/ncomms1467. PMC 3195253 . PMID 21915109.
^ Bartoli C, Roux F (2017). «Исследования ассоциаций по всему геному в патосистемах растений: к подходу экологической геномики». Frontiers in Plant Science . 8 : 763. doi : 10.3389/fpls.2017.00763 . PMC 5441063. PMID 28588588.
^ Abasht B, Lamont SJ (октябрь 2007 г.). «Анализ ассоциаций по всему геному выявляет скрытые аллели как важный фактор гетерозиса по упитанности в популяции цыплят F2». Animal Genetics . 38 (5): 491–498. doi :10.1111/j.1365-2052.2007.01642.x. PMID 17894563.
^ Sebastiani P, Solovieff N, Puca A, Hartley SW, Melista E, Andersen S, Dworkis DA, Wilk JB, Myers RH, Steinberg MH, Montano M, Baldwin CT, Perls TT (июль 2010 г.). «Генетические сигнатуры исключительной долголетия у людей». Science . 2010 (5987). doi :10.1126/science.1190532. PMID 20595579.(Отозвано, см. doi :10.1126/science.333.6041.404-a, PMID 21778381, Retraction Watch)
^ MacArthur D (8 июля 2010 г.). «В исследовании «генов долголетия» обнаружены серьезные недостатки». Wired . Получено 7 декабря 2011 г.
^ Sebastiani P, Solovieff N, Puca A, Hartley SW, Melista E, Andersen S, Dworkis DA, Wilk JB, Myers RH, Steinberg MH, Montano M, Baldwin CT, Perls TT (июль 2011 г.). "Retraction". Science . 333 (6041): 404. doi :10.1126/science.333.6041.404-a. PMID 21778381.
^ Tam V, Patel N, Turcotte M, Bossé Y, Paré G, Meyre D (май 2019 г.). «Преимущества и ограничения исследований ассоциаций на уровне генома». Nature Reviews Genetics . 20 (8): 467–484. doi :10.1038/s41576-019-0127-1. ISSN 1471-0056. PMID 31068683. S2CID 148570302.
^ Rosenberg NA, Huang L, Jewett EM, Szpiech ZA, Jankovic I, Boehnke M (май 2010 г.). «Исследования ассоциаций по всему геному в различных популяциях». Nature Reviews Genetics . 11 (5): 356–66. doi :10.1038/nrg2760. PMC 3079573. PMID 20395969 .
^ Sham PC, Cherny SS, Purcell S, Hewitt JK (май 2000 г.). «Анализ силы сцепления и ассоциации количественных признаков с использованием моделей дисперсионных компонентов для данных о сибстве». American Journal of Human Genetics . 66 (5): 1616–30. doi :10.1086/302891. PMC 1378020 . PMID 10762547.
^ Борецки ИБ (2006). "Сцепление и ассоциации исследования". Энциклопедия наук о жизни . John Wiley & Sons, Ltd. doi :10.1038/npg.els.0005483. ISBN9780470015902. {{cite book}}: |work=проигнорировано ( помощь )
^ Visscher PM, Goddard ME , Derks EM, Wray NR (май 2012). «Психиатрическая генетика, основанная на доказательствах, также известная как ложная дихотомия между гипотезами распространенных и редких вариантов». Молекулярная психиатрия . 17 (5): 474–85. doi : 10.1038/mp.2011.65 . PMID 21670730.
^ Border R, Athanasiadis G, Buil A, Schork AJ, Cai N, Young AI, Werge T, Flint J, Kendler KS, Sankararaman S, Dahl AW, Zaitlen NA (2022). «Ассортативное скрещивание по кросс-признакам широко распространено и увеличивает оценки генетической корреляции». Science . 378 (6621): 754–761. Bibcode :2022Sci...378..754B. doi :10.1126/science.abo2059. ISSN 0036-8075. PMC 9901291 . PMID 36395242.
Внешние ссылки
На Викискладе есть медиафайлы по теме « Исследования ассоциаций на уровне генома» .
Программные инструменты и базы данных для взаимодействия генотипа и фенотипа на omicX [ постоянная мертвая ссылка ]
Статистические методы анализа исследований ассоциаций по всему геному [серия видеолекций]