Проект 1000 геномов

Проект 1000 геномов ( 1KGP ), который проводился с января 2008 по 2015 год, был международным исследовательским усилием по созданию самого подробного каталога генетических вариаций человека на тот момент. Ученые планировали секвенировать геномы по крайней мере тысячи анонимных здоровых участников из ряда различных этнических групп в течение следующих трех лет, используя достижения в недавно разработанных технологиях . В 2010 году проект завершил свою пилотную фазу, которая была подробно описана в публикации в журнале Nature . ^[1] В 2012 году секвенирование 1092 геномов было объявлено в публикации Nature . ^[2] В 2015 году две статьи в Nature сообщили о результатах и завершении проекта, а также о возможностях для будущих исследований. ^[3]^[4]

Было выявлено множество редких вариаций, ограниченных близкородственными группами, и проанализировано восемь классов структурных вариаций. ^[5]

Проект объединил многопрофильные исследовательские группы из институтов по всему миру, включая Китай , Италию , Японию , Кению , Нигерию , Перу , Великобританию и США, которые внесли свой вклад в набор данных о последовательностях и в уточненную карту генома человека, свободно доступную через публичные базы данных как для научного сообщества, так и для широкой общественности. ^[2]

Международный ресурс образцов генома был создан для размещения и расширения набора данных после завершения проекта. ^[6]

Фон

После завершения проекта «Геном человека» достижения в области генетики популяций человека и сравнительной геномики позволили глубже понять генетическое разнообразие. ^[7] Понимание структурных вариаций (вставок/делеций ( инделей ), вариаций числа копий (CNV), ретроэлементов ), однонуклеотидных полиморфизмов (SNP) и естественного отбора было улучшено. ^[8]^[9]^[10]^[11]

Разнообразие генетических вариаций человека, таких как индели, было обнаружено и исследовано, а также вариации генома человека ^{[ необходима ссылка ]}

Естественный отбор

Он также был направлен на предоставление доказательств, которые могут быть использованы для изучения влияния естественного отбора на различия в популяциях. Модели полиморфизмов ДНК могут быть использованы для надежного обнаружения сигнатур отбора и могут помочь идентифицировать гены, которые могут лежать в основе вариаций в устойчивости к болезням или метаболизме лекарств. ^[12]^[13] Такие идеи могли бы улучшить понимание фенотипических вариаций , генетических нарушений и менделевского наследования и их влияния на выживание и/или воспроизводство различных человеческих популяций.

Описание проекта

Цели

Проект «1000 геномов» был разработан для того, чтобы заполнить пробел в знаниях между редкими генетическими вариантами, которые оказывают сильное влияние преимущественно на простые признаки (например, муковисцидоз , болезнь Хантингтона ), и распространенными генетическими вариантами, которые оказывают умеренное влияние и связаны со сложными признаками (например, когнитивные способности , диабет , заболевания сердца ). ^[14]

Основной целью этого проекта было создание полного и подробного каталога генетических вариаций человека , который может быть использован для ассоциативных исследований, связывающих генетические вариации с заболеваниями. Консорциум стремился обнаружить >95 % вариантов (например, SNP, CNV, индели) с малыми частотами аллелей всего 1 % по всему геному и 0,1–0,5 % в генных регионах, а также оценить популяционные частоты, фоны гаплотипа и модели неравновесного сцепления аллелей вариантов. ^[15]

Вторичные цели включали поддержку лучшего выбора SNP и зонда для платформ генотипирования в будущих исследованиях и улучшение референтной последовательности человека . Ожидалось, что завершенная база данных станет полезным инструментом для изучения регионов, находящихся под отбором, вариаций в нескольких популяциях и понимания основных процессов мутации и рекомбинации . ^[15]

Контур

Геном человека состоит приблизительно из 3 миллиардов пар оснований ДНК и, по оценкам, несет около 20 000 генов , кодирующих белки . При разработке исследования консорциуму необходимо было решить несколько критических вопросов, касающихся метрик проекта, таких как технологические проблемы, стандарты качества данных и покрытие последовательностей. ^[15]

В течение следующих трех лет ^{[ требуется разъяснение ]} ученые из Института Сэнгера , BGI Shenzhen и Сети крупномасштабного секвенирования Национального института исследований генома человека планировали секвенировать минимум 1000 человеческих геномов. Из-за большого объема требуемых данных о последовательностях набор дополнительных участников продолжался. ^[14]

Почти 10 миллиардов оснований должны были быть секвенированы в день в течение двухлетней фазы производства, что эквивалентно более чем двум человеческим геномам каждые 24 часа. Предполагаемый набор данных о последовательностях должен был включать 6 триллионов оснований ДНК, в 60 раз больше данных о последовательностях, чем было опубликовано в базах данных ДНК в то время. ^[14]

Для определения окончательного дизайна полного проекта должны были быть проведены три пилотных исследования в течение первого года проекта. Первый пилотный проект предполагает генотипирование 180 человек из 3 основных географических групп при низком охвате (2×). Для второго пилотного исследования геномы двух нуклеарных семей (оба родителя и взрослый ребенок) будут секвенированы с глубоким охватом (20× на геном). Третье пилотное исследование включает секвенирование кодирующих областей ( экзонов ) 1000 генов у 1000 человек с глубоким охватом (20×). ^[14]^[15]

Было подсчитано, что проект, вероятно, обойдется более чем в 500 миллионов долларов, если будут использоваться стандартные технологии секвенирования ДНК. Несколько новых технологий (например, Solexa , 454 , SOLiD ) должны были быть применены, что снизило ожидаемые затраты до 30–50 миллионов долларов. Основная поддержка будет предоставлена Wellcome Trust Sanger Institute в Хинкстоне, Англия; Beijing Genomics Institute , Шэньчжэнь (BGI Shenzhen), Китай; и NHGRI , частью Национальных институтов здравоохранения (NIH). ^[14]

В соответствии с принципами Форт-Лодердейла Архивировано 28 декабря 2013 г. на Wayback Machine , все данные о последовательности генома (включая вызовы вариантов) находятся в свободном доступе по мере развития проекта и могут быть загружены по ftp с веб-страницы проекта 1000 геномов.

Образцы генома человека

На основе общих целей проекта, образцы будут выбраны для обеспечения мощности в популяциях, где проводятся исследования ассоциаций для распространенных заболеваний. Кроме того, образцы не должны иметь медицинскую или фенотипическую информацию, поскольку предлагаемый каталог будет базовым ресурсом по человеческим вариациям. ^[15]

Для пилотных исследований будут секвенированы образцы человеческого генома из коллекции HapMap . Будет полезно сосредоточиться на образцах, которые имеют дополнительные доступные данные (такие как последовательность ENCODE , генотипы по всему геному, последовательность фосмидного конца, анализы структурных вариаций и экспрессия генов ), чтобы иметь возможность сравнить результаты с результатами других проектов. ^[15]

Соблюдая обширные этические процедуры, проект 1000 геномов затем будет использовать образцы от добровольных доноров. В исследование будут включены следующие популяции: йоруба в Ибадане (YRI), Нигерия ; японцы в Токио (JPT); китайцы в Пекине (CHB); жители Юты с происхождением из северной и западной Европы (CEU); лухья в Вебуе , Кения (LWK); масаи в Киньяве, Кения (MKK); тосканцы в Италии (TSI); перуанцы в Лиме , Перу (PEL); индейцы гуджарати в Хьюстоне (GIH); китайцы в столичном Денвере (CHD); люди мексиканского происхождения в Лос-Анджелесе (MXL); и люди африканского происхождения на юго-западе Соединенных Штатов (ASW). ^[14]

* Население, собранное в диаспоре

Общественная встреча

Данные, полученные в рамках проекта «1000 геномов», широко используются сообществом генетиков, что делает первый проект «1000 геномов» одной из самых цитируемых статей в биологии. ^[17] Для поддержки этого сообщества пользователей в июле 2012 года проект провел аналитическую встречу сообщества, на которой обсуждались ключевые открытия проекта, их влияние на популяционную генетику и исследования заболеваний человека, а также резюме других крупномасштабных исследований секвенирования. ^[18]

Результаты проекта

Пилотная фаза

Пилотный этап состоял из трех проектов:

Полногеномное секвенирование с низким охватом 179 человек из 4 популяций
секвенирование с высоким покрытием двух трио (мать-отец-ребенок)
Секвенирование экзонов 697 особей из 7 популяций

Было обнаружено, что в среднем каждый человек несет около 250–300 вариантов потери функции в аннотированных генах и 50–100 вариантов, ранее связанных с наследственными расстройствами. На основе двух трио подсчитано, что скорость мутации de novo зародышевой линии составляет приблизительно 10 ⁻⁸ на основание на поколение. ^[1]

Смотрите также

Ссылки

^ ab Abecasis GR , Altshuler D , Auton A, Brooks LD, Durbin RM, Gibbs RA и др. (октябрь 2010 г.). «Карта вариаций генома человека, полученная в результате секвенирования в масштабе популяции». Nature . 467 (7319): 1061–73. Bibcode : 2010Natur.467.1061T. doi : 10.1038/nature09534. PMC 3042601. PMID 20981092.
^ ab Abecasis GR, Auton A, Brooks LD, DePristo MA, Durbin RM, Handsaker RE и др. (ноябрь 2012 г.). «Интегрированная карта генетической изменчивости 1092 человеческих геномов». Nature . 491 (7422): 56–65. Bibcode :2012Natur.491...56T. doi :10.1038/nature11632. PMC 3498066 . PMID 23128226.
^ Auton A, Brooks LD, Durbin RM, Garrison EP, Kang HM, Korbel JO и др. (октябрь 2015 г.). «Глобальный справочник по генетическим вариациям человека». Nature . 526 (7571): 68–74. Bibcode :2015Natur.526...68T. doi :10.1038/nature15393. PMC 4750478 . PMID 26432245.
^ Sudmant PH, Rausch T, Gardner EJ, Handsaker RE, Abyzov A, Huddleston J, et al. (Октябрь 2015 г.). «Интегрированная карта структурных вариаций в 2504 человеческих геномах». Nature . 526 (7571): 75–81. Bibcode :2015Natur.526...75.. doi :10.1038/nature15394. PMC 4617611 . PMID 26432246.
^ "Разнообразие жизни". Nature News & Comment . 2015-09-30 . Получено 2015-10-15 .
^ "Проект 1000 геномов | Научные вычисления и данные". Медицинская школа Маунт-Синай . 2020-07-07 . Получено 2023-10-01 .
^ Nielsen R (октябрь 2010 г.). «Геномика: в поисках редких человеческих вариантов». Nature . 467 (7319): 1050–1. Bibcode :2010Natur.467.1050N. doi : 10.1038/4671050a . PMID 20981085.
^ JC Long, Генетическая изменчивость человека: механизмы и результаты микроэволюции, Американская антропологическая ассоциация (2004)
^ Anzai T, Shiina T, Kimura N, Yanagiya K, Kohara S, Shigenari A и др. (июнь 2003 г.). «Сравнительное секвенирование областей MHC класса I человека и шимпанзе раскрывает вставки/делеции как основной путь к геномной дивергенции». Труды Национальной академии наук Соединенных Штатов Америки . 100 (13): 7708–13. Bibcode : 2003PNAS..100.7708A. doi : 10.1073/pnas.1230533100 . PMC 164652. PMID 12799463 .
^ Redon R, Ishikawa S, Fitch KR, Feuk L, Perry GH, Andrews TD и др. (ноябрь 2006 г.). «Глобальная вариация числа копий в геноме человека». Nature . 444 (7118): 444–54. Bibcode :2006Natur.444..444R. doi :10.1038/nature05329. PMC 2669898 . PMID 17122850.
^ Баррейро Л.Б., Лаваль Г., Куах Х., Патин Э., Кинтана-Мурси Л. (март 2008 г.). «Естественный отбор привел к дифференциации популяций современных людей». Природная генетика . 40 (3): 340–5. дои : 10.1038/ng.78. PMID 18246066. S2CID 205357396.
^ EE Harris et al., Молекулярная сигнатура отбора, лежащая в основе человеческих адаптаций, Ежегодник физической антропологии 49: 89-130 (2006)
^ Бамшад М, Вудинг СП (февраль 2003 г.). «Сигнатуры естественного отбора в геноме человека». Nature Reviews. Генетика . 4 (2): 99–111. doi :10.1038/nrg999. PMID 12560807. S2CID 13722452.
^ abcdef G Spencer, Международный консорциум объявляет о проекте «1000 геномов», EMBARGOED (2008) http://www.nih.gov/news/health/jan2008/nhgri-22.htm
^ Отчет о встрече abcdef : Семинар по планированию глубокого каталога генетических вариаций человека, (2007) http://www.1000genomes.org/sites/1000genomes.org/files/docs/1000Genomes-MeetingReport.pdf
^ Олексик ТК, Брухин В, О'Брайен С.Дж. (2015). «Проект «Геном Россия»: закрываем самое большое оставшееся упущение на карте мирового генома». GigaScience . 4 : 53. doi : 10.1186/s13742-015-0095-0 . PMC 4644275. PMID 26568821 .
^ C. King (2012) Самые горячие исследования 2011 года. Science Watch http://archive.sciencewatch.com/newsletter/2012/201203/hottest_research_2012/
^ Встреча сообщества по анализу проекта «1000 геномов» http://1000gconference.sph.umich.edu/

Внешние ссылки

1000 геномов — подробный каталог генетических вариаций человека — официальная веб-страница
Международный проект HapMap. Архивировано 16 апреля 2014 г. на официальной веб-странице Wayback Machine .
Информация о проекте «Геном человека»