Международный проект HapMap был организацией, которая стремилась разработать карту гаплотипа ( HapMap ) генома человека , чтобы описать общие закономерности генетической изменчивости человека . HapMap используется для поиска генетических вариантов, влияющих на здоровье, болезни и реакции на лекарства и факторы окружающей среды. Информация, полученная в ходе проекта, предоставляется в свободном доступе для исследований.
Международный проект HapMap — это совместная работа исследователей из академических центров, некоммерческих биомедицинских исследовательских групп и частных компаний в Канаде , Китае (включая Гонконг ), Японии , Нигерии , Великобритании и США . Официально проект стартовал со встречи 27–29 октября 2002 года и, как ожидалось, продлится около трех лет. Он состоит из трех этапов; полные данные, полученные на этапе I, были опубликованы 27 октября 2005 года. [1] Анализ набора данных этапа II был опубликован в октябре 2007 года. [2] Набор данных этапа III был выпущен весной 2009 года, а публикация, представляющая окончательные результаты, была опубликована в сентябре 2010 года. [3]
В отличие от более редких менделевских заболеваний, комбинации различных генов и окружающей среды играют роль в развитии и прогрессировании распространенных заболеваний (таких как диабет , рак , болезни сердца , инсульт , депрессия и астма ) или в индивидуальной реакции на фармакологические агенты. [4] Чтобы найти генетические факторы, вовлеченные в эти заболевания, можно было бы в принципе провести исследование ассоциаций по всему геному : получить полную генетическую последовательность нескольких людей, некоторые из которых больны, а некоторые нет, а затем искать различия между двумя наборами геномов. В то время этот подход был неосуществим из-за стоимости полного секвенирования генома . Проект HapMap предложил короткий путь.
Хотя любые два неродственных человека разделяют около 99,5% своей последовательности ДНК , их геномы различаются в определенных местах нуклеотидов . Такие сайты известны как однонуклеотидные полиморфизмы (SNP), и каждая из возможных результирующих форм гена называется аллелем . [ 5] Проект HapMap фокусируется только на общих SNP, где каждый аллель встречается по крайней мере у 1% популяции.
У каждого человека есть две копии всех хромосом , за исключением половых хромосом у мужчин . Для каждого SNP комбинация аллелей, которую имеет человек, называется генотипом . Генотипирование относится к выявлению того, какой генотип есть у человека в определенном месте. Проект HapMap выбрал выборку из 269 человек и выбрал несколько миллионов четко определенных SNP, генотипировал людей по этим SNP и опубликовал результаты. [6]
Аллели соседних SNP на одной хромосоме коррелируют. В частности, если аллель одного SNP для данного индивидуума известен, аллели соседних SNP часто можно предсказать, процесс, известный как вменение генотипа . [7] Это происходит потому, что каждый SNP возник в эволюционной истории как единичная точечная мутация , а затем был передан на хромосоме, окруженной другими, более ранними, точечными мутациями. SNP, которые разделены большим расстоянием на хромосоме, обычно не очень хорошо коррелируют, потому что рекомбинация происходит в каждом поколении и смешивает последовательности аллелей двух хромосом. Последовательность последовательных аллелей на определенной хромосоме известна как гаплотип . [ 8]
Чтобы найти генетические факторы, вовлеченные в определенное заболевание, можно действовать следующим образом. Сначала определяется определенный интересующий регион генома, возможно, из более ранних исследований наследования. В этом регионе находится набор теговых SNP из данных HapMap; это SNP, которые очень хорошо коррелируют со всеми другими SNP в регионе. Используя их, можно использовать вменение генотипа для определения (вменения) других SNP и, таким образом, всего гаплотипа с высокой степенью достоверности. Затем определяется генотип для этих теговых SNP у нескольких людей, некоторые из которых имеют заболевание, а некоторые нет. Сравнивая две группы, можно определить вероятные местоположения и гаплотипы, которые вовлечены в заболевание.
Гаплотипы , как правило, общие для разных популяций, но их частота может сильно различаться. Для включения в HapMap были отобраны четыре популяции: 30 взрослых трио йоруба с обоими родителями из Ибадана , Нигерия (YRI), 30 трио жителей Юты северо- и западноевропейского происхождения (CEU), 44 неродственных японца из Токио , Япония (JPT) и 45 неродственных китайцев хань из Пекина , Китай (CHB). Хотя гаплотипы, выявленные в этих популяциях, должны быть полезны для изучения многих других популяций, в настоящее время параллельные исследования изучают полезность включения дополнительных популяций в проект.
Все образцы были собраны в ходе процесса вовлечения сообщества с соответствующим информированным согласием. Процесс вовлечения сообщества был разработан для выявления и попытки реагирования на культурно-специфические проблемы и предоставления участвующим сообществам вклада в процессы информированного согласия и сбора образцов. [9]
На третьем этапе были собраны 11 глобальных групп предков: ASW (африканское происхождение на юго-западе США); CEU (жители Юты с северо- и западноевропейским происхождением из коллекции CEPH); CHB (китайцы хань в Пекине, Китай); CHD (китайцы в Денвере, Колорадо); GIH (индейцы гуджарати в Хьюстоне, Техас); JPT (японцы в Токио, Япония); LWK (лухья в Вебуе, Кения); MEX (мексиканское происхождение в Лос-Анджелесе, Калифорния); MKK (масаи в Киньяве, Кения); TSI (тосканцы в Италии); YRI (йоруба в Ибадане, Нигерия). [10]
Также были созданы три комбинированные панели, которые позволяют лучше идентифицировать SNP в группах за пределами девяти однородных образцов: CEU+TSI (комбинированная панель жителей Юты с североевропейским и западноевропейским происхождением из коллекции CEPH и тосканцев в Италии); JPT+CHB (комбинированная панель японцев в Токио, Япония и китайцев хань в Пекине, Китай) и JPT+CHB+CHD (комбинированная панель японцев в Токио, Япония, китайцев хань в Пекине, Китай и китайцев в столичном Денвере, Колорадо). Например, CEU+TSI является лучшей моделью британских граждан Великобритании, чем CEU в отдельности. [10]
В 1990-х годах секвенировать весь геном пациента было дорого. Поэтому Национальные институты здравоохранения приняли идею «сокращения», которая заключалась в том, чтобы смотреть только на те участки генома, где у многих людей есть вариантная единица ДНК. Теория, лежащая в основе сокращения, заключалась в том, что поскольку основные заболевания распространены, то также распространены и генетические варианты, которые их вызывают. Естественный отбор сохраняет геном человека свободным от вариантов, которые вредят здоровью до того, как дети вырастут, утверждала теория, но не справляется с вариантами, которые поражают здоровье в более позднем возрасте, позволяя им стать довольно распространенными (в 2002 году Национальные институты здравоохранения начали проект стоимостью 138 миллионов долларов под названием HapMap , чтобы каталогизировать общие варианты в европейских, восточноазиатских и африканских геномах). [11]
Для фазы I один общий SNP генотипировался каждые 5000 оснований. В целом было генотипировано более миллиона SNP. Генотипирование проводилось 10 центрами с использованием пяти различных технологий генотипирования. Качество генотипирования оценивалось с использованием дубликатов или связанных образцов и путем проведения периодических проверок качества, когда центры должны были генотипировать общие наборы SNP.
Канадская группа под руководством Томаса Дж. Хадсона из Университета Макгилла в Монреале сосредоточилась на хромосомах 2 и 4p. Китайскую команду возглавлял Хуанмин Ян в Пекине и Шанхае , а Лап-Чи Цуй в Гонконге сосредоточился на хромосомах 3, 8p и 21. Японскую команду возглавлял Юсукэ Накамура в Токийском университете , и она сосредоточилась на хромосомах 5, 11, 14, 15, 16, 17 и 19. Британскую команду возглавлял Дэвид Р. Бентли в Институте Сэнгера , и она сосредоточилась на хромосомах 1, 6, 10, 13 и 20. В США было четыре центра генотипирования: группа под руководством Марка Чи и Арнольда Олифанта в Illumina Inc. в Сан-Диего (изучение хромосом 8q, 9, 18q, 22 и X), группа под руководством Дэвида Альтшулера и Марка Дейли в Институте Брода в Кембридже, США (хромосомы 4q, 7q, 18p, Y и митохондрия ), группа под руководством Ричарда Гиббса из Медицинского колледжа Бейлора в Хьюстоне (хромосома 12) и группа под руководством Пуй-Ян Квок из Калифорнийского университета в Сан-Франциско (хромосома 7p).
Чтобы получить достаточное количество SNP для создания Карты, Консорциум профинансировал большой проект по повторному секвенированию для обнаружения миллионов дополнительных SNP. Они были отправлены в публичную базу данных dbSNP . В результате к августу 2006 года база данных включала более десяти миллионов SNP, и более 40% из них были известны как полиморфные . Для сравнения, в начале проекта было идентифицировано менее 3 миллионов SNP, и не более 10% из них были известны как полиморфные.
В ходе фазы II Дэвид Р. Кокс, Келли А. Фрейзер и другие сотрудники Perlegen Sciences генотипировали более двух миллионов дополнительных однонуклеотидных полиморфизмов по всему геному, а компания Affymetrix — 500 000 .
Все данные, полученные в ходе проекта, включая частоты SNP, генотипы и гаплотипы , были размещены в открытом доступе и доступны для скачивания. [12] Этот веб-сайт также содержит браузер генома, который позволяет находить SNP в любой интересующей области, их частоты аллелей и их связь с близлежащими SNP. Также предоставляется инструмент, который может определять теговые SNP для заданной интересующей области. К этим данным также можно получить прямой доступ из широко используемой программы Haploview .
{{cite journal}}
: CS1 maint: числовые имена: список авторов ( ссылка )