Геномная структурная вариация — это вариация структуры хромосомы организма , такая как делеции, дупликации, вариации числа копий , вставки, инверсии и транслокации . Первоначально структурная вариация затрагивает длину последовательности примерно от 1 кб до 3 Мб, что больше, чем SNP , и меньше, чем аномалия хромосомы (хотя определения частично совпадают). [1] Однако рабочий диапазон структурных вариаций расширился и теперь включает события > 50 п.н. [2] Некоторые структурные вариации связаны с генетическими заболеваниями , однако большинство — нет. [3] [4] Примерно 13% генома человека определяется как структурно изменчивый в нормальной популяции, и существует по меньшей мере 240 генов, которые существуют как гомозиготные делеционные полиморфизмы в человеческих популяциях, что позволяет предположить, что эти гены не являются обязательными для людей. [4] В то время как у людей медиана SNP составляет 3,6 Мбн (по сравнению с референтным геномом), медиана в 8,9 Мбн зависит от структурных вариаций, которые, таким образом, вызывают большинство генетических различий между людьми с точки зрения необработанных данных о последовательностях. [4]
Микроскопические структурные вариации
Микроскопический означает, что его можно обнаружить с помощью оптических микроскопов , например, анеуплоидии , маркерные хромосомы , грубые перестройки и вариации в размере хромосом. [5] [6] Считается, что частота в человеческой популяции недооценена из-за того, что некоторые из них на самом деле нелегко идентифицировать. Эти структурные аномалии существуют у 1 из каждых 375 живорождений по предполагаемой информации. [7]
Субмикроскопические структурные вариации
Субмикроскопические структурные варианты гораздо сложнее обнаружить из-за их небольшого размера. Первое исследование в 2004 году, которое использовало ДНК-микрочипы , смогло обнаружить десятки генетических локусов , которые показали вариацию числа копий , делеции и дупликации , более 100 килобаз в геноме человека. [8] Однако к 2015 году исследования по секвенированию всего генома смогли обнаружить около 5000 структурных вариантов размером всего 100 пар оснований, охватывающих приблизительно 20 мегабаз в каждом отдельном геноме. [3] [4] Эти структурные варианты включают делеции, тандемные дупликации, инверсии , вставки мобильных элементов . Скорость мутаций также намного выше, чем у микроскопических структурных вариантов, оцененная двумя исследованиями в 16% и 20% соответственно, оба из которых, вероятно, занижены из-за проблем с точным обнаружением структурных вариантов. [3] [9] Также было показано, что генерация спонтанных структурных вариантов значительно увеличивает вероятность генерации дальнейших спонтанных однонуклеотидных вариантов или инделей в пределах 100 килобаз от структурного вариационного события. [3]
Изменение числа копий
Вариации числа копий (CNV) — это большая категория структурных вариаций, которая включает вставки , делеции и дупликации . В недавних исследованиях вариации числа копий проверялись на людях, не имеющих генетических заболеваний, с использованием методов, которые используются для количественного генотипирования SNP. Результаты показывают, что 28% предполагаемых регионов у людей на самом деле содержат вариации числа копий. [10] [11] Кроме того, CNV в геноме человека затрагивают больше нуклеотидов, чем полиморфизм одного нуклеотида (SNP). Также следует отметить, что многие из CNV не находятся в кодирующих регионах. Поскольку CNV обычно вызываются неравной рекомбинацией , широко распространенные похожие последовательности, такие как LINE и SINE, могут быть общим механизмом создания CNV. [12] [13]
Инверсия
Известно несколько инверсий, связанных с болезнями человека. Например, повторяющаяся инверсия в 400 кб в гене фактора VIII является частой причиной гемофилии А , [14] а меньшие инверсии, влияющие на идунорат 2-сульфатазу (IDS), вызывают синдром Хантера . [15] Другие примеры включают синдром Ангельмана и синдром Сотоса . Однако недавние исследования показывают, что у одного человека может быть 56 предполагаемых инверсий, поэтому инверсии, не связанные с болезнью, встречаются чаще, чем предполагалось ранее. Также в этом исследовании указано, что точки разрыва инверсии обычно связаны с сегментными дупликациями. [16] Одна инверсия в 900 кб в хромосоме 17 находится под положительным отбором и, как прогнозируется, увеличит ее частоту в европейской популяции. [17]
Другие структурные варианты
Более сложные структурные варианты могут включать комбинацию вышеперечисленного в одном событии. [3] Наиболее распространенным типом сложных структурных вариаций являются нетандемные дупликации, где последовательность дублируется и вставляется в инвертированной или прямой ориентации в другую часть генома. [3] Другие классы сложных структурных вариантов включают делецию-инверсию-делеции, дупликацию-инверсию-дупликации и тандемные дупликации с вложенными делециями. [3]
Существуют также скрытые транслокации и сегментная однородительская дисомия (UPD). Сообщений об этих вариациях становится все больше, но их сложнее обнаружить, чем традиционные вариации, поскольку эти варианты сбалансированы, а методы на основе массива или ПЦР не позволяют их обнаружить. [18]
Структурные вариации и фенотипы
Предполагается, что некоторые генетические заболевания вызваны структурными вариациями, но эта связь не очень определена. Неправдоподобно делить эти варианты на два класса как «нормальные» и «болезненные», поскольку фактический результат одного и того же варианта также будет различаться. Кроме того, некоторые из вариантов на самом деле положительно отобраны для (упомянутого выше). Серия исследований показала, что спонтанные ( de novo ) CNV, нарушающие гены, нарушают гены примерно в четыре раза чаще при аутизме, чем в контрольной группе, и вносят вклад примерно в 5–10% случаев. [3] [19] [20] [21] [22] Унаследованные варианты также вносят вклад примерно в 5–10% случаев аутизма. [3]
Структурные вариации также имеют свою функцию в популяционной генетике. Различная частота одной и той же вариации может использоваться в качестве генетической метки для вывода о связи между популяциями в разных областях. Полное сравнение структурных вариаций человека и шимпанзе также предполагает, что некоторые из них могут быть зафиксированы в одном виде из-за его адаптивной функции. [23] Существуют также делеции, связанные с устойчивостью к малярии и СПИДу . [24] [25] Кроме того, некоторые высокоизменчивые сегменты, как полагают, вызваны балансирующим отбором, но есть и исследования, опровергающие эту гипотезу. [26]
База данных структурных вариаций
Некоторые браузеры генома и биоинформационные базы данных имеют список структурных вариаций в геноме человека с акцентом на CNV и могут отображать их на странице просмотра генома, например, UCSC Genome Browser . [27] Под страницей просмотра части генома есть «Common Cell CNVs» и «Structural Var», которые можно включить. На NCBI есть специальная страница [28] для структурных вариаций. В этой системе отображаются как «внутренние», так и «внешние» координаты; они обе не являются фактическими точками разрыва, а предполагают минимальный и максимальный диапазон последовательности, затронутой структурной вариацией. Типы классифицируются как вставка, потеря, усиление, инверсия, LOH, вывернутый, transchr и UPD. [ необходима цитата ]
Методы обнаружения
Были разработаны новые методы для анализа структурных вариаций генетической информации человека с высоким разрешением. Методы, используемые для тестирования генома, являются либо определенными целевыми, либо широкогеномными. Для широкогеномных тестов подходы сравнительной геномной гибридизации на основе массивов обеспечивают наилучшие широкогеномные сканирования для поиска новых вариантов числа копий. [30] Эти методы используют фрагменты ДНК, которые маркируются из интересующего генома и гибридизуются с другим геномом, маркированным по-другому, с массивами, отмеченными клонированными фрагментами ДНК. Это выявляет различия в числе копий между двумя геномами. [30]
Для целевых геномных исследований лучшими анализами для проверки определенных областей генома являются, прежде всего, ПЦР. Наиболее известным из методов, основанных на ПЦР, является количественная полимеразная цепная реакция в реальном времени (qPCR). [30] Другой подход заключается в специальной проверке определенных областей, которые окружают известные сегментные дупликации, поскольку они обычно являются областями вариации числа копий. [30] Метод генотипирования SNP, который предлагает независимые интенсивности флуоресценции для двух аллелей, может быть использован для нацеливания на нуклеотиды между двумя копиями сегментной дупликации. [30] Из этого можно наблюдать увеличение интенсивности от одного из аллелей по сравнению с другим.
С развитием технологии секвенирования нового поколения (NGS) были описаны четыре класса стратегий обнаружения структурных вариантов с использованием данных NGS, каждый из которых основан на паттернах, диагностических для различных классов SV. [31] [29] [32] [33]
Методы глубины чтения или подсчета чтения предполагают случайное распределение (например, распределение Пуассона ) прочтений из короткой последовательности прочтений. Расхождение с этим распределением исследуется для обнаружения дупликаций и делеций. Регионы с дупликацией покажут более высокую глубину чтения, тогда как регионы с делецией приведут к более низкой глубине чтения.
Методы расщепленного чтения позволяют обнаруживать вставки (включая вставки мобильных элементов ) и делеции вплоть до разрешения одной пары оснований. Наличие SV определяется по прерывистому выравниванию с референтным геномом. Пробел в чтении обозначает делецию, а в референте — вставку.
Методы пар чтения изучают длину и ориентацию парных конечных прочтений из коротких данных секвенирования прочтений. Например, пары прочтений, расположенные дальше друг от друга, чем ожидалось, указывают на делецию. Транслокации, инверсии и тандемные дупликации также могут быть обнаружены с помощью пар прочтений.
Сборка последовательности de novo может применяться с достаточно точными прочтениями. Хотя на практике использование этого метода ограничено длиной прочтений последовательности, сборки генома на основе длинных прочтений предлагают структурное обнаружение вариаций для таких классов, как вставки, которые избегают обнаружения при использовании других методов. [34]
^ Райх, Дэвид Э.; Шаффнер, Стивен Ф.; Дейли, Марк Дж.; МакВин, Джил ; Малликин, Джеймс К.; Хиггинс, Джон М.; Рихтер, Дэниел Дж.; Ландер, Эрик С.; Альтшулер , Дэвид (2002). «Изменчивость последовательности генома человека и влияние истории генов, мутаций и рекомбинации». Nature Genetics . 32 (1): 135–42. doi :10.1038/ng947. PMID 12161752. S2CID 16822751.
^ Грипенберг, Улла (1964). «Изменение размера и ориентация человеческой Y-хромосомы». Chromosoma . 15 (5): 618–29. doi :10.1007/BF00319995. PMID 14333154. S2CID 26549548.
^ Wyandt, HE; Tonk, VS (2004). Атлас гетероморфизмов хромосом человека . Нидерланды: Kluwer Academic. ISBN978-90-481-6296-3.[ нужна страница ]
^ Sebat, J. (23 июля 2004 г.). «Масштабный полиморфизм числа копий в геноме человека». Science . 305 (5683): 525–528. Bibcode :2004Sci...305..525S. doi :10.1126/science.1098918. PMID 15273396. S2CID 20357402.
^ Клоостерман, Вигард П.; Франчиоли, Лоран К.; Хормоздиари, Ферейдун; Маршалл, Тобиас; Хехир-Ква, Джейн Ю.; Абделлауи, Абдель; Ламейер, Эрик-Вуббо; Моед, Маттейс Х.; Коваль Вячеслав; Ренкенс, Иво; ван Русмален, Маркус Дж.; Арп, Паскаль; Карссен, Леннарт К.; Коу, Брэдли П.; Handsaker, Роберт Э.; Сучиман, Эка Д.; Куппен, Эдвин; Тунг, Джи Тджван; Маквей, Митч; Вендл, Майкл С .; Уиттерлинден, Андре; ван Дуйн, Корнелия М.; Свертц, Моррис А.; Вейменга, Сиска; ван Оммен, Герт Ян Б.; Слагбум, П. Элин; Бумсма, Доррет И.; Шенхут, Александр; Эйхлер, Эван Э .; де Баккер, Пол IW; Да, Кай; Гурьев, Виктор (июнь 2015 г.). «Особенности структурных изменений de novo в геноме человека». Геномные исследования . 25 (6): 792–801. дои : 10.1101/гр.185041.114. ПМЦ 4448676 . ПМИД 25883321.
^ Sebat, J.; Lakshmi, B; Troge, J; Alexander, J; Young, J; Lundin, P; Månér, S; Massa, H; et al. (2004). «Масштабный полиморфизм числа копий в геноме человека». Science . 305 (5683): 525–8. Bibcode :2004Sci...305..525S. doi :10.1126/science.1098918. PMID 15273396. S2CID 20357402.
^ Iafrate, A John; Feuk, Lars; Rivera, Miguel N; Listewnik, Marc L; Donahoe, Patricia K ; Qi, Ying; Scherer, Stephen W; Lee, Charles (2004). «Обнаружение крупномасштабных вариаций в геноме человека». Nature Genetics . 36 (9): 949–51. doi : 10.1038/ng1416 . PMID 15286789.
^ Lupski, James R. (2010). «Ретротранспозиция и структурные вариации в геноме человека». Cell . 141 (7): 1110–2. doi : 10.1016/j.cell.2010.06.014 . PMID 20602993. S2CID 2047696.
^ Lam, Hugo YK; Mu, Xinmeng Jasmine; Stutz, Adrian M; Tanzer, Andrea; Cayting, Philip D; Snyder, Michael; Kim, Philip M; Korbel, Jan O ; Gerstein, Mark B (2010). "Анализ структурных вариантов с разрешением нуклеотидов с использованием BreakSeq и библиотеки точек останова". Nature Biotechnology . 28 (1): 47–55. doi :10.1038/nbt.1600. PMC 2951730 . PMID 20037582.
^ Джонсон, Мэтью Э.; Виджано, Луиджи; Бейли, Джеффри А.; Абдул-Рауф, Муна; Гудвин, Грэм; Рокки, Мариано; Эйхлер, Эван Э. (2001). «Положительный отбор семейства генов во время появления людей и африканских обезьян». Nature . 413 (6855): 514–9. Bibcode :2001Natur.413..514J. doi :10.1038/35097067. PMID 11586358. S2CID 4327069.
^ Редон, Ричард; Ишикава, Шумпей; Фитч, Карен Р.; Фьюк, Ларс; Перри, Джордж Х.; Эндрюс, Т. Дэниел; Фиглер, Хайке; Шаперо, Майкл Х.; и др. (2006). «Глобальная вариация числа копий в геноме человека». Nature . 444 (7118): 444–54. Bibcode :2006Natur.444..444R. doi :10.1038/nature05329. PMC 2669898 . PMID 17122850.
^ Гонсалес, Э.; Кулкарни, Х; Боливар, Х; Мангано, А; Санчес, Р.; Катано, Г; Ниббс, Р. Дж.; Фридман, Б. И.; и др. (2005). «Влияние сегментных дупликаций, содержащих ген CCL3L1, на восприимчивость к ВИЧ-1/СПИДу». Science . 307 (5714): 1434–40. Bibcode :2005Sci...307.1434G. doi :10.1126/science.1101160. PMID 15637236. S2CID 8815153.
^ Bubb, KL; Bovee, D; Buckley, D; Haugen, E; Kibukawa, M; Paddock, M; Palmieri, A; Subramanian, S; et al. (2006). «Сканирование генома человека не выявило новых локусов при древнем балансирующем отборе». Genetics . 173 (4): 2165–77. doi :10.1534/genetics.106.055715. PMC 1569689 . PMID 16751668.
^ ab Tattini, Lorenzo; D'Aurizio, Romina; Magi, Alberto (2015). «Обнаружение геномных структурных вариантов на основе данных секвенирования следующего поколения». Frontiers in Bioengineering and Biotechnology . 3 (92): 92. doi : 10.3389/fbioe.2015.00092 . PMC 4479793. PMID 26161383 .