Вариация числа копий ( CNV ) — это явление, при котором участки генома повторяются, а число повторов в геноме варьируется между индивидуумами. [1] Вариация числа копий — это тип структурной вариации : в частности, это тип события дупликации или делеции , которое затрагивает значительное количество пар оснований. [2] Примерно две трети всего генома человека могут состоять из повторов [3] , а 4,8–9,5% генома человека можно классифицировать как вариации числа копий. [4] У млекопитающих вариации числа копий играют важную роль в создании необходимой вариации в популяции, а также в фенотипе заболевания. [1]
Вариации числа копий можно в целом разделить на две основные группы: короткие повторы и длинные повторы. Однако четких границ между этими двумя группами нет, и классификация зависит от природы интересующих локусов . Короткие повторы включают в себя в основном динуклеотидные повторы (два повторяющихся нуклеотида, например, ACACAC...) и тринуклеотидные повторы. Длинные повторы включают повторы целых генов. Эта классификация, основанная на размере повтора, является наиболее очевидным типом классификации, поскольку размер является важным фактором при изучении типов механизмов, которые, скорее всего, привели к появлению повторов, [5] отсюда и вероятные эффекты этих повторов на фенотип.
Одним из наиболее известных примеров короткой вариации числа копий является тринуклеотидный повтор пар оснований CAG в гене хантингтина, ответственном за неврологическое расстройство болезнь Хантингтона . [6] В этом конкретном случае, как только тринуклеотид CAG повторяется более 36 раз в расширении тринуклеотидного повтора , у человека, скорее всего, разовьется болезнь Хантингтона, и она, скорее всего, будет унаследована его или ее потомством. [6] Количество повторов тринуклеотида CAG обратно пропорционально возрасту начала болезни Хантингтона. [7] Часто считается, что эти типы коротких повторов возникают из-за ошибок в активности полимеразы во время репликации , включая проскальзывание полимеразы, переключение шаблона и переключение вилки, которые будут подробно рассмотрены позже. Короткий размер повтора этих вариаций числа копий сам по себе приводит к ошибкам в полимеразе, поскольку эти повторяющиеся области склонны к неправильному распознаванию полимеразой, и реплицированные области могут быть реплицированы снова, что приводит к дополнительным копиям повтора. [8] Кроме того, если эти тринуклеотидные повторы находятся в одной и той же рамке считывания в кодирующей части гена, это может привести к длинной цепи той же аминокислоты , возможно, создавая белковые агрегаты в клетке, [7] и если эти короткие повторы попадают в некодирующую часть гена, это может повлиять на экспрессию и регуляцию гена . С другой стороны, переменное количество повторов целых генов реже идентифицируется в геноме. Одним из примеров полного повтора гена является ген альфа-амилазы 1 ( AMY1 ), который кодирует альфа-амилазу, которая имеет значительную вариацию числа копий между различными популяциями с разным рационом питания. [9] Хотя конкретный механизм, который позволяет гену AMY1 увеличивать или уменьшать число копий, все еще является предметом дискуссий, некоторые гипотезы предполагают, что негомологичное соединение концов или микрогомологичное соединение концов, вероятно, ответственно за эти полные повторы гена. [9] Повторы целых генов оказывают немедленное воздействие на экспрессию этого конкретного гена, и тот факт, что изменение числа копий гена AMY1 связано с диетой, является замечательным примером недавней эволюционной адаптации человека. [9]Хотя это общие группы, в которые объединены вариации числа копий, точное число пар оснований, на которые влияют вариации числа копий, зависит от конкретных интересующих локусов. В настоящее время, используя данные из всех зарегистрированных вариаций числа копий, средний размер варианта числа копий составляет около 118 кб, а медиана — около 18 кб. [10]
С точки зрения структурной архитектуры вариаций числа копий, исследования предположили и определили горячие точки в геноме, где вариации числа копий в четыре раза более обогащены. [2] Эти горячие точки были определены как регионы, содержащие длинные повторы, которые на 90–100% схожи, известные как сегментные дупликации, либо тандемные , либо перемежающиеся, и, что наиболее важно, эти горячие точки имеют повышенную скорость хромосомной перестройки . [2] Считалось, что эти крупномасштабные хромосомные перестройки приводят к нормальной вариации и генетическим заболеваниям , включая вариации числа копий. [1] Более того, эти горячие точки вариации числа копий постоянны во многих популяциях с разных континентов, что подразумевает, что эти горячие точки были либо независимо приобретены всеми популяциями и переданы через поколения, либо они были приобретены на ранней стадии эволюции человека до разделения популяций, последнее кажется более вероятным. [1] Наконец, пространственные смещения местоположения, в котором вариации числа копий распределены наиболее плотно, по-видимому, не происходят в геноме. [1] Хотя первоначально было обнаружено с помощью флуоресцентной гибридизации in situ и микросателлитного анализа , что повторы числа копий локализуются в областях, которые являются высокоповторяющимися, таких как теломеры , центромеры и гетерохроматин , [11] недавние исследования по всему геному пришли к иному выводу. [2] А именно, субтеломерные области и перицентромерные области являются теми местами, где обнаружено большинство горячих точек хромосомной перестройки, и нет значительного увеличения вариаций числа копий в этой области. [2] Кроме того, эти области горячих точек хромосомной перестройки не имеют уменьшенных чисел генов, что опять же подразумевает, что существует минимальное пространственное смещение геномного расположения вариаций числа копий. [2]
Первоначально считалось, что вариации числа копий занимают чрезвычайно малую и незначительную часть генома посредством цитогенетических наблюдений. [12] Вариации числа копий, как правило, были связаны только с небольшими тандемными повторами или определенными генетическими нарушениями, [13] поэтому вариации числа копий изначально изучались только с точки зрения определенных локусов. Однако технологические разработки привели к увеличению числа высокоточных способов идентификации и изучения вариаций числа копий. Вариации числа копий первоначально изучались цитогенетическими методами, которые являются методами, позволяющими наблюдать физическую структуру хромосомы. [12] Одним из таких методов является флуоресцентная гибридизация in situ (FISH), которая включает в себя вставку флуоресцентных зондов, которые требуют высокой степени комплементарности в геноме для связывания. [10] Сравнительная геномная гибридизация также широко использовалась для обнаружения вариаций числа копий путем визуализации флуорофора и последующего сравнения длины хромосом. [10]
Недавние достижения в области геномных технологий привели к появлению многих важных методов, которые обладают чрезвычайно высоким геномным разрешением, и в результате было сообщено о растущем числе вариаций числа копий в геноме. [10] Первоначально эти достижения включали использование массива бактериальных искусственных хромосом (BAC) с интервалами около 1 мегабазы по всему гену, [14] BAC также могут обнаруживать вариации числа копий в горячих точках перестройки, что позволяет обнаружить 119 новых вариаций числа копий. [2] Высокопроизводительное геномное секвенирование произвело революцию в области геномики человека, и были проведены исследования in silico для обнаружения вариаций числа копий в геноме. [2] Референтные последовательности сравнивались с другими интересующими последовательностями с использованием фосмид путем строгого контроля клонов фосмид до 40 кб. [15] Секвенирование конечных прочтений предоставит достаточную информацию для выравнивания референсной последовательности с интересующей последовательностью, и любые несоответствия легко заметить, поэтому можно сделать вывод, что это вариации числа копий в этой области клона. [15] Этот тип метода обнаружения обеспечивает высокое геномное разрешение и точное местоположение повтора в геноме, а также может обнаруживать другие типы структурных вариаций, такие как инверсии. [10]
Кроме того, еще одним способом обнаружения вариаций числа копий является использование однонуклеотидных полиморфизмов (SNP). [10] Из-за обилия данных человеческих SNP направление обнаружения вариаций числа копий изменилось на использование этих SNP. [16] Опираясь на тот факт, что человеческая рекомбинация относительно редка и что многие события рекомбинации происходят в определенных регионах генома, известных как горячие точки рекомбинации, неравновесие сцепления может быть использовано для выявления вариаций числа копий. [16] Были предприняты усилия по связыванию вариаций числа копий с определенными гаплотипическими SNP путем анализа неравновесия сцепления, используя эти ассоциации, можно распознавать вариации числа копий в геноме, используя SNP в качестве маркеров. Методы секвенирования следующего поколения, включая секвенирование с коротким и длинным чтением, в настоящее время все чаще используются и начали заменять методы на основе массивов для обнаружения вариаций числа копий. [17] [18]
Существует два основных типа молекулярных механизмов формирования вариаций числа копий: основанные на гомологичности и основанные на негомологии. [5] Хотя было выдвинуто много предположений, большинство из этих теорий являются предположениями и догадками. Не существует убедительных доказательств, которые бы коррелировали конкретную вариацию числа копий с конкретным механизмом.
Одной из наиболее признанных теорий, которая приводит к вариациям числа копий, а также к делециям и инверсиям, является неаллельная гомологичная рекомбинация . [19] Во время мейотической рекомбинации гомологичные хромосомы объединяются в пары и образуют два конечных двухцепочечных разрыва, приводящих к соединениям Холлидея . Однако в аберрантном механизме во время образования соединений Холлидея двухцепочечные разрывы смещаются, и кроссинговер попадает в неаллельные положения на той же хромосоме. Когда соединение Холлидея разрешается, событие неравного кроссинговера позволяет переносить генетический материал между двумя гомологичными хромосомами, и в результате часть ДНК на обоих гомологах повторяется. [19] Поскольку повторяющиеся области больше не разделяются независимо , дублированная область хромосомы наследуется. Другой тип механизма, основанного на гомологичной рекомбинации, который может привести к вариации числа копий, известен как репликация, индуцированная разрывом. [20] Когда в геноме неожиданно происходит двухцепочечный разрыв, клетка активирует пути, которые опосредуют восстановление разрыва. [20] Ошибки при восстановлении разрыва, подобные неаллельной гомологичной рекомбинации, могут привести к увеличению числа копий определенного региона генома. Во время восстановления двухцепочечного разрыва сломанный конец может вторгнуться в свою гомологичную хромосому вместо того, чтобы воссоединиться с исходной цепью. [20] Как и в механизме неаллельной гомологичной рекомбинации, дополнительная копия определенного региона переносится на другую хромосому, что приводит к событию дупликации. Кроме того, обнаружено, что белки когезина помогают в системе восстановления двухцепочечных разрывов, зажимая два конца в непосредственной близости, что предотвращает межхромосомное вторжение концов. [21] Если по какой-либо причине, например, из-за активации рибосомной РНК , активность когезина нарушается, то может наблюдаться локальное увеличение ошибок восстановления двухцепочечных разрывов. [21]
Другой класс возможных механизмов, которые, как предполагается, приводят к вариациям числа копий, основан на негомологичных механизмах. Чтобы отличить этот механизм от гомологичных, необходимо понимать концепцию гомологии. Гомологичное спаривание хромосом включает использование цепей ДНК, которые очень похожи друг на друга (~97%), и эти цепи должны быть длиннее определенной длины, чтобы избежать коротких, но очень похожих пар. [5] Негомологичные спаривания, с другой стороны, полагаются только на несколько пар оснований сходства между двумя цепями, поэтому возможен обмен или дублирование генетических материалов в процессе негомологичных двухцепочечных репараций. [5]
Одним из типов негомологичных механизмов является негомологичное соединение концов или механизм микрогомологического соединения концов . [22] Эти механизмы также участвуют в восстановлении двухцепочечных разрывов, но не требуют гомологии или требуют ограниченной микрогомологии. [5] Когда эти цепи восстанавливаются, часто в восстановленную цепь добавляются небольшие делеции или вставки. Возможно, что ретротранспозоны вставляются в геном через эту систему восстановления. [22] Если ретротранспозоны вставляются в неаллельную позицию на хромосоме, мейотическая рекомбинация может привести к рекомбинации вставки в ту же цепь, что и уже существующая копия того же региона. Другим механизмом является цикл разрыв-слияние-мост, который включает сестринские хроматиды , которые обе потеряли свою теломерную область из-за двухцепочечных разрывов. [23] Предполагается, что эти сестринские хроматиды сольются вместе, образуя одну дицентрическую хромосому , а затем разделятся на два разных ядра. [23] Поскольку разделение дицентрической хромосомы приводит к двухцепочечному разрыву, концевые области могут сливаться с другими двухцепочечными разрывами и повторять цикл. [23] Слияние двух сестринских хроматид может вызвать инвертированную дупликацию, и когда эти события повторяются на протяжении всего цикла, инвертированная область будет повторяться, что приведет к увеличению числа копий. [23] Последний механизм, который может привести к вариациям числа копий, — это проскальзывание полимеразы, которое также известно как переключение шаблона. [24] Во время нормальной репликации ДНК полимераза на отстающей нити должна непрерывно открывать и закрывать область репликации. [24] Когда в последовательности ДНК уже существуют повторы небольшого масштаба, полимераза может быть «сбита с толку», когда она повторно зажимается для продолжения репликации, и вместо того, чтобы закрепиться на правильных парах оснований, она может сместить несколько пар оснований и снова реплицировать часть повторяющейся области. [24] Обратите внимание, что хотя это было экспериментально обнаружено и является широко принятым механизмом, молекулярные взаимодействия, которые привели к этой ошибке, остаются неизвестными. Кроме того, поскольку этот тип механизма требует, чтобы полимераза прыгала вокруг цепи ДНК, и маловероятно, что полимераза может повторно закрепиться в другом локусе на расстоянии нескольких килобаз, поэтому это больше применимо к коротким повторам, таким как динуклеотидные или тринуклеотидные повторы. [25]
Амилаза — это фермент слюны, который отвечает за расщепление крахмала на моносахариды , и один из типов амилазы кодируется геном альфа-амилазы ( AMY1 ). [9] Локус AMY1 , как и фермент амилаза, является одним из наиболее изученных и секвенированных генов в геноме человека. Его гомологи также обнаружены у других приматов, и поэтому вполне вероятно, что ген приматов AMY1 является предком человеческого гена AMY1 и был адаптирован на ранней стадии эволюции приматов. [9] AMY1 — один из наиболее хорошо изученных генов, который имеет широкий диапазон переменного числа копий в разных популяциях человека. [9] Ген AMY1 также является одним из немногих изученных генов, которые продемонстрировали убедительные доказательства, которые коррелируют его функцию белка с числом его копий. [9] Известно, что число копий изменяет транскрипцию , а также уровни трансляции определенного гена, однако исследования показали, что связь между уровнями белка и числом копий является переменной. [26] В генах AMY1 американцев европейского происхождения обнаружено, что концентрация слюнной амилазы тесно связана с числом копий гена AMY1 . [9] В результате была выдвинута гипотеза, что число копий гена AMY1 тесно связано с его белковой функцией, которая заключается в переваривании крахмала. [9]
Было обнаружено, что число копий гена AMY1 коррелирует с различными уровнями крахмала в рационе разных популяций. [9] Восемь популяций с разных континентов были разделены на группы с высоким содержанием крахмала и группы с низким содержанием крахмала, и число копий их гена AMY1 было визуализировано с использованием высокоразрешающей FISH и qPCR . [9] Было обнаружено, что популяции с высоким содержанием крахмала, состоящие из японцев, хадза и европейско-американских популяций, имели значительно более высокое (в два раза выше) среднее число копий AMY1 , чем популяции с низким содержанием крахмала, включая популяции биака, мбути, датог и якутов. [9] Была выдвинута гипотеза, что уровни крахмала в обычном рационе, субстрата для AMY1, могут напрямую влиять на число копий гена AMY1 . [9] Поскольку был сделан вывод, что число копий AMY1 напрямую коррелирует с амилазой слюны, [9] чем больше крахмала присутствует в ежедневном рационе популяции, тем более эволюционно выгодно иметь несколько копий гена AMY1 . Ген AMY1 был первым геном, который предоставил веские доказательства эволюции на молекулярно-генетическом уровне. [26] Более того, используя сравнительную геномную гибридизацию , вариации числа копий всего генома японской популяции сравнивались с таковыми у якутской популяции. [9] Было обнаружено, что вариация числа копий гена AMY1 значительно отличалась от вариации числа копий в других генах или областях генома, что позволяет предположить, что ген AMY1 находился под сильным селективным давлением, которое имело мало или вообще не влияло на другие вариации числа копий. [9] Наконец, вариабельность длины 783 микросателлитов между двумя популяциями сравнивалась с вариабельностью числа копий гена AMY1 . Было обнаружено, что диапазон числа копий гена AMY1 был больше, чем у более чем 97% исследованных микросателлитов. [9] Это означает, что естественный отбор сыграл значительную роль в формировании среднего числа генов AMY1 в этих двух популяциях. [9] Однако, поскольку было изучено только шесть популяций, важно рассмотреть возможность того, что в их рационе или культуре могут быть и другие факторы, влияющие на число копий AMY1, помимо крахмала.
Хотя неясно, когда число копий гена AMY1 начало увеличиваться, известно и подтверждено, что ген AMY1 существовал у ранних приматов. У шимпанзе , ближайших эволюционных родственников людей, было обнаружено две диплоидные копии гена AMY1 , которые идентичны по длине человеческому гену AMY1, [9] что значительно меньше, чем у людей. С другой стороны, у бонобо , также близкого родственника современных людей, было обнаружено более двух диплоидных копий гена AMY1 . [9] Тем не менее, гены AMY1 бонобо были секвенированы и проанализированы, и было обнаружено, что кодирующие последовательности генов AMY1 были нарушены, что может привести к выработке дисфункциональной слюнной амилазы. [9] Из результатов можно сделать вывод, что увеличение числа копий AMY1 бонобо , вероятно, не коррелирует с количеством крахмала в их рационе. Далее была выдвинута гипотеза, что увеличение числа копий началось недавно во время ранней эволюции гомининов , поскольку ни у одной из высших обезьян не было более двух копий гена AMY1 , который производил функциональный белок. [9] Кроме того, было высказано предположение, что увеличение числа копий AMY1 началось около 20 000 лет назад, когда люди перешли от образа жизни охотников-собирателей к сельскохозяйственным обществам, что также произошло, когда люди в значительной степени полагались на корнеплоды с высоким содержанием крахмала. [9] Эта гипотеза, хотя и логичная, не имеет экспериментальных доказательств из-за трудностей в сборе информации об изменении рациона человека, особенно в отношении корнеплодов с высоким содержанием крахмала, поскольку их нельзя напрямую наблюдать или тестировать. Недавние прорывы в секвенировании ДНК позволили исследователям секвенировать более старую ДНК, такую как ДНК неандертальцев, с определенной степенью точности. Возможно, секвенирование ДНК неандертальцев может предоставить временной маркер того, когда число копий гена AMY1 увеличилось, и дать представление о рационе человека и эволюции генов.
В настоящее время неизвестно, какой механизм привел к первоначальной дупликации гена амилазы, и это может означать, что вставка ретровирусных последовательностей была вызвана негомологичным соединением концов, что вызвало дупликацию гена AMY1 . [27] Однако в настоящее время нет никаких доказательств, подтверждающих эту теорию, и поэтому эта гипотеза остается предположением. Недавнее происхождение многокопийного гена AMY1 подразумевает, что в зависимости от окружающей среды число копий гена AMY1 может увеличиваться и уменьшаться очень быстро по сравнению с генами, которые не взаимодействуют с окружающей средой так напрямую. [26] Ген AMY1 является прекрасным примером того, как дозировка гена влияет на выживание организма в данной среде. Множественные копии гена AMY1 дают тем, кто в большей степени полагается на диету с высоким содержанием крахмала, эволюционное преимущество, поэтому большое число копий гена сохраняется в популяции. [26]
Среди нейронов человеческого мозга часто встречаются соматически полученные вариации числа копий. [28] Вариации числа копий показывают широкую вариабельность (от 9 до 100% нейронов мозга в разных исследованиях). Большинство изменений имеют размер от 2 до 10 Мб, причем делеции намного превосходят по численности амплификации. [28]
Геномная дупликация и трипликация гена, по-видимому, являются редкой причиной болезни Паркинсона , хотя и более распространенной, чем точечные мутации. [29]
Варианты числа копий в гене RCL1 связаны с рядом нейропсихиатрических фенотипов у детей. [30]
Недавно обсуждалась связь вариаций числа копий с семействами генов . Семейства генов определяются как набор родственных генов, которые выполняют схожие функции, но имеют незначительные временные или пространственные различия, и эти гены, вероятно, произошли от одного предкового гена. [26] Основная причина, по которой вариации числа копий связаны с семействами генов, заключается в том, что существует вероятность того, что гены в семействе могли произойти от одного предкового гена, который был продублирован в разных копиях. [26] Мутации накапливаются со временем в генах, и при естественном отборе, действующем на гены, некоторые мутации приводят к экологическим преимуществам, позволяющим этим генам наследоваться, и в конечном итоге отделяются чистые семейства генов. Примером семейства генов, которое могло быть создано из-за вариаций числа копий, является семейство генов глобина . Семейство генов глобина представляет собой сложную сеть генов, состоящую из генов альфа и бета глобина, включая гены, которые экспрессируются как у эмбрионов, так и у взрослых особей, а также псевдогены . [31] Все эти гены глобина в семействе глобина хорошо сохранились и отличаются только небольшой частью гена, что указывает на то, что они произошли от общего предкового гена, возможно, из-за дупликации исходного гена глобина. [31]
Исследования показали, что вариации числа копий значительно чаще встречаются в генах, кодирующих белки, которые напрямую взаимодействуют с окружающей средой, чем белки, которые участвуют в основных клеточных процессах. [32] Было высказано предположение, что эффект дозировки гена, сопровождающий вариацию числа копий, может привести к пагубным последствиям, если нарушаются основные клеточные функции, поэтому белки, участвующие в клеточных путях, подвергаются сильному очищающему отбору . [32] Кроме того, белки функционируют вместе и взаимодействуют с белками других путей, поэтому важно рассматривать эффекты естественного отбора на биомолекулярных путях, а не на отдельных белках. При этом было обнаружено, что белки на периферии пути обогащены вариациями числа копий, тогда как белки в центре путей обеднены вариациями числа копий. [33] Было объяснено, что белки на периферии пути взаимодействуют с меньшим количеством белков, и поэтому изменение дозировки белка, вызванное изменением числа копий, может иметь меньшее влияние на общий результат клеточного пути. [33]