Дупликация генов (или хромосомная дупликация , или амплификация генов ) является основным механизмом, посредством которого создается новый генетический материал в ходе молекулярной эволюции . Его можно определить как любое дублирование участка ДНК , содержащего ген . Дупликация генов может возникать в результате нескольких типов ошибок в механизмах репликации и восстановления ДНК , а также в результате случайного захвата эгоистичными генетическими элементами. Общие источники дупликации генов включают эктопическую рекомбинацию , ретротранспозицию , анеуплоидию , полиплоидию и проскальзывание репликации . [1]
Дупликации возникают в результате явления, называемого неравным кроссинговером , которое происходит во время мейоза между смещенными гомологичными хромосомами. Вероятность того, что это произойдет, зависит от степени совместного использования повторяющихся элементов между двумя хромосомами. Продуктами этой рекомбинации являются дупликация в месте обмена и реципрокная делеция. Эктопическая рекомбинация обычно опосредуется сходством последовательностей в дублирующих точках разрыва, которые образуют прямые повторы. Повторяющиеся генетические элементы, такие как мобильные элементы, представляют собой один из источников повторяющейся ДНК, которая может способствовать рекомбинации, и они часто обнаруживаются в точках останова дупликации у растений и млекопитающих. [2]
Проскальзывание репликации — это ошибка репликации ДНК, которая может привести к дублированию коротких генетических последовательностей. Во время репликации ДНК-полимераза начинает копировать ДНК. В какой-то момент процесса репликации полимераза отделяется от ДНК, и репликация останавливается. Когда полимераза повторно прикрепляется к цепи ДНК, она выравнивает реплицирующуюся цепь в неправильном положении и случайно копирует один и тот же участок более одного раза. Проскальзыванию репликации также часто способствуют повторяющиеся последовательности, но для этого требуется лишь несколько оснований сходства. [ нужна цитата ]
Ретротранспозоны , главным образом L1 , иногда могут действовать на клеточную мРНК. Транскрипты обратно транскрибируются в ДНК и вставляются в случайное место генома, создавая ретрогены. Полученная последовательность обычно лишена интронов и часто содержит поли(А)-последовательности, которые также интегрированы в геном. Многие ретрогены демонстрируют изменения в регуляции генов по сравнению с последовательностями их родительских генов, что иногда приводит к появлению новых функций. Ретрогены могут перемещаться между разными хромосомами, формируя хромосомную эволюцию. [3]
Анеуплоидия возникает, когда нерасхождение одной хромосомы приводит к аномальному количеству хромосом. Анеуплоидия часто вредна и у млекопитающих регулярно приводит к самопроизвольным абортам (выкидышам). Некоторые анеуплоидные особи жизнеспособны, например трисомия 21 у человека, что приводит к синдрому Дауна . Анеуплоидия часто изменяет дозировку генов губительно для организма; поэтому маловероятно, что он распространится среди населения.
Полиплоидия , или дупликация всего генома, является продуктом нерасхождения во время мейоза, что приводит к образованию дополнительных копий всего генома. Полиплоидия распространена у растений, но она также наблюдалась у животных: два раунда дупликации всего генома ( событие 2R ) в линии позвоночных привели к появлению человека. [4] Это также наблюдалось у дрожжей-гемиаскомицетов ~100 млн лет назад. [5] [6]
После дупликации всего генома наступает относительно короткий период нестабильности генома, обширной потери генов, повышенного уровня нуклеотидных замен и перестройки регуляторной сети. [7] [8] Кроме того, значительную роль играют эффекты дозировки генов. [9] Таким образом, большинство дубликатов теряются в течение короткого периода времени, однако значительная часть дубликатов выживает. [10] Интересно, что гены, участвующие в регуляции, преимущественно сохраняются. [11] [12] Кроме того, сохранение регуляторных генов, особенно генов Hox , привело к адаптивным инновациям.
Быстрая эволюция и функциональная дивергенция наблюдались на уровне транскрипции дуплицированных генов, обычно за счет точечных мутаций в коротких мотивах связывания транскрипционных факторов. [13] [14] Кроме того, быстрая эволюция мотивов фосфорилирования белков, обычно встроенных в быстро развивающиеся внутренне неупорядоченные области, является еще одним фактором, способствующим выживанию и быстрой адаптации/неофункционализации дублированных генов. [15] Таким образом, по-видимому, существует связь между регуляцией генов (по крайней мере, на посттрансляционном уровне) и эволюцией генома. [15]
Полиплоидия также является хорошо известным источником видообразования, поскольку потомство, имеющее разное количество хромосом по сравнению с родительскими видами, часто не может скрещиваться с неполиплоидными организмами. Считается, что дупликация всего генома менее вредна, чем анеуплоидия, поскольку относительная дозировка отдельных генов должна быть одинаковой.
Сравнение геномов показывает, что дупликация генов распространена у большинства исследованных видов. На это указывают переменные числа копий ( вариации числа копий ) в геноме человека [16] [17] или плодовых мух. [18] Однако было трудно измерить скорость, с которой происходит такое дублирование. Недавние исследования дали первую прямую оценку скорости дупликации генов по всему геному у C. elegans , первого многоклеточного эукариота, для которого такая оценка стала доступной. Скорость дупликации генов у C. elegans составляет порядка 10 -7 дупликаций/ген/поколение, то есть в популяции из 10 миллионов червей будет дупликация гена на поколение. Эта скорость на два порядка превышает спонтанную скорость точковых мутаций на нуклеотидный сайт у этого вида. [19] Более ранние (косвенные) исследования показали, что скорость локус-специфической дупликации у бактерий, дрозофилы и человека варьируется от 10 -3 до 10 -7 /ген/поколение. [20] [21] [22]
Дупликация генов является важным источником генетической новизны, которая может привести к эволюционным инновациям. Дупликация создает генетическую избыточность, при которой вторая копия гена часто свободна от давления отбора , то есть ее мутации не оказывают вредного воздействия на организм-хозяин. Если в одной копии гена происходит мутация, которая влияет на его первоначальную функцию, вторая копия может служить «запасной частью» и продолжать функционировать правильно. Таким образом, дублирующиеся гены накапливают мутации быстрее, чем функциональный ген с одной копией, на протяжении поколений организмов, и одна из двух копий может развить новую и другую функцию. Некоторыми примерами такой неофункционализации являются очевидная мутация дуплицированного пищеварительного гена в семействе ледяных рыб в ген антифриза, а также дупликация, приводящая к появлению нового гена змеиного яда [23] и синтез 1-бета-гидрокситестостерона у свиней. [24]
Считается, что дупликация генов играет важную роль в эволюции ; этой позиции придерживаются члены научного сообщества уже более 100 лет. [25] Сусуму Оно был одним из самых известных разработчиков этой теории в своей классической книге « Эволюция путем дупликации генов» (1970). [26] Оно утверждал, что дупликация генов является наиболее важной эволюционной силой с момента появления универсального общего предка . [27] Крупные случаи дупликации генома могут быть довольно частыми. Считается, что весь геном дрожжей подвергся дупликации около 100 миллионов лет назад. [28] Растения являются наиболее плодовитыми дупликаторами генома. Например, пшеница является гексаплоидной (разновидность полиплоида ), то есть имеет шесть копий своего генома.
Другая возможная судьба дублирующихся генов заключается в том, что обе копии в равной степени могут накапливать дегенеративные мутации, пока любые дефекты дополняются другой копией. Это приводит к нейтральной « субфункционализации » (процессу конструктивной нейтральной эволюции ) или модели DDC (дупликация-дегенерация-комплементация), [29] [30] , в которой функциональность исходного гена распределяется между двумя копиями. Ни один ген не может быть утерян, поскольку оба теперь выполняют важные недублированные функции, но в конечном итоге ни один из них не способен достичь новой функциональности.
Субфункционализация может происходить посредством нейтральных процессов, при которых мутации накапливаются без каких-либо вредных или полезных эффектов. Однако в некоторых случаях субфункционализация может иметь место с явными адаптивными преимуществами. Если предковый ген плейотропен и выполняет две функции, часто ни одну из этих двух функций невозможно изменить, не затрагивая другую функцию. Таким образом, разделение наследственных функций на два отдельных гена может обеспечить адаптивную специализацию подфункций, тем самым обеспечивая адаптивное преимущество. [31]
Часто возникающие в результате геномные вариации приводят к неврологическим расстройствам, зависящим от дозы гена, таким как синдром Ретта и болезнь Пелицеуса-Мерцбахера . [32] Такие вредные мутации, скорее всего, будут потеряны из популяции, не сохранятся и не разовьют новые функции. Однако многие дупликации на самом деле не являются ни вредными, ни полезными, и эти нейтральные последовательности могут быть потеряны или могут распространиться среди популяции посредством случайных колебаний посредством генетического дрейфа .
Два гена, которые существуют после события дупликации гена, называются паралогами и обычно кодируют белки со схожей функцией и/или структурой. Напротив, ортологичные гены присутствуют у разных видов, каждый из которых изначально произошел от одной и той же предковой последовательности. (См. Гомология последовательностей в генетике ).
В биологических исследованиях важно (но часто сложно) различать паралоги и ортологи. Эксперименты по функции генов человека часто можно проводить на других видах , если в геноме этого вида можно найти гомолог человеческого гена, но только если гомолог ортологичен. Если они являются паралогами и возникли в результате дупликации генов, их функции, вероятно, будут слишком разными. Одна или несколько копий дуплицированных генов, составляющих семейство генов, могут быть затронуты вставкой мобильных элементов , что вызывает значительные различия между ними в их последовательностях и, в конечном итоге, может стать причиной дивергентной эволюции . Это также может влиять на вероятность и скорость генной конверсии между гомологами дубликатов генов из-за меньшего сходства или отсутствия сходства в их последовательностях.
Паралоги можно идентифицировать в отдельных геномах путем сравнения последовательностей всех аннотированных моделей генов друг с другом. Такое сравнение может быть выполнено на транслированных аминокислотных последовательностях (например, BLASTp, tBLASTx) для идентификации древних дупликаций или на нуклеотидных последовательностях ДНК (например, BLASTn, мегабласт) для идентификации более поздних дупликаций. Большинство исследований по выявлению дупликаций генов требуют взаимных лучших совпадений или нечетких взаимных лучших совпадений, где каждый паралог должен быть единственным лучшим совпадением другого в сравнении последовательностей. [33]
Большинство дупликаций генов существуют в виде малокопийных повторов (LCR), довольно часто повторяющихся последовательностей, таких как мобильные элементы. Чаще всего они обнаруживаются в перицентрономных , субтеломерных и интерстициальных областях хромосомы. Многие LCR из-за своего размера (> 1 КБ), сходства и ориентации очень чувствительны к дупликациям и делециям.
Такие технологии, как геномные микрочипы , также называемые сравнительной геномной гибридизацией массивов (array CGH), используются для высокопроизводительного обнаружения хромосомных аномалий, таких как микродупликации, из образцов геномной ДНК. В частности, технология ДНК- микрочипов может одновременно отслеживать уровни экспрессии тысяч генов при многих методах лечения или экспериментальных условиях, что значительно облегчает эволюционные исследования регуляции генов после дупликации или видообразования генов . [34] [35]
Дупликации генов также можно выявить с помощью платформ секвенирования нового поколения. Самый простой способ выявить дублирования в данных повторного секвенирования генома — это использование считываний парного секвенирования. На тандемные дупликации указывают секвенирование пар прочтений, которые отображаются в аномальной ориентации. Благодаря сочетанию увеличенного охвата последовательностей и аномальной ориентации картирования можно выявить дублирования в данных геномного секвенирования.
Международная система цитогеномной номенклатуры человека (ISCN) — это международный стандарт номенклатуры хромосом человека , который включает названия полос, символы и сокращенные термины, используемые при описании хромосом человека и хромосомных аномалий. Сокращения включают dup для дупликаций частей хромосомы. [36] Например, dup(17p12) вызывает болезнь Шарко-Мари-Тута типа 1А. [37]
Дупликация генов не обязательно представляет собой устойчивое изменение в геноме вида. Фактически, такие изменения часто не сохраняются за пределами первоначального организма-хозяина. С точки зрения молекулярной генетики , амплификация гена является одним из многих способов сверхэкспрессии гена . Генетическая амплификация может происходить искусственно, например, с использованием метода полимеразной цепной реакции для амплификации коротких цепей ДНК in vitro с использованием ферментов , или она может происходить естественным путем, как описано выше. Если это естественная дупликация, она все равно может происходить в соматической клетке , а не в зародышевой клетке (что было бы необходимо для длительных эволюционных изменений).
Дупликации онкогенов являются частой причиной многих видов рака . В таких случаях генетическая дупликация происходит в соматической клетке и затрагивает только геном самой раковой клетки, а не весь организм и тем более любое последующее потомство. Недавняя комплексная классификация на уровне пациентов и количественная оценка движущих событий в когортах TCGA показали, что в среднем на одну опухоль приходится 12 движущих событий, из которых 1,5 являются амплификациями онкогенов. [38]
Полногеномные дупликации также часто встречаются при раке: они обнаруживаются в 30–36% опухолей наиболее распространенных типов рака. [40] [41] Их точная роль в канцерогенезе неясна, но в некоторых случаях они приводят к потере сегрегации хроматина, что приводит к изменениям конформации хроматина, что, в свою очередь, приводит к онкогенным эпигенетическим и транскрипционным модификациям. [42]