stringtranslate.com

Рождение гена de novo

Новые гены могут возникать из негенных изначально областей посредством плохо изученных механизмов. (A) Негенная область сначала получает транскрипцию и открытую рамку считывания (ORF) в любом порядке, способствуя рождению гена de novo . ORF приведена только в иллюстративных целях, поскольку гены de novo могут быть также мультиэкзонными или не иметь ORF, как в случае с генами РНК . (B) Наложение. Создается новая ORF, которая перекрывается с существующей ORF, но в другой рамке. (C) Экзонизация. Ранее интронная область альтернативно сплайсируется как экзон, например, когда повторяющиеся последовательности приобретаются посредством ретропозиции , а новые сайты сплайсинга создаются посредством мутационных процессов. Наложение и экзонизацию можно рассматривать как особые случаи рождения гена de novo.
Новые гены могут быть образованы из предковых генов посредством различных механизмов. [1] (A) Дупликация и дивергенция. После дупликации одна копия подвергается ослабленному отбору и постепенно приобретает новую функцию(и). (B) Слияние генов. Гибридный ген, образованный из некоторых или всех двух ранее отдельных генов. Слияние генов может происходить посредством различных механизмов; здесь показана интерстициальная делеция. (C) Деление гена. Один ген разделяется, образуя два отдельных гена, например, путем дупликации и дифференциальной дегенерации двух копий. [2] (D) Горизонтальный перенос генов . Гены, полученные от других видов путем горизонтального переноса, подвергаются дивергенции и неофункционализации. (E) Ретропозиция. Транскрипты могут быть обратно транскрибированы и интегрированы как безинтронный ген в другом месте генома. Затем этот новый ген может подвергнуться дивергенции.

Рождение генов de novo — это процесс, посредством которого новые гены развиваются из некодирующей ДНК . [1] [3] Гены de novo представляют собой подмножество новых генов и могут кодировать белки или действовать как гены РНК. [4] Процессы, управляющие рождением генов de novo, изучены недостаточно, хотя существует несколько моделей, описывающих возможные механизмы, посредством которых может происходить рождение генов de novo .

Хотя рождение генов de novo могло произойти в любой момент эволюционной истории организма, древние события рождения генов de novo трудно обнаружить. Большинство исследований генов de novo на сегодняшний день были сосредоточены на молодых генах, как правило, таксономически ограниченных генах (TRG), которые присутствуют в одном виде или линии, включая так называемые гены-сироты , определяемые как гены, которые не имеют какого-либо идентифицируемого гомолога. Однако важно отметить, что не все гены-сироты возникают de novo , а вместо этого могут появляться посредством довольно хорошо охарактеризованных механизмов, таких как дупликация генов (включая ретропозицию) или горизонтальный перенос генов с последующей дивергенцией последовательностей или делением/слиянием генов . [5] [6]

Хотя рождение генов de novo когда-то считалось крайне маловероятным явлением [7] , в настоящее время описано несколько недвусмысленных примеров [8], и некоторые исследователи предполагают, что рождение генов de novo может играть важную роль в эволюционных инновациях, морфологической спецификации и адаптации [9] [10], вероятно, благодаря их низкому уровню плейотропии .

История

Еще в 1930-х годах Дж. Б. С. Холдейн и другие предположили, что копии существующих генов могут приводить к появлению новых генов с новыми функциями. [6] В 1970 году Сусуму Оно опубликовал основополагающий текст «Эволюция путем дупликации генов» . [11] В течение некоторого времени впоследствии консенсусное мнение заключалось в том, что практически все гены произошли от предковых генов, [12] а Франсуа Жакоб в своем знаменитом эссе 1977 года заметил, что «вероятность того, что функциональный белок появится de novo путем случайной ассоциации аминокислот, практически равна нулю». [7]

Однако в том же году Пьер-Поль Грассе ввел термин « overprinting » для описания появления генов посредством экспрессии альтернативных открытых рамок считывания (ORF), которые перекрывают уже существующие гены. [13] Эти новые ORF могут быть вне рамки или антисмысловыми по отношению к уже существующему гену. Они также могут быть в рамке с существующей ORF, создавая укороченную версию исходного гена, или представлять собой 3'-расширения существующей ORF в соседнюю ORF. Первые два типа overprinting можно рассматривать как особый подтип рождения гена de novo ; хотя и перекрывается с ранее кодирующей областью генома, первичная аминокислотная последовательность нового белка является полностью новой и получена из рамки, которая ранее не содержала ген. Первые примеры этого явления у бактериофагов были описаны в серии исследований с 1976 по 1978 год, [14] [15] [16] и с тех пор было выявлено множество других примеров у вирусов, бактерий и нескольких видов эукариот. [17] [18] [19] [20] [21] [22]

Феномен экзонизации также представляет собой особый случай рождения гена de novo , в котором, например, часто повторяющиеся интронные последовательности приобретают сайты сплайсинга посредством мутации, что приводит к экзонам de novo . Впервые это было описано в 1994 году в контексте последовательностей Alu , обнаруженных в кодирующих областях мРНК приматов. [23] Интересно, что такие экзоны de novo часто встречаются в второстепенных вариантах сплайсинга, что может позволить эволюционное «тестирование» новых последовательностей, сохраняя при этом функциональность основных вариантов сплайсинга. [24]

Тем не менее, некоторые считали, что большинство или все эукариотические белки были построены из ограниченного пула экзонов «стартового типа». [25] Используя данные о последовательностях, доступные в то время, обзор 1991 года оценил количество уникальных, предковых эукариотических экзонов как < 60 000, [25] в то время как в 1992 году была опубликована работа, в которой оценивалось, что подавляющее большинство белков принадлежало не более чем к 1000 семействам. [26] Примерно в то же время, однако, была опубликована последовательность хромосомы III почкующихся дрожжей Saccharomyces cerevisiae , [27] что стало первым случаем, когда была секвенирована целая хромосома любого эукариотического организма. Секвенирование всего ядерного генома дрожжей было завершено к началу 1996 года благодаря масштабным совместным международным усилиям. [28] В своем обзоре проекта генома дрожжей Бернар Дюжон отметил, что неожиданное обилие генов, не имеющих известных гомологов, было, пожалуй, самым поразительным открытием всего проекта. [28]

В 2006 и 2007 годах ряд исследований предоставил, возможно, первые задокументированные примеры рождения генов de novo , которые не включали наложение. [29] [30] [31] Эти исследования проводились с использованием транскриптомов добавочных желез Drosophila yakuba и Drosophila erecta , и они идентифицировали 20 предполагаемых генов, ограниченных линией, которые, по-видимому, вряд ли были результатом дупликации генов. [31] Левин и его коллеги идентифицировали и подтвердили пять генов-кандидатов de novo, специфичных для Drosophila melanogaster и/или близкородственной Drosophila simulans, с помощью строгого подхода, сочетающего биоинформатические и экспериментальные методы. [30]

После этих первоначальных исследований многие группы выявили конкретные случаи событий рождения генов de novo в различных организмах. [32] Первый ген de novo , идентифицированный у дрожжей, ген BSC4, был идентифицирован у S. cerevisiae в 2008 году. Этот ген демонстрирует доказательства очищающего отбора, экспрессируется как на уровне мРНК, так и на уровне белка, и при удалении является синтетически летальным с двумя другими генами дрожжей, все из которых указывают на функциональную роль продукта гена BSC4 . [33] Исторически одним из аргументов против понятия широко распространенного рождения генов de novo является эволюционная сложность сворачивания белка. Интересно, что позже было показано, что Bsc4 принимает частично свернутое состояние, которое сочетает свойства нативного и ненативного сворачивания белка. [34] У растений первым геном de novo , который был функционально охарактеризован, был QQS , ген Arabidopsis thaliana, идентифицированный в 2009 году, который регулирует метаболизм углерода и азота. [35] Первый функционально охарактеризованный ген de novo , идентифицированный у мышей, некодирующий ген РНК, также был описан в 2009 году. [36] У приматов информационный анализ 2008 года подсчитал, что 15/270 генов-сирот приматов были сформированы de novo . [37] В отчете 2009 года были идентифицированы первые три гена de novo человека, один из которых является терапевтической мишенью при хроническом лимфолейкозе. [38] С этого времени множество исследований на уровне генома выявили большое количество генов-сирот во многих организмах, хотя степень, в которой они возникли de novo , и степень, в которой их можно считать функциональными, остаются предметом споров.

Идентификация

Идентификацияde novoвозникающие последовательности

Существует два основных подхода к систематической идентификации новых генов: геномная филостратиграфия [39] и методы, основанные на синтении . [40] Оба подхода широко используются по отдельности или в качестве дополнительных.

Геномная филостратиграфия

Геномная филостратиграфия включает в себя изучение каждого гена в фокусном или референтном виде и вывод о наличии или отсутствии предковых гомологов с помощью алгоритмов выравнивания последовательностей BLAST [41] или связанных с ними инструментов. Каждому гену в фокусном виде может быть назначен возраст (он же «уровень сохранения» или «геномный филострат»), который основан на предопределенной филогении, причем возраст соответствует наиболее отдаленному родственному виду, в котором обнаружен гомолог. [39] Когда ген не имеет какого-либо обнаруживаемого гомолога за пределами его собственного генома или близких родственников, говорят, что это новый, таксономически ограниченный или сиротский ген.

Филостратиграфия ограничена набором близкородственных геномов, которые доступны, и результаты зависят от критериев поиска BLAST. [42] Кроме того, часто бывает трудно определить на основе отсутствия наблюдаемого сходства последовательностей, возник ли новый ген de novo или отделился от предкового гена до неузнаваемости, например, после события дупликации. На это указало исследование, в котором моделировалась эволюция генов одинакового возраста и было обнаружено, что далекие ортологи могут быть необнаружимы для быстро эволюционирующих генов. [43] С другой стороны, при учете изменений в скорости эволюции в молодых регионах генов филостратиграфический подход был более точным при назначении возраста генов в моделируемых данных. [44] Последующие исследования с использованием моделируемой эволюции показали, что филостратиграфия не смогла обнаружить ортолога в наиболее отдаленно родственных видах для 13,9% генов D. melanogaster и 11,4% генов S. cerevisiae . [45] [46] Однако повторный анализ исследований, в которых использовалась филостратиграфия на дрожжах, плодовых мушках и людях, показал, что даже при учете таких ошибок и исключении из анализа трудно стратифицируемых генов качественные выводы не изменились. [47] Влияние филостратиграфической ошибки на исследования, изучающие различные особенности генов de novo, остается спорным.

Подходы, основанные на синтении

Подходы, основанные на синтении, используют порядок и относительное расположение генов (или других признаков) для идентификации потенциальных предков кандидатов на гены de novo . [10] [42] Синтенические выравнивания закрепляются консервативными «маркерами». Гены являются наиболее распространенным маркером при определении синтенных блоков, хотя также используются k-меры и экзоны. [48] [40] Подтверждение того, что синтенная область не имеет кодирующего потенциала у видов внешней группы, позволяет с большей уверенностью утверждать о происхождении de novo . [42] Самым сильным возможным доказательством возникновения de novo является вывод о конкретной «разрешающей» мутации(ях), которая создала кодирующий потенциал, как правило, посредством анализа более мелких областей последовательности, называемых микросинтеническими областями, у близкородственных видов.

Одной из проблем применения методов, основанных на синтении, является то, что синтению может быть трудно обнаружить в более длительных временных масштабах. Для решения этой проблемы были созданы различные методы оптимизации, такие как использование экзонов, сгруппированных независимо от их конкретного порядка, для определения синтенных блоков [40] или алгоритмов, которые используют хорошо сохранившиеся геномные регионы для расширения микросинтенных блоков. [49] Существуют также трудности, связанные с применением подходов, основанных на синтении, к фрагментированным геномным сборкам [50] или в линиях с высокой скоростью хромосомных перестроек, как это часто бывает у насекомых. [51] Подходы, основанные на синтении, могут применяться к общегеномным исследованиям генов de novo [37] [38] [52] [53] [54] [55] [56] [57] и представляют собой перспективную область разработки алгоритмов для датирования рождения генов. Некоторые использовали подходы, основанные на синтении, в сочетании с поиском сходства в попытке разработать стандартизированные, строгие конвейеры [58] , которые можно было бы применить к любой группе геномов, чтобы попытаться устранить расхождения в различных списках генов de novo , которые были созданы.

Определение статуса

Даже когда эволюционное происхождение конкретной кодирующей последовательности установлено, все еще отсутствует консенсус относительно того, что представляет собой подлинное событие рождения гена de novo . Одной из причин этого является отсутствие согласия относительно того, должна ли вся последовательность иметь негенное происхождение. Для генов de novo , кодирующих белок , было предложено разделить гены de novo на подтипы на основе доли рассматриваемой ORF, которая была получена из ранее некодирующей последовательности. [42] Кроме того, для того, чтобы произошло рождение гена de novo , рассматриваемая последовательность должна быть геном, что привело к вопросу о том, что представляет собой ген, при этом некоторые модели устанавливают строгую дихотомию между генными и негенными последовательностями, а другие предлагают более подвижный континуум. [59]

Все определения генов связаны с понятием функции, поскольку общепризнанно, что настоящий ген должен кодировать функциональный продукт, будь то РНК или белок. Однако существуют различные взгляды на то, что составляет функцию, в зависимости от того, оценивается ли данная последовательность с использованием генетических, биохимических или эволюционных подходов. [42] [60] [61] [62] Неоднозначность понятия «функция» особенно проблематична для области рождения генов de novo , где объекты исследования часто быстро развиваются. [62] Чтобы решить эти проблемы, Питтсбургская модель функции деконструирует «функцию» на пять значений, чтобы описать различные свойства, которые приобретает локус, подвергающийся рождению гена de novo : Экспрессия, Возможности, Взаимодействия, Физиологические импликации и Эволюционные импликации. [62]

Общепринято, что подлинный ген de novo экспрессируется по крайней мере в некотором контексте, [5] что позволяет отбору работать, и многие исследования используют доказательства экспрессии в качестве критерия включения при определении генов de novo . Экспрессия последовательностей на уровне мРНК может быть подтверждена индивидуально с помощью таких методов, как количественная ПЦР , или глобально с помощью секвенирования РНК (RNA-seq) . Аналогичным образом, экспрессия на уровне белка может быть определена с высокой достоверностью для отдельных белков с помощью таких методов, как масс-спектрометрия или вестерн-блоттинг , в то время как профилирование рибосом (Ribo-seq) обеспечивает глобальный обзор трансляции в данном образце. В идеале, чтобы подтвердить, что ген возник de novo , также должно быть продемонстрировано отсутствие экспрессии синтенной области видов внешней группы. [63]

Генетические подходы к обнаружению определенного фенотипа или изменения в приспособленности при нарушении определенной последовательности полезны для выведения функции. [61] Другие экспериментальные подходы, включая скрининг белок-белковых и/или генетических взаимодействий, также могут использоваться для подтверждения биологического эффекта для конкретного de novo ORF.

Эволюционные подходы могут быть использованы для вывода о существовании молекулярной функции из вычислительно полученных сигнатур отбора. В случае TRG одной из общих сигнатур отбора является отношение несинонимичных к синонимичным заменам ( отношение dN/dS ), рассчитанное для разных видов из одного и того же таксона. Аналогично, в случае видоспецифичных генов данные полиморфизма могут быть использованы для расчета отношения pN/pS для разных штаммов или популяций фокального вида. Учитывая, что молодые видоспецифичные гены de novo по определению не обладают глубокой консервацией, обнаружение статистически значимых отклонений от 1 может быть затруднено без нереалистично большого количества секвенированных штаммов/популяций. Пример этого можно увидеть в Mus musculus , где три очень молодых гена de novo не имеют сигнатур отбора, несмотря на хорошо продемонстрированные физиологические роли. [64] По этой причине подходы pN/pS часто применяются к группам генов-кандидатов, позволяя исследователям делать вывод, что по крайней мере некоторые из них эволюционно консервативны, не имея возможности указать, какие именно. Вместо этого использовались другие признаки отбора, такие как степень расхождения нуклеотидов в синтенных областях, сохранение границ ORF или для генов, кодирующих белки, оценка кодирования, основанная на частотах гексамеров нуклеотидов. [65] [66]

Распространенность

Оценки чисел

Оценки частоты и количества генов de novo в различных линиях сильно различаются и сильно зависят от методологии. Исследования могут идентифицировать гены de novo только с помощью методов филостратиграфии/BLAST или могут использовать комбинацию вычислительных методов и могут или не могут оценивать экспериментальные доказательства экспрессии и/или биологической роли. [10] Кроме того, анализы в масштабе генома могут рассматривать все или большинство ORF в геноме, [59] или вместо этого могут ограничивать свой анализ ранее аннотированными генами.

Линия D. melanogaster является иллюстрацией этих различных подходов. Раннее исследование с использованием комбинации поисков BLAST, выполненных на последовательностях кДНК, вместе с ручным поиском и информацией о синтении, выявило 72 новых гена, специфичных для D. melanogaster , и 59 новых генов, специфичных для трех из четырех видов в комплексе видов D. melanogaster . В этом отчете было обнаружено, что только 2/72 (~2,8%) новых генов, специфичных для D. melanogaster , и 7/59 (~11,9%) новых генов, специфичных для комплекса видов, были получены de novo [56] , а остальные возникли путем дупликации/ретропозиции. Аналогичным образом, анализ 195 молодых (<35 миллионов лет) генов D. melanogaster, идентифицированных с помощью синтенных выравниваний, показал, что только 16 возникли de novo . [54] Напротив, анализ, сосредоточенный на транскриптомных данных из семенников шести штаммов D. melanogaster, идентифицировал 106 фиксированных и 142 сегрегирующих гена de novo . [55] Для многих из них были идентифицированы предковые ORF, но не были выражены. Более новое исследование показало, что до 39 % сиротских генов в кладе Drosophila могли возникнуть de novo , поскольку они перекрываются с некодирующими областями генома. [67] Подчеркивая различия между межвидовыми и внутривидовыми сравнениями, исследование в естественных популяциях Saccharomyces paradoxus показало, что количество идентифицированных полипептидов de novo более чем удвоилось при рассмотрении внутривидового разнообразия. [68] У приматов одно раннее исследование идентифицировало 270 сиротских генов (уникальных для людей, шимпанзе и макак), из которых 15, как считалось, возникли de novo . [37] Более поздние отчеты выявили гораздо больше генов de novo только у людей, что подтверждается транскрипционными и протеомными доказательствами. [57] [69] Исследования других линий/организмов также пришли к другим выводам относительно количества генов de novo , присутствующих в каждом организме, а также конкретных наборов идентифицированных генов. Пример этих крупномасштабных исследований описан в таблице ниже.

Вообще говоря, остается спорным, представляют ли дупликация и дивергенция или рождение генов de novo доминирующий механизм появления новых генов, [54] [56] [59] [70] [71] [72] отчасти потому, что гены de novo, вероятно, как появляются, так и теряются чаще, чем другие молодые гены. В исследовании происхождения генов-сирот в трех различных эукариотических линиях авторы обнаружили, что в среднем только около 30% генов-сирот можно объяснить дивергенцией последовательностей. [72]

Динамика

Важно различать частоту рождения генов de novo и количество генов de novo в данной линии. Если рождение генов de novo происходит часто, можно было бы ожидать, что геномы будут иметь тенденцию к росту содержания генов с течением времени; однако содержание генов в геномах обычно относительно стабильно. [10] Это подразумевает, что частый процесс гибели генов должен уравновешивать рождение генов de novo , и действительно, гены de novo отличаются своей быстрой заменой по сравнению с устоявшимися генами. В поддержку этого представления недавно появившиеся гены Drosophila с гораздо большей вероятностью будут потеряны, в первую очередь через псевдогенизацию , причем самые молодые сироты теряются с самой высокой скоростью; [73] это несмотря на тот факт, что было показано, что некоторые сироты Drosophila быстро становятся необходимыми. [54] Похожая тенденция частой потери среди молодых семейств генов наблюдалась в роде нематод Pristionchus . [74] Аналогичным образом, анализ пяти транскриптомов млекопитающих показал, что большинство ORF у мышей были либо очень старыми, либо видоспецифичными, что подразумевает частое рождение и гибель de novo транскриптов. [71] Сходную тенденцию можно было бы продемонстрировать с помощью дальнейшего анализа шести транскриптомов приматов. [69] В популяциях диких S. paradoxus de novo ORF появляются и исчезают с аналогичной скоростью. [68] Тем не менее, сохраняется положительная корреляция между количеством видоспецифичных генов в геноме и эволюционным расстоянием от его самого недавнего предка. [75] [67] Быстрое появление и исчезновение генов de novo было также обнаружено на популяционном уровне путем анализа девяти естественных популяций трехиглой колюшки. [76] Помимо рождения и гибели генов de novo на уровне ORF, мутационные и другие процессы также подвергают геномы постоянному «транскрипционному обороту». В одном исследовании на мышах было обнаружено, что, хотя все области генома предка были транскрибированы в какой-то момент по крайней мере у одного потомка, часть генома, находящаяся под активной транскрипцией в данном штамме или подвиде, подвержена быстрым изменениям. [77] Транскрипционный оборот некодирующих РНК-генов особенно быстр по сравнению с кодирующими генами. [78]

Примерыde novoгены

Функции

Общие характеристики

Недавно возникшие de novo гены отличаются от устоявшихся генов несколькими способами. Сообщалось, что у широкого спектра видов молодые и/или таксономически ограниченные гены короче по длине, чем устоявшиеся гены, более положительно заряжены, быстрее развиваются [88] и менее выражены. [37] [59] [73] [74] [89] [90 ] [91] [92] [93] [94] [95] [96] [71] [69] [67] [76] [ чрезмерное цитирование ] Хотя эти тенденции могут быть результатом смещения обнаружения гомологии, повторный анализ нескольких исследований, которые учитывали это смещение, показал, что полученные качественные выводы не были затронуты. [47] Другая особенность включает тенденцию молодых генов иметь свои гидрофобные аминокислоты, более сгруппированные рядом друг с другом вдоль первичной последовательности. [97] [98]

Экспрессия молодых генов также оказалась более специфичной для тканей или состояний, чем у существующих генов. [29] [31] [ 37] [55] [57] [59] [94] [99] [100] [101] [67] [76] В частности, относительно высокая экспрессия генов de novo наблюдалась в мужских репродуктивных тканях у дрозофилы , колюшки, мышей и людей, а также в человеческом мозге. [57] [102] [67] [76] У животных с адаптивной иммунной системой более высокая экспрессия в мозге и яичках может быть функцией иммунопривилегированной природы этих тканей. Анализ на мышах обнаружил специфическую экспрессию межгенных транскриптов в тимусе и селезенке (в дополнение к мозгу и яичкам). Было высказано предположение, что у позвоночных транскрипты de novo должны сначала экспрессироваться в тканях, лишенных иммунных клеток, прежде чем они смогут экспрессироваться в тканях, имеющих иммунный надзор. [101]

Скорость эволюции

Что касается эволюции последовательностей, исследования анализа dN/dS часто указывают на то, что гены de novo развиваются с более высокой скоростью по сравнению с другими генами. [103] [88] Что касается эволюции экспрессии и структурной эволюции, количественные исследования в различных эволюционных возрастах или филостратиграфических ветвях очень немногочисленны.

Особенности, которые способствуютde novoрождение гена

Также интересно сравнить особенности недавно возникших de novo генов с пулом негенных ORF, из которых они возникают. Теоретическое моделирование показало, что такие различия являются продуктом как отбора по особенностям, которые увеличивают вероятность функционализации, так и нейтральных эволюционных сил, которые влияют на оборот аллелей. [104] Эксперименты на S. cerevisiae показали, что предсказанные трансмембранные домены были тесно связаны с полезными эффектами приспособленности, когда молодые ORF были сверхэкспрессированы, но не когда установленные (старые) ORF были сверхэкспрессированы. [105] Эксперименты на E. coli показали, что случайные пептиды имели тенденцию оказывать более благоприятные эффекты, когда они были обогащены аминокислотами, которые были маленькими, и это способствовало внутреннему структурному беспорядку. [106]

Особенности, зависящие от происхождения

Особенности генов de novo могут зависеть от вида или изучаемой линии. Это, по-видимому, отчасти является результатом изменения содержания GC в геномах и того, что молодые гены имеют больше сходства с негенными последовательностями из генома, в котором они возникли, чем устоявшиеся гены. [107] Особенности в полученном белке, такие как процент трансмембранных остатков и относительная частота различных предсказанных вторичных структурных особенностей, показывают сильную зависимость GC в генах-сиротах, тогда как в более древних генах эти особенности лишь слабо зависят от содержания GC. [107]

Связь между возрастом гена и количеством прогнозируемого внутреннего структурного расстройства (ISD) в кодируемых белках была предметом значительных дебатов. Утверждалось, что ISD также является признаком, зависящим от линии, примером чего является тот факт, что в организмах с относительно высоким содержанием GC, от D. melanogaster до паразита Leishmania major , молодые гены имеют высокий ISD, [108] [109] тогда как в геноме с низким содержанием GC, таком как почкующиеся дрожжи, несколько исследований показали, что молодые гены имеют низкий ISD. [59] [89] [96] [107] Однако исследование, которое исключило молодые гены с сомнительными доказательствами функциональности, определяемыми в бинарных терминах как находящиеся под отбором для сохранения генов, обнаружило, что оставшиеся молодые гены дрожжей имеют высокий ISD, что позволяет предположить, что результат для дрожжей может быть обусловлен загрязнением набора молодых генов ORF, которые не соответствуют этому определению, и, следовательно, с большей вероятностью будут иметь свойства, отражающие содержание GC и другие негенные особенности генома. [110] Помимо самых молодых сирот, это исследование показало, что ISD имеет тенденцию уменьшаться с увеличением возраста гена, и что это в первую очередь связано с аминокислотным составом, а не с содержанием GC. [110] В более коротких временных масштабах использование генов de novo , которые имеют наибольшую валидацию, позволяет предположить, что молодые гены более неупорядочены у Lachancea , но менее неупорядочены у Saccharomyces . [96] Внутреннее структурное расстройство и склонность к агрегации не показали существенных различий с возрастом в некоторых исследованиях млекопитающих [71] и приматов, [69], но обнаружили в других исследованиях млекопитающих. [110] Одно крупное исследование всей базы данных доменов белка Pfam показало обогащение более молодого домена белка аминокислотами, способствующими расстройству, среди животных, но обогащение на основе доступности аминокислот в растениях. [98]

Роль эпигенетических модификаций

Исследование генов de novo у A. thaliana показало, что они оба гиперметилированы и в целом лишены модификаций гистонов . [53] В соответствии с моделью протогена или загрязнением не-генами, уровни метилирования генов de novo были промежуточными между установленными генами и межгенными областями. Паттерны метилирования этих генов de novo стабильно наследуются, а уровни метилирования были самыми высокими и наиболее похожими на установленные гены в генах de novo с подтвержденной способностью кодировать белок. [53] У патогенного грибка Magnaporthe oryzae менее консервативные гены, как правило, имеют паттерны метилирования , связанные с низким уровнем транскрипции. [111] Исследование на дрожжах также показало, что гены de novo обогащаются в горячих точках рекомбинации , которые, как правило, являются областями, свободными от нуклеосом. [96]

У Pristionchus pacificus гены-сироты с подтвержденной экспрессией демонстрируют состояния хроматина, которые отличаются от состояний аналогично экспрессируемых установленных генов. [95] Стартовые сайты генов-сирот имеют эпигенетические сигнатуры, характерные для энхансеров, в отличие от консервативных генов, которые демонстрируют классические промоторы. [95] Многие неэкспрессируемые гены-сироты украшены репрессивными модификациями гистонов, в то время как отсутствие таких модификаций облегчает транскрипцию экспрессируемого подмножества генов-сирот, что подтверждает идею о том, что открытый хроматин способствует формированию новых генов. [95]

Структурная эволюция

Белки de novo обычно демонстрируют менее четко определенные вторичные и трехмерные структуры, часто лишенные жесткой укладки, но имеющие обширные неупорядоченные области. [103] [110] Количественный анализ эволюции вторичных структурных элементов и третичных структур с течением времени все еще отсутствует. Поскольку структура обычно более консервативна, чем последовательность, сравнение структур между ортологами может обеспечить более глубокое понимание возникновения и эволюции генов de novo и помочь подтвердить, что эти гены являются истинными генами de novo . [112] Тем не менее, до сих пор только очень немногие белки de novo были структурно и функционально охарактеризованы, особенно из-за проблем с очисткой белков и последующей стабильностью. Прогресс был достигнут с использованием различных меток очистки, типов клеток и шаперонов. [113]

«Антифризный гликопротеин» (AFGP) у арктической трески предотвращает замерзание их крови в арктических водах. [84] [83] Было показано, что Bsc4, короткий несущественный de novo белок у дрожжей, [33] строится в основном из β-слоев и имеет гидрофобное ядро. [34] Он связан с восстановлением ДНК в условиях дефицита питательных веществ. [114] Белок de novo у Drosophila Goddard был впервые охарактеризован в 2017 году. Самцы мух Drosophila melanogaster с нокдауном не могли производить сперму. [80] Недавно удалось показать, что этот недостаток был вызван неудачей индивидуализации удлиненных сперматид. Используя вычислительные филогеномные и структурные прогнозы, экспериментальный структурный анализ и клеточные биологические анализы, было высказано предположение, что половина структуры Годдарда неупорядочена, а другая половина состоит из альфа-спиральных аминокислот. Эти анализы также показали, что ортологи Годдарда показывают схожие результаты. Таким образом, структура Годдарда, по-видимому, в основном сохранилась с момента ее появления. [81]

Механизмы

Распространенное выражение

С развитием таких технологий, как РНК-секвенирование и Рибо-секвенирование, теперь известно, что эукариотические геномы повсеместно транскрибируются [115] [116] [117] [118] и транслируются. [119] Многие ОРС, которые либо не аннотированы, либо аннотированы как длинные некодирующие РНК (lncRNA), транслируются на каком-то уровне, либо в условиях, либо тканеспецифическим образом. [59] [119] [120] [121] [122] [123] Хотя эти события трансляции происходят нечасто, они подвергают негенную последовательность отбору. Эта всеобъемлющая экспрессия составляет основу нескольких моделей, описывающих рождение генов de novo .

Было высказано предположение, что эпигенетический ландшафт генов de novo на ранних стадиях формирования может быть особенно изменчивым между популяциями, что приводит к изменчивой экспрессии генов, тем самым позволяя молодым генам исследовать «ландшафт экспрессии». [124] Ген QQS у A. thaliana является одним из примеров этого явления; его экспрессия отрицательно регулируется метилированием ДНК, которое, хотя и наследуется в течение нескольких поколений, широко варьируется по своим уровням как среди естественных образцов, так и в пределах диких популяций. [124] Эпигенетика также в значительной степени отвечает за пермиссивную транскрипционную среду в семенниках, в частности, посредством включения в нуклеосомы неканонических вариантов гистонов, которые заменяются гистонподобными протаминами во время сперматогенеза. [125]

Межгенные ОРС как элементарные структурные модули

Анализ разнообразия потенциала сворачивания показывает, что большинство аминокислотных последовательностей, кодируемых межгенными ОРС S. cerevisiae, предположительно, являются складчатыми. [126] Что еще более важно, эти аминокислотные последовательности с потенциалом сворачивания могут служить элементарными строительными блоками для генов de novo или интегрироваться в уже существующие гены. [126]

Порядок событий

Для рождения гена, кодирующего белок de novo , негенная последовательность должна быть транскрибирована и приобрести ORF перед тем, как стать транслируемой. Эти события могут происходить в любом порядке, и есть доказательства, подтверждающие как модель «сначала ORF», так и модель «сначала транскрипция». [5] [127] Анализ генов de novo , которые разделяются у D. melanogaster, показал, что последовательности, которые транскрибируются, имеют схожий кодирующий потенциал с ортологичными последовательностями из линий, не имеющих доказательств транскрипции. [55] Это открытие подтверждает идею о том, что многие ORF могут существовать до транскрипции. Ген антифриза гликопротеина AFGP , который появился de novo у арктических тресковых, представляет собой более определенный пример, в котором было показано, что появление ORF de novo предшествует промоторной области. [83] Кроме того, предположительно негенные ORF, достаточно длинные, чтобы кодировать функциональные пептиды, многочисленны в эукариотических геномах и, как ожидается, будут встречаться с высокой частотой случайно. [55] [59] Прослеживая историю эволюции последовательностей ORF и активацию транскрипции генов de novo человека , исследование показало, что некоторые ORF были готовы придать биологическое значение при их рождении. [127] В то же время транскрипция эукариотических геномов гораздо более обширна, чем считалось ранее, и есть задокументированные примеры геномных областей, которые были транскрибированы до появления ORF, ставшей геном de novo . [79] Доля генов de novo , которые кодируют белок, неизвестна, но появление «сначала транскрипция» привело некоторых к предположению, что гены de novo , кодирующие белок , могут сначала существовать как промежуточные звенья генов РНК. Случай бифункциональных РНК, которые и транслируются, и функционируют как гены РНК, показывает, что такой механизм правдоподобен. [128]

Эти два события могут происходить одновременно, когда перестройка хромосом является событием, ускоряющим рождение гена. [129]

Модели

Было описано несколько теоретических моделей и возможных механизмов рождения генов de novo . Модели, как правило, не являются взаимоисключающими, и возможно, что множественные механизмы могут привести к появлению генов de novo . [42] Примером является ген белка антифриза типа III, который происходит от старого гена синтазы сиаловой кислоты ( SAS ) у антарктической рыбы зоарцид.

Гипотеза «Вне яичек»

Раннее исследование случая рождения генов de novo , которое идентифицировало пять генов de novo у D. melanogaster , отметило преимущественную экспрессию этих генов в семенниках, [30] и несколько дополнительных генов de novo были идентифицированы с использованием транскриптомных данных, полученных из семенников и мужских добавочных желез D. yakuba и D. erecta . [29] [31] Это согласуется с другими исследованиями, которые показали, что существует быстрая эволюция генов, связанных с воспроизводством, в ряде линий, [130] [131] [132] предполагая, что половой отбор может играть ключевую роль в адаптивной эволюции и рождении генов de novo . Последующий крупномасштабный анализ шести штаммов D. melanogaster идентифицировал 248 генов de novo , экспрессируемых в семенниках , из которых ~57% не были фиксированными. [55] Недавнее исследование двенадцати видов Drosophila дополнительно идентифицировало более высокую долю генов de novo с экспрессией, смещенной в семенники, по сравнению с аннотированным протеомом. [67] Было высказано предположение, что большое количество генов de novo с экспрессией, специфичной для самцов, выявленных у Drosophila, вероятно, связано с тем, что такие гены предпочтительно сохраняются по сравнению с другими генами de novo по причинам, которые не совсем ясны. [73] Интересно, что два предполагаемых гена de novo у Drosophila ( Goddard и Saturn ) оказались необходимыми для нормальной мужской фертильности. [80] [81] Генетический скрининг более 40 предполагаемых генов de novo с экспрессией, обогащенной семенниками, у Drosophila melanogaster показал, что один из генов de novo, atlas , необходим для правильной конденсации хроматина на последних стадиях сперматогенеза у самцов. atlas произошел в результате слияния гена, кодирующего белок, который возник у основания рода Drosophila , и консервативной некодирующей РНК. [133] Сравнительный анализ транскриптомов яичек и придаточных желез, соматической ткани самцов, которая важна для фертильности, D. melanogaster показывает, что гены de novo вносят больший вклад в транскриптомную сложность яичек по сравнению с придаточными железами. [134] Одноклеточное РНК-секвенирование D. melanogasterяички показали, что паттерн экспрессии генов de novo был смещен в сторону раннего сперматогенеза. [135]

У людей исследование, в котором были идентифицированы 60 генов de novo , специфичных для человека , показало, что их средняя экспрессия, измеренная с помощью РНК-секвенирования, была самой высокой в ​​яичках. [57] Другое исследование, изучающее гены, специфичные для млекопитающих, в более общем плане, также обнаружило обогащенную экспрессию в яичках. [136] Транскрипция в яичках млекопитающих считается особенно беспорядочной, отчасти из-за повышенной экспрессии транскрипционного аппарата [137] [138] и открытой хроматиновой среды. [139] Наряду с иммунопривилегированной природой яичек, эта беспорядочная транскрипция, как полагают, создает идеальные условия для экспрессии негенных последовательностей, необходимых для рождения генов de novo . Экспрессия, специфичная для яичек, по-видимому, является общей чертой всех новых генов, поскольку анализ Drosophila и видов позвоночных показал, что молодые гены демонстрировали экспрессию, смещенную в сторону яичек, независимо от механизма их происхождения. [99]

Преадаптационная модель

Преадаптационная модель рождения генов de novo использует математическое моделирование, чтобы показать, что когда последовательности, которые обычно скрыты, подвергаются слабому или экранированному отбору, полученный пул «криптических» последовательностей (т. е. протогенов) может быть очищен от «очевидно вредных» вариантов, таких как те, которые склонны приводить к агрегации белков, и, таким образом, обогащен потенциальными адаптациями относительно полностью невыраженного и неочищенного набора последовательностей. [140] Это выявление и очистка криптических вредных негенных последовательностей является побочным продуктом всепроникающей транскрипции и трансляции межгенных последовательностей и, как ожидается, будет способствовать рождению функциональных генов, кодирующих белок de novo . [122] Это происходит потому, что при устранении наиболее вредных вариантов то, что остается, в процессе устранения, с большей вероятностью будет адаптивным, чем ожидается от случайных последовательностей. Используя эволюционное определение функции (то есть, что ген по определению находится под очищающим отбором против потери), модель преадаптации предполагает, что «рождение гена — это внезапный переход к функциональности» [110] , который происходит, как только ORF приобретает чистый полезный эффект. Чтобы избежать вреда, новорожденные гены должны демонстрировать преувеличенные версии генных особенностей, связанных с избеганием вреда. Это контрастирует с моделью протогена, которая ожидает, что новорожденные гены будут иметь особенности, промежуточные между старыми генами и не-генами. [110]

Математика модели преадаптации предполагает, что распределение эффектов приспособленности является бимодальным, с новыми последовательностями мутаций, имеющими тенденцию что-то ломать или ремонтировать, но редко где-то посередине. [140] [141] Следуя этой логике, популяции могут либо развить локальные решения, в которых отбор работает на каждом отдельном локусе и поддерживается относительно высокая частота ошибок, либо глобальное решение с низкой частотой ошибок, которое допускает накопление вредных криптических последовательностей. [140] Считается, что рождение генов de novo благоприятно в популяциях, которые развивают локальные решения, поскольку относительно высокая частота ошибок приведет к пулу криптических вариаций, которые «преадаптированы» посредством очистки вредных последовательностей. Локальные решения более вероятны в популяциях с высоким эффективным размером популяции .

В поддержку модели преадаптации анализ ISD у мышей и дрожжей показал, что молодые гены имеют более высокий ISD, чем старые гены, в то время как случайные негенные последовательности, как правило, показывают самые низкие уровни ISD. [110] Хотя наблюдаемая тенденция могла быть частично результатом подмножества молодых генов, полученных путем оверпринтинга, [142] более высокий ISD в молодых генах также наблюдается среди перекрывающихся пар вирусных генов. [143] Что касается других предсказанных структурных особенностей, таких как содержание β-цепи и склонность к агрегации, пептиды, кодируемые протогенами, похожи на негенные последовательности и категорически отличаются от канонических генов. [144]

Протогенная модель

Эта протогенная модель согласуется с преадаптационной моделью относительно важности всеобъемлющей экспрессии и относится к набору всеобъемлюще экспрессируемых последовательностей, которые не соответствуют всем определениям гена, как к «протогенам». [59] В отличие от преадаптационной модели, протогенная модель предполагает, что новорожденные гены имеют промежуточные характеристики между старыми генами и негенами. [110] В частности, эта модель предусматривает более постепенный процесс отбора из негенного в генное состояние, отвергая бинарную классификацию гена и негена.

В расширении модели протогена было высказано предположение, что по мере того, как протогены становятся более похожими на гены, их потенциал для адаптивных изменений уступает место выбранным эффектам; таким образом, прогнозируемое влияние мутаций на приспособленность зависит от эволюционного статуса ORF. [105] Это представление подтверждается тем фактом, что сверхэкспрессия устоявшихся ORF в S. cerevisiae имеет тенденцию быть менее полезной (и более вредной), чем сверхэкспрессия появляющихся ORF. [105]

Несколько особенностей ORF коррелируют с возрастом ORF, как определено филостратиграфическим анализом, причем молодые ORF имеют свойства, промежуточные между старыми ORF и не-генами; это было принято как доказательство в пользу модели прото-гена, в которой состояние прото-гена является континуумом. [59] Это доказательство подверглось критике, поскольку те же очевидные тенденции ожидаются и в модели, в которой идентичность как гена является бинарным. В этой модели, когда каждая возрастная группа содержит различное соотношение генов и не-генов, парадокс Симпсона может генерировать корреляции в неправильном направлении. [110]

Модель медленного роста и линьки

Модель «расти медленно и линять» описывает потенциальный механизм рождения генов de novo , в частности, генов, кодирующих белки. В этом сценарии существующие ORF, кодирующие белки, расширяются на своих концах, особенно на своих 3'-концах, что приводит к созданию новых N- и C-концевых доменов. [145] [146] [147] [148] [149] Новые C-концевые домены могут сначала развиваться под слабым отбором посредством случайной экспрессии через сквозную трансляцию, как в модели преадаптации, и только позже становятся конститутивно экспрессируемыми через мутацию, которая нарушает стоп-кодон. [140] [146] Гены, испытывающие высокую трансляционную сквозную трансляцию, как правило, имеют внутренне неупорядоченные C-концы. [150] Кроме того, существующие гены часто находятся близко к повторяющимся последовательностям, которые кодируют неупорядоченные домены. Эти новые неупорядоченные домены могут изначально давать некоторую неспецифическую связывающую способность, которая постепенно совершенствуется отбором. Последовательности, кодирующие эти новые домены, могут иногда отделяться от их родительской ORF, приводя или способствуя созданию гена de novo . [146] Интересно, что анализ 32 геномов насекомых показал, что новые домены (т. е. те, которые уникальны для насекомых), как правило, развиваются довольно нейтрально, только несколько участков находятся под положительным отбором, в то время как их белки-хозяева остаются под очищающим отбором, что предполагает, что новые функциональные домены возникают постепенно и несколько стохастически. [151]

Избежать адаптивного конфликта

Эволюционная модель выхода из адаптивного конфликта (EAC) предлагает возможный способ исправления новой дупликации генов: конфликт из-за контрастной функции в пределах одного гена приводит к фиксации новой дупликации. [152] [153]

Модель барьера плейотропии

Модель «барьера плейотропии» предполагает, что вновь эволюционировавшие гены, включая гены de novo и гены, связанные с дупликацией, могут способствовать эволюционным инновациям или эволюции определенных функций из-за их низкого (или нулевого) плейотропного эффекта при столкновении с новой селективной силой, основываясь на наблюдениях за данными о генетических заболеваниях человека.

Здоровье человека

Помимо своей значимости для области эволюционной биологии, рождение генов de novo имеет последствия для здоровья человека. Было высказано предположение, что новые гены, включая гены de novo , могут играть огромную роль в видоспецифичных признаках; [6] [10] [32] [154] однако, многие видоспецифичные гены не имеют функциональной аннотации. [136] Тем не менее, есть данные, позволяющие предположить, что специфичные для человека гены de novo участвуют в таких заболеваниях, как рак. NYCM , ген de novo , уникальный для людей и шимпанзе, регулирует патогенез нейробластом в мышиных моделях, [155] а специфичный для приматов PART1 , ген lncRNA, был идентифицирован как супрессор опухолей и онкоген в различных контекстах. [37] [156] [157] Несколько других генов de novo , специфичных для человека или приматов , включая PBOV1 , [158] GR6 , [159] [160] MYEOV , [161] ELFN1-AS1 , [162] и CLLU1 , [38] также связаны с раком. Некоторые даже предложили рассматривать специфически экспрессируемые в опухолях эволюционно новые гены как свой собственный класс генетических элементов, отмечая, что многие такие гены находятся под положительным отбором и могут быть неофункционализированы в контексте опухолей. [162]

Специфическая экспрессия многих генов de novo в человеческом мозге [57] также поднимает интригующую возможность того, что гены de novo влияют на когнитивные черты человека. Одним из таких примеров является FLJ33706 , ген de novo , который был идентифицирован в GWAS и анализах сцепления для никотиновой зависимости и показывает повышенную экспрессию в мозге пациентов с болезнью Альцгеймера. [163] Вообще говоря, экспрессия молодых, специфичных для приматов генов обогащена в плодном человеческом мозге по сравнению с экспрессией аналогичных молодых генов в мозге мыши. [164] Большинство этих молодых генов, некоторые из которых возникли de novo , экспрессируются в неокортексе, который, как считается, отвечает за многие аспекты специфичного для человека познания. Многие из этих молодых генов демонстрируют сигнатуры положительного отбора, а функциональные аннотации указывают на то, что они участвуют в различных молекулярных процессах, но обогащены факторами транскрипции. [164]

Помимо своей роли в процессах рака, человеческие гены, возникшие de novo, были вовлечены в поддержание плюрипотентности [165] и в иммунную функцию. [37] [136] [166] Преимущественная экспрессия генов de novo в яичках также предполагает их роль в воспроизводстве. Учитывая, что функция многих человеческих генов de novo остается неохарактеризованной, кажется вероятным, что понимание их вклада в здоровье и развитие человека будет продолжать расти.

Исследования генома сирот иde novoгены в различных линиях.

Примечание: Для целей этой таблицы гены определяются как гены-сироты (когда они специфичны для вида) или TRG (когда они ограничены близкородственной группой видов), когда механизм возникновения не был исследован, и как гены de novo , когда было выведено возникновение de novo , независимо от метода вывода. Обозначение генов de novo как «кандидатов» или «протогенов» отражает язык, используемый авторами соответствующих исследований.

Смотрите также

Ссылки

Эта статья была адаптирована из следующего источника по лицензии CC BY 4.0 (2019) (отчеты рецензента): Стивен Бранден Ван Осс; Энн-Руксандра Карвунис (23 мая 2019 г.). "De novo gene birth". PLOS Genetics . 15 (5): e1008160. doi : 10.1371/JOURNAL.PGEN.1008160 . ISSN  1553-7390. PMC 6542195.  PMID 31120894.  Wikidata Q86320144  .

  1. ^ ab Long M, Betrán E, Thornton K, Wang W (ноябрь 2003 г.). «Происхождение новых генов: взгляд из молодых и старых». Nature Reviews Genetics . 4 (11): 865–75. doi :10.1038/nrg1204. PMID  14634634. S2CID  33999892.
  2. ^ Wang W, Yu H, Long M (май 2004). «Дупликация-дегенерация как механизм деления генов и происхождение новых генов у видов Drosophila». Nature Genetics . 36 (5): 523–7. doi : 10.1038/ng1338 . PMID  15064762.
  3. ^ Levy A (октябрь 2019 г.). «Как эволюция строит гены с нуля». Nature . 574 (7778): 314–316. Bibcode :2019Natur.574..314L. doi : 10.1038/d41586-019-03061-x . PMID  31619796.
  4. ^ Schmitz JF, Bornberg-Bauer E (2017). «Факт или вымысел: обновления о том, как гены, кодирующие белок, могут возникать de novo из ранее некодирующей ДНК». F1000Research . 6 : 57. doi : 10.12688/f1000research.10079.1 . PMC 5247788. PMID  28163910 . 
  5. ^ abc Schlötterer C (апрель 2015 г.). «Гены с нуля — эволюционная судьба генов de novo». Trends in Genetics . 31 (4): 215–9. doi :10.1016/j.tig.2015.02.007. PMC 4383367. PMID 25773713  . 
  6. ^ abc Kaessmann H (октябрь 2010 г.). «Происхождение, эволюция и фенотипическое воздействие новых генов». Genome Research . 20 (10): 1313–26. doi :10.1101/gr.101386.109. PMC 2945180. PMID 20651121  . 
  7. ^ ab Jacob F (июнь 1977). «Эволюция и подгонка». Science . 196 (4295): 1161–1166. Bibcode :1977Sci...196.1161J. doi :10.1126/science.860134. PMID  860134. S2CID  29756896.
  8. ^ Ван Осс СБ, Карвунис АР (май 2019). «Рождение гена de novo». PLOS Genetics . 15 (5): e1008160. doi : 10.1371/journal.pgen.1008160 . PMC 6542195. PMID  31120894 . 
  9. ^ Khalturin K, Hemmrich G, Fraune S, Augustin R, Bosch TC (сентябрь 2009 г.). «Больше, чем просто сироты: важны ли таксономически ограниченные гены в эволюции?». Trends in Genetics . 25 (9): 404–413. doi :10.1016/j.tig.2009.07.006. PMID  19716618.
  10. ^ abcde Tautz D, Domazet-Lošo T (август 2011). «Эволюционное происхождение сиротских генов». Nature Reviews. Genetics . 12 (10): 692–702. doi :10.1038/nrg3053. PMID  21878963. S2CID  31738556.
  11. ^ Ohno S (1970) Эволюция путем генной дупликации Allen & Unwin ; Springer-Verlag
  12. ^ Tautz D (2014). «Открытие эволюции генов de novo». Перспективы в биологии и медицине . 57 (1): 149–61. doi : 10.1353/pbm.2014.0006. hdl : 11858/00-001M-0000-0024-3416-1 . PMID  25345708. S2CID  29552265.
  13. ^ Грассе ПП (1977) Эволюция живых организмов: доказательства новой теории трансформации Academic Press
  14. ^ Barrell BG, Air GM, Hutchison CA (ноябрь 1976 г.). «Перекрывающиеся гены в бактериофаге phiX174». Nature . 264 (5581): 34–41. Bibcode :1976Natur.264...34B. doi :10.1038/264034a0. PMID  1004533. S2CID  4264796.
  15. ^ Shaw DC, Walker JE, Northrop FD, Barrell BG, Godson GN, Fiddes JC (апрель 1978 г.). «Ген K, новый перекрывающийся ген в бактериофаге G4». Nature . 272 ​​(5653): 510–5. Bibcode :1978Natur.272..510S. doi :10.1038/272510a0. PMID  692656. S2CID  4218777.
  16. ^ Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA и др. (февраль 1977 г.). «Нуклеотидная последовательность ДНК бактериофага phi X174». Nature . 265 (5596): 687–95. Bibcode :1977Natur.265..687S. doi :10.1038/265687a0. PMID  870828. S2CID  4206886.
  17. ^ Keese PK, Gibbs A (октябрь 1992 г.). «Происхождение генов: «большой взрыв» или непрерывное творение?». Труды Национальной академии наук Соединенных Штатов Америки . 89 (20): 9489–93. Bibcode : 1992PNAS ...89.9489K. doi : 10.1073/pnas.89.20.9489 . PMC 50157. PMID  1329098. 
  18. ^ Ohno S (апрель 1984). «Рождение уникального фермента из альтернативной рамки считывания предсуществующей, внутренне повторяющейся кодирующей последовательности». Труды Национальной академии наук Соединенных Штатов Америки . 81 (8): 2421–5. Bibcode : 1984PNAS...81.2421O. doi : 10.1073 /pnas.81.8.2421 . PMC 345072. PMID  6585807. 
  19. ^ Sabath N, Wagner A, Karlin D (декабрь 2012 г.). «Эволюция вирусных белков, возникших de novo путем наложения». Молекулярная биология и эволюция . 29 (12): 3767–80. doi :10.1093/molbev/mss179. PMC 3494269. PMID  22821011 . 
  20. ^ Макаловска И, Лин КФ, Эрнандес К (октябрь 2007 г.). «Рождение и смерть перекрытий генов у позвоночных». BMC Evolutionary Biology . 7 (1): 193. Bibcode : 2007BMCEE...7..193M. doi : 10.1186/1471-2148-7-193 . PMC 2151771. PMID  17939861 . 
  21. ^ Samandi S, Roy AV, Delcourt V, Lucier JF, Gagnon J, Beaudoin MC и др. (октябрь 2017 г.). «Глубокая аннотация транскриптома позволяет обнаруживать и функционально характеризовать криптические малые белки». eLife . 6 . doi : 10.7554/eLife.27860 . PMC 5703645 . PMID  29083303. 
  22. ^ ab Khan YA, Jungreis I, Wright JC, Mudge JM, Choudhary JS, Firth AE, Kellis M (март 2020 г.). «Доказательства новой перекрывающейся кодирующей последовательности в POLG, инициированной стартовым кодоном CUG». BMC Genetics . 21 (1): 25. doi : 10.1186/s12863-020-0828-7 . PMC 7059407 . PMID  32138667. 
  23. ^ Макаловский В., Митчелл ГА, Лабуда Д. (июнь 1994 г.). «Последовательности Alu в кодирующих областях мРНК: источник белковой изменчивости». Trends in Genetics . 10 (6): 188–93. doi :10.1016/0168-9525(94)90254-2. PMID  8073532.
  24. ^ Сорек Р. (октябрь 2007 г.). «Рождение новых экзонов: механизмы и эволюционные последствия». РНК . 13 (10): 1603–8. doi :10.1261/rna.682507. PMC 1986822. PMID  17709368 . 
  25. ^ ab Dorit RL, Gilbert W (декабрь 1991 г.). «Ограниченная вселенная экзонов». Current Opinion in Genetics & Development . 1 (4): 464–9. doi :10.1016/S0959-437X(05)80193-5. PMID  1822278.
  26. ^ Chothia C (июнь 1992). «Белки. Тысяча семейств для молекулярного биолога». Nature . 357 (6379): 543–4. Bibcode :1992Natur.357..543C. doi : 10.1038/357543a0 . PMID  1608464. S2CID  4355476.
  27. ^ Оливер СГ, ван дер Аарт КЖ, Агостони-Карбоне МЛ, Эгл М, Альбергина Л, Александраки Д и др. (Май 1992). «Полная последовательность ДНК хромосомы III дрожжей». Nature . 357 (6373): 38–46. Bibcode :1992Natur.357...38O. doi :10.1038/357038a0. PMID  1574125. S2CID  4271784.
  28. ^ ab Dujon B (июль 1996 г.). «Проект генома дрожжей: что мы узнали?». Trends in Genetics . 12 (7): 263–70. doi :10.1016/0168-9525(96)10027-5. PMID  8763498.
  29. ^ abc Begun DJ, Lindfors HA, Kern AD, Jones CD (июнь 2007 г.). «Доказательства de novo эволюции генов, экспрессируемых в яичках, в кладе Drosophila yakuba/Drosophila erecta». Genetics . 176 (2): 1131–7. doi :10.1534/genetics.106.069245. PMC 1894579 . PMID  17435230. 
  30. ^ abc Levine MT, Jones CD, Kern AD, Lindfors HA, Begun DJ (июнь 2006 г.). «Новые гены, полученные из некодирующей ДНК у Drosophila melanogaster, часто сцеплены с Х-хромосомой и демонстрируют смещенную экспрессию в сторону яичек». Труды Национальной академии наук Соединенных Штатов Америки . 103 (26): 9935–9. Bibcode : 2006PNAS..103.9935L. doi : 10.1073/pnas.0509809103 . PMC 1502557. PMID  16777968 . 
  31. ^ abcd Бегун DJ, Линдфорс HA, Томпсон ME, Холлоуэй AK (март 2006 г.). «Недавно эволюционировавшие гены, идентифицированные из Drosophila yakuba и добавочной железы D. erecta, экспрессировали метки последовательностей». Генетика . 172 (3): 1675–81. doi :10.1534/genetics.105.050336. PMC 1456303 . PMID  16361246. 
  32. ^ ab McLysaght A, Guerzoni D (сентябрь 2015 г.). "Новые гены из некодирующей последовательности: роль генов de novo, кодирующих белок, в эволюционных инновациях эукариот". Philosophical Transactions of the Royal Society of London. Серия B, Биологические науки . 370 (1678): 20140332. doi :10.1098/rstb.2014.0332. PMC 4571571. PMID  26323763 . 
  33. ^ abc Цай Дж, Чжао Р, Цзян Х, Ван В (май 2008 г.). «Происхождение de novo нового гена, кодирующего белок, у Saccharomyces cerevisiae». Генетика . 179 (1): 487–96. doi :10.1534/genetics.107.084491. ПМК 2390625 . ПМИД  18493065. 
  34. ^ abc Бунгард Д., Коппл Дж.С., Ян Дж., Чхун Дж.Дж., Кумиров В.К., Фой С.Г. и др. (ноябрь 2017 г.). «Складчатость природного белка, эволюционировавшего De Novo». Структура . 25 (11): 1687–1696.е4. doi :10.1016/j.str.2017.09.006. ПМЦ 5677532 . ПМИД  29033289. 
  35. ^ ab Li L, Foster CM, Gan Q, Nettleton D, James MG, Myers AM и др. (май 2009 г.). «Идентификация нового белка QQS как компонента сети метаболизма крахмала в листьях Arabidopsis». The Plant Journal . 58 (3): 485–98. doi : 10.1111/j.1365-313X.2009.03793.x . PMID  19154206.
  36. ^ ab Heinen TJ, Staubach F, Häming D, Tautz D (сентябрь 2009 г.). «Появление нового гена из межгенной области». Current Biology . 19 (18): 1527–31. Bibcode : 2009CBio...19.1527H. doi : 10.1016/j.cub.2009.07.049 . PMID  19733073. S2CID  12446879.
  37. ^ abcdefgh Толл-Риера М, Бош Н, Беллора Н, Кастело Р, Арменгол Л, Эстивилл X и др. (март 2009 г.). «Происхождение генов-сирот приматов: подход сравнительной геномики». Молекулярная биология и эволюция . 26 (3): 603–12. дои : 10.1093/molbev/msn281 . ПМИД  19064677.
  38. ^ abcd Knowles DG, McLysaght A (октябрь 2009 г.). "Недавнее новое происхождение генов, кодирующих человеческие белки". Genome Research . 19 (10): 1752–9. doi :10.1101/gr.095026.109. PMC 2765279. PMID  19726446 . 
  39. ^ ab Domazet-Loso T, Brajković J, Tautz D (ноябрь 2007 г.). «Филостратиграфический подход к раскрытию геномной истории основных адаптаций в линиях метазойных организмов». Trends in Genetics . 23 (11): 533–9. doi :10.1016/j.tig.2007.08.014. PMID  18029048.
  40. ^ abc Gehrmann T, Reinders MJ (ноябрь 2015 г.). «Протения: обнаружение и визуализация статистически значимых синтенных кластеров на уровне протеома». Биоинформатика . 31 (21): 3437–44. doi :10.1093/bioinformatics/btv389. PMC 4612220. PMID  26116928 . 
  41. ^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (октябрь 1990 г.). "Базовый инструмент поиска локального выравнивания". Журнал молекулярной биологии . 215 (3): 403–10. doi :10.1016/S0022-2836(05)80360-2. PMID  2231712. S2CID  14441902.
  42. ^ abcdef McLysaght A, Hurst LD (сентябрь 2016 г.). «Открытые вопросы в изучении генов de novo: что, как и почему». Nature Reviews Genetics . 17 (9): 567–78. doi :10.1038/nrg.2016.78. PMID  27452112. S2CID  6033249.[ постоянная мертвая ссылка ]
  43. ^ Elhaik E, Sabath N, Graur D (январь 2006 г.). «Обратная связь между скоростью эволюции и возрастом генов млекопитающих» является артефактом увеличения генетического расстояния со скоростью эволюции и временем расхождения». Молекулярная биология и эволюция . 23 (1): 1–3. doi : 10.1093/molbev/msj006 . PMID  16151190.
  44. ^ Albà MM, Castresana J (апрель 2007 г.). «О поиске гомологии с помощью белка Blast и характеристике возраста генов». BMC Evolutionary Biology . 7 (1): 53. Bibcode : 2007BMCEE...7...53A. doi : 10.1186/1471-2148-7-53 . PMC 1855329. PMID  17408474 . 
  45. ^ Moyers BA, Zhang J (май 2016 г.). «Оценка филостратиграфических доказательств широко распространенного рождения генов De Novo в эволюции генома». Молекулярная биология и эволюция . 33 (5): 1245–56. doi :10.1093/molbev/msw008. PMC 5010002. PMID  26758516 . 
  46. ^ Moyers BA, Zhang J (январь 2015 г.). «Филостратиграфическое смещение создает ложные закономерности эволюции генома». Молекулярная биология и эволюция . 32 (1): 258–67. doi :10.1093/molbev/msu286. PMC 4271527. PMID  25312911 . 
  47. ^ ab Domazet-Lošo T, Carvunis AR, Albà MM, Šestak MS, Bakaric R, Neme R и др. (апрель 2017 г.). «Нет доказательств влияния филостратиграфического смещения на выводы о закономерностях возникновения и эволюции генов». Молекулярная биология и эволюция . 34 (4): 843–856. doi :10.1093/molbev/msw284. PMC 5400388. PMID  28087778. 
  48. ^ Ghiurcuta CG, Moret BM (июнь 2014 г.). «Оценка синтении для улучшения сравнительных исследований». Биоинформатика . 30 (12): i9-18. doi :10.1093/bioinformatics/btu259. PMC 4058928. PMID  24932010 . 
  49. ^ Жан Г, Никольски М (2011). "SyDiG: раскрытие синтении в отдаленных геномах" (PDF) . Международный журнал исследований и приложений биоинформатики . 7 (1): 43–62. doi :10.1504/IJBRA.2011.039169. PMID  21441096. S2CID  2644451.
  50. ^ Liu D, Hunt M, Tsai IJ (январь 2018 г.). «Вывод синтении между сборками генома: систематическая оценка». BMC Bioinformatics . 19 (1): 26. doi : 10.1186/s12859-018-2026-4 . PMC 5791376 . PMID  29382321. 
  51. ^ Ranz JM, Casals F, Ruiz A (февраль 2001 г.). «Насколько пластичен эукариотический геном? Экстремальная скорость хромосомной перестройки в роде Drosophila». Genome Research . 11 (2): 230–9. doi :10.1101/gr.162901. PMC 311025. PMID 11157786  . 
  52. ^ ab Lu TC, Leu JY, Lin WC (ноябрь 2017 г.). «Комплексный анализ поддерживаемых транскриптом генов De Novo в дрожжах Saccharomyces sensu stricto». Молекулярная биология и эволюция . 34 (11): 2823–2838. doi :10.1093/molbev/msx210. PMC 5850716. PMID  28981695 . 
  53. ^ abcd Li ZW, Chen X, Wu Q, Hagmann J, Han TS, Zou YP, Ge S, Guo YL (август 2016 г.). «О происхождении генов De Novo в популяциях Arabidopsis thaliana». Genome Biology and Evolution . 8 (7): 2190–202. doi :10.1093/gbe/evw164. PMC 4987118. PMID  27401176 . 
  54. ^ abcdefgh Chen S, Zhang YE, Long M (декабрь 2010 г.). «Новые гены у дрозофилы быстро становятся необходимыми». Science . 330 (6011): 1682–5. Bibcode :2010Sci...330.1682C. doi :10.1126/science.1196380. PMC 7211344 . PMID  21164016. S2CID  7899890. 
  55. ^ abcdefg Чжао Л., Саелао П., Джонс CD, Begun DJ (февраль 2014 г.). «Происхождение и распространение генов de novo в популяциях Drosophila melanogaster». Наука . 343 (6172): 769–72. Бибкод : 2014Sci...343..769Z. дои : 10.1126/science.1248286. ПМЦ 4391638 . ПМИД  24457212. 
  56. ^ abcd Zhou Q, Zhang G, Zhang Y, Xu S, Zhao R, Zhan Z, et al. (сентябрь 2008 г.). «О происхождении новых генов у дрозофилы». Genome Research . 18 (9): 1446–55. doi :10.1101/gr.076588.108. PMC 2527705. PMID  18550802 . 
  57. ^ abcdefg Ву Д.Д., Ирвин Д.М., Чжан Ю.П. (ноябрь 2011 г.). «Происхождение de novo генов, кодирующих человеческие белки». ПЛОС Генетика . 7 (11): e1002379. дои : 10.1371/journal.pgen.1002379 . ПМЦ 3213175 . ПМИД  22102831. 
  58. ^ Vakirlis N, McLysaght A (2019). "Computational Prediction of de Novo Emerged Protein-Coding Genes". Computational Methods in Protein Evolution . Methods in Molecular Biology. Vol. 1851. Springer. pp. 63–81. doi :10.1007/978-1-4939-8736-8_4. ISBN 978-1-4939-8735-1. PMID  30298392. S2CID  52942639.
  59. ^ abcdefghijkl Carvunis AR, Rolland T, Wapinski I, Calderwood MA, Yildirim MA, Simonis N, et al. (Июль 2012 г.). «Протогены и рождение генов de novo». Nature . 487 (7407): 370–374. Bibcode :2012Natur.487..370C. doi :10.1038/nature11184. PMC 3401362 . PMID  22722833. 
  60. ^ Doolittle WF, Brunet TD, Linquist S, Gregory TR (май 2014 г.). «Различение «функции» и «эффекта» в геномной биологии». Genome Biology and Evolution . 6 (5): 1234–1237. doi :10.1093/gbe/evu098. PMC 4041003. PMID  24814287 . 
  61. ^ ab Kellis M, Wold B, Snyder MP, Bernstein BE, Kundaje A, Marinov GK и др. (апрель 2014 г.). «Определение функциональных элементов ДНК в геноме человека». Труды Национальной академии наук Соединенных Штатов Америки . 111 (17): 6131–6138. Bibcode : 2014PNAS..111.6131K. doi : 10.1073/pnas.1318948111 . PMC 4035993. PMID  24753594 . 
  62. ^ abc Keeling DM, Garza P, Nartey CM, Carvunis AR (ноябрь 2019 г.). «Значения термина «функция» в биологии и проблемный случай возникновения гена de novo». eLife . 8 . doi : 10.7554/eLife.47014 . PMC 6824840 . PMID  31674305. 
  63. ^ Andersson DI, Jerlström-Hultqvist J, Näsvall J (июнь 2015 г.). «Эволюция новых функций de novo и из уже существующих генов». Cold Spring Harbor Perspectives in Biology . 7 (6): a017996. doi :10.1101/cshperspect.a017996. PMC 4448608. PMID  26032716 . 
  64. ^ Xie C, Bekpen C, Künzel S, Keshavarz M, Krebs-Wheaton R, Skrabar N и др. (январь 2019 г.). «Изучение начала появления генов de novo у мышей выявляет быструю интеграцию новых генов в функциональные сети». bioRxiv . bioRxiv 10.1101/510214 . doi : 10.1101/510214 . 
  65. ^ Руис-Орера Дж., Эрнандес-Родригес Дж., Чива С., Сабидо Э., Кондова И., Бонтроп Р. и др. (декабрь 2015 г.). «Происхождение генов De Novo у человека и шимпанзе». ПЛОС Генетика . 11 (12): e1005721. arXiv : 1507.07744 . Бибкод : 2015arXiv150707744R. дои : 10.1371/journal.pgen.1005721 . ПМЦ 4697840 . ПМИД  26720152. 
  66. ^ МИЯТА, ТАКАШИ; ЯСУНАГА, ТЕРУО; НИШИДА, ТОСИРО (1980). «Расхождение нуклеотидных последовательностей и функциональные ограничения в эволюции мРНК». Труды Национальной академии наук Соединенных Штатов Америки . 77 (12): 7328–7332. Bibcode :1980PNAS...77.7328M. doi : 10.1073/pnas.77.12.7328 . PMC 350496 . PMID  6938980. 
  67. ^ abcdefg Heames B, Schmitz J, Bornberg-Bauer E (май 2020 г.). «Континуум эволюционирующих De Novo генов обусловливает новизну кодирования белков у дрозофилы». Журнал молекулярной эволюции . 88 (4): 382–398. Bibcode : 2020JMolE..88..382H. doi : 10.1007/s00239-020-09939-z. PMC 7162840. PMID 32253450  . 
  68. ^ abc Durand É, Gagnon-Arsenault I, Hallin J, Hatin I, Dubé AK, Nielly-Thibault L, et al. (июнь 2019 г.). «Оборот рибосомно-ассоциированных транскриптов из de novo ORFs производит геноподобные характеристики, доступные для появления генов de novo в популяциях диких дрожжей». Genome Research . 29 (6): 932–943. doi : 10.1101/gr.239822.118 . PMC 6581059 . PMID  31152050. 
  69. ^ abcde Dowling D, Schmitz JF, Bornberg-Bauer E (ноябрь 2020 г.). «Стохастическое усиление и потеря новых транскрибированных открытых рамок считывания в человеческой линии». Genome Biology and Evolution . 12 (11): 2183–2195. doi :10.1093/gbe/evaa194. PMC 7674706. PMID  33210146 . 
  70. ^ ab Neme R, Tautz D (февраль 2013 г.). «Филогенетические закономерности появления новых генов подтверждают модель частой эволюции de novo». BMC Genomics . 14 : 117. doi : 10.1186/1471-2164-14-117 . PMC 3616865 . PMID  23433480. 
  71. ^ abcde Schmitz JF, Ullrich KK, Bornberg-Bauer E (октябрь 2018 г.). «Зарождающиеся de novo гены могут развиваться из замороженных случайностей, избежавших быстрого оборота транскриптов». Nature Ecology & Evolution . 2 (10): 1626–1632. Bibcode : 2018NatEE...2.1626S. doi : 10.1038/s41559-018-0639-7. PMID  30201962. S2CID  52181376.
  72. ^ ab Vakirlis N, Carvunis AR, McLysaght A (февраль 2020 г.). «Анализ на основе синтении показывает, что расхождение последовательностей не является основным источником генов-сирот». eLife . 9 . doi : 10.7554/eLife.53500 . PMC 7028367 . PMID  32066524. 
  73. ^ abc Palmieri N, Kosiol C, Schlötterer C (февраль 2014 г.). "Жизненный цикл сиротских генов дрозофилы". eLife . 3 : e01311. arXiv : 1401.4956 . Bibcode :2014arXiv1401.4956P. doi : 10.7554/eLife.01311 . PMC 3927632 . PMID  24554240. 
  74. ^ ab Prabh N, Roeseler W, Witte H, Eberhardt G, Sommer RJ, Rödelsperger C (ноябрь 2018 г.). "Pristionchus nematodes". Genome Research . 28 (11): 1664–1674. doi :10.1101/gr.234971.118. PMC 6211646. PMID  30232197 . 
  75. ^ ab Wissler L, Gadau J, Simola DF, Helmkampf M, Bornberg-Bauer E (2013). «Механизмы и динамика появления сиротских генов в геномах насекомых». Genome Biology and Evolution . 5 (2): 439–55. doi :10.1093/gbe/evt009. PMC 3590893. PMID  23348040 . 
  76. ^ abcd Schmitz JF, Chain FJ, Bornberg-Bauer E (август 2020 г.). «Эволюция новых генов в популяциях трехиглой колюшки». Наследственность . 125 (1–2): 50–59. doi :10.1038/s41437-020-0319-7. PMC 7413265. PMID  32499660 . 
  77. ^ Neme R, Tautz D (февраль 2016 г.). «Быстрый оборот транскрипции генома в ходе эволюции подвергает всю некодирующую ДНК появлению генов de novo». eLife . 5 : e09977. doi : 10.7554/eLife.09977 . PMC 4829534 . PMID  26836309. 
  78. ^ Kutter C, Watt S, Stefflova K, Wilson MD, Goncalves A, Ponting CP, Odom DT, Marques AC (2012). «Быстрый оборот длинных некодирующих РНК и эволюция экспрессии генов». PLOS Genetics . 8 (7): e1002841. doi : 10.1371/journal.pgen.1002841 . PMC 3406015. PMID  22844254 . 
  79. ^ abcde Reinhardt JA, Wanjiru BM, Brant AT, Saelao P, Begun DJ, Jones CD (2013). "Созданная de novo ORF в Drosophila важна для приспособленности организма и быстро эволюционировала из ранее некодирующих последовательностей". PLOS Genetics . 9 (10): e1003860. doi : 10.1371/journal.pgen.1003860 . PMC 3798262 . PMID  24146629. 
  80. ^ abc Gubala AM, Schmitz JF, Kearns MJ, Vinh TT, Bornberg-Bauer E, Wolfner MF, Findlay GD (май 2017 г.). «Гены Годдарда и Сатурна необходимы для мужской фертильности дрозофилы и могут возникнуть De Novo». Молекулярная биология и эволюция . 34 (5): 1066–1082. doi :10.1093/molbev/msx057. PMC 5400382. PMID  28104747 . 
  81. ^ abc Lange A, Patel PH, Heames B, Damry AM, Saenger T, Jackson CJ и др. (март 2021 г.). «Структурная и функциональная характеристика предполагаемого гена de novo у Drosophila». Nature Communications . 12 (1): 1667. Bibcode :2021NatCo..12.1667L. doi :10.1038/s41467-021-21667-6. PMC 7954818 . PMID  33712569. 
  82. ^ Zile K, Dessimoz C, Wurm Y, Masel J (август 2020 г.). «Только одно таксономически ограниченное семейство генов в подгруппе Drosophila melanogaster может быть идентифицировано с высокой степенью уверенности». Genome Biology and Evolution . 12 (8): 1355–1366. doi :10.1093/gbe/evaa127. PMC 8059200. PMID  32589737 . 
  83. ^ abc Zhuang X, Yang C, Murphy KR, Cheng CC (март 2019 г.). «Молекулярный механизм и история эволюции гена антифриза-гликопротеина от бессмысленного к смысловому у северных тресковых». Труды Национальной академии наук Соединенных Штатов Америки . 116 (10): 4400–4405. Bibcode : 2019PNAS..116.4400Z. doi : 10.1073/pnas.1817138116 . PMC 6410882. PMID  30765531 . 
  84. ^ ab Баалсруд Х.Т., Торресен ОК, Солбаккен М.Х., Зальцбургер В., Ханель Р., Якобсен К.С., Джентофт С. (март 2018 г.). «Геновая эволюция антифризных гликопротеинов De Novo у трески, выявленная с помощью данных полногеномной последовательности». Молекулярная биология и эволюция . 35 (3): 593–606. doi : 10.1093/molbev/msx311. ПМК 5850335 . ПМИД  29216381. 
  85. ^ Xie C, Bekpen C, Künzel S, Keshavarz M, Krebs-Wheaton R, Skrabar N и др. (август 2019 г.). «Ген, возникший de novo у домовой мыши, регулирует циклы беременности у самок». eLife . 8 . doi : 10.7554/eLife.44392 . PMC 6760900 . PMID  31436535. 
  86. ^ Li D, Dong Y, Jiang Y, Jiang H, Cai J, Wang W (апрель 2010 г.). «Ген, возникший de novo, подавляет путь спаривания почкующихся дрожжей и подавляется белком, кодируемым его антисмысловой цепью». Cell Research . 20 (4): 408–20. doi : 10.1038/cr.2010.31 . PMID  20195295.
  87. ^ Li D, Yan Z, Lu L, Jiang H, Wang W (декабрь 2014 г.). "Плейотропия гена MDF1, возникшего de novo". Scientific Reports . 4 : 7280. Bibcode :2014NatSR...4E7280L. doi :10.1038/srep07280. PMC 4250933 . PMID  25452167. 
  88. ^ ab Moutinho AF, Eyre-Walker A, Dutheil JY (сентябрь 2022 г.). «Убедительные доказательства в пользу модели адаптивной прогулки в эволюции генов у Drosophila и Arabidopsis». PLOS Biology . 20 (9): e3001775. doi : 10.1371/journal.pbio.3001775 . PMC 9470001. PMID  36099311 . 
  89. ^ abc Ekman D, Elofsson A (февраль 2010 г.). «Идентификация и количественная оценка последовательностей белков-сирот в грибах». Журнал молекулярной биологии . 396 (2): 396–405. doi :10.1016/j.jmb.2009.11.053. PMID  19944701.
  90. ^ Домазет-Лосо Т., Тауц Д. (октябрь 2003 г.). «Эволюционный анализ сиротских генов у дрозофилы». Genome Research . 13 (10): 2213–2219. doi :10.1101/gr.1311003. PMC 403679. PMID  14525923 . 
  91. ^ Guo WJ, Li P, Ling J, Ye SP (2007). "Значительные сравнительные характеристики между сиротскими и несиротскими генами в геноме риса (Oryza sativa L.)". Сравнительная и функциональная геномика . 2007 : 21676. doi : 10.1155/2007/21676 . PMC 2216055. PMID  18273382 . 
  92. ^ Wolf YI, Novichkov PS, Karev GP, Koonin EV, Lipman DJ (май 2009). «Универсальное распределение эволюционных скоростей генов и отличительные характеристики эукариотических генов разного видимого возраста». Труды Национальной академии наук Соединенных Штатов Америки . 106 (18): 7273–7280. doi : 10.1073/pnas.0901808106 . PMC 2666616. PMID  19351897 . 
  93. ^ ab Sun W, Zhao XW, Zhang Z (сентябрь 2015 г.). «Идентификация и эволюция сиротских генов у домашнего шелкопряда Bombyx mori». FEBS Letters . 589 (19 Pt B): 2731–2738. Bibcode : 2015FEBSL.589.2731S. doi : 10.1016/j.febslet.2015.08.008 . PMID  26296317.
  94. ^ abc Donoghue MT, Keshavaiah C, Swamidatta SH, Spillane C (февраль 2011 г.). "Эволюционное происхождение генов, специфичных для Brassicaceae, у Arabidopsis thaliana". BMC Evolutionary Biology . 11 (1): 47. Bibcode :2011BMCEE..11...47D. doi : 10.1186/1471-2148-11-47 . PMC 3049755 . PMID  21332978. 
  95. ^ abcd Werner MS, Sieriebriennikov B, Prabh N, Loschko T, Lanz C, Sommer RJ (ноябрь 2018 г.). «Молодые гены имеют различную структуру генов, эпигенетические профили и транскрипционную регуляцию». Genome Research . 28 (11): 1675–1687. doi :10.1101/gr.234872.118. PMC 6211652 . PMID  30232198. 
  96. ^ abcde Вакирлис Н., Хеберт А.С., Опуленте Д.А., Ахаз Г., Хиттингер К.Т., Фишер Г. и др. (март 2018 г.). «Молекулярный портрет генов De Novo в дрожжах». Молекулярная биология и эволюция . 35 (3): 631–645. doi : 10.1093/molbev/msx315. ПМЦ 5850487 . ПМИД  29220506. 
  97. ^ Foy SG, Wilson BA, Bertram J, Cordes MH, Masel J (апрель 2019 г.). «Изменение стратегии избегания агрегации знаменует долгосрочное направление эволюции белков». Genetics . 211 (4): 1345–1355. doi :10.1534/genetics.118.301719. PMC 6456324 . PMID  30692195. 
  98. ^ ab James JE, Willis SM, Nelson PG, Weibel C, Kosinski LJ, Masel J (январь 2021 г.). «Универсальные и таксон-специфические тенденции в последовательностях белков как функция возраста». eLife . 10 : e57347. doi : 10.7554/eLife.57347 . PMC 7819706 . PMID  33416492. 
  99. ^ ab Zhang JY, Zhou Q (январь 2019). «О регуляторной эволюции новых генов на протяжении их жизненной истории». Молекулярная биология и эволюция . 36 (1): 15–27. doi : 10.1093/molbev/msy206 . PMID  30395322. S2CID  53216993.
  100. ^ Wu B, Knudson A (июль 2018 г.). «Происхождение генов, кодирующих белки, у дрожжей de novo». mBio . 9 (4). doi :10.1128/mBio.01024-18. PMC 6069113 . PMID  30065088. 
  101. ^ ab Bekpen C, Xie C, Tautz D (август 2018 г.). «Работа с адаптивной иммунной системой во время эволюции генов de novo из межгенных последовательностей». BMC Evolutionary Biology . 18 (1): 121. Bibcode : 2018BMCEE..18..121B. doi : 10.1186/s12862-018-1232-z . PMC 6091031. PMID  30075701 . 
  102. ^ Pertea M, Shumate A, Pertea G, Varabyou A, Chang YC, Madugundu A и др. (2018). «Тысячи крупномасштабных экспериментов по секвенированию РНК дают полный список новых человеческих генов и выявляют обширный транскрипционный шум». bioRxiv . bioRxiv 10.1101/332825 . doi : 10.1101/332825 . 
  103. ^ ab Peng, Junhui; Zhao, Li (2023-06-27), "Происхождение и структурная эволюция генов de novo у Drosophila", BioRxiv: Сервер препринтов по биологии , doi : 10.1101/2023.03.13.532420, PMC 10326970 , PMID  37425675 , получено 2023-12-25 
  104. ^ Nielly-Thibault L, Landry CR (август 2019 г.). «Различия между сырьем и продуктами рождения генов de Novo могут быть результатом мутационных предубеждений». Genetics . 212 (4): 1353–1366. doi :10.1534/genetics.119.302187. PMC 6707459 . PMID  31227545. 
  105. ^ abc Vakirlis N, Acar O, Hsu B, Castilho Coelho N, Van Oss SB, Wacholder A и др. (февраль 2020 г.). "Возникновение de novo адаптивных мембранных белков из геномных последовательностей, богатых тимином". Nature Communications . 11 (1): 781. Bibcode :2020NatCo..11..781V. doi :10.1038/s41467-020-14500-z. PMC 7005711 . PMID  32034123. 
  106. ^ Kosinski L, Aviles N, Gomez K, Masel J (июнь 2022 г.). «Случайные пептиды, богатые небольшими и способствующими беспорядку аминокислотами, с меньшей вероятностью будут вредными». Genome Biology and Evolution . 14 (6): evac085. doi :10.1093/gbe/evac085. PMC 9210321. PMID  35668555. 
  107. ^ abc Basile W, Sachenkova O, Light S, Elofsson A (март 2017 г.). «Высокое содержание GC приводит к тому, что белки-сироты становятся внутренне неупорядоченными». PLOS Computational Biology . 13 (3): e1005375. Bibcode : 2017PLSCB..13E5375B . doi : 10.1371/journal.pcbi.1005375 . PMC 5389847. PMID  28355220. 
  108. ^ Bitard-Feildel T, Heberlein M, Bornberg-Bauer E, Callebaut I (декабрь 2015 г.). «Обнаружение сиротских доменов в Drosophila с использованием «гидрофобного кластерного анализа»". Biochimie . 119 : 244–53. doi : 10.1016/j.biochi.2015.02.019. PMID  25736992.
  109. ^ Мукерджи С., Панда А., Гош ТС. (июнь 2015 г.). «Выяснение эволюционных особенностей и функциональных последствий генов-сирот у Leishmania major ». Инфекция, генетика и эволюция . 32 : 330–7. Bibcode : 2015InfGE..32..330M. doi : 10.1016/j.meegid.2015.03.031. PMID  25843649.
  110. ^ abcdefghij Wilson BA, Foy SG, Neme R, Masel J (июнь 2017 г.). «Молодые гены сильно неупорядочены, как и предсказывает гипотеза преадаптации рождения генов de novo». Nature Ecology & Evolution . 1 (6): 0146–146. Bibcode :2017NatEE...1..146W. doi :10.1038/s41559-017-0146. PMC 5476217 . PMID  28642936. 
  111. ^ Jeon J, Choi J, Lee GW, Park SY, Huh A, Dean RA и др. (февраль 2015 г.). «Профилирование метилирования ДНК по всему геному дает представление об эпигенетической регуляции развития грибкового патогенного грибка Magnaporthe oryzae». Scientific Reports . 5 : 8567. Bibcode :2015NatSR...5E8567J. doi :10.1038/srep08567. PMC 4338423 . PMID  25708804. 
  112. ^ Bornberg-Bauer E, Hlouchova K, Lange A (июнь 2021 г.). «Структура и функция естественно эволюционировавших de novo белков». Current Opinion in Structural Biology . 68 : 175–183. doi : 10.1016/j.sbi.2020.11.010 . PMID  33567396.
  113. ^ Eicholt, Lars A.; Aubel, Margaux; Berk, Katrin; Bornberg-Bauer, Erich; Lange, Andreas (2022-07-13). "Гетерологичная экспрессия естественно эволюционировавших предполагаемых de novo белков с шаперонами". Protein Science . 31 (8). Wiley: e4371. doi :10.1002/pro.4371. ISSN  0961-8368. PMC 9278007 . PMID  35900020. 
  114. ^ Pan X, Ye P, Yuan DS, Wang X, Bader JS, Boeke JD (март 2006 г.). «Сеть целостности ДНК в дрожжах Saccharomyces cerevisiae». Cell . 124 (5): 1069–1081. doi : 10.1016/j.cell.2005.12.036 . PMID  16487579. S2CID  84338859.
  115. ^ Дэвид Л., Хубер В., Грановская М., Тоедлинг Дж., Палм К.Дж., Бофкин Л. и др. (апрель 2006 г.). «Карта транскрипции в геноме дрожжей с высоким разрешением». Труды Национальной академии наук Соединенных Штатов Америки . 103 (14): 5320–5325. Bibcode : 2006PNAS..103.5320D. doi : 10.1073/pnas.0601091103 . PMC 1414796. PMID  16569694 . 
  116. ^ Тиссёр М., Квапис М., Мориллон А. (ноябрь 2011 г.). «Повсеместная транскрипция - Уроки дрожжей». Биохимия . 93 (11): 1889–1896. дои : 10.1016/j.biochi.2011.07.001. ПМИД  21771634.
  117. ^ Nagalakshmi U, Wang Z, Waern K, Shou C, Raha D, Gerstein M, Snyder M (июнь 2008 г.). «Транскрипционный ландшафт генома дрожжей, определенный с помощью секвенирования РНК». Science . 320 (5881): 1344–1349. Bibcode :2008Sci...320.1344N. doi :10.1126/science.1158441. PMC 2951732 . PMID  18451266. 
  118. ^ Clark MB, Amaral PP, Schlesinger FJ, Dinger ME, Taft RJ, Rinn JL и др. (Июль 2011 г.). «Реальность всепроникающей транскрипции». PLOS Biology . 9 (7): e1000625, обсуждение e1001102. doi : 10.1371/journal.pbio.1000625 . PMC 3134446. PMID  21765801 . 
  119. ^ ab Ingolia NT, Brar GA, Stern-Ginossar N, Harris MS, Talhouarne GJ, Jackson SE и др. (сентябрь 2014 г.). «Профилирование рибосом выявляет всепроникающую трансляцию за пределами аннотированных генов, кодирующих белок». Cell Reports . 8 (5): 1365–1379. doi :10.1016/j.celrep.2014.07.045. PMC 4216110 . PMID  25159147. 
  120. ^ Руис-Орера Дж., Вердагер-Грау П., Вильянуэва-Каньяс Х.Л., Мессегер X, Альба М.М. (май 2018 г.). «Трансляция нейтрально эволюционирующих пептидов обеспечивает основу для эволюции генов de novo». Экология и эволюция природы . 2 (5): 890–896. Бибкод :2018NatEE...2..890R. дои : 10.1038/s41559-018-0506-6. hdl : 10230/36048 . PMID  29556078. S2CID  4959952.
  121. ^ Ruiz-Orera J, Messeguer X, Subirana JA, Alba MM (сентябрь 2014 г.). «Длинные некодирующие РНК как источник новых пептидов». eLife . 3 : e03523. arXiv : 1405.4174 . Bibcode :2014arXiv1405.4174R. doi : 10.7554/eLife.03523 . PMC 4359382 . PMID  25233276. 
  122. ^ abc Wilson BA, Masel J (2011). «Предположительно некодирующие транскрипты демонстрируют обширную связь с рибосомами». Genome Biology and Evolution . 3 : 1245–1252. doi :10.1093/gbe/evr099. PMC 3209793. PMID 21948395  . 
  123. ^ Chen J, Brunner AD, Cogan JZ, Nuñez JK, Fields AP, Adamson B и др. (март 2020 г.). «Всепроникающая функциональная трансляция неканонических человеческих открытых рамок считывания». Science . 367 (6482): 1140–1146. Bibcode :2020Sci...367.1140C. doi :10.1126/science.aay0262. PMC 7289059 . PMID  32139545. 
  124. ^ ab Silveira AB, Trontin C, Cortijo S, Barau J, Del Bem LE, Loudet O и др. (апрель 2013 г.). «Обширные природные эпигенетические вариации гена, возникшего de novo». ПЛОС Генетика . 9 (4): e1003437. дои : 10.1371/journal.pgen.1003437 . ПМЦ 3623765 . ПМИД  23593031. 
  125. ^ Кимминс С., Сассоне-Корси П. (март 2005 г.). «Ремоделирование хроматина и эпигенетические особенности зародышевых клеток». Nature . 434 (7033): 583–9. Bibcode :2005Natur.434..583K. doi :10.1038/nature03368. PMID  15800613. S2CID  4373304.
  126. ^ ab Papadopoulos C, Callebaut I, Gelly JC, Hatin I, Namy O, Renard M и др. (ноябрь 2021 г.). «Межгенные ORF как элементарные структурные модули рождения генов de novo и эволюции белков». Genome Research . 31 (12): 2303–2315. doi :10.1101/gr.275638.121. PMC 8647833 . PMID  34810219. 
  127. ^ ab Vakirlis, Nikolaos; Vance, Zoe; Duggan, Kate M.; McLysaght, Aoife (2022-12-20). "Рождение de novo функциональных микропротеинов в человеческой линии". Cell Reports . 41 (12): 111808. doi : 10.1016/j.celrep.2022.111808 . ISSN  2211-1247. PMC 10073203. PMID 36543139.  S2CID 254966620  . 
  128. ^ Dinger ME, Pang KC, Mercer TR, Mattick JS (ноябрь 2008 г.). «Дифференциация кодирующих белок и некодирующих РНК: проблемы и неоднозначности». PLOS Computational Biology . 4 (11): e1000176. Bibcode : 2008PLSCB...4E0176D. doi : 10.1371/journal.pcbi.1000176 . PMC 2518207. PMID  19043537 . 
  129. ^ Stewart NB, Rogers RL (сентябрь 2019 г.). «Хромосомные перестройки как источник формирования новых генов у Drosophila yakuba». PLOS Genetics . 15 (9): e1008314. doi : 10.1371/journal.pgen.1008314 . PMC 6776367. PMID  31545792 . 
  130. ^ Swanson WJ, Vacquier VD (февраль 2002 г.). «Быстрая эволюция репродуктивных белков». Nature Reviews Genetics . 3 (2): 137–44. doi :10.1038/nrg733. PMID  11836507. S2CID  25696990.
  131. ^ Бустаманте CD, Фледель-Алон А, Уильямсон С., Нильсен Р., Хубиш М.Т., Глановский С., Таненбаум Д.М., Уайт Т.Дж., Снински Дж.Дж., Эрнандес Р.Д., Чивелло Д., Адамс М.Д., Каргилл М., Кларк А.Г. (октябрь 2005 г.). «Естественный отбор генов, кодирующих белки, в геноме человека». Природа . 437 (7062): 1153–7. Бибкод : 2005Natur.437.1153B. дои : 10.1038/nature04240. PMID  16237444. S2CID  4423768.
  132. ^ Clark NL, Aagaard JE, Swanson WJ (январь 2006 г.). «Эволюция репродуктивных белков у животных и растений». Reproduction . 131 (1): 11–22. doi : 10.1530/rep.1.00357 . PMID  16388004.
  133. ^ Rivard EL, Ludwig AG, Patel PH, Grandchamp A, Arnold SE, Berger A и др. (сентябрь 2021 г.). «Предполагаемый de novo эволюционировавший ген, необходимый для конденсации хроматина сперматид у Drosophila melanogaster». PLOS Genetics . 17 (9): e1009787. doi : 10.1371/journal.pgen.1009787 . PMC 8445463. PMID  34478447 . 
  134. ^ Кридланд Дж. М., Маджане AC, Чжао Л., Бегун DJ (январь 2022 г.). «Популяционная биология генов de novo, экспрессируемых дополнительными железами, у Drosophila melanogaster». Генетика . 220 (1). дои : 10.1093/генетика/iyab207. ПМЦ 8733444 . ПМИД  34791207. 
  135. ^ Витт, Эван; Бенджамин, Сиги; Светец, Николас; Чжао, Ли (16 августа 2019 г.). Ландри, Кристиан Р.; Витткопп, Патрисия Дж.; Уайт-Купер, Хелен (ред.). «Testis single-cell RNA-seq reveals the dynamics of de novo gene transcription and germline mutational bias in Drosophila». eLife . 8 : e47138. doi : 10.7554/eLife.47138 . ISSN  2050-084X. PMC 6697446 . PMID  31418408. S2CID  198249413. 
  136. ^ abc Луис Вильянуэва-Каньяс Дж, Руис-Орера Дж, Агеа М.И., Галло М., Андреу Д., Альба М.М. (июль 2017 г.). «Новые гены и функциональные инновации у млекопитающих». Геномная биология и эволюция . 9 (7): 1886–1900. doi : 10.1093/gbe/evx136. ПМЦ 5554394 . ПМИД  28854603. 
  137. ^ Schmidt EE (июль 1996). «Транскрипционная промискуитетность в яичках». Current Biology . 6 (7): 768–9. Bibcode :1996CBio....6..768S. doi : 10.1016/S0960-9822(02)00589-4 . PMID  8805310. S2CID  14318566.
  138. ^ White-Cooper H, Davidson I (июль 2011 г.). «Уникальные аспекты регуляции транскрипции в мужских половых клетках». Cold Spring Harbor Perspectives in Biology . 3 (7): a002626. doi :10.1101/cshperspect.a002626. PMC 3119912. PMID 21555408  . 
  139. ^ Kleene KC (август 2001 г.). «Возможная мейотическая функция особых паттернов экспрессии генов в сперматогенных клетках млекопитающих». Механизмы развития . 106 (1–2): 3–23. doi : 10.1016/S0925-4773(01)00413-0 . PMID  11472831. S2CID  949694.
  140. ^ abcd Rajon E, Masel J (январь 2011 г.). «Эволюция молекулярных коэффициентов ошибок и последствия для эволюционируемости». Труды Национальной академии наук Соединенных Штатов Америки . 108 (3): 1082–7. Bibcode : 2011PNAS..108.1082R. doi : 10.1073 /pnas.1012918108 . PMC 3024668. PMID  21199946. 
  141. ^ Masel J (март 2006 г.). «Скрытые генетические вариации обогащаются для потенциальных адаптаций». Genetics . 172 (3): 1985–1991. doi :10.1534/genetics.105.051649. PMC 1456269 . PMID  16387877. 
  142. ^ Casola C (2018). «От de novo к «de nono»: большинство новых генов, кодирующих белок, идентифицированных с помощью филостратиграфии, представляют собой старые гены или недавние дубликаты». bioRxiv . bioRxiv 10.1101/287193 . doi : 10.1101/287193 . 
  143. ^ Уиллис С., Масел Дж. (сентябрь 2018 г.). «Рождение гена способствует структурному расстройству, кодируемому перекрывающимися генами». Генетика . 210 (1): 303–313. doi :10.1534/genetics.118.301249. PMC 6116962. PMID  30026186 . 
  144. ^ Abrusán G (декабрь 2013 г.). «Интеграция новых генов в клеточные сети и их структурное созревание». Genetics . 195 (4): 1407–1417. doi :10.1534/genetics.113.152256. PMC 3832282 . PMID  24056411. 
  145. ^ Giacomelli MG, Hancock AS, Masel J (февраль 2007 г.). «Преобразование 3'-UTR в кодирующие области». Молекулярная биология и эволюция . 24 (2): 457–464. doi :10.1093/molbev/msl172. PMC 1808353. PMID  17099057 . 
  146. ^ abc Bornberg-Bauer E, Schmitz J, Heberlein M (октябрь 2015 г.). «Появление белков de novo из «темной геномной материи» путем «медленного роста и линьки»". Труды биохимического общества . 43 (5): 867–873. doi :10.1042/BST20150089. PMID  26517896.
  147. ^ Wilder JA, Hewett EK, Gansner ME (декабрь 2009 г.). «Молекулярная эволюция GYPC: доказательства недавних структурных инноваций и положительного отбора у людей». Молекулярная биология и эволюция . 26 (12): 2679–2687. doi :10.1093/molbev/msp183. PMC 2775107. PMID  19679754 . 
  148. ^ Вахрушева АА, Казанов МД, Миронов АА, Базыкин ГА (февраль 2011). "Эволюция прокариотических генов путем сдвига стоп-кодонов". Журнал молекулярной эволюции . 72 (2): 138–146. Bibcode :2011JMolE..72..138V. doi :10.1007/s00239-010-9408-1. PMID  21082168. S2CID  812377.
  149. ^ Andreatta ME, Levine JA, Foy SG, Guzman LD, Kosinski LJ, Cordes MH, Masel J (май 2015 г.). «Недавнее происхождение белка C-Termini De Novo». Genome Biology and Evolution . 7 (6): 1686–1701. doi :10.1093/gbe/evv098. PMC 4494051. PMID  26002864 . 
  150. ^ Kleppe AS, Bornberg-Bauer E (ноябрь 2018 г.). «Надежность за счет внутренне неупорядоченных C-концов и трансляционного считывания». Nucleic Acids Research . 46 (19): 10184–10194. doi :10.1093/nar/gky778. PMC 6365619. PMID  30247639 . 
  151. ^ Klasberg S, Bitard-Feildel T, Callebaut I, Bornberg-Bauer E (июль 2018 г.). «Происхождение и структурные свойства новых и de novo доменов белков в ходе эволюции насекомых». Журнал FEBS . 285 (14): 2605–2625. doi : 10.1111/febs.14504 . PMID  29802682.
  152. ^ Deng C, Cheng CH, Ye H, He X, Chen L (декабрь 2010 г.). «Эволюция антифризного белка путем неофункционализации в условиях выхода из адаптивного конфликта». Труды Национальной академии наук Соединенных Штатов Америки . 107 (50): 21593–21598. Bibcode : 2010PNAS..10721593D. doi : 10.1073/pnas.1007883107 . PMC 3003108. PMID  21115821 . 
  153. ^ Лонг М., ВанКурен Н.В., Чен С., Вибрановски М.Д. (2013). «Новая эволюция генов: мало ли мы знали». Annual Review of Genetics . 47 : 307–333. doi :10.1146/annurev-genet-111212-133301. PMC 4281893. PMID  24050177 . 
  154. ^ Chen S, Krinsky BH, Long M (сентябрь 2013 г.). «Новые гены как драйверы фенотипической эволюции». Nature Reviews Genetics . 14 (9): 645–60. doi :10.1038/nrg3521. PMC 4236023. PMID  23949544 . 
  155. ^ Suenaga Y, Islam SM, Alagu J, Kaneko Y, Kato M, Tanaka Y и др. (январь 2014 г.). "NCYM, цис-антисмысловой ген MYCN, кодирует de novo эволюционировавший белок, который ингибирует GSK3β, что приводит к стабилизации MYCN в нейробластомах человека". PLOS Genetics . 10 (1): e1003996. doi : 10.1371/journal.pgen.1003996 . PMC 3879166 . PMID  24391509. 
  156. ^ Lin B, White JT, Ferguson C, Bumgarner R, Friedman C, Trask B и др. (февраль 2000 г.). «ЧАСТЬ-1: новый человеческий простатспецифический, регулируемый андрогенами ген, который отображается на хромосоме 5q12». Cancer Research . 60 (4): 858–63. PMID  10706094.
  157. ^ Kang M, Ren M, Li Y, Fu Y, Deng M, Li C (июль 2018 г.). «Экзосомно-опосредованный перенос lncRNA PART1 индуцирует резистентность к гефитинибу при плоскоклеточной карциноме пищевода, функционируя как конкурирующая эндогенная РНК». Журнал экспериментальных и клинических исследований рака . 37 (1): 171. doi : 10.1186/s13046-018-0845-9 . PMC 6063009. PMID  30049286 . (Отозвано, см. doi :10.1186/s13046-023-02648-7, PMID  37024914 . Если это преднамеренная ссылка на отозванную статью, замените на . ){{retracted|...}}{{retracted|...|intentional=yes}}
  158. ^ Самусик Н., Круковская Л., Мельн И., Шилов Е., Козлов А.П. (2013). «PBOV1 — это человеческий ген de novo с опухолеспецифической экспрессией, который связан с положительным клиническим исходом рака». PLOS ONE . ​​8 (2): e56162. Bibcode :2013PLoSO...856162S. doi : 10.1371/journal.pone.0056162 . PMC 3572036 . PMID  23418531. 
  159. ^ Guerzoni D, McLysaght A (апрель 2016 г.). «Гены de Novo возникают медленно, но устойчиво вдоль линии приматов и подвергаются неполной сортировке по линии». Genome Biology and Evolution . 8 (4): 1222–32. doi :10.1093/gbe/evw074. PMC 4860702. PMID  27056411 . 
  160. ^ Pekarsky Y, Rynditch A, Wieser R, Fonatsch C, Gardiner K (сентябрь 1997 г.). «Активация нового гена в 3q21 и идентификация транскриптов межгенного слияния с экотропным вирусным сайтом вставки I при лейкемии». Cancer Research . 57 (18): 3914–9. PMID  9307271.
  161. ^ Папамихос СИ, Маргаритис Д, Котсианидис И (2015). «Адаптивная эволюция в сочетании с экзаптацией ретротранспозона позволила создать ген, кодирующий специфический для человеческого белка, который способствует пролиферации раковых клеток и метастазированию как при гематологических злокачественных новообразованиях, так и при солидных опухолях: необычный случай гена MYEOV». Scientifica . 2015 : 984706. doi : 10.1155/2015/984706 . PMC 4629056. PMID  26568894 . 
  162. ^ ab Козлов АП (2016). "Экспрессия эволюционно новых генов в опухолях". Инфекционные агенты и рак . 11 : 34. doi : 10.1186/s13027-016-0077-6 . PMC 4949931. PMID  27437030 . 
  163. ^ Li CY, Zhang Y, Wang Z, Zhang Y, Cao C, Zhang PW и др. (март 2010 г.). «Человеческий специфический ген, кодирующий белок de novo, связанный с функциями человеческого мозга». PLOS Computational Biology . 6 (3): e1000734. Bibcode : 2010PLSCB...6E0734L. doi : 10.1371/journal.pcbi.1000734 . PMC 2845654. PMID  20376170 . 
  164. ^ ab Zhang YE, Landback P, Vibranovski MD, Long M (октябрь 2011 г.). «Ускоренное включение новых генов развития мозга в геном человека». PLOS Biology . 9 (10): e1001179. doi : 10.1371/journal.pbio.1001179 . PMC 3196496. PMID  22028629 . 
  165. ^ Wang J, Xie G, Singh M, Ghanbarian AT, Raskó T, Szvetnik A и др. (декабрь 2014 г.). «Транскрипция, управляемая эндогенным ретровирусом, специфичная для приматов, определяет наивно-подобные стволовые клетки» (PDF) . Nature . 516 (7531): 405–9. Bibcode : 2014Natur.516..405W. doi : 10.1038/nature13804. PMID  25317556. S2CID  205240839.
  166. ^ Dolstra H, Fredrix H, Maas F, Coulie PG, Brasseur F, Mensink E и др. (январь 1999 г.). «Минорный антиген гистосовместимости человека, специфичный для острого лимфобластного лейкоза В-клеток». Журнал экспериментальной медицины . 189 (2): 301–8. doi :10.1084/jem.189.2.301. PMC 2192993. PMID  9892612 . 
  167. ^ Hunter S, Apweiler R, Attwood TK, Bairoch A, Bateman A, Binns D и др. (январь 2009 г.). "InterPro: интегративная база данных сигнатур белков". Nucleic Acids Research . 37 (выпуск базы данных): D211-5. doi :10.1093/nar/gkn785. PMC 2686546. PMID  18940856 . 
  168. ^ Murphy DN, McLysaght A (2012). "Происхождение генов de novo кодирования белков у мышевидных грызунов". PLOS ONE . 7 (11): e48650. Bibcode : 2012PLoSO...748650M. doi : 10.1371/journal.pone.0048650 . PMC 3504067. PMID  23185269 . 
  169. ^ Zhang L, Ren Y, Yang T, Li G, Chen J, Gschwend AR и др. (апрель 2019 г.). «Быстрая эволюция разнообразия белков путем возникновения de novo в Oryza». Nature Ecology & Evolution . 3 (4): 679–690. Bibcode : 2019NatEE...3..679Z. doi : 10.1038/s41559-019-0822-5. PMID  30858588. S2CID  73728579.
  170. ^ Prabh N, Rödelsperger C (июль 2019 г.). «De Novo, дивергенция и смешанное происхождение способствуют появлению сиротских генов у нематод Pristionchus». G3 . 9 (7): 2277–2286. doi :10.1534/g3.119.400326. PMC 6643871 . PMID  31088903.