stringtranslate.com

Некодирующая ДНК

Последовательности некодирующей ДНК ( нкДНК ) являются компонентами ДНК организма , которые не кодируют белковые последовательности. Некоторые некодирующие ДНК транскрибируются в функциональные некодирующие молекулы РНК (например, транспортную РНК , микроРНК , пиРНК , рибосомальную РНК и регуляторные РНК ). Другие функциональные области фракции некодирующей ДНК включают регуляторные последовательности , которые контролируют экспрессию генов ; области прикрепления к каркасу ; точки начала репликации ДНК ; центромеры ; и теломеры . Некоторые некодирующие области, по-видимому, в основном нефункциональны, такие как интроны , псевдогены , межгенная ДНК и фрагменты транспозонов и вирусов . Области, которые полностью нефункциональны, называются мусорной ДНК .

Фракция некодирующей геномной ДНК

У бактерий кодирующие области обычно занимают 88% генома. [1] Оставшиеся 12% не кодируют белки, но большая их часть все еще имеет биологическую функцию через гены , где транскрипт РНК является функциональным (некодирующие гены) и регуляторные последовательности, что означает, что почти весь бактериальный геном имеет функцию. [1] Количество кодирующей ДНК у эукариот обычно составляет гораздо меньшую часть генома, поскольку эукариотические геномы содержат большое количество повторяющейся ДНК, не встречающейся у прокариот. Геном человека содержит где-то 1–2% кодирующей ДНК. [2] [3] Точное число неизвестно, поскольку существуют споры о количестве функциональных кодирующих экзонов и об общем размере генома человека. Это означает, что 98–99% генома человека состоит из некодирующей ДНК, и это включает в себя множество функциональных элементов, таких как некодирующие гены и регуляторные последовательности.

Размер генома у эукариот может варьироваться в широких пределах, даже между близкородственными видами. Это загадочное наблюдение изначально было известно как парадокс C-значения, где «C» относится к гаплоидному размеру генома. [4] Парадокс был разрешен с открытием того, что большинство различий было обусловлено расширением и сокращением повторяющейся ДНК, а не количеством генов. Некоторые исследователи предположили, что эта повторяющаяся ДНК в основном была мусорной ДНК . Причины изменений размера генома все еще выясняются, и эта проблема называется загадкой C-значения. [5]

Это привело к наблюдению, что количество генов, по-видимому, не коррелирует с воспринимаемыми представлениями о сложности, поскольку количество генов, по-видимому, относительно постоянно, проблема, названная парадоксом G-значения . [6] Например, сообщалось, что геном одноклеточного Polychaos dubium (ранее известного как Amoeba dubia ) содержит в 200 раз больше ДНК, чем у человека (т. е. более 600 миллиардов пар оснований против чуть более 3 миллиардов у человека). [7] Геном рыбы-собаки Takifugu rubripes составляет всего лишь одну восьмую часть генома человека, но, по-видимому, имеет сопоставимое количество генов. Гены занимают около 30% генома рыбы-собаки, а кодирующая ДНК - около 10%. (Некодирующая ДНК = 90%.) Уменьшенный размер генома рыбы-собаки обусловлен сокращением длины интронов и меньшим количеством повторяющейся ДНК. [8] [9]

Utricularia gibba , растение пузырчатки , имеет очень маленький ядерный геном (100,7 Мб) по сравнению с большинством растений. [10] [11] Вероятно, оно произошло от предкового генома размером 1500 Мб. [11] Геном пузырчатки имеет примерно такое же количество генов, как и другие растения, но общее количество кодирующей ДНК составляет около 30% генома. [10] [11]

Остальная часть генома (70% некодирующей ДНК) состоит из промоторов и регуляторных последовательностей, которые короче, чем у других видов растений. [10] Гены содержат интроны, но их меньше, и они меньше, чем интроны в других геномах растений. [10] Есть некодирующие гены, включая множество копий генов рибосомной РНК. [11] Геном также содержит последовательности теломер и центромеры, как и ожидалось. [11] Большая часть повторяющейся ДНК, наблюдаемой у других эукариот, была удалена из генома пузырчатки с тех пор, как эта линия отделилась от таковых у других растений. Около 59% генома пузырчатки состоит из последовательностей, связанных с транспозонами, но поскольку геном намного меньше других геномов, это представляет собой значительное сокращение количества этой ДНК. [11] Авторы оригинальной статьи 2013 года отмечают, что утверждения о наличии дополнительных функциональных элементов в некодирующей ДНК животных, по-видимому, не применимы к геномам растений. [10]

Согласно статье в New York Times, в ходе эволюции этого вида «… генетический мусор, который не служил никакой цели, был удален, а необходимый материал был сохранен». [12] По словам Виктора Альберта из Университета Буффало, растение способно удалить свою так называемую мусорную ДНК и «иметь совершенно хорошее многоклеточное растение с множеством различных клеток, органов, типов тканей и цветов, и вы можете обойтись без мусора. Мусор не нужен». [13]

Типы некодирующих последовательностей ДНК

Некодирующие гены

Существует два типа генов : гены, кодирующие белок, и некодирующие гены . [14] Некодирующие гены являются важной частью некодирующей ДНК и включают гены для транспортной РНК и рибосомальной РНК . Эти гены были открыты в 1960-х годах. Геномы прокариот содержат гены для ряда других некодирующих РНК, но гены некодирующих РНК гораздо более распространены у эукариот.

Типичные классы некодирующих генов у эукариот включают гены малых ядерных РНК (мяРНК), малых ядрышковых РНК (мРНК), микроРНК (миРНК), коротких интерферирующих РНК (siРНК), взаимодействующих с PIWI РНК (пиРНК) и длинных некодирующих РНК (днРНК). Кроме того, существует ряд уникальных генов РНК, которые производят каталитические РНК . [15]

Некодирующие гены составляют всего несколько процентов прокариотических геномов [16], но они могут составлять значительно более высокую долю в эукариотических геномах. [17] У людей некодирующие гены занимают не менее 6% генома, в основном потому, что существуют сотни копий генов рибосомной РНК. [ необходима цитата ] Гены, кодирующие белок, занимают около 38% генома; эта доля намного выше, чем кодирующая область, поскольку гены содержат большие интроны. [ необходима цитата ]

Общее количество некодирующих генов в геноме человека является спорным. Некоторые ученые считают, что существует всего около 5000 некодирующих генов, в то время как другие полагают, что их может быть более 100000 (см. статью о некодирующих РНК ). Разница во многом обусловлена ​​дебатами о количестве генов lncRNA. [18]

Промоторы и регуляторные элементы

Промоторы — это сегменты ДНК вблизи 5'-конца гена, где начинается транскрипция. Это сайты, где РНК-полимераза связывается для инициации синтеза РНК. У каждого гена есть некодирующий промотор.

Регуляторные элементы — это сайты, которые контролируют транскрипцию близлежащего гена. Они почти всегда являются последовательностями, где факторы транскрипции связываются с ДНК, и эти факторы транскрипции могут либо активировать транскрипцию (активаторы), либо подавлять транскрипцию (репрессоры). Регуляторные элементы были открыты в 1960-х годах, а их общие характеристики были разработаны в 1970-х годах путем изучения специфических факторов транскрипции у бактерий и бактериофагов . [ необходима цитата ]

Промоторы и регуляторные последовательности представляют собой обильный класс некодирующей ДНК, но они в основном состоят из набора относительно коротких последовательностей, поэтому они не занимают слишком большую часть генома. Точное количество регуляторной ДНК в геноме млекопитающих неясно, поскольку трудно отличить ложные сайты связывания факторов транскрипции от тех, которые являются функциональными. Характеристики связывания типичных ДНК-связывающих белков были охарактеризованы в 1970-х годах, а биохимические свойства факторов транскрипции предсказывают, что в клетках с большими геномами большинство сайтов связывания не будут биологически функциональными. [ необходима цитата ]

Многие регуляторные последовательности находятся вблизи промоторов, обычно выше сайта начала транскрипции гена. Некоторые находятся внутри гена, а некоторые расположены ниже сайта терминации транскрипции. У эукариот есть некоторые регуляторные последовательности, которые находятся на значительном расстоянии от области промотора. Эти отдаленные регуляторные последовательности часто называют энхансерами , но строгого определения энхансера, которое отличает его от других сайтов связывания факторов транскрипции, не существует. [19] [20]

Интроны

Иллюстрация несплайсированного предшественника пре-мРНК с пятью интронами и шестью экзонами (вверху). После удаления интронов с помощью сплайсинга зрелая последовательность мРНК готова к трансляции (внизу).

Интроны — это части гена, которые транскрибируются в последовательность РНК-предшественника , но в конечном итоге удаляются сплайсингом РНК во время обработки в зрелую РНК. Интроны встречаются в обоих типах генов: генах, кодирующих белок, и некодирующих генах. Они присутствуют в прокариотах, но гораздо чаще встречаются в геномах эукариот. [ необходима цитата ]

Интроны группы I и группы II занимают лишь небольшой процент генома, когда они присутствуют. Сплайсосомные интроны (см. рисунок) встречаются только у эукариот и могут составлять существенную часть генома. Например, у людей интроны в генах, кодирующих белки, занимают 37% генома. Объединение этого с примерно 1% кодирующих последовательностей означает, что гены, кодирующие белки, занимают около 38% генома человека. Расчеты для некодирующих генов более сложны, поскольку существуют значительные споры относительно общего числа некодирующих генов, но рассмотрение только четко определенных примеров означает, что некодирующие гены занимают по крайней мере 6% генома. [21] [2]

Непереведенные регионы

Стандартные учебники по биохимии и молекулярной биологии описывают некодирующие нуклеотиды в мРНК, расположенные между 5'-концом гена и кодоном инициации трансляции. Эти регионы называются 5'-нетранслируемыми регионами или 5'-UTR. Похожие регионы, называемые 3'-нетранслируемыми регионами (3'-UTR), находятся в конце гена. 5'-UTR и 3'UTR очень короткие у бактерий, но они могут быть длиной в несколько сотен нуклеотидов у эукариот. Они содержат короткие элементы, которые контролируют инициацию трансляции (5'-UTR) и терминацию транскрипции (3'-UTR), а также регуляторные элементы, которые могут контролировать стабильность мРНК, процессинг и нацеливание на различные регионы клетки. [22] [23] [24]

Истоки репликации

Синтез ДНК начинается в определенных местах, называемых точками начала репликации . Это области генома, где собирается механизм репликации ДНК, и ДНК раскручивается, чтобы начать синтез ДНК. В большинстве случаев репликация происходит в обоих направлениях от точки начала репликации.

Главными особенностями точек начала репликации являются последовательности, в которых связаны определенные инициирующие белки. Типичная точка начала репликации охватывает около 100-200 пар оснований ДНК. Прокариоты имеют одну точку начала репликации на хромосому или плазмиду, но в эукариотических хромосомах обычно имеется несколько точек начала репликации. Геном человека содержит около 100 000 точек начала репликации, что составляет около 0,3% генома. [25] [26] [27]

Центромеры

Схематическая кариограмма человека, показывающая обзор человеческого генома в G-бэндинге , где некодирующая ДНК присутствует в центромерах (показана как узкий сегмент каждой хромосомы), а также встречается в большей степени в более темных ( GC-бедных ) областях. [28]

Центромеры — это участки, где веретенообразные волокна прикрепляются к вновь реплицированным хромосомам, чтобы разделить их на дочерние клетки при делении клетки. Каждая эукариотическая хромосома имеет одну функциональную центромеру, которая рассматривается как суженная область в конденсированной метафазной хромосоме. Центромерная ДНК состоит из ряда повторяющихся последовательностей ДНК, которые часто занимают значительную часть генома, поскольку каждая центромера может иметь длину в миллионы пар оснований. Например, у людей были определены последовательности всех 24 центромер [29] , и они составляют около 6% генома. Однако маловероятно, что вся эта некодирующая ДНК необходима, поскольку существует значительная вариация в общем количестве центромерной ДНК у разных людей. [30] Центромеры — это еще один пример функциональных некодирующих последовательностей ДНК, которые известны уже почти полвека, и вполне вероятно, что они более распространены, чем кодирующая ДНК.

Теломеры

Теломеры — это области повторяющейся ДНК на конце хромосомы , которые обеспечивают защиту от хромосомной деградации во время репликации ДНК . Недавние исследования показали, что теломеры функционируют, помогая своей собственной стабильности. Теломерные повторы, содержащие РНК (TERRA), представляют собой транскрипты, полученные из теломер. Было показано, что TERRA поддерживает активность теломеразы и удлиняет концы хромосом. [31]

Места крепления лесов

Геномы как прокариот, так и эукариот организованы в большие петли ДНК, связанной с белком. У эукариот основания петель называются областями прикрепления каркаса (SAR), и они состоят из участков ДНК, которые связывают комплекс РНК/белок для стабилизации петли. В геноме человека насчитывается около 100 000 петель, и каждая из них состоит примерно из 100 п.н. ДНК. Общее количество ДНК, выделенной для SAR, составляет около 0,3% генома человека. [32]

Псевдогены

Псевдогены — это в основном бывшие гены, которые стали нефункциональными из-за мутации, но этот термин также относится к неактивным последовательностям ДНК, которые получены из РНК, произведенных функциональными генами ( обработанные псевдогены ). Псевдогены — это лишь небольшая часть некодирующей ДНК в прокариотических геномах, поскольку они устраняются отрицательным отбором. Однако у некоторых эукариот псевдогены могут накапливаться, поскольку отбор недостаточно силен, чтобы устранить их (см. Почти нейтральная теория молекулярной эволюции ).

Геном человека содержит около 15 000 псевдогенов, полученных из генов, кодирующих белки, и неизвестное количество, полученное из некодирующих генов. [33] Они могут охватывать значительную часть генома (~5%), поскольку многие из них содержат бывшие интронные последовательности.

Псевдогены по определению являются мусорной ДНК и развиваются с нейтральной скоростью, как и ожидалось для мусорной ДНК. [34] Некоторые бывшие псевдогены вторично приобрели функцию, и это заставляет некоторых ученых предполагать, что большинство псевдогенов не являются мусором, поскольку у них есть еще не открытая функция. [35]

Повторяющиеся последовательности, транспозоны и вирусные элементы

Мобильные генетические элементы в клетке (слева) и как они могут быть приобретены (справа)

Транспозоны и ретротранспозоны являются мобильными генетическими элементами . Повторяющиеся последовательности ретротранспозонов , которые включают длинные вкрапленные ядерные элементы (LINE) и короткие вкрапленные ядерные элементы (SINE), составляют большую часть геномных последовательностей у многих видов. Последовательности Alu , классифицируемые как короткие вкрапленные ядерные элементы, являются наиболее распространенными мобильными элементами в геноме человека. Было обнаружено несколько примеров того, как SINE осуществляют транскрипционный контроль некоторых генов, кодирующих белки. [36] [37] [38]

Эндогенные ретровирусные последовательности являются продуктом обратной транскрипции ретровирусных геномов в геномы зародышевых клеток . Мутация в этих ретротранскрибированных последовательностях может инактивировать вирусный геном. [39 ]

Более 8% человеческого генома состоит из (в основном разложившихся) эндогенных ретровирусных последовательностей, как часть более 42% фракции, которая узнаваемо получена из ретротранспозонов, в то время как еще 3% можно идентифицировать как остатки ДНК-транспозонов . Большая часть оставшейся половины генома, которая в настоящее время не имеет объясненного происхождения, как ожидается, берет свое начало в мобильных элементах, которые были активны так давно (> 200 миллионов лет), что случайные мутации сделали их неузнаваемыми. [40] Изменение размера генома по крайней мере у двух видов растений в основном является результатом последовательностей ретротранспозонов. [41] [42]

Высокоповторяющаяся ДНК

Высокоповторяющаяся ДНК состоит из коротких участков ДНК, которые повторяются много раз в тандеме (один за другим). Повторяющиеся сегменты обычно имеют длину от 2 до 10 пар оснований, но известны и более длинные. Высокоповторяющаяся ДНК редко встречается у прокариот, но распространена у эукариот, особенно с большими геномами. Иногда ее называют сателлитной ДНК .

Большая часть высокоповторяющейся ДНК находится в центромерах и теломерах (см. выше), и большая ее часть функциональна, хотя некоторые могут быть избыточными. Другая значительная часть находится в коротких тандемных повторах (STR; также называемых микросателлитами ), состоящих из коротких участков простого повтора, такого как ATC. В геноме человека около 350 000 STR, и они разбросаны по всему геному со средней длиной около 25 повторов. [43] [44]

Изменения в количестве повторов STR могут вызывать генетические заболевания, когда они находятся внутри гена, но большинство этих областей, по-видимому, являются нефункциональной мусорной ДНК, где количество повторов может значительно варьироваться от человека к человеку. Вот почему эти различия в длине широко используются в ДНК-дактилоскопии .

Мусорная ДНК

Мусорная ДНК — это ДНК, которая не имеет биологически значимой функции, такой как псевдогены и фрагменты некогда активных транспозонов. Бактерии и вирусные геномы имеют очень мало мусорной ДНК [45] [46], но некоторые эукариотические геномы могут иметь значительное количество мусорной ДНК. [47] Точное количество нефункциональной ДНК у людей и других видов с большими геномами не было определено, и в научной литературе существуют значительные противоречия. [48] [49]

Нефункциональная ДНК в бактериальных геномах в основном находится в межгенной фракции некодирующей ДНК, но в эукариотических геномах она может быть также обнаружена в интронах . Существует множество примеров функциональных элементов ДНК в некодирующей ДНК, и ошибочно приравнивать некодирующую ДНК к мусорной ДНК.

Исследования ассоциаций по всему геному (GWAS) и некодирующая ДНК

Исследования ассоциаций по всему геному (GWAS) выявляют связи между аллелями и наблюдаемыми признаками, такими как фенотипы и заболевания. Большинство ассоциаций возникают между полиморфизмами одного нуклеотида (SNP) и изучаемым признаком, и большинство этих SNP находятся в нефункциональной ДНК. Ассоциация устанавливает связь, которая помогает картировать область ДНК, ответственную за признак, но она не обязательно выявляет мутации, вызывающие заболевание или фенотипическое различие. [50] [51] [52] [53] [54]

SNP, которые тесно связаны с признаками, с наибольшей вероятностью идентифицируют причинную мутацию. (Такая связь называется неравновесным сцеплением ). Около 12% этих полиморфизмов обнаружены в кодирующих областях; около 40% расположены в интронах; а большинство остальных находятся в межгенных областях, включая регуляторные последовательности. [51]

Смотрите также

Ссылки

  1. ^ ab Kirchberger PC, Schmidt ML и Ochman H (2020). «Изобретательность бактериальных геномов». Annual Review of Microbiology . 74 : 815–834. doi : 10.1146/annurev-micro-020518-115822. PMID  32692614. S2CID  220699395.
  2. ^ ab Piovesan A, Antonaros F, Vitale L, Strippoli P, Pelleri MC, Caracausi M (2019). «Гены, кодирующие человеческие белки, и статистика особенностей генов в 2019 году». BMC Research Notes . 12 (1): 315. doi : 10.1186/s13104-019-4343-8 . PMC 6549324. PMID  31164174 . 
  3. ^ Omenn GS (2021). «Размышления о проекте HUPO Human Proteome Project, флагманском проекте Human Proteome Organization, через 10 лет». Молекулярная и клеточная протеомика . 20 : 100062. doi : 10.1016/j.mcpro.2021.100062. PMC 8058560. PMID  33640492 . 
  4. ^ Томас CA (1971). «Генетическая организация хромосом». Annual Review of Genetics . 5 : 237–256. doi :10.1146/annurev.ge.05.120171.001321. PMID  16097657.
  5. ^ Эллиотт TA, Грегори TR (2015). «Что находится в геноме? Загадка C-значения и эволюция содержимого эукариотического генома». Phil. Trans. R. Soc. B . 370 (1678): 20140331. doi :10.1098/rstb.2014.0331. PMC 4571570 . PMID  26323762. S2CID  12095046. 
  6. ^ Hahn MW, Wray GA (2002). «Парадокс g-значения». Эволюция и развитие . 4 (2): 73–75. doi :10.1046/j.1525-142X.2002.01069.x. PMID  12004964. S2CID  2810069.
  7. ^ Gregory TR, Hebert PD (апрель 1999). «Модуляция содержания ДНК: приблизительные причины и конечные последствия». Genome Research . 9 (4): 317–324. doi : 10.1101/gr.9.4.317 . PMID  10207154. S2CID  16791399.
  8. ^ Aparicio S, Chapman J, Stupka E, Putnam N, Chia JM, Dehal P, Christoffels A, Rash S, Hoon S, Smit A (2002). «Полногеномная дробовая сборка и анализ генома Fugu rubripes». Science . 297 (5585): 1301–1310. Bibcode :2002Sci...297.1301A. doi :10.1126/science.1072104. PMID  12142439. S2CID  10310355.
  9. ^ Ohno S (1972). «Столько «мусорной» ДНК в нашем геноме». Brookhaven Symposia in Biology . 23 : 366–370. OCLC  101819442. PMID  5065367.
  10. ^ abcde Ибарра-Лаклетт Э., Лайонс Э., Эрнандес-Гусман Г., Перес-Торрес К.А., Карретеро-Паулет Л., Чанг Т.Х., Лан Т., Уэлч А.Дж., Хуарес М.Дж., Симпсон Дж. и др. (2013). «Архитектура и эволюция мельчайшего генома растения». Природа . 498 (7452): 94–98. Бибкод : 2013Natur.498...94I. дои : 10.1038/nature12132. ПМЦ 4972453 . PMID  23665961. S2CID  18219754. 
  11. ^ abcdef Lan T, Renner T, Ibarra-Laclette E, Farr KM, Chang TH, Cervantes-Pérez SA, Zheng C, Sankoff D, Tang H и Purbojati RW (2017). «Длиннопрочитанное секвенирование раскрывает адаптивную топографию генома плотоядного растения». Труды Национальной академии наук . 114 (22 ) : E4435–E4441. Bibcode : 2017PNAS..114E4435L. doi : 10.1073/pnas.1702072114 . PMC 5465930. PMID  28507139. 
  12. ^ Klein J (19 мая 2017 г.). «Генетическая уборка превратила горбатые пузырчатые в плотоядные растения». New York Times . Получено 30 мая 2022 г.
  13. ^ Hsu C, and Stolte D (13 мая 2013 г.). «Плотоядное растение выбрасывает «мусорную» ДНК» (пресс-релиз). Тусон, Аризона, США: Университет Аризоны . Получено 29 мая 2022 г.
  14. ^ Кампуракис К (2017). Ощущение генов . Кембридж, Великобритания: Cambridge University Press. ISBN 978-1-107-12813-2.[ нужна страница ]
  15. ^ Cech TR, Steitz JA (2014). «Революция некодирующих РНК — отмена старых правил к созданию новых». Cell . 157 (1): 77–94. doi : 10.1016/j.cell.2014.03.008 . PMID  24679528. S2CID  14852160.
  16. ^ Рогозин ИБ, Макарова КС, Натале ДА, Спиридонов АН, Татусов РЛ, Вольф ЮИ и др. (Октябрь 2002 г.). «Конгруэнтная эволюция различных классов некодирующей ДНК в прокариотических геномах». Nucleic Acids Research . 30 (19): 4264–4271. doi :10.1093/nar/gkf549. PMC 140549 . PMID  12364605. 
  17. ^ Белявски JP, Джонс C (2016). «Адаптивная молекулярная эволюция: методы обнаружения». Энциклопедия эволюционной биологии . С. 16–25. doi :10.1016/B978-0-12-800049-6.00171-2. ISBN 978-0-12-800426-5.
  18. ^ Ponting CP и Haerty W (2022). «Полногеномный анализ длинных некодирующих РНК человека: провокационный обзор». Annual Review of Genomics and Human Genetics . 23 : 153–172. doi : 10.1146/annurev-genom-112921-123710 . hdl : 20.500.11820/ede40d70-b99c-42b0-a378-3b9b7b256a1b . PMID  35395170. S2CID  248049706.
  19. ^ Compe E, Egly JM (2021). «Долгий путь к пониманию инициации транскрипции RNAPII и связанных с ней синдромов». Annual Review of Biochemistry . 90 : 193–219. doi : 10.1146/annurev-biochem-090220-112253. PMID  34153211. S2CID  235595550.
  20. ^ Visel A, Rubin EM, Pennacchio LA (сентябрь 2009 г.). «Геномные представления об энхансерах дистанционного действия». Nature . 461 (7261): 199–205. Bibcode :2009Natur.461..199V. doi :10.1038/nature08451. PMC 2923221 . PMID  19741700. 
  21. ^ Harrow J, Frankish A, Gonzalez JM, Tapanari E, Diekhans M, Kokocinski F, Aken BL, Barrell D, Zadissa A, Searle S (2012). "GENCODE: справочная аннотация генома человека для проекта ENCODE". Genome Research . 22 (9): 1760–1774. doi :10.1101/gr.135350.111. PMC 3431492. PMID  22955987 . 
  22. ^ Альбертс Б., Брей Д., Льюис Дж., Рафф М., Робертс К., Уотсон Дж. Д. (1994). Молекулярная биология клетки, 3-е издание . Лондон, Великобритания: Garland Publishing Inc.[ нужна страница ]
  23. ^ Левин Б. (2004). Гены VIII . Аппер Сэдл Ривер, Нью-Джерси, США: Pearson/Prentice Hall.[ нужна страница ]
  24. ^ Moran L, Horton HR, Scrimgeour KG, Perry MD (2012). Принципы биохимии, пятое издание . Upper Saddle River, NJ, США: Pearson.[ нужна страница ]
  25. ^ Leonard AC, Méchali M (2013). «Истоки репликации ДНК». Cold Spring Harbor Perspectives in Biology . 5 (10): a010116. doi :10.1101/cshperspect.a010116. PMC 3783049. PMID 23838439  . 
  26. ^ Urban JM, Foulk MS, Casella C, Gerbi SA (2015). «Поиск источников репликации ДНК у многоклеточных эукариот». F1000Prime Reports . 7 : 30. doi : 10.12703/P7-30 . PMC 4371235. PMID  25926981 . 
  27. ^ Prioleau M, MacAlpine DM (2016). «Истоки репликации ДНК — с чего мы начинаем?». Genes & Development . 30 (15): 1683–1697. doi :10.1101/gad.285114.116. PMC 5002974. PMID  27542827 . 
  28. ^ Romiguier J, Roux C (2017). «Аналитические смещения, связанные с содержанием GC в молекулярной эволюции». Frontiers in Genetics . 8 : 16. doi : 10.3389/fgene.2017.00016 . PMC 5309256. PMID  28261263 . 
  29. ^ Альтемос Н., Логсдон Г.А., Бзикадзе А.В., Сидхвани П., Лэнгли С.А., Калдас Г.В. и др. (2021). «Полные геномные и эпигенетические карты центромер человека». Наука . 376 (6588): 56. doi :10.1126/science.abl4178. ПМЦ 9233505 . PMID  35357911. S2CID  247853627. 
  30. ^ Miga KH (2019). «Центромерные сателлитные ДНК: скрытая вариация последовательностей в популяции человека». Гены . 10 (5): 353. doi : 10.3390/genes10050352 . PMC 6562703. PMID  31072070 . 
  31. ^ Cusanelli E, Chartrand P (май 2014). «Теломерная некодирующая РНК: РНК, содержащая теломерные повторы, в биологии теломер». Wiley Interdisciplinary Reviews. РНК . 5 (3): 407–419. doi :10.1002/wrna.1220. PMID  24523222. S2CID  36918311.
  32. ^ Mistreli T (2020). «Самоорганизующийся геном: принципы архитектуры и функции генома». Cell . 183 (1): 28–45. doi :10.1016/j.cell.2020.09.014. PMC 7541718 . PMID  32976797. 
  33. ^ "Ансамбль человеческого референсного генома GRCh38.p13".
  34. ^ Xu J, Zhang J (2015). «Функциональны ли человеческие транслируемые псевдогены?». Молекулярная биология и эволюция . 33 (3): 755–760. doi :10.1093/molbev/msv268. PMC 5009996. PMID  26589994 . 
  35. ^ Wen YZ, Zheng LL, Qu LH, Ayala FJ, Lun ZR (2012). «Псевдогены больше не псевдо». RNA Biology . 9 (1): 27–32. doi : 10.4161/rna.9.1.18277 . PMID  22258143. S2CID  13161678.
  36. ^ Ponicsan SL, Kugel JF, Goodrich JA (апрель 2010 г.). «Геномные драгоценности: SINE РНК регулируют производство мРНК». Current Opinion in Genetics & Development . 20 (2): 149–155. doi :10.1016/j.gde.2010.01.004. PMC 2859989. PMID  20176473 . 
  37. ^ Häsler J, Samuelsson T, Strub K (июль 2007 г.). «Полезный „мусор“: Alu РНК в транскриптоме человека». Cellular and Molecular Life Sciences (Представленная рукопись). 64 (14): 1793–1800. doi :10.1007/s00018-007-7084-0. PMC 11136058 . PMID  17514354. S2CID  5938630. 
  38. ^ Walters RD, Kugel JF, Goodrich JA (август 2009 г.). «Неоценимый мусор: клеточное воздействие и функция Alu и B2 РНК». IUBMB Life . 61 (8): 831–837. doi :10.1002/iub.227. PMC 4049031. PMID  19621349 . 
  39. ^ Nelson PN, Hooley P, Roden D, Davari Ejtehadi H, Rylance P, Warren P, et al. (Октябрь 2004 г.). «Человеческие эндогенные ретровирусы: транспонируемые элементы с потенциалом?». Clinical and Experimental Immunology . 138 (1): 1–9. doi :10.1111/j.1365-2249.2004.02592.x. PMC 1809191. PMID  15373898. 
  40. ^ Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, et al. (Февраль 2001). «Первоначальное секвенирование и анализ генома человека». Nature . 409 (6822): 860–921. Bibcode :2001Natur.409..860L. doi : 10.1038/35057062 . hdl : 2027.42/62798 . PMID  11237011.
  41. ^ Piegu B, Guyot R, Picault N, Roulin A, Sanyal A, Saniyal A и др. (октябрь 2006 г.). «Удвоение размера генома без полиплоидизации: динамика геномных расширений, вызванных ретротранспозицией, у Oryza australiensis, дикого родственника риса». Genome Research . 16 (10): 1262–1269. doi :10.1101/gr.5290206. PMC 1581435 . PMID  16963705. 
  42. ^ Hawkins JS, Kim H, Nason JD, Wing RA, Wendel JF (октябрь 2006 г.). «Дифференциальная специфическая для линии амплификация мобильных элементов ответственна за вариации размера генома у Gossypium». Genome Research . 16 (10): 1252–1261. doi :10.1101/gr.5282906. PMC 1581434 . PMID  16954538. 
  43. ^ Gymrek M, Willems T, Guilmatre A, Zeng H, Markus B, Georgiev S, Daly MJ, Price AL, Pritchard JK, Sharp AJ, Erlich Y (2016). «Обильный вклад коротких тандемных повторов в вариабельность экспрессии генов у людей». Nature Genetics . 48 (1): 22–29. doi :10.1038/ng.3461. PMC 4909355 . PMID  26642241. 
  44. ^ Kronenberg ZN, Fiddes IT, Gordon D, Murali S, Cantsilieris S, Meyerson OS, Underwood JG, Nelson BJ, Chaisson MJ, Dougherty ML (2018). "Высокоразрешающий сравнительный анализ геномов высших приматов". Science . 360 (6393): 1085. doi :10.1126/science.aar6343. PMC 6178954 . PMID  29880660. 
  45. ^ Gil R и Latorre A (2012). «Факторы, лежащие в основе мусорной ДНК у бактерий». Genes . 3 (4): 634–650. doi : 10.3390/genes3040634 . PMC 3899985 . PMID  24705080. 
  46. ^ Брандес, Надав; Линиал, Михал (2016). «Перекрытие генов и ограничения размера в вирусном мире». Biology Direct . 11 (1): 26. doi : 10.1186/s13062-016-0128-3 . ISSN  1745-6150. PMC 4875738. PMID 27209091  . 
  47. ^ Palazzo AF, Gregory TR (май 2014 г.). «Дело в пользу мусорной ДНК». PLOS Genetics . 10 (5): e1004351. doi : 10.1371/journal.pgen.1004351 . PMC 4014423. PMID  24809441 . 
  48. ^ Моранж, Мишель (2014). «Геном как многоцелевая структура, созданная эволюцией» (PDF) . Перспективы в биологии и медицине . 57 (1): 162–171. doi :10.1353/pbm.2014.0008. PMID  25345709. S2CID  27613442.
  49. ^ Haerty W и Ponting CP (2014). «Ни один ген в геноме не имеет смысла, кроме как в свете эволюции». Annual Review of Genomics and Human Genetics . 25 : 71–92. doi : 10.1146/annurev-genom-090413-025621 . PMID  24773316.
  50. ^ Корте А., Фарлво А. (2013). «Преимущества и ограничения анализа признаков с помощью GWAS: обзор». Plant Methods . 9 : 29. doi : 10.1186/1746-4811-9-29 . PMC 3750305. PMID  23876160. S2CID  206976469. 
  51. ^ ab Manolio TA (июль 2010 г.). «Исследования ассоциаций по всему геному и оценка риска заболеваний». The New England Journal of Medicine . 363 (2): 166–76. doi : 10.1056/NEJMra0905980 . PMID  20647212.
  52. ^ Visscher PV, Wray NR, Zhang Q, Sklar P, McCarthy MI, Brown MA, Yang J (2017). «10 лет открытия GWAS: биология, функция и перевод». American Journal of Human Genetics . 101 (1): 5–22. doi :10.1016/j.ajhg.2017.06.005. PMC 5501872. PMID  28686856 . 
  53. ^ Галлахер МД, Чен-Плоткин, А.С. (2018). «Эпоха после GWAS: от ассоциации к функции». Американский журнал генетики человека . 102 (5): 717–730. doi :10.1016/j.ajhg.2018.04.002. PMC 5986732. PMID  29727686 . 
  54. ^ Маригорта У.М., Родригес Х.А., Гибсон Г., Наварро А. (2018). «Воспроизводимость и прогнозирование: уроки и проблемы GWAS». Тенденции в генетике . 34 (7): 504–517. doi :10.1016/j.tig.2018.03.005. ПМК 6003860 . ПМИД  29716745. 

Дальнейшее чтение

Внешние ссылки