stringtranslate.com

Некодирующая ДНК

Некодирующие последовательности ДНК ( нкДНК ) — это компоненты ДНК организма , которые не кодируют белковые последовательности. Некоторая некодирующая ДНК транскрибируется в функциональные некодирующие молекулы РНК (например , транспортную РНК , микроРНК , пиРНК , рибосомальную РНК и регуляторные РНК ). Другие функциональные области некодирующей фракции ДНК включают регуляторные последовательности , которые контролируют экспрессию генов ; области крепления каркаса ; истоки репликации ДНК ; центромеры ; и теломеры . Некоторые некодирующие области, например, интроны , псевдогены , межгенная ДНК и фрагменты транспозонов и вирусов , по-видимому, в основном нефункциональны .

Фракция некодирующей геномной ДНК

У бактерий кодирующие области обычно занимают 88% генома. [1] Оставшиеся 12% не кодируют белки, но большая их часть по-прежнему выполняет биологическую функцию через гены , где транскрипт РНК является функциональным (некодирующие гены) и регуляторными последовательностями, что означает, что почти весь бактериальный геном имеет функцию . [1] Количество кодирующей ДНК у эукариот обычно составляет гораздо меньшую часть генома, поскольку геномы эукариот содержат большое количество повторяющейся ДНК, не встречающейся у прокариот. Геном человека содержит где-то 1–2% кодирующей ДНК. [2] [3] Точное количество неизвестно, поскольку существуют споры по поводу количества функциональных кодирующих экзонов и общего размера человеческого генома. Это означает, что 98–99% генома человека состоит из некодирующей ДНК, включая множество функциональных элементов, таких как некодирующие гены и регуляторные последовательности.

Размер генома эукариот может варьироваться в широком диапазоне, даже между близкородственными видами. Это загадочное наблюдение первоначально было известно как парадокс C-значения , где «C» относится к размеру гаплоидного генома. [4] Парадокс разрешился с открытием, что большая часть различий обусловлена ​​расширением и сокращением повторяющейся ДНК, а не количеством генов. Некоторые исследователи предположили, что эта повторяющаяся ДНК в основном представляет собой мусорную ДНК . Причины изменения размера генома все еще выясняются, и эта проблема называется «Загадкой C-значения». [5]

Это привело к наблюдению, что количество генов, по-видимому, не коррелирует с воспринимаемыми представлениями о сложности, поскольку количество генов кажется относительно постоянным. Эта проблема получила название парадокса G-значения . [6] Например, сообщается, что геном одноклеточного Polychaos dubium (ранее известного как Amoeba dubia ) содержит более чем в 200 раз больше ДНК человека (т.е. более 600 миллиардов пар оснований против чуть более 3 миллиардов у людей). [7] Геном рыбы-фугу Takifugu Rubripes составляет лишь одну восьмую размера человеческого генома, но, похоже, имеет сопоставимое количество генов. Гены занимают около 30% генома рыбы-фугу, а кодирующая ДНК — около 10%. (Некодирующая ДНК = 90%). Уменьшенный размер генома иглобрюха обусловлен уменьшением длины интронов и меньшим количеством повторяющейся ДНК. [8] [9]

Utricularia gibba , растение пузырчатки , имеет очень маленький ядерный геном (100,7 Мб) по сравнению с большинством растений. [10] [11] Вероятно, он произошел от предкового генома размером 1500 МБ. [11] Геном пузырчатки имеет примерно такое же количество генов, как и другие растения, но общее количество кодирующей ДНК составляет около 30% генома. [10] [11]

Остальная часть генома (70% некодирующей ДНК) состоит из промоторов и регуляторных последовательностей, которые короче, чем у других видов растений. [10] Гены содержат интроны, но их меньше и они меньше, чем интроны в геномах других растений. [10] Существуют некодирующие гены, в том числе множество копий генов рибосомальной РНК. [11] Как и ожидалось, геном также содержит теломеры и центромеры. [11] Большая часть повторяющейся ДНК, наблюдаемой у других эукариот, была удалена из генома пузырчатки, поскольку эта линия отделилась от генома других растений. Около 59% генома пузырчатки состоит из последовательностей, связанных с транспозонами, но поскольку геном намного меньше, чем другие геномы, это представляет собой значительное уменьшение количества этой ДНК. [11] Авторы оригинальной статьи 2013 года отмечают, что утверждения о дополнительных функциональных элементах в некодирующей ДНК животных, похоже, не применимы к геномам растений. [10]

Согласно статье New York Times, в ходе эволюции этого вида «...генетический мусор, не служивший какой-либо цели, был удален, а необходимый материал сохранен». [12] По словам Виктора Альберта из Университета Буффало, растение способно избавиться от так называемой мусорной ДНК и «получить прекрасное многоклеточное растение с множеством различных клеток, органов, типов тканей и цветов, и вы можете сделать это». это без барахла. Барахло не нужно». [13]

Типы некодирующих последовательностей ДНК

Некодирующие гены

Существует два типа генов : гены, кодирующие белки, и некодирующие гены . [14] Некодирующие гены являются важной частью некодирующей ДНК и включают гены транспортной РНК и рибосомальной РНК . Эти гены были открыты в 1960-х годах. Геномы прокариот содержат гены ряда других некодирующих РНК, но гены некодирующих РНК гораздо чаще встречаются у эукариот.

Типичные классы некодирующих генов у эукариот включают гены малых ядерных РНК (мяРНК), малых ядрышковых РНК (sno РНК), микроРНК (миРНК), коротких интерферирующих РНК (миРНК), PIWI-взаимодействующих РНК (пиРНК) и длинных некодирующих РНК . днРНК). Кроме того, существует ряд уникальных генов РНК, которые продуцируют каталитические РНК . [15]

Некодирующие гены составляют лишь несколько процентов геномов прокариот [16] , но они могут составлять гораздо более высокую долю в геномах эукариот. [17] У человека некодирующие гены занимают не менее 6% генома, главным образом потому, что существуют сотни копий генов рибосомальной РНК. [ нужна цитация ] Гены, кодирующие белки, занимают около 38% генома; фракция, которая намного превышает кодирующую область, поскольку гены содержат большие интроны. [ нужна цитата ]

Общее количество некодирующих генов в геноме человека является спорным. Некоторые ученые считают, что существует всего около 5000 некодирующих генов, в то время как другие полагают, что их может быть более 100 000 (см. статью « Некодирующие РНК »). Разница во многом обусловлена ​​спорами о количестве генов днРНК. [18]

Промоторы и регуляторные элементы

Промоторы — это сегменты ДНК вблизи 5’-конца гена, где начинается транскрипция. Это места, где связывается РНК-полимераза , инициируя синтез РНК. Каждый ген имеет некодирующий промотор.

Регуляторные элементы — это сайты, которые контролируют транскрипцию близлежащего гена. Почти всегда это последовательности, в которых факторы транскрипции связываются с ДНК, и эти факторы транскрипции могут либо активировать транскрипцию (активаторы), либо подавлять транскрипцию (репрессоры). Регуляторные элементы были открыты в 1960-х годах, а их общая характеристика была разработана в 1970-х годах путем изучения специфических факторов транскрипции у бактерий и бактериофагов . [ нужна цитата ]

Промоторы и регуляторные последовательности представляют собой обширный класс некодирующей ДНК, но в основном они состоят из набора относительно коротких последовательностей, поэтому не занимают очень большую часть генома. Точное количество регуляторной ДНК в геноме млекопитающих неясно, поскольку трудно отличить ложные сайты связывания транскрипционных факторов от функциональных. Характеристики связывания типичных ДНК-связывающих белков были охарактеризованы в 1970-х годах, а биохимические свойства факторов транскрипции предсказывают, что в клетках с большими геномами большинство сайтов связывания не будут биологически функциональными. [ нужна цитата ]

Многие регуляторные последовательности встречаются вблизи промоторов, обычно выше места начала транскрипции гена. Некоторые из них встречаются внутри гена, а некоторые расположены ниже места терминации транскрипции. У эукариот существуют регуляторные последовательности, расположенные на значительном расстоянии от промоторной области. Эти отдаленные регуляторные последовательности часто называют энхансерами , но не существует строгого определения энхансера, которое отличало бы его от других сайтов связывания транскрипционных факторов. [19] [20]

Интроны

Иллюстрация несплайсированного предшественника пре-мРНК с пятью интронами и шестью экзонами (вверху). После удаления интронов посредством сплайсинга зрелая последовательность мРНК готова к трансляции (внизу).

Интроны — это части гена, которые транскрибируются в последовательность РНК-предшественника , но в конечном итоге удаляются в результате сплайсинга РНК во время процессинга с образованием зрелой РНК. Интроны встречаются в обоих типах генов: генах, кодирующих белки, и некодирующих генах. Они присутствуют у прокариот, но гораздо чаще встречаются в геномах эукариот. [ нужна цитата ]

Интроны группы I и группы II занимают лишь небольшой процент генома, когда они присутствуют. Сплайсосомные интроны (см. рисунок) встречаются только у эукариот и могут составлять значительную часть генома. У человека, например, интроны в генах, кодирующих белки, покрывают 37% генома. Если объединить это с примерно 1% кодирующих последовательностей, это означает, что гены, кодирующие белки, занимают около 38% генома человека. Расчеты для некодирующих генов более сложны, поскольку существуют серьезные споры об общем количестве некодирующих генов, но если брать только четко определенные примеры, это означает, что некодирующие гены занимают не менее 6% генома. [21] [2]

Непереведенные регионы

Стандартные учебники по биохимии и молекулярной биологии описывают некодирующие нуклеотиды мРНК, расположенные между 5'-концом гена и кодоном инициации трансляции. Эти регионы называются 5'-нетранслируемыми регионами или 5'-UTR. Подобные области, называемые 3'-нетранслируемыми областями (3'-UTR), находятся на конце гена. 5'-UTR и 3'UTR очень короткие у бактерий, но у эукариот их длина может достигать нескольких сотен нуклеотидов. Они содержат короткие элементы, которые контролируют инициацию трансляции (5'-UTR) и терминацию транскрипции (3'-UTR), а также регуляторные элементы, которые могут контролировать стабильность, процессинг и нацеливание мРНК в различные области клетки. [22] [23] [24]

Истоки репликации

Синтез ДНК начинается в определенных местах, называемых точками начала репликации . Это участки генома, где собирается механизм репликации ДНК и ДНК раскручивается, чтобы начать синтез ДНК. В большинстве случаев репликация происходит в обоих направлениях от источника репликации.

Основными признаками начала репликации являются последовательности, с которыми связаны специфические белки инициации. Типичный источник репликации охватывает около 100-200 пар оснований ДНК. У прокариотов есть один источник репликации на хромосому или плазмиду, но в эукариотических хромосомах обычно имеется несколько источников репликации. Геном человека содержит около 100 000 точек начала репликации, что составляет около 0,3% генома. [25] [26] [27]

Центромеры

Схематическая кариограмма человека, показывающая обзор генома человека по G-диапазону , где некодирующая ДНК присутствует в центромерах (показана как узкий сегмент каждой хромосомы), а также встречается в большей степени в более темных ( плохих GC ) регионы. [28]

Центромеры — это места, где волокна веретена прикрепляются к вновь реплицированным хромосомам, чтобы разделить их на дочерние клетки при делении клетки. Каждая эукариотическая хромосома имеет одну функциональную центромеру, которая рассматривается как суженная область в конденсированной метафазной хромосоме. Центромерная ДНК состоит из ряда повторяющихся последовательностей ДНК, которые часто занимают значительную часть генома, поскольку каждая центромера может иметь длину в миллионы пар оснований. У человека, например, определены последовательности всех 24 центромер [29] и они составляют около 6% генома. Однако маловероятно, что вся эта некодирующая ДНК важна, поскольку у разных людей существуют значительные различия в общем количестве центромерной ДНК. [30] Центромеры являются еще одним примером функциональных некодирующих последовательностей ДНК, которые известны уже почти полвека, и вполне вероятно, что они более распространены, чем кодирующая ДНК.

Теломеры

Теломеры представляют собой участки повторяющейся ДНК на конце хромосомы , которые обеспечивают защиту от разрушения хромосом во время репликации ДНК . Недавние исследования показали, что теломеры способствуют собственной стабильности. РНК, содержащая теломерные повторы (TERRA), представляет собой транскрипты, полученные из теломер. Было показано, что TERRA поддерживает теломеразную активность и удлиняет концы хромосом. [31]

Области крепления каркаса

Геномы как прокариот, так и эукарот организованы в большие петли связанной с белками ДНК. У эукариот основания петель называются областями прикрепления каркаса (SAR) и состоят из участков ДНК, которые связывают комплекс РНК/белок для стабилизации петли. В геноме человека около 100 000 петель, каждая из которых состоит примерно из 100 пар оснований ДНК. Общее количество ДНК, посвященное SAR, составляет около 0,3% генома человека. [32]

Псевдогены

Псевдогены — это в основном бывшие гены, которые стали нефункциональными из-за мутации, но этот термин также относится к неактивным последовательностям ДНК, которые происходят из РНК, продуцируемых функциональными генами ( процессированные псевдогены ). Псевдогены составляют лишь небольшую часть некодирующей ДНК в геномах прокариот, поскольку они устраняются путем негативного отбора. Однако у некоторых эукариот псевдогены могут накапливаться, поскольку отбор недостаточно силен, чтобы их устранить (см. Почти нейтральная теория молекулярной эволюции ).

Геном человека содержит около 15 000 псевдогенов, происходящих из генов, кодирующих белки, и неизвестное количество, происходящих из некодирующих генов. [33] Они могут покрывать значительную часть генома (~5%), поскольку многие из них содержат бывшие последовательности интронов.

Псевдогены по определению являются мусорной ДНК, и они развиваются с нейтральной скоростью, как и ожидалось для мусорной ДНК. [34] Некоторые бывшие псевдогены вторично приобрели определенную функцию, и это заставляет некоторых ученых предполагать, что большинство псевдогенов не являются мусором, поскольку у них есть еще не обнаруженная функция. [35]

Повторяющиеся последовательности, транспозоны и вирусные элементы

Мобильные генетические элементы в клетке (слева) и способы их приобретения (справа)

Транспозоны и ретротранспозоны являются мобильными генетическими элементами . Повторяющиеся последовательности ретротранспозонов , которые включают длинные вкрапленные ядерные элементы (LINE) и короткие вкрапленные ядерные элементы (SINE), составляют большую часть геномных последовательностей у многих видов. Последовательности Alu , классифицируемые как короткие вкрапленные ядерные элементы, являются наиболее распространенными мобильными элементами в геноме человека. Было обнаружено несколько примеров того, как SINEs осуществляют транскрипционный контроль некоторых генов, кодирующих белки. [36] [37] [38]

Эндогенные последовательности ретровирусов являются продуктом обратной транскрипции геномов ретровирусов в геномы половых клеток . Мутация внутри этих ретротранскрибируемых последовательностей может инактивировать вирусный геном. [39]

Более 8% генома человека состоит из (в основном разложившихся) эндогенных последовательностей ретровирусов, как часть более 42% фракции, которая явно происходит из ретротранспозонов, в то время как еще 3% можно определить как остатки ДНК-транспозонов . Ожидается, что большая часть оставшейся половины генома, происхождение которой в настоящее время не имеет объяснения, возникла в мобильных элементах, которые были активны так давно (> 200 миллионов лет), что случайные мутации сделали их неузнаваемыми. [40] Вариации размера генома по крайней мере у двух видов растений в основном являются результатом последовательностей ретротранспозонов. [41] [42]

Очень повторяющаяся ДНК

Высокоповторяющаяся ДНК состоит из коротких участков ДНК, которые повторяются много раз последовательно ( один за другим). Повторяющиеся сегменты обычно имеют длину от 2 до 10 п.н., но известны и более длинные. Высокоповторяющаяся ДНК редко встречается у прокариот, но часто встречается у эукариот, особенно с большими геномами. Иногда ее называют сателлитной ДНК .

Большая часть высокоповторяющейся ДНК находится в центромерах и теломерах (см. выше), и большая часть ее функциональна, хотя некоторые из них могут быть избыточными. Другая значительная часть находится в коротких тандемных повторах (STR; также называемых микросателлитами ), состоящих из коротких участков простого повтора, такого как ATC. В геноме человека около 350 000 STR, и они разбросаны по всему геному со средней длиной около 25 повторов. [43] [44]

Вариации в количестве повторов STR могут вызывать генетические заболевания, если они находятся внутри гена, но большинство этих областей представляют собой нефункциональную мусорную ДНК, где количество повторов может значительно варьироваться от человека к человеку. Вот почему эти различия в длине широко используются при дактилоскопии ДНК .

Мусорная ДНК

Мусорная ДНК — это ДНК, которая не имеет биологически значимой функции, например, псевдогены и фрагменты некогда активных транспозонов. Геномы бактерий и вирусов содержат очень мало мусорной ДНК [45] [46] , но некоторые эукариотические геномы могут содержать значительное количество мусорной ДНК. [47] Точное количество нефункциональной ДНК у людей и других видов с большими геномами не определено, и в научной литературе существуют значительные разногласия. [48] ​​[49]

Нефункциональная ДНК в бактериальных геномах в основном расположена в межгенной фракции некодирующей ДНК, но в геномах эукариот ее также можно обнаружить в интронах . Важно отметить, что существует множество примеров функциональных элементов ДНК в некодирующей ДНК и что ошибочно приравнивать некодирующую ДНК к мусорной ДНК.

Полногеномные исследования ассоциаций (GWAS) и некодирующая ДНК

Полногеномные исследования ассоциаций (GWAS) выявляют связи между аллелями и наблюдаемыми признаками, такими как фенотипы и заболевания. Большинство ассоциаций возникает между однонуклеотидными полиморфизмами (SNP) и исследуемым признаком, и большинство этих SNP расположены в нефункциональной ДНК. Ассоциация устанавливает связь, которая помогает картировать область ДНК, ответственную за признак, но не обязательно идентифицирует мутации, вызывающие заболевание или фенотипические различия. [50] [51] [52] [53] [54]

SNP, которые тесно связаны с признаками, с наибольшей вероятностью идентифицируют причинную мутацию. (Эта ассоциация называется неравновесием по тесному сцеплению .) Около 12% этих полиморфизмов обнаруживаются в кодирующих областях; около 40% расположены в интронах; а большая часть остальных обнаружена в межгенных областях, включая регуляторные последовательности. [51]

Смотрите также

Рекомендации

  1. ^ ab Кирхбергер ПК, Шмидт МЛ и Охман Х (2020). «Изобретательность бактериальных геномов». Ежегодный обзор микробиологии . 74 : 815–834. doi : 10.1146/annurev-micro-020518-115822. PMID  32692614. S2CID  220699395.
  2. ^ аб Пиовесан А, Антонарос Ф, Витале Л, Стрипполи П, Пеллери МК, Каракаузи М (2019). «Гены, кодирующие человеческие белки, и статистика особенностей генов в 2019 году». Исследовательские заметки BMC . 12 (1): 315. дои : 10.1186/s13104-019-4343-8 . ПМЦ 6549324 . ПМИД  31164174. 
  3. ^ Оменн GS (2021). «Размышления о проекте HUPO Human Proteome, флагманском проекте организации Human Proteome, через 10 лет». Молекулярная и клеточная протеомика . 20 : 100062. doi : 10.1016/j.mcpro.2021.100062. ПМЦ 8058560 . ПМИД  33640492. 
  4. ^ Томас, Калифорния (1971). «Генетическая организация хромосом». Ежегодный обзор генетики . 5 : 237–256. doi : 10.1146/annurev.ge.05.120171.001321. ПМИД  16097657.
  5. ^ Эллиотт Т.А., Грегори Т.Р. (2015). «Что находится в геноме? Загадка значения C и эволюция содержания генома эукариот». Фил. Пер. Р. Сок. Б. _ 370 (1678): 20140331. doi :10.1098/rstb.2014.0331. ПМЦ 4571570 . PMID  26323762. S2CID  12095046. 
  6. ^ Хан М.В., Рэй, Джорджия (2002). «Парадокс значения g». Эволюция и развитие . 4 (2): 73–75. дои : 10.1046/j.1525-142X.2002.01069.x. PMID  12004964. S2CID  2810069.
  7. ^ Грегори Т.Р., Хеберт П.Д. (апрель 1999 г.). «Модуляция содержания ДНК: непосредственные причины и конечные последствия». Геномные исследования . 9 (4): 317–324. дои : 10.1101/гр.9.4.317 . PMID  10207154. S2CID  16791399.
  8. ^ Апарисио С., Чепмен Дж., Ступка Е., Патнэм Н., Чиа Дж.М., Дехал П., Кристоффельс А., Раш С., Хун С., Смит А. (2002). «Полногеномная сборка дробовика и анализ генома Fugu Rubripes». Наука . 297 (5585): 1301–1310. Бибкод : 2002Sci...297.1301A. дои : 10.1126/science.1072104. PMID  12142439. S2CID  10310355.
  9. ^ Оно С (1972). «В нашем геноме так много «мусорной» ДНК». Брукхейвенские симпозиумы по биологии . 23 : 366–370. OCLC  101819442. PMID  5065367.
  10. ^ abcde Ибарра-Лаклетт Э., Лайонс Э., Эрнандес-Гусман Г., Перес-Торрес К.А., Карретеро-Паулет Л., Чанг Т.Х., Лан Т., Уэлч А.Дж., Хуарес М.Дж., Симпсон Дж. и др. (2013). «Архитектура и эволюция мельчайшего генома растения». Природа . 498 (7452): 94–98. Бибкод : 2013Natur.498...94I. дои : 10.1038/nature12132. ПМЦ 4972453 . PMID  23665961. S2CID  18219754. 
  11. ^ abcdef Лан Т., Реннер Т., Ибарра-Лаклетт Э., Фарр К.М., Чанг Т.Х., Сервантес-Перес С.А., Чжэн С., Санкофф Д., Тан Х. и Пурбоджати Р.В. (2017). «Длительное секвенирование раскрывает адаптивную топографию генома хищного растения». Труды Национальной академии наук . 114 (22): Е4435–Е4441. Бибкод : 2017PNAS..114E4435L. дои : 10.1073/pnas.1702072114 . ПМК 5465930 . ПМИД  28507139. 
  12. Кляйн Дж. (19 мая 2017 г.). «Генетическая уборка превратила горбатых пузырчаток в плотоядные растения». Газета "Нью-Йорк Таймс . Проверено 30 мая 2022 г.
  13. ^ Сюй С. и Столте Д. (13 мая 2013 г.). «Плотоядное растение выбрасывает «мусорную» ДНК» (пресс-релиз). Тусон, Аризона, США: Университет Аризоны . Проверено 29 мая 2022 г.
  14. ^ Кампуракис К. (2017). Разбираемся в генах . Кембридж, Великобритания: Издательство Кембриджского университета. ISBN 978-1-107-12813-2.[ нужна страница ]
  15. ^ Чех Т.Р., Стейц Дж.А. (2014). «Революция некодирующих РНК: отказ от старых правил и создание новых». Клетка . 157 (1): 77–94. дои : 10.1016/j.cell.2014.03.008 . PMID  24679528. S2CID  14852160.
  16. ^ Рогозин И.Б., Макарова КС, Натале Д.А., Спиридонов АН, Татусов Р.Л., Вольф Ю.И. и др. (октябрь 2002 г.). «Конгруэнтная эволюция различных классов некодирующей ДНК в геномах прокариот». Исследования нуклеиновых кислот . 30 (19): 4264–4271. дои : 10.1093/nar/gkf549. ПМК 140549 . ПМИД  12364605. 
  17. ^ Белявски Дж. П., Джонс С. (2016). «Адаптивная молекулярная эволюция: методы обнаружения». Энциклопедия эволюционной биологии . стр. 16–25. дои : 10.1016/B978-0-12-800049-6.00171-2. ISBN 978-0-12-800426-5.
  18. ^ Понтинг КП и Хаэрти В. (2022). «Полногеномный анализ длинных некодирующих РНК человека: провокационный обзор». Ежегодный обзор геномики и генетики человека . 23 : 153–172. doi : 10.1146/annurev-genom-112921-123710 . hdl : 20.500.11820/ede40d70-b99c-42b0-a378-3b9b7b256a1b . PMID  35395170. S2CID  248049706.
  19. ^ Compe E, Egly JM (2021). «Долгий путь к пониманию инициации транскрипции RNAPII и связанных с ней синдромов». Ежегодный обзор биохимии . 90 : 193–219. doi : 10.1146/annurev-biochem-090220-112253. PMID  34153211. S2CID  235595550.
  20. ^ Висел А, Рубин Э.М., Пеннаккио, Лос-Анджелес (сентябрь 2009 г.). «Геномные взгляды на усилители отдаленного действия». Природа . 461 (7261): 199–205. Бибкод : 2009Natur.461..199V. дои : 10.1038/nature08451. ПМЦ 2923221 . ПМИД  19741700. 
  21. ^ Харроу Дж., Фрэнкиш А., Гонсалес Дж.М., Тапанари Э., Дикханс М., Кокочински Ф., Акен Б.Л., Баррелл Д., Задисса А., Сирл С. (2012). «GENCODE: эталонная аннотация генома человека для проекта ENCODE». Геномные исследования . 22 (9): 1760–1774. дои : 10.1101/гр.135350.111. ПМЦ 3431492 . ПМИД  22955987. 
  22. ^ Альбертс Б., Брэй Д., Льюис Дж., Рафф М., Робертс К., Уотсон Дж.Д. (1994). Молекулярная биология клетки, 3-е издание . Лондон, Великобритания: Garland Publishing Inc.[ нужна страница ]
  23. ^ Левин Б. (2004). Гены VIII . Река Аппер-Сэддл, Нью-Джерси, США: Пирсон/Прентис-Холл.[ нужна страница ]
  24. ^ Моран Л., Хортон Х.Р., Скримджер К.Г., Перри, доктор медицины (2012). Принципы биохимии. Пятое издание . Река Аппер-Сэддл, Нью-Джерси, США: Пирсон.[ нужна страница ]
  25. ^ Леонард AC, Мечали М (2013). «Происхождение репликации ДНК». Перспективы Колд-Спринг-Харбор в биологии . 5 (10): а010116. doi : 10.1101/cshperspect.a010116. ПМЦ 3783049 . ПМИД  23838439. 
  26. ^ Урбан Дж. М., Фулк М. С., Казелла С., Герби С. А. (2015). «Охота за происхождение репликации ДНК у многоклеточных эукариот». Отчеты F1000Prime . 7:30 . дои : 10.12703/P7-30 . ПМЦ 4371235 . ПМИД  25926981. 
  27. ^ Приоло М, Макалпайн DM (2016). «Происхождение репликации ДНК - с чего начать?». Гены и развитие . 30 (15): 1683–1697. дои : 10.1101/gad.285114.116. ПМК 5002974 . ПМИД  27542827. 
  28. ^ Ромигье Дж., Ру С. (2017). «Аналитические предубеждения, связанные с содержанием GC в молекулярной эволюции». Границы генетики . 8 : 16. дои : 10.3389/fgene.2017.00016 . ПМК 5309256 . ПМИД  28261263. 
  29. ^ Альтемоз Н., Логсдон Г.А., Бзикадзе А.В., Сидхвани П., Лэнгли С.А., Калдас Г.В. и др. (2021). «Полные геномные и эпигенетические карты центромер человека». Наука . 376 (6588): 56. doi :10.1126/science.abl4178. ПМЦ 9233505 . PMID  35357911. S2CID  247853627. 
  30. ^ Мига КХ (2019). «Центромерные сателлитные ДНК: скрытые вариации последовательностей в человеческой популяции». Гены . 10 (5): 353. doi : 10.3390/genes10050352 . ПМК 6562703 . ПМИД  31072070. 
  31. ^ Кузанелли Э., Чартран П. (май 2014 г.). «Теломерная некодирующая РНК: РНК, содержащая теломерные повторы, в биологии теломер». Междисциплинарные обзоры Wiley. РНК . 5 (3): 407–419. дои : 10.1002/wrna.1220. PMID  24523222. S2CID  36918311.
  32. ^ Мистрели Т (2020). «Самоорганизующийся геном: принципы архитектуры и функционирования генома». Клетка . 183 (1): 28–45. doi :10.1016/j.cell.2020.09.014. ПМЦ 7541718 . ПМИД  32976797. 
  33. ^ "Ансамбль эталонного генома человека GRCh38.p13" .
  34. ^ Сюй Дж, Чжан Дж (2015). «Функциональны ли псевдогены, переведенные человеком?». Молекулярная биология и эволюция . 33 (3): 755–760. doi : 10.1093/molbev/msv268. ПМК 5009996 . ПМИД  26589994. 
  35. ^ Вэнь Ю.З., Чжэн Л.Л., Цюй Л.Х., Аяла Ф.Дж., Лунь З.Р. (2012). «Псевдогены больше не псевдо». Биология РНК . 9 (1): 27–32. дои : 10.4161/rna.9.1.18277 . PMID  22258143. S2CID  13161678.
  36. ^ Ponicsan SL, Kugel JF, Goodrich JA (апрель 2010 г.). «Геномные драгоценности: РНК SINE регулируют выработку мРНК». Текущее мнение в области генетики и развития . 20 (2): 149–155. дои :10.1016/j.gde.2010.01.004. ПМЦ 2859989 . ПМИД  20176473. 
  37. ^ Хэслер Дж., Самуэльссон Т., Струб К. (июль 2007 г.). «Полезный« мусор »: Alu-РНК в транскриптоме человека». Клеточные и молекулярные науки о жизни (представлена ​​рукопись). 64 (14): 1793–1800. дои : 10.1007/s00018-007-7084-0. PMID  17514354. S2CID  5938630.
  38. ^ Уолтерс Р.Д., Кугель Дж.Ф., Гудрич Дж.А. (август 2009 г.). «Незаменимый мусор: клеточное воздействие и функция РНК Alu и B2». ИУБМБ Жизнь . 61 (8): 831–837. дои : 10.1002/iub.227. ПМК 4049031 . ПМИД  19621349. 
  39. ^ Нельсон П.Н., Хули П., Роден Д., Давари Эджтехади Х., Райлэнс П., Уоррен П. и др. (октябрь 2004 г.). «Эндогенные ретровирусы человека: мобильные элементы с потенциалом?». Клиническая и экспериментальная иммунология . 138 (1): 1–9. дои : 10.1111/j.1365-2249.2004.02592.x. ПМК 1809191 . ПМИД  15373898. 
  40. ^ Ландер ES, Линтон LM, Биррен Б, Нусбаум C, Зоди MC, Болдуин Дж и др. (февраль 2001 г.). "Начальная последовательность и анализ человеческого генома". Природа . 409 (6822): 860–921. Бибкод : 2001Natur.409..860L. дои : 10.1038/35057062 . hdl : 2027.42/62798 . ПМИД  11237011.
  41. ^ Пьегу Б., Гайо Р., Пико Н., Рулен А., Саньял А., Саниял А. и др. (октябрь 2006 г.). «Удвоение размера генома без полиплоидизации: динамика геномной экспансии, обусловленной ретротранспозицией, у Oryza australiensis, дикого родственника риса». Геномные исследования . 16 (10): 1262–1269. дои : 10.1101/гр.5290206. ПМЦ 1581435 . ПМИД  16963705. 
  42. ^ Хокинс Дж.С., Ким Х., Нэйсон Дж.Д., Винг РА, Вендел Дж.Ф. (октябрь 2006 г.). «За изменение размера генома Gossypium ответственна специфичная для каждой линии амплификация мобильных элементов». Геномные исследования . 16 (10): 1252–1261. дои : 10.1101/гр.5282906. ПМЦ 1581434 . ПМИД  16954538. 
  43. ^ Гимрек М., Виллемс Т., Гильматр А., Зенг Х., Маркус Б., Георгиев С., Дейли М.Дж., Прайс А.Л., Притчард Дж.К., Шарп А.Дж., Эрлих Ю. (2016). «Обильный вклад коротких тандемных повторов в вариации экспрессии генов у людей». Природная генетика . 48 (1): 22–29. дои : 10.1038/ng.3461. ПМЦ 4909355 . ПМИД  26642241. 
  44. ^ Кроненберг З.Н., Фиддес И.Т., Гордон Д., Мурали С., Канцилиерис С., Мейерсон О.С., Андервуд Дж.Г., Нельсон Б.Дж., Чессон М.Дж., Догерти М.Л. (2018). «Сравнительный анализ геномов человекообразных обезьян высокого разрешения». Наука . 360 (6393): 1085. doi :10.1126/science.aar6343. ПМК 6178954 . ПМИД  29880660. 
  45. ^ Гил Р. и Латорре А. (2012). «Факторы, лежащие в основе ненужной ДНК бактерий». Гены . 3 (4): 634–650. дои : 10.3390/genes3040634 . ПМЦ 3899985 . ПМИД  24705080. 
  46. ^ Брандес, Надав; Линиал, Михал (2016). «Перекрытие генов и ограничения размера в вирусном мире». Биология Директ . 11 (1): 26. дои : 10.1186/s13062-016-0128-3 . ISSN  1745-6150. ПМЦ 4875738 . ПМИД  27209091. 
  47. ^ Палаццо AF, Грегори Т.Р. (май 2014 г.). «Дело о мусорной ДНК». ПЛОС Генетика . 10 (5): e1004351. дои : 10.1371/journal.pgen.1004351 . ПМК 4014423 . ПМИД  24809441. 
  48. ^ Моранж, Мишель (2014). «Геном как многоцелевая структура, созданная эволюцией» (PDF) . Перспективы биологии и медицины . 57 (1): 162–171. дои : 10.1353/pbm.2014.0008. PMID  25345709. S2CID  27613442.
  49. ^ Хаэрти В. и Понтинг КП (2014). «Ни один ген в геноме не имеет смысла, кроме как в свете эволюции». Ежегодный обзор геномики и генетики человека . 25 : 71–92. doi : 10.1146/annurev-genom-090413-025621 . ПМИД  24773316.
  50. ^ Корте А, Фарлво А (2013). «Преимущества и ограничения анализа признаков с помощью GWAS: обзор». Растительные методы . 9:29 . дои : 10.1186/1746-4811-9-29 . ПМК 3750305 . PMID  23876160. S2CID  206976469. 
  51. ^ аб Манолио Т.А. (июль 2010 г.). «Полногеномные исследования ассоциаций и оценка риска заболеваний». Медицинский журнал Новой Англии . 363 (2): 166–76. дои : 10.1056/NEJMra0905980 . ПМИД  20647212.
  52. ^ Висшер П.В., Рэй Н.Р., Чжан К., Склар П., Маккарти М.И., Браун М.А., Ян Дж. (2017). «10 лет открытия GWAS: биология, функции и трансляция». Американский журнал генетики человека . 101 (1): 5–22. дои : 10.1016/j.ajhg.2017.06.005. ПМК 5501872 . ПМИД  28686856. 
  53. ^ Галлахер, доктор медицинских наук, Чен-Плоткин, А.С. (2018). «Эра пост-GWAS: от ассоциации к функции». Американский журнал генетики человека . 102 (5): 717–730. дои : 10.1016/j.ajhg.2018.04.002. ПМЦ 5986732 . ПМИД  29727686. 
  54. ^ Маригорта УМ, Родригес Х.А., Гибсон Г., Наварро А. (2018). «Воспроизводимость и прогнозирование: уроки и проблемы GWAS». Тенденции в генетике . 34 (7): 504–517. doi :10.1016/j.tig.2018.03.005. ПМК 6003860 . ПМИД  29716745. 

дальнейшее чтение

Внешние ссылки