Мусорная ДНК ( нефункциональная ДНК ) — это последовательность ДНК, не имеющая значимой биологической функции. [1] [2] В геномах большинства организмов имеется некоторое количество «мусорной» ДНК — в основном псевдогены и фрагменты транспозонов и вирусов — но возможно, что у некоторых организмов имеется значительное количество «мусорной» ДНК. [3]
Все белково-кодирующие области генов обычно рассматриваются как функциональные элементы геномов. Кроме того, небелковые кодирующие области, такие как гены рибосомальной РНК и транспортной РНК, регуляторные последовательности, контролирующие экспрессию этих генов, элементы генома, включающие точки начала репликации (у всех видов), центромеры, теломеры и области прикрепления каркаса (у эукариотов). ) обычно также считаются функциональными элементами геномов. ( Дополнительную информацию см. в разделе «Некодирующая ДНК» .)
Трудно определить, являются ли другие области генома функциональными или нефункциональными. Существуют серьезные разногласия по поводу того, какие критерии следует использовать для определения функции. Многие ученые придерживаются эволюционного взгляда на геном и предпочитают критерии, основанные на том, сохраняются ли последовательности ДНК в результате естественного отбора. [4] [5] [6] Другие ученые оспаривают эту точку зрения или имеют разные интерпретации данных. [7] [8] [9]
Идея о том, что только часть человеческого генома может быть функциональной, возникла в конце 1940-х годов. Предполагаемая частота мутаций у людей предполагает, что если большая часть этих мутаций будет вредной, то человеческий вид не сможет пережить такую мутационную нагрузку (генетическую нагрузку). Это привело к предсказаниям в конце 1940-х годов одного из основателей популяционной генетики Дж. Б. С. Холдейна и нобелевского лауреата Германа Мюллера о том, что лишь небольшой процент человеческого генома содержит функциональные элементы ДНК (гены), которые могут быть уничтожены мутацией. [10] [11] ( дополнительную информацию см. в разделе «Генетическая нагрузка »)
В 1966 году Мюллер проанализировал эти предсказания и пришел к выводу, что геном человека может содержать только около 30 000 генов, исходя из количества вредных мутаций, которые этот вид может переносить. [12] Подобные предсказания были сделаны и другими ведущими экспертами в области молекулярной эволюции, которые пришли к выводу, что человеческий геном не может содержать более 40 000 генов и что менее 10% генома являются функциональными. [13] [14] [4] [15]
Известно, что размер геномов у разных видов значительно различается, и, по-видимому, не существует корреляции между размером генома и сложностью вида. Даже близкородственные виды могут иметь очень разные размеры генома. Это наблюдение привело к тому, что стало известно как парадокс C-значения . [16] Парадокс был разрешен с открытием повторяющейся ДНК и наблюдением, что большая часть различий в размерах генома может быть связана с повторяющейся ДНК. [16] [17] Некоторые ученые считали, что большая часть повторяющейся ДНК участвует в регуляции экспрессии генов, но многие ученые считали, что избыток повторяющейся ДНК нефункционален. [18] [16] [19] [20] [21]
Примерно в то же время (конец 1960 -х годов) недавно разработанная методика C0t -анализа была усовершенствована и теперь включает гибридизацию РНК:ДНК, что привело к открытию того, что значительно менее 10% генома человека комплементарно мРНК, и эта ДНК находится в уникальная (неповторяющаяся) фракция. Это подтвердило предсказания, сделанные на основе аргументов в пользу генетической нагрузки, и соответствовало идее о том, что большая часть повторяющейся ДНК нефункциональна. [22] [23] [24]
Идея о том, что большие количества эукариотических геномов могут быть нефункциональными, противоречила преобладающему взгляду на эволюцию в 1968 году, поскольку казалось вероятным, что нефункциональная ДНК будет устранена в результате естественного отбора. Развитие нейтральной теории и почти нейтральной теории позволило решить эту проблему, поскольку позволило сохранить слегка вредную нефункциональную ДНК в соответствии с фундаментальными принципами популяционной генетики. [14] [13] [25]
Термин «мусорная ДНК» начал использоваться в конце 1950-х годов [26] , но Сусуму Оно популяризировал этот термин в статье 1972 года под названием «Так много «мусорной» ДНК в нашем геноме» [27] , где он обобщил современные данные, которые накопилось к тому времени. [27] Во второй статье того же года он пришел к выводу, что 90% геномов млекопитающих состоят из нефункциональной ДНК. [4] Доводы в пользу «мусорной» ДНК были обобщены в длинной статье Дэвида Комингса в 1972 году, где он перечислил четыре причины для предложения «мусорной» ДНК: [28]
Открытие интронов в 1970-х годах, казалось, подтвердило точку зрения сторонников «мусорной» ДНК, поскольку это означало, что гены были очень большими и даже огромные геномы не могли вместить большое количество генов. Сторонники «мусорной» ДНК были склонны отвергать последовательности интронов как в основном нефункциональные ДНК (мусорные), но противники «мусорной» ДНК выдвинули ряд гипотез, приписывающих последовательностям интронов различные функции. [29] [30] [31] [32] [33]
К 1980 году стало очевидно, что большая часть повторяющейся ДНК в геноме человека связана с транспозонами . Это побудило к появлению серии статей и писем, описывающих транспозоны как эгоистическую ДНК, которая действует как паразит в геномах и не дает организму никаких преимуществ в приспособленности. [34] [35] [36] [37] [38]
Противники «мусорной» ДНК интерпретировали эти результаты как свидетельство того, что большая часть генома функциональна, и разработали несколько гипотез, утверждающих, что последовательности транспозонов могут принести пользу организму или виду. [39] Самым главным противником мусорной ДНК в то время был Томас Кавальер-Смит , который утверждал, что дополнительная ДНК необходима для увеличения объема ядра и обеспечения более эффективного транспорта через ядерную мембрану. [40]
Позиции двух сторон в споре ужесточились: одна сторона полагала, что эволюция согласуется с большим количеством мусорной ДНК, а другая сторона полагала, что естественный отбор должен устранить мусорную ДНК. Эти различные взгляды на эволюцию были подчеркнуты в письме Томаса Джукса , сторонника мусорной ДНК, Фрэнсису Крику от 20 декабря 1979 года: [41]
Дорогой Фрэнсис, я уверен, что вы понимаете, как ужасно разозлятся многие люди, если вы скажете, что большая часть ДНК — мусор. Генетики будут злиться, потому что они думают, что ДНК священна. Эволюционисты-дарвинисты будут возмущены, потому что они верят, что каждое изменение в ДНК, принятое в ходе эволюции, обязательно является адаптивным изменением. Предположение чего-либо иного является оскорблением священной памяти Дарвина.
Другая точка зрения была высказана Бриттеном и Коном в их основополагающей статье о повторяющейся ДНК. [17]
Концепция, которая нам противна, заключается в том, что около половины ДНК высших организмов тривиальна или постоянно инертна (в эволюционном масштабе времени).
В популярной прессе и научной литературе существует значительная путаница относительно различия между некодирующей ДНК и мусорной ДНК.
Согласно недавней статье, опубликованной в журнале American Scientist :
Около 99 процентов нашего генома исторически классифицировалось как некодирующая, бесполезная «мусорная» ДНК. Следовательно, эти последовательности редко изучались. [42]
В недавней книге говорится:
Когда ее впервые обнаружили, негенную ДНК иногда называли (несколько насмешливо люди, которые не знали ничего лучше) «мусорной ДНК», потому что она не имела очевидной полезности, и они глупо полагали, что, если она не несет кодирующей информации, она, должно быть, бесполезна. мусор. [43]
Общей темой является то, что первоначальные сторонники мусорной ДНК считали всю некодирующую ДНК мусорной и обычно игнорировали ее. [2] [6] Это утверждение было приписано статье Дэвида Комингса в 1972 году [28] , где он, как сообщается, сказал, что мусорная ДНК относится ко всей некодирующей ДНК. [19] Но Камингс никогда этого не говорил. В этой статье он обсуждает некодирующие гены рибосомальных РНК и тРНК, а также некодирующую регуляторную ДНК и предлагает несколько возможных функций основной массы некодирующей ДНК. [28] В другой публикации того же года Комингс снова обсуждает термин «мусорная ДНК», четко понимая, что он не включает в себя некодирующие регуляторные последовательности. [44]
Эти заявления подверглись критике со стороны многих авторов за искажение истории мусорной ДНК; [1] [45] [46] [47] [2] например:
Это просто неправда, что некодирующая ДНК уже давно считается бесполезным мусором и что функциональные гипотезы были предложены лишь недавно – несмотря на частоту, с которой это клише повторяется в сообщениях средств массовой информации и в слишком многих научных исследованиях. [48]
Некоторые критические замечания были резкими:
Утверждения ревизионистов, приравнивающие некодирующую ДНК к мусору, просто показывают, что люди, которым разрешено демонстрировать свою логорею в Nature и других гламурных журналах, так же невежественны, как и худшие креационисты из числа молодых земных. [49]
С 1960-х годов сторонники «мусорной» ДНК были хорошо осведомлены о функциональной некодирующей ДНК и даже обсуждали возможные функции, когда были идентифицированы новые типы некодирующих последовательностей. [2] Например, существование функциональных некодирующих элементов ДНК, таких как некодирующие гены, регуляторные последовательности, точки начала репликации и центромеры, было хорошо известно в конце 1960-х годов, когда была предложена идея мусорной ДНК. [50] Многие из основных сторонников «мусорной» ДНК прямо отмечали важность (некодирующих) регуляторных последовательностей и затрагивали вопрос о том, являются ли регуляторные последовательности незначительной частью функционального генома или же регуляторные последовательности занимают большую часть генома человека. . [16] [44] [51] Ранние сторонники мусорной ДНК не основывали свои аргументы на невежестве; они основывали свои аргументы на том, что было известно о размерах генома, дупликации генов, мутационной нагрузке и популяционной генетике. [2] (См. «История мусорной ДНК».)
Некоторые утверждают, что термин «некодирующая ДНК» неудачен, поскольку он звучит как «бессмысленная последовательность, которая вообще ничего не делает». Они предлагают заменить эту вводящую в заблуждение фразу «нетранслированной ДНК». [52]
Фраза «мусорная ДНК» является спорной, и различные точные определения (и связанные с ними подходы) дают совершенно разные оценки ее распространенности. [6] Резкие возражения против термина «мусорная ДНК» побудили некоторых выступать за более нейтральную номенклатуру, такую как «нефункциональная ДНК». [1]
Сторонники мусорной ДНК определяют «функциональную» ДНК как ДНК, которая в настоящее время находится в стадии очищающего отбора. Например, Дэн Гаур в своем учебнике «Молекулярная и геномная эволюция».
Такое определение «функции» называется функцией обслуживания. [54] [55] Были опубликованы и другие подобные определения, но все они имеют общую идею о том, что мусорная ДНК — это ДНК, которая не имеет функции, а это означает, что она не находится под негативным селективным давлением. [46] [1] [45] Около 11% или менее человеческого генома законсервировано [56] [57] и около 7% находится в стадии очищающего отбора. [58]
Биохимическая активность — еще один критерий, используемый для оценки функциональных элементов. Биохимическая активность включает в себя то, транскрибируется ли данный локус или связывается ли он с фактором транскрипции. В серии статей, опубликованных в 2012 году, проект Энциклопедия элементов ДНК ( ENCODE ) сообщил, что обнаруживаемая биохимическая активность наблюдалась в регионах, охватывающих не менее 80% генома человека. [59] Эти выводы были подкреплены рекламной кампанией, объявляющей о прекращении использования мусорной ДНК. [60] [61]
Выводы ENCODE были оспорены в серии публикаций в течение следующих нескольких лет, причем некоторые из них предполагали, что многие транскрипты являются ложными транскриптами, которые не обязательно происходят из функциональных областей генома. Они также предположили, что многие сайты связывания транскрипционных факторов являются нефункциональными сайтами, которые случайно встречаются в больших геномах. [62] [1] [63] [64] [65] [2] [46] [66] [5] [45]
В 2014 году исследователи ENCODE ответили, что у различных подходов (генетических, эволюционных, биохимических), используемых для получения оценок функциональных элементов, есть как ограничения, так и преимущества. Они согласились, что биохимическая активность сама по себе не является надежным индикатором функции, и не стали повторять свое более раннее утверждение о том, что 80% генома функционально. Их пересмотренная позиция заключается в том, что данные ENCODE могут использоваться для идентификации элементов-кандидатов, которые можно дополнительно изучить, чтобы увидеть, являются ли они функциональными, и что этот вклад «гораздо важнее, чем любая промежуточная оценка функциональной части человеческого генома». " [9]
Самая последняя попытка определить функцию с использованием биохимической активности сосредоточена на выявлении того, какие транскрипты выполняют функцию и какие сайты связывания транскрипционных факторов являются истинными регуляторными последовательностями. [67] Одним из способов отличить истинную функциональную биохимическую активность от ложной нефункциональной биохимической активности является поиск доказательств сохранения последовательности или очищающего отбора. Противники «мусорной» ДНК утверждают, что биохимическая активность обнаруживает функциональные области генома, которые не идентифицируются методами сохранения последовательности или очищающего отбора. [68] [8] [69]
Различные методологии, основанные на разных неявных определениях, дают разные оценки нефункциональной части генома. [6]
Например, 20% геномной ДНК человека не проявляют заметной биохимической активности [59] , но методы сравнительной геномики оценивают нефункциональную фракцию в 85-92%. [70] [9] [56] Следовательно, разные точные определения мусорной ДНК дадут разные точные пропорции. Каждый метод имеет ограничения; например, генетические подходы могут упускать из виду функциональные элементы, которые физически не проявляются в организме; эволюционные подходы сталкиваются с трудностями при использовании точного выравнивания последовательностей нескольких видов, поскольку геномы даже близкородственных видов значительно различаются; а биохимические признаки не всегда автоматически обозначают функцию. [9] В конечном итоге генетические, эволюционные и биохимические подходы могут быть использованы взаимодополняющим образом для выявления областей, которые могут быть функциональными в биологии человека и заболеваниях. [9]
Одним из критериев, который использовался для оценки функциональных элементов, является биохимическая активность. [71] Обнаруживаемая биохимическая активность (например , транскрипция , ассоциация факторов транскрипции , структура хроматина и модификация гистонов ) наблюдалась по меньшей мере для 80% геномной ДНК человека в рамках проекта Энциклопедии элементов ДНК ( ENCODE ). [59] Это формирует верхнюю оценку функциональной части генома человека, поскольку биохимическая активность не обязательно является биологической функцией или селективным преимуществом . [62] [1] [64] [2] [46] Например, сайты связывания транскрипционных факторов короткие и могут быть случайно обнаружены по всему геному [72], а 70% транскрибируемых последовательностей содержат менее 1 транскрипта на клетку и так же может быть ложная фоновая транскрипция. [9]
Дебатам способствует то, что не существует единого мнения о том, что представляет собой «функциональный» элемент в геноме, поскольку генетики, биологи-эволюционисты и молекулярные биологи используют разные подходы и определения «функции», [9] часто с недостатком ясности. что они означают в литературе. [55] Из-за неоднозначности терминологии существуют разные точки зрения по этому вопросу. [73]
Однако широко распространенная транскрипция и сплайсинг в геноме человека обсуждаются как еще один индикатор генетической функции в дополнение к геномной консервативности, которая может пропускать плохо консервативные функциональные последовательности. [9] Большая часть очевидной «мусорной» ДНК участвует в эпигенетической регуляции и, по-видимому, необходима для развития сложных организмов. [74] [75] [76]
Некоторые критики утверждают, что функциональность можно оценить только на основе соответствующей нулевой гипотезы . В этом случае нулевая гипотеза будет состоять в том, что эти части генома нефункциональны и обладают свойствами, будь то на основе консервации или биохимической активности, которые можно было бы ожидать от таких участков на основе нашего общего понимания молекулярной эволюции и биохимия . По мнению этих критиков, до тех пор, пока не будет показано, что рассматриваемый регион имеет дополнительные функции, помимо того, что ожидается от нулевой гипотезы, его следует временно назвать нефункциональным. [77]
Данные секвенирования генома дают веские аргументы в пользу «мусорной» ДНК. Например, в геноме человека есть тысячи участков, которые могут быть потеряны без заметного (или известного) воздействия. Эти сайты могут охватывать сотни тысяч пар оснований , и известно множество делеций более миллиона пар оснований. [78] Фактически, сотни таких локусов содержат известные гены, так что даже эти гены кажутся ненужными. [78]
Одним из показателей функциональности геномной области является то, что эта последовательность была сохранена путем очищающего отбора (или если удаление последовательности является вредным для организма). Оценки функционально ограниченной части человеческого генома, основанные на эволюционной консервации с использованием сравнительной геномики, варьируются от 8 до 15%. [70] [9] [56] Это может все еще быть заниженной, если учесть ограничения, специфичные для происхождения. Однако другие выступают против того, чтобы полагаться исключительно на оценки сравнительной геномики из-за ее ограниченных возможностей, поскольку было обнаружено, что некодирующая ДНК участвует в эпигенетической активности и сложных сетях генетических взаимодействий и исследуется в эволюционной биологии развития . [74] [9] [75] [76]
Биологически функциональные последовательности также могут оказывать различное эволюционное воздействие на саму последовательность или на организм, в котором она обнаружена. Большая часть ДНК в больших геномах возникает в результате эгоистичной амплификации мобильных элементов . Некоторые из этих последовательностей выполняют биологическую функцию (транспозицию и саморепликацию в геноме хозяина), но не обеспечивают селективного преимущества организму-хозяину. [79]
Дополнительная сложность заключается в том, что большое количество нефункциональных фоновых транскриптов, продуцируемых нефункциональными последовательностями, может эволюционировать в функциональные элементы de novo . [80] [81] Таким образом, последовательность, подходящая под строгое определение мусора как не имеющего биологической функции и никакого эффекта приспособленности, все же может иметь долгосрочное эволюционное значение. [82] [83]
Функциональные элементы определяются как дискретные, линейно упорядоченные особенности последовательности, которые определяют молекулярные продукты (например, гены, кодирующие белки, или некодирующие РНК) или биохимические активности с механистической ролью в регуляции генов или генома (например, промоторы транскрипции или усилители).
Функциональные элементы определяются как дискретные, линейно упорядоченные особенности последовательности, которые определяют молекулярные продукты (например, гены, кодирующие белки, или некодирующие РНК) или биохимические активности с механистической ролью в регуляции генов или генома (например, промоторы транскрипции или усилители).