ДНК -связывающий домен ( DBD ) представляет собой независимо свернутый белковый домен , который содержит по крайней мере один структурный мотив , который распознает двух- или одноцепочечную ДНК . DBD может распознавать конкретную последовательность ДНК ( последовательность распознавания ) или иметь общее сродство к ДНК. [1] Некоторые ДНК-связывающие домены могут также включать в свою свернутую структуру нуклеиновые кислоты.
Один или несколько ДНК-связывающих доменов часто являются частью более крупного белка , состоящего из дополнительных белковых доменов с разными функциями. Дополнительные домены часто регулируют активность ДНК-связывающего домена. Функция связывания ДНК является либо структурной, либо включает регуляцию транскрипции , причем эти две роли иногда перекрываются.
ДНК-связывающие домены, функции которых связаны со структурой ДНК , играют биологическую роль в репликации , репарации , хранении и модификации ДНК, например, в метилировании .
Многие белки, участвующие в регуляции экспрессии генов, содержат ДНК-связывающие домены. Например, белки, которые регулируют транскрипцию путем связывания ДНК, называются факторами транскрипции . Конечным результатом большинства клеточных сигнальных каскадов является регуляция генов.
DBD взаимодействует с нуклеотидами ДНК специфичным или неспецифичным для последовательности способом , но даже неспецифическое распознавание предполагает некоторую молекулярную комплементарность между белком и ДНК. Распознавание ДНК с помощью DBD может происходить по большой или малой бороздке ДНК или по сахарно-фосфатному остову ДНК (см. Структуру ДНК ). Каждый конкретный тип распознавания ДНК адаптирован к функции белка. Например, расщепляющий ДНК фермент ДНКаза I разрезает ДНК почти случайным образом и поэтому должен связываться с ДНК неспецифичным для последовательности образом. Но даже в этом случае ДНКаза I распознает определенную трехмерную структуру ДНК , создавая несколько специфический образец расщепления ДНК, который может быть полезен для изучения распознавания ДНК с помощью метода, называемого ДНК-следом .
Многие ДНК-связывающие домены должны распознавать определенные последовательности ДНК, такие как DBD факторов транскрипции , которые активируют определенные гены, или последовательности ферментов, которые модифицируют ДНК в определенных сайтах, таких как ферменты рестрикции и теломераза . Характер водородных связей в большой бороздке ДНК менее вырожден, чем в малой бороздке ДНК, что обеспечивает более привлекательный сайт для распознавания ДНК, специфичного для последовательности .
Специфичность ДНК-связывающих белков можно изучать с помощью многих биохимических и биофизических методов, таких как гель-электрофорез , аналитическое ультрацентрифугирование , калориметрия , мутация ДНК , мутация или модификация структуры белка , ядерный магнитный резонанс , рентгеновская кристаллография , поверхностный плазмонный резонанс , электронный парамагнитный резонанс , сшивка и микромасштабный термофорез (МСТ).
Большая часть генов в каждом геноме кодирует ДНК-связывающие белки (см. таблицу). Однако лишь небольшое число семейств белков связываются с ДНК. Например, более 2000 из примерно 20 000 белков человека являются «ДНК-связывающими», включая около 750 белков «цинковых пальцев». [3]
Первоначально обнаруженный у бактерий, мотив спираль-поворот-спираль обычно встречается в белках-репрессорах и имеет длину около 20 аминокислот. У эукариот гомеодомен состоит из двух спиралей, одна из которых узнает ДНК (она же спираль узнавания). Они часто встречаются в белках, регулирующих процессы развития ( PROSITE HTH [ постоянная мертвая ссылка ] ).
Домен цинкового пальца в основном встречается у эукариот, но некоторые примеры были обнаружены и у бактерий. [5] Домен цинкового пальца обычно имеет длину от 23 до 28 аминокислот и стабилизируется путем координации ионов цинка с регулярно расположенными координирующими цинк остатками (гистидинами или цистеинами). Самый распространенный класс цинковых пальцев (Cys2His2) координирует один ион цинка и состоит из спирали узнавания и двухцепочечного бета-листа. [6] В транскрипционных факторах эти домены часто встречаются в массивах (обычно разделенных короткими линкерными последовательностями), а соседние пальцы располагаются с интервалом в 3 пары оснований при связывании с ДНК.
Домен основной лейциновой молнии ( bZIP ) встречается главным образом у эукариот и в ограниченной степени у бактерий. Домен bZIP содержит альфа-спираль с лейцином в каждой седьмой аминокислоте. Если две такие спирали найдут друг друга, лейцины могут взаимодействовать, как зубцы в застежке-молнии, позволяя димеризовать два белка. При связывании с ДНК основные аминокислотные остатки связываются с сахарофосфатным остовом, в то время как спирали располагаются в основных бороздках. Он регулирует экспрессию генов.
Домен крылатой спирали (WH) , состоящий примерно из 110 аминокислот, имеет четыре спирали и двухцепочечный бета-лист.
Домен SCOP 46785 «крылатая спираль-поворот-спираль» (wHTH) обычно имеет длину 85-90 аминокислот. Он образован трехспиральным пучком и четырехнитевым бета-листом (крылом).
Основной домен спираль-петля-спираль (bHLH) встречается в некоторых факторах транскрипции и характеризуется двумя альфа-спиралями (α-спиралями), соединенными петлей. Одна спираль обычно меньше и благодаря гибкости петли допускает димеризацию путем сворачивания и упаковки с другой спиралью. Более крупная спираль обычно содержит участки связывания ДНК.
Домены HMG-бокса обнаружены в группах белков с высокой подвижностью, которые участвуют в различных ДНК-зависимых процессах, таких как репликация и транскрипция. Они также изменяют гибкость ДНК, вызывая изгибы. [7] [8] Домен состоит из трех альфа-спиралей, разделенных петлями.
Домены Wor3, названные в честь бело-непрозрачного регулятора 3 (Wor3) у Candida albicans, возникли в ходе эволюции позже, чем большинство ранее описанных ДНК-связывающих доменов, и встречаются только у небольшого числа грибов. [9]
OB-фолд представляет собой небольшой структурный мотив, первоначально названный в честь его свойств связывания олигонуклеотидов / олигосахаридов . Длина OB-складных доменов составляет от 70 до 150 аминокислот. [10] OB-складки связывают одноцепочечную ДНК и, следовательно, представляют собой одноцепочечные связывающие белки . [10]
Белки OB-фолда были идентифицированы как критические для репликации ДНК , рекомбинации ДНК , репарации ДНК , транскрипции , трансляции , реакции на холодовой шок и поддержания теломер . [11]
Домен иммуноглобулина ( InterPro : IPR013783 ) состоит из структуры бета-листа с большими соединительными петлями, которые служат для распознавания либо основных борозд ДНК, либо антигенов. Обычно обнаруживаются в белках иммуноглобулинов, они также присутствуют в белках Stat цитокинового пути. Вероятно, это связано с тем, что цитокиновый путь развился относительно недавно и использовал уже функциональные системы, а не создавал свои собственные.
B3 DBD ( InterPro : IPR003340 , SCOP 117343 ) обнаруживается исключительно в факторах транскрипции высших растений и эндонуклеазах рестрикции EcoRII и BfiI и обычно состоит из 100-120 остатков . Он включает семь бета-листов и две альфа-спирали , которые образуют ДНК-связывающую белковую складку псевдобочонка .
Эффекторы TAL обнаружены в бактериальных патогенах растений рода Xanthomonas и участвуют в регуляции генов растения-хозяина с целью облегчения вирулентности, пролиферации и распространения бактерий. [12] Они содержат центральную область из тандемных повторов из 33-35 остатков, и каждая область повтора кодирует одно основание ДНК в сайте связывания TALE. [13] [14] В повторе только остаток 13 напрямую контактирует с основанием ДНК, определяя специфичность последовательности, в то время как другие положения вступают в контакт с основной цепью ДНК, стабилизируя ДНК-связывающее взаимодействие. [15] Каждый повтор внутри массива принимает форму парных альфа-спиралей, в то время как весь массив повторов образует правостороннюю суперспираль, обертывающую двойную спираль ДНК. Было показано, что массивы эффекторных повторов TAL сжимаются при связывании с ДНК, и был предложен механизм поиска с двумя состояниями, при котором удлиненная TALE начинает сжиматься вокруг ДНК, начиная с успешного распознавания тимина с уникальной повторяющейся единицы, N-концевой ядра TAL. - массив повторяющихся эффекторов. [16] Родственные белки обнаружены у бактериального патогена растений Ralstonia solanacearum , [17] грибкового эндосимбионта Burkholderia rhizoxinica [18] и двух пока еще неопознанных морских микроорганизмов. [19] Код связывания ДНК и структура массива повторов консервативны между этими группами, называемыми TALE -likes .
Система CRISPR/Cas Streptococcus pyogenes может быть запрограммирована на управление как активацией [20] , так и репрессией природных и искусственных промоторов эукариот посредством простой разработки направляющих РНК с комплементарностью по спариванию оснований к сайтам-мишеням ДНК. [21] Cas9 можно использовать в качестве настраиваемой платформы связывания ДНК под управлением РНК. Домен Cas9 может быть функционализирован с помощью представляющих интерес регуляторных доменов (например, активации, репрессии или эпигенетического эффектора) или с помощью эндонуклеазного домена в качестве универсального инструмента геномной инженерии биологии. [22] [23] и затем нацеливаться на несколько локусов с использованием различных направляющих РНК.