В молекулярной биологии , блок CCAAT (также иногда сокращенно блок CAAT или блок CAT ) представляет собой отчетливый шаблон нуклеотидов с консенсусной последовательностью GGCCAATCT , которые находятся выше по течению на 60-100 оснований от начального сайта транскрипции . Блок CAAT сигнализирует о сайте связывания для фактора транскрипции РНК и обычно сопровождается консервативной консенсусной последовательностью. Это инвариантная последовательность ДНК примерно на расстоянии минус 70 пар оснований от начала транскрипции во многих эукариотических промоторах . Гены, имеющие этот элемент, по-видимому, требуют его для транскрибирования гена в достаточных количествах. Он часто отсутствует в генах, кодирующих белки, используемые практически во всех клетках. Этот блок вместе с блоком GC известен тем, что связывает общие факторы транскрипции. Обе эти консенсусные последовательности принадлежат регуляторному промотору . Полная экспрессия гена происходит, когда белки-активаторы транскрипции связываются с каждым модулем в регуляторном промоторе. Для активации блока CCAAT требуется специфическое связывание белка. Эти белки известны как белки, связывающие CCAAT-бокс/факторы связывания CCAAT-бокс.
CCAAT-бокс — это элемент, часто встречающийся перед кодирующими областями эукариот, но не встречающийся у прокариот. [2]
В направлении транскрипции цепи матрицы консенсусная последовательность или рассчитанный порядок наиболее частых остатков для CAAT-бокса был 3'-TG ATTGG (T/C)(T/C)(A/G)-5'. Использование скобок означает, что присутствует одно из оснований, но не указывается их относительная частота. Например, «(T/C)» будет означать, что либо тимин, либо цитозин предпочтительно выбраны для. [3] В пределах метазоа (царство животных) комплекс фактора связывания ядра (CBF)-ДНК сохраняет высокую степень консервативности в мотиве связывания CCAAT, а также в последовательностях, фланкирующих этот пентамерный мотив. Мотив CCAAT в растениях (в эксперименте использовался шпинат) немного отличается от мотива у метазоа тем, что он фактически является мотивом связывания CAAT; промоутер не имеет одного из двух остатков C из пентамерного мотива, и искусственное добавление второго C не оказывает существенного влияния на активность связывания. В некоторых последовательностях полностью отсутствует CAAT-бокс. Во-вторых, окружающие нуклеотиды в растениях не соответствуют консенсусной последовательности, определенной выше Bi et al. [4]
CAAT-бокс — это то, что известно как основной промотор, также известный как базальный промотор или просто промотор , — это область ДНК, которая инициирует транскрипцию определенного гена. Эта область, в частности, для CAAT-бокса, расположена примерно на 60–100 оснований выше (по направлению к 5'-концу), однако не менее чем на 27 пар оснований дальше от начального сайта транскрипции или гена эукариот, в котором комплекс общих факторов транскрипции связывается с РНК-полимеразой II до начала транскрипции. [5] [6] Для транскрипции важно, чтобы эти основные факторы связывания (также называемые ядерным фактором Y или NF-Y) могли связываться с мотивом CCAAT. Эксперименты во многих лабораториях показали, что мутации в мотиве CCAAT, которые вызывают потерю связывания CBF, также снижают транскрипционную активность в этих промоторах, что позволяет предположить, что комплексы CBF-CCAAT необходимы для оптимальной транскрипционной активности. [3]
В эксперименте, проведенном с основными факторами связывания (CBF) и комплексами ДНК, исследователи смогли определить предпочтительные последовательности промотора в области над и непосредственно рядом с CAAT-боксом, и двух областях по обе стороны от CAAT-бокса. Используя процесс случайного связывания, опосредованный ПЦР , исследователи смогли показать, что последовательность «3' - (T/C)G ATTGG (T/C)(T/C)(A/G) - 5'», непосредственно фланкирующая область ATTGG (CCAAT в комплементарной цепи), была предпочтительно выбрана на кодирующей цепи (напротив цепи-матрицы). [3] [7] [8] Это было показано с использованием олигонуклеотидной последовательности (R1), которая содержала 27 случайных нуклеотидов, фланкированных определенной последовательностью из 20 нуклеотидов с каждой стороны. Хотя ни один нуклеотид не был выбран в каждом клоне по обе стороны от мотива ATTGG (CCAAT в комплементарной цепи), было несколько нуклеотидов в позициях, выбранных с высокой частотой. Наиболее заметным из последовательности выше был остаток G по направлению к 5' концу ATTGG. Другие остатки, также перечисленные, были примечательны, но между двумя остатками есть разделение. Этот же эксперимент также дал ту же последовательность, что и показано выше, при использовании другого олигонуклеотида (R2), который содержал ядро ATTGG и фланкировался 12 5' случайными нуклеотидами и 10 3' случайными нуклеотидами. Обе эти последовательности очень похожи и подтверждены в нескольких экспериментах. Для последовательностей, которые фланкировали мотив ATTGG двумя остатками аденина (AA) на его 5' конце и G(A/G) на его 3' конце, по-видимому, ингибировалось образование комплекса CBF-ДНК и впоследствии встречалось только в 1% последовательностей промотора. [3] В другом эксперименте, проведенном с главным поздним промотором (MLP) аденовирусов из различных видов хозяев, было показано, что мутация CAAT-бокса и последовательности CCAAT, которая, как полагают, играет ключевую роль в (MLP) человеческих аденовирусов подгруппы C, у видов с дефицитной последовательностью CAAT. Инициация транскрипции у мутантных видов MLP была значительно снижена по сравнению с таковой у дикого типа или видов, в которых был мутант CAAT. Неспособность восстановить нормально функциональные аденовирусы, продемонстрированная CAAT-боксом, согласуется с идеей о том, что CAAT-бокс играет жизненно важную роль в MLP аденовируса и является предпочтительным по сравнению с другими транскрипционными элементами. [9]
Эти основные факторы связывания, или ядерные факторы (NF-Y), состоят из трех субъединиц – NF-YA, NF-YB и NF-YC. В то время как у животных каждая субъединица NF-Y кодируется одним геном, у растений наблюдается диверсификация как по структуре, так и по функциям. Семейства NF-Y состоят из восьми-39 членов на субъединицу. Основной причиной этой диверсификации являются дупликации генов и тандемные дупликации, которые способствовали увеличению размеров семейства NF-Y по сравнению с единичными кодируемыми ядерными факторами животных. [10] Каждая субъединица содержит эволюционно консервативную часть – C-конец NF-YA, центральную часть NF-YB и N-конец NF-YC, более 70% из них у разных видов остаются консервативными. Однако соседние регионы, как правило, не консервативны. [6]
Семейство NF-YA кодирует факторы транскрипции, которые имеют различную длину (от 207 до 347 аминокислот для M. truncatula ). Белки NF-YA обычно характеризуются двумя доменами, которые строго консервативны у всех высших эукариот, исследованных на сегодняшний день. Первый домен (A1) содержит 20 аминокислот, которые образуют альфа-спираль , которая, по-видимому, важна при взаимодействии с NF-YB и NF-YC. Второй домен (A2) примыкает к домену A1 консервативной линкерной последовательностью — последовательностью из 21 аминокислоты, жизненно важной для специфического связывания ДНК с боксом CCAAT. Домены A1 и A2 консервативны по отношению к C-концу млекопитающих, но занимают более центральную область в субъединицах NF-YA растений. У растений субъединица NF-YA эволюционировала, чтобы регулировать развитие факультативного корневого органа, присутствующего только у бобовых растений и, как было показано, экспрессируемого в корневой ткани. Было показано, что он обладает свойствами, подобными засухоустойчивости, и его активность повышается во время стресса, вызванного засухой, в корнях и листьях Arabidopsis . Мутанты NF-YA показали потерю функции и повышенную чувствительность к засухоподобным условиям, и, напротив, повышенная экспрессия NF-YA привела к устойчивости к засухе . [10]
Семейство NF-YB, подобно субъединице NF-YA, имеет переменную длину, однако в среднем намного меньше, чем субъединица NF-YA (90–240 аминокислот в «M. truncatula»). Они были охарактеризованы структурой и аминокислотным составом, похожими на мотив гистоновой складки (HFM). Он состоит из трех альфа-спиралей, разделенных двумя доменами бета-цепи-петли. Подобно NF-YA, было показано, что NF-YB также улучшает устойчивость к засухе при сверхэкспрессии, а также стимулирует цветение у Arabidopsis . [10]
Белки NF-YC имеют промежуточный размер между белками NF-YA и NF-YB (117–292 аминокислоты у M. truncatula ) и также содержат HFM, который преобладает в белках NF-YB. Также было показано, что он участвует во времени цветения у некоторых растений (сверхэкспрессия приводит к более раннему цветению), где его влияние потенциально регулируется связыванием белка CONSTANS (CO) с субъединицей NF-YC. [10]
Из-за эволюционного изменения генов, кодирующих NF-Y в растениях, они впоследствии имеют большой диапазон потенциальных тримерных комплексов. Например, у Arabidopsis было идентифицировано 36 субъединиц фактора транскрипции NF-Y (включая 10 субъединиц NF-YA, 13 субъединиц NF-YB и 13 субъединиц NF-YC), которые теоретически могли бы образовывать 1690 уникальных комплексов (содержащих по одной субъединице каждого типа). Это число, конечно, выше, чем происходит на самом деле, поскольку некоторые субъединицы имеют специфические паттерны связывания. Функциональный анализ генов, кодирующих NF-Y в растениях, показал, что в результате их эволюционной диверсификации относительно их животных аналогов они приобрели разнообразные специфические функции, такие как развитие эмбриона, контроль времени цветения, ER-стресс, стресс от засухи и развитие клубеньков и корней. Это может быть лишь небольшой частью их возможностей, поскольку число теоретически возможных комбинаций комплексов NF-Y настолько велико, а на самом деле может быть создана лишь малая часть (менее 10% всех возможных взаимодействий были подтверждены в обоих направлениях у дрожжей). [10]
Другим аспектом мотива связывания CCAAT являются белки связывания CCAAT/энхансера (C/EBP). Они представляют собой группу факторов транскрипции из 6 членов (α-ζ), которые высококонсервативны и связываются с мотивом CCAAT. Хотя исследования этих связывающих белков относительно недавние, было показано, что их функция играет жизненно важную роль в клеточной пролиферации и дифференциации, метаболизме , воспалении и иммунитете в различных клетках, но особенно в гепатоцитах , адипоцитах и гемопоэтических клетках . [11] Например, в адипоцитах это было показано в различных экспериментах с мышами: эктопическая экспрессия этих C/EBP (C/EBPα и C/EBPβ) была способна инициировать программы дифференциации клетки даже при отсутствии адипогенных гормонов или дифференциацию преадипоцитов в адипоциты (или жировые клетки). Кроме того, переизбыток этих C/EBP (в частности, C/EBPδ) вызывает ускоренную реакцию. И, кроме того, в клетках, лишенных C/EBP, или у мышей с дефицитом C/EBP, оба не способны подвергаться адипогенезу. Это приводит к гибели мышей от гипогликемии или уменьшению накопления липидов в жировой ткани. [12] C/EBP следуют общему домену основной лейциновой молнии (bZIP) на C-конце и способны образовывать димеры с другими C/EBP или другими факторами транскрипции. Эта димеризация позволяет C/EBP специфически связываться с ДНК через палиндромную последовательность в большой бороздке ДНК. Они регулируются различными способами, включая гормоны , митогены , цитокины , питательные вещества и другие различные факторы. [11]