Фактор специфичности расщепления и полиаденилирования ( CPSF ) участвует в отщеплении 3' - сигнальной области от вновь синтезированной молекулы пре- мессенджерной РНК (пре-мРНК) в процессе транскрипции гена . У эукариот предшественники информационной РНК (пре-мРНК) транскрибируются в ядре с ДНК ферментом РНК-полимеразой II. Пре-мРНК должны подвергнуться посттранскрипционным модификациям, образуя зрелую РНК (мРНК), прежде чем они смогут быть транспортированы в цитоплазму для трансляции в белки. Посттранскрипционные модификации включают в себя добавление 5'-кэпа m7G, сплайсинг интронных последовательностей, а также 3'-расщепление и полиаденилирование. [1]
По словам Шонемана и др., «CPSF распознает сигнал полиаденилирования (PAS), обеспечивая специфичность последовательности при расщеплении и полиаденилировании пре-мРНК, и катализирует расщепление пре-мРНК». [2] Необходимо вызвать паузу РНК-полимеразы, как только она распознает функциональный PAS. [3] Это первый белок, который связывается с сигнальной областью рядом с сайтом расщепления пре-мРНК, к которой поли(А)-хвост будет добавлен полинуклеотид-аденилилтрансферазой . Сигнальная область, состоящая из 10–30 нуклеотидов выше сайта расщепления, сигнал полиаденилирования (PAS), имеет каноническую нуклеотидную последовательность AAUAAA, которая высоко консервативна в подавляющем большинстве пре-мРНК. Область AAAUAAA обычно определяется цитозин/адениновым (СА) динуклеотидом, который представляет собой предпочтительную последовательность, расположенную с 5'-конца к месту эндонуклеолитического расщепления. [2] [4] Вторая нижестоящая сигнальная область, расположенная примерно на 40 нуклеотидов ниже от сайта расщепления на той части пре-мРНК, которая расщепляется перед полиаденилированием, состоит из U/GU-богатой области, необходимой для эффективного процессинга. Этот нижестоящий фрагмент ухудшился. Зрелая РНК транспортируется в цитоплазму, где транслируется в белки. [4] [5]
У млекопитающих CPSF представляет собой белковый комплекс , состоящий из шести субъединиц: CPSF-160 (CPSF1), CPSF-100 (CPSF2), CPSF-73 (CPSF3) и CPSF-30 (CPSF4) кДа-субъединиц, WDR33 и Fip1 (FIP1L1). ).
Субъединицы образуют два компонента: факторы специфичности полиаденилирования млекопитающих (mPSF) и фактор расщепления млекопитающих (mCF). mPSF состоит из CPSF-160, WDR33, CPSF-30 и Fip1. Это необходимо для распознавания PAS и полиаденилирования. mCF состоит из CPSF-73, CPSF-100 и симплекина. Он катализирует реакцию расщепления, узнавая 3'-сайт процессинга мРНК гистонов. [4] [5]
CPSF-73 представляет собой цинк-зависимую гидролазу , которая расщепляет предшественник мРНК между динуклеотидом CA сразу после сигнальной последовательности полиаденилирования AAUAAA. [6] [7]
CPSF-100 способствует эндонуклеазной активности CPSF-73. [2]
CPSF-160 (160 кДа) является самой крупной субъединицей CPSF и напрямую связывается с сигналом полиаденилирования AAAAAA. [8] 160 кДа имеет три β-пропеллерных домена и С-концевой домен.
CPSF-30 (30 кДа) имеет пять мотивов цинковых пальцев Cys-Cys-Cys-His (CCCH) возле N-конца и цинковый сустав CCCH на C-конце. Существуют две изоформы CPSF-30, которые можно найти в комплексах CPSF. РНК-связывающая активность CPSF-30 опосредуется его цинковыми пальцами 2 и 3. Домен повтора WD 33 (146 кДа) имеет домен WD40 вблизи N-конца. Домен WD40 взаимодействует с РНК. WDR33 и CPSF-30 распознают сигнал полиаденилирования (PAS) в пре-мРНК, что помогает определить положение расщепления РНК. CPSF-30 распознает богатую AU гексамерную область посредством кооперативного металлозависимого механизма связывания. [4] [5] [9] [10]
Хотя CPSF-160 является крупнейшей субъединицей CPSF, исследование, проведенное Schönemann et al., предполагает, что за распознавание PAS отвечает WDR33, а не CPSF-160, как считалось ранее. Исследование пришло к выводу, что причина, по которой CPSF-160 считался ответственным за распознавание PAS, заключалась в том, что субъединица WDR33 не была обнаружена на момент подачи заявления. [2]
Fip1 связывается с U-богатыми РНК посредством своего богатого аргинином С-конца. Он связывается с последовательностями РНК выше гексамерной области AAAUAAA in vitro. Fip1 и CPSF-160 привлекают поли(А)-полимеразу (PAP) к 3'-сайту процессинга. [4] PAP стимулируется ядерным поли(А)-связывающим белком для добавления хвоста поли(А), нематрицированных остатков аденозина, к сайту расщепления. [3] [7]
Только CPSF-160, CPSF-30, Fip1 и WDR33 необходимы и достаточны для формирования активного субкомплекса CPSF при AAAUAAA-зависимом полиаденилировании. CPSF-73 и CPSF-100 являются одноразовыми. [2]
CPSF рекрутирует белки в 3'-область. Идентифицированные белки, которые координируются активностью CPSF, включают: фактор, стимулирующий расщепление , и два плохо изученных фактора расщепления . Связывание полинуклеотидаденилаттрансферазы , ответственной за фактический синтез хвоста, является необходимой предпосылкой расщепления, что гарантирует, что расщепление и полиаденилирование являются тесно связанными процессами.
Альтернативное полиаденилирование (АПА) представляет собой регуляторный механизм, который образует множественные 3'-концы мРНК. [7]
Изоформы APA одного и того же гена могут кодировать разные белки и/или содержать разные 3'-нетранслируемые области (UTR). Дерегулирование APA связано с рядом заболеваний человека. Поскольку более длинные НТО имеют больше сайтов связывания для микроРНК и/или РНК-связывающих белков по сравнению с более короткими НТО, APA требует различной стабильности, эффективности трансляции и/или внутриклеточной локализации. [4]
PAS млекопитающих имеют ряд ключевых цис- элементов.
Последовательности PAS вариабельны, и во многих PAS отсутствует один или несколько цис -элементов. Распознавание PAS осуществляется за счет взаимодействий белок-РНК.
CPSF синергетически связывается с гексамером AAAAAA, а CstF синергически связывается с нижестоящим элементом (DSE). Комплекс CFI связывается с мотивами UGUA. CPSF, CstF и CFI связываются непосредственно с РНК. Они также привлекают другие белки, такие как CFII, симплекин и поли(А)-полимераза (PAP), для сборки 3'-процессирующего комплекса мРНК, также известного как комплекс расщепления и полиаденилирования. Сборке этих факторов способствует С-концевой домен (CTD) большой субъединицы РНК-полимеразы II (РНКП II). CTD обеспечивает посадочную площадку для факторов процессинга мРНК. [4] [11]
Симплекин (SYMPK) представляет собой каркасный белок, который опосредует взаимодействие между CPSF и CstF. [2]
В CPSF млекопитающих как фактор расщепления I (CFI m ), так и фактор специфичности расщепления и полиаденилирования (CPSF) необходимы для расщепления и полиаденилирования, тогда как фактор стимуляции расщепления (CstF) необходим только для стадии расщепления. [12] CPSF и CstF путешествуют вместе с РНК-полимеразой II (RNAP II) во время зарождающейся транскрипции гена в поисках PAS. [3]
Фактор расщепления I (CFI m ) состоит из белков массой 25 ( CPSF5 ), 59 (CPSF7) и 68 (CPSF6) кДа. Фактор расщепления II (CFII m ) состоит из Pcf11, Clp1 и фактора стимуляции расщепления (CstF). CFII m связывается с С-концевым доменом РНКП II и другими факторами CpA. [3] [13]
Фактор стимуляции расщепления (CstF) состоит из трех субъединиц: CstF77 (CstF3), CstF50 (CstF1) и CstF64 (CstF2 и CstF2T). CstF распознает PAS, который находится на 20 нуклеотидов ниже сигнальной области сайта расщепления, который представляет собой мотив последовательности, богатой GU , за которым следуют последовательности, богатые U. CstF способствует выбору сайта расщепления, а также альтернативному полиаденилированию. [4] [5] [13]
Сопряжение транскрипции РНК-полимеразы II (pol II) может влиять на реакции процессинга тремя способами. [11]