Сплайсинг белка — это внутримолекулярная реакция конкретного белка , в которой внутренний сегмент белка (называемый интеином ) удаляется из белка-предшественника с лигированием С-концевых и N-концевых внешних белков (называемых экстеинами ) с обеих сторон. Сплайсинг-соединение белка-предшественника в основном представляет собой цистеин или серин , которые являются аминокислотами , содержащими нуклеофильную боковую цепь . Реакции сплайсинга белка, которые известны сейчас, не требуют экзогенных кофакторов или источников энергии, таких как аденозинтрифосфат (АТФ) или гуанозинтрифосфат (ГТФ). Обычно сплайсинг связан только со сплайсингом пре-мРНК . Этот белок-предшественник содержит три сегмента — N-экстеин , за которым следует интеин, за которым следует С-экстеин . После сплайсинга полученный белок содержит N-экстеин, связанный с С-экстеином; этот продукт сплайсинга также называется экстеином.
Первый интеин был обнаружен в 1988 году путем сравнения последовательностей между вакуолярной АТФазой Neurospora crassa [1] и моркови [2] (без интеина) и гомологичным геном в дрожжах (с интеином), который был впервые описан как предполагаемый переносчик ионов кальция . [3] В 1990 году Хирата и др. [4] продемонстрировали, что дополнительная последовательность в гене дрожжей транскрибировалась в мРНК и удалялась из белка хозяина только после трансляции. С тех пор интеины были обнаружены во всех трех доменах жизни (эукариоты, бактерии и археи) и в вирусах .
Сплайсинг белка был неожиданным, и его механизмы были открыты двумя группами (Anraku [5] и Stevens [6] ) в 1990 году. Они обе обнаружили Saccharomyces cerevisiae VMA1 в предшественнике фермента вакуолярной H + -АТФазы . Аминокислотная последовательность N- и C-концов соответствовала 70% последовательности ДНК вакуолярной H + -АТФазы других организмов, тогда как аминокислотная последовательность центрального положения соответствовала 30% общей последовательности ДНК дрожжевой HO нуклеазы .
Многие гены имеют несвязанные сегменты, кодирующие интеины, вставленные в разных позициях. По этим и другим причинам интеины (или, правильнее сказать, сегменты генов, кодирующие интеины) иногда называют эгоистичными генетическими элементами , но, возможно, точнее будет назвать их паразитическими . Согласно геноцентрическому взгляду на эволюцию, большинство генов являются «эгоистичными» только в той мере, в какой они конкурируют с другими генами или аллелями , но обычно они выполняют функцию для организмов, тогда как «паразитические генетические элементы», по крайней мере изначально, не вносят положительного вклада в приспособленность организма. [7] [8]
По состоянию на декабрь 2019 года база данных UniProtKB содержит 188 записей, вручную аннотированных как интеины, начиная от десятков аминокислотных остатков до тысяч. [9] Первый интеин был обнаружен закодированным в гене VMA Saccharomyces cerevisiae . Позже они были обнаружены в грибах ( аскомицеты , базидиомицеты , зигомицеты и хитридиевые грибы ), а также в различных белках. Было описано, что белок, отдаленно связанный с известными интеинами, содержащими белок, но тесно связанный с белками metazoan hedgehog , имеет последовательность интеина из Glomeromycota . Многие из недавно описанных интеинов содержат хоуминговые эндонуклеазы, и некоторые из них, по-видимому, активны. [10] Обилие интеина в грибах указывает на латеральный перенос генов, содержащих интеин. В то время как у эубактерий и архей в настоящее время известно 289 и 182 интеина. Неудивительно, что большая часть интеина у эубактерий и архей, как и у грибов, встроена в метаболический белок нуклеиновой кислоты. [10]
Интеины сильно различаются, но многие из тех же интеин-содержащих белков встречаются у ряда видов. Например, белок фактора 8 пре-мРНК-процессинга ( Prp8 ), играющий важную роль в сплайсосоме , имеет семь различных сайтов вставки интеина у разных видов эукариот. [11] Интеин-содержащий Prp8 чаще всего встречается у грибов, но также встречается у Amoebozoa , Chlorophyta , Capsaspora и Choanoflagellida . Многие микобактерии содержат интеины в DnaB (бактериальная репликативная геликаза), RecA (бактериальная ДНК-рекомбиназа) и SufB ( белок сборки кластера FeS ). [12] [13] Существует замечательное разнообразие в структуре и количестве интеинов DnaB как внутри рода микобактерий, так и за его пределами. Интересно, что интеин-содержащий DnaB также встречается в хлоропластах водорослей. [14] Интеин-содержащие белки, обнаруженные в археях, включают RadA (гомолог RecA), RFC, PolB, RNR. [15] Многие из тех же интеин-содержащих белков (или их гомологов) обнаружены в двух или даже во всех трех доменах жизни. Интеины также обнаружены в протеомах, кодируемых бактериофагами и эукариотическими вирусами. Вирусы могли быть вовлечены в качестве векторов распространения интеинов среди широкого спектра интеин-содержащих организмов. [15]
Процесс для интеинов класса 1 начинается со сдвига NO или NS, когда боковая цепь первого остатка ( серин , треонин или цистеин ) интеиновой части белка-предшественника нуклеофильно атакует пептидную связь остатка, расположенного непосредственно выше по течению (то есть конечный остаток N-экстеина), образуя линейный эфир (или тиоэфир ) промежуточного соединения. Трансэтерификация происходит, когда боковая цепь первого остатка C-экстеина атакует новообразованный (тио)эфир, освобождая N-конец интеина. Это образует разветвленное промежуточное соединение, в котором N-экстеин и C-экстеин соединены, хотя и не через пептидную связь. Последний остаток интеина всегда является аспарагином ( Asn), и амидный атом азота этой боковой цепи расщепляет пептидную связь между интеином и C-экстеином, в результате чего образуется свободный сегмент интеина с терминальным циклическим имидом . Наконец, свободная аминогруппа C-экстеина теперь атакует (тио)эфир, связывающий N- и C-экстеины вместе. Сдвиг ON или SN создает пептидную связь и функциональный лигированный белок. [16]
Интеины класса 2 не имеют нуклеофильной первой боковой цепи, только аланин. Вместо этого реакция начинается непосредственно с нуклеофильного замещения, при этом первый остаток C-экстеина атакует пептидный карбоксил на конечном остатке N-экстеина. Остальное происходит как обычно, начиная с превращения Asn в циклический имид. [17]
Интеины класса 3 не имеют нуклеофильной первой боковой цепи, только аланин, однако у них есть внутренний несмежной мотив «WCT». Внутренний остаток C (цистеин) атакует пептидный карбоксил на конечном остатке N-экстеина (нуклеофильное замещение). Трансэтерификация происходит, когда первый остаток C-экстеина атакует новообразованный тиоэстер. Остальное происходит как обычно. [18]
Механизм эффекта сплайсинга представляет собой естественную аналогию с методом химического получения белков среднего размера, называемым нативным химическим лигированием .
Интеин — это сегмент белка , способный отщеплять себя и присоединяться к оставшимся частям ( экстеинам ) с помощью пептидной связи во время сплайсинга белка. [19] Интеины также называют белковыми интронами по аналогии с интронами (РНК) .
Первая часть названия интеина основана на научном названии организма , в котором он обнаружен, а вторая часть основана на названии соответствующего гена или экстеина. Например, интеин, обнаруженный в Thermoplasma acidophilum и связанный с субъединицей A вакуолярной АТФазы (VMA), называется «Tac VMA».
Обычно, как в этом примере, для обозначения организма достаточно всего трех букв, но есть и вариации. Например, для обозначения штамма могут быть добавлены дополнительные буквы. Если в соответствующем гене закодировано более одного интеина, интеинам присваивается числовой суффикс, начинающийся с 5 ′ до 3 ′ или в порядке их идентификации (например, «Msm dnaB-1»).
Сегмент гена, кодирующий интеин, обычно имеет то же название, что и интеин, но во избежание путаницы название самого интеина обычно пишется с заглавной буквы ( например , Pfu RIR1-1), тогда как название соответствующего сегмента гена пишется курсивом ( например , Pfu rir1-1 ). Другой способ устранения неоднозначности — поставить строчную букву «i» после названия исходного белка, например , «Msm DnaBi1». [20]
Интеины можно классифицировать по многим критериям.
Интеины могут содержать домен гена самонаводящейся эндонуклеазы (HEG) в дополнение к доменам сплайсинга. Этот домен отвечает за распространение интеина путем расщепления ДНК на аллеле , свободном от интеина, на гомологичной хромосоме , запуская систему репарации двухцепочечных разрывов ДНК (DSBR), которая затем восстанавливает разрыв, таким образом копируя ДНК, кодирующую интеин, в ранее свободный от интеина сайт. [17] Домен HEG не является необходимым для сплайсинга интеина, и поэтому он может быть потерян, образуя минимальный или мини - интеин . Несколько исследований продемонстрировали модульную природу интеинов путем добавления или удаления доменов HEG и определения активности новой конструкции. [ необходима цитата ]
Иногда интеин белка-предшественника происходит из двух генов. В этом случае интеин называется расщепленным интеином . Например, у цианобактерий DnaE , каталитическая субъединица α ДНК-полимеразы III , кодируется двумя отдельными генами, dnaE-n и dnaE-c . Продукт dnaE-n состоит из последовательности N-экстеина, за которой следует последовательность интеина 123-AA, тогда как продукт dnaE-c состоит из последовательности интеина 36-AA, за которой следует последовательность C-экстеина. [21]
Интеины очень эффективны при сплайсинге белков, и, соответственно, они нашли важную роль в биотехнологии . На сегодняшний день идентифицировано более 200 интеинов; размеры варьируются от 100 до 800 аминокислот . Интеины были разработаны для конкретных применений, таких как полусинтез белков [22] и селективная маркировка сегментов белков, что полезно для исследований больших белков методом ЯМР . [23]
Фармацевтическое ингибирование вырезания интеина может быть полезным инструментом для разработки лекарственных препаратов ; белок, содержащий интеин, не будет выполнять свою нормальную функцию, если интеин не будет вырезаться, поскольку его структура будет нарушена.
Было высказано предположение, что интеины могут оказаться полезными для достижения аллотопической экспрессии некоторых высокогидрофобных белков , обычно кодируемых митохондриальным геномом, например, в генной терапии . [24] Гидрофобность этих белков является препятствием для их импорта в митохондрии. Поэтому вставка негидрофобного интеина может позволить осуществить этот импорт. Удаление интеина после импорта затем восстановит белок до дикого типа .
Аффинные метки широко использовались для очистки рекомбинантных белков, поскольку они позволяют накапливать рекомбинантный белок с небольшим количеством примесей. Однако аффинная метка должна быть удалена протеазами на заключительном этапе очистки. Дополнительный этап протеолиза поднимает проблемы специфичности протеазы при удалении аффинных меток из рекомбинантного белка и удалении продукта переваривания. Эту проблему можно избежать, слияя аффинную метку с саморасщепляемыми интеинами в контролируемой среде. Первое поколение векторов экспрессии такого рода использовало модифицированный интеин Saccharomyces cerevisiae VMA (Sce VMA). Чонг и др. [25] использовали домен связывания хитина (CBD) из Bacillus circulans в качестве аффинной метки и слили эту метку с модифицированным интеином Sce VMA. Модифицированный интеин подвергается реакции саморасщепления на своем N-концевом пептидном соединении с 1,4-дитиотреитолом (DTT), β-меркаптоэтанолом (β-ME) или цистеином при низких температурах в широком диапазоне pH. После экспрессии рекомбинантного белка гомогенат клеток пропускается через колонку, содержащую хитин . Это позволяет CBD химерного белка связываться с колонкой. Кроме того, когда температура понижается и молекулы, описанные выше, проходят через колонку, химерный белок подвергается самосплайсингу, и элюируется только целевой белок. Эта новая технология устраняет необходимость в этапе протеолиза, и модифицированный Sce VMA остается в колонке, прикрепленный к хитину через CBD. [25]
Недавно интеины использовались для очистки белков на основе самоагрегирующихся пептидов. Эластиноподобные полипептиды (ELP) являются полезным инструментом в биотехнологии. Слитые с целевым белком, они имеют тенденцию образовывать агрегаты внутри клеток. [26] Это устраняет хроматографический этап, необходимый для очистки белка. Теги ELP использовались в слитом белке интеина, так что агрегаты можно было выделить без хроматографии (центрифугированием), а затем интеин и тег можно было расщепить контролируемым образом, чтобы высвободить целевой белок в раствор. Эту изоляцию белка можно было выполнить с использованием непрерывного потока среды, что давало большое количество белка, что делало этот процесс более экономически эффективным, чем обычные методы. [26] Другая группа исследователей использовала более мелкие самоагрегирующиеся теги для изоляции целевого белка. Небольшие амфипатические пептиды 18A и ELK16 (рисунок 5) использовались для образования саморасщепляющегося агрегирующего белка. [27]
За последние двадцать лет возрос интерес к использованию интеинов для антимикробных применений. [12] Сплайсинг интеинов встречается исключительно в одноклеточных организмах, с особенно высоким содержанием в патогенных микроорганизмах. [28] Кроме того, интеины обычно встречаются в белках домашнего хозяйства и/или белках, участвующих в выживании организма в организме человека. Посттрансляционное удаление интеина необходимо для того, чтобы белок правильно сворачивался и функционировал. Например, Гаэль Юэ и др. продемонстрировали, что в Mycobacterium tuberculosis несплайсированный SufB предотвращает образование комплекса SufBCD, компонента механизма SUF. [29] Таким образом, ингибирование сплайсинга интеинов может служить мощной платформой для разработки антимикробных препаратов.
Текущие исследования ингибиторов сплайсинга интеина были сосредоточены на разработке антимикобактериальных препаратов ( M. tb. имеет три белка, содержащих интеин), а также агентов, активных против патогенных грибов Cryptococcus и Aspergillus. [13] Цисплатин и аналогичные соединения, содержащие платину, ингибируют сплайсинг интеина M. tb. RecA посредством координации с каталитическими остатками. [30] Двухвалентные катионы, такие как ионы меди (II) и цинка (II), действуют аналогично, обратимо ингибируя сплайсинг. [12] Однако ни один из этих методов в настоящее время не подходит для эффективного и безопасного антибиотика. Грибковый интеин Prp8 также ингибируется двухвалентными катионами и цисплатином посредством взаимодействия с каталитическим остатком Cys1. [12] В 2021 году Ли и др. показали, что малые молекулярные ингибиторы сплайсинга интеина Prp8 были селективны и эффективны в замедлении роста C. neoformans и C. gattii , предоставив захватывающие доказательства антимикробного потенциала ингибиторов сплайсинга интеина. [31]