Анти-CRISPR (Anti-Clustered Regularly Interspaced Short Palindromic Repeats или Acr) — это группа белков, обнаруженных в фагах , которые подавляют нормальную активность CRISPR -Cas, иммунной системы некоторых бактерий . [1] CRISPR состоит из геномных последовательностей, которые можно обнаружить в прокариотических организмах , которые происходят от бактериофагов , которые ранее инфицировали бактерии, и используются для защиты клетки от дальнейших вирусных атак. [2] Анти-CRISPR является результатом эволюционного процесса, происходящего в фагах, чтобы избежать разрушения их геномов прокариотической клеткой, которую они будут инфицировать. [3]
До открытия этого типа белков семейства приобретение мутаций было единственным известным способом, который фаги могли использовать для избежания опосредованного CRISPR-Cas разрушения, путем снижения связывающей аффинности фага и CRISPR. Тем не менее, у бактерий есть механизмы для перенацеливания мутантного бактериофага, процесс, который называется «адаптация прайминга». Таким образом, насколько в настоящее время известно исследователям, анти-CRISPR является наиболее эффективным способом обеспечения выживания фагов в течение всего процесса инфицирования бактерий. [4]
Системы Anti-CRISPR были впервые обнаружены в профагах Pseudomonas aeruginosa [5] , которые отключали систему CRISPR–Cas типа IF, характерную для некоторых штаммов этих бактерий. После анализа геномных последовательностей этих фагов были обнаружены гены, кодирующие пять различных белков Anti-CRISPR (также называемых Acrs). Такими белками были AcrF1 , AcrF2 , AcrF3 , AcrF4 и AcrF5 . Исследования показали, что ни один из этих белков не нарушал экспрессию генов Cas или сборку молекул CRISPR, поэтому считалось, что эти белки типа IF напрямую влияли на интерференцию CRISPR–Cas. [6]
Дальнейшие исследования подтвердили эту гипотезу с открытием 4 других белков ( AcrE1 , AcrE2 , AcrE3 и AcrE4 ), которые, как было показано, препятствуют системе CRISPR-Cas Pseudomonas aeruginosa . [7] Более того, локус генов, кодирующих эти белки типа IE, был действительно близок к тому, который отвечает за экспрессию белков типа IF в той же группе фагов, что привело к выводу, что оба типа белков работают вместе. [8] Однако эти первые девять белков не имели общих мотивов последовательностей , что облегчило бы идентификацию новых семейств белков Anti-CRISPR.
Позже было замечено, что фаги, которые производили такие белки, также кодировали предполагаемый транскрипционный регулятор, названный Aca 1 (anti-CRISPR associated 1), который был генетически расположен очень близко к генам anti-CRISPR. Предполагается, что этот регуляторный белок отвечает за экспрессию гена anti-CRISPR во время инфекционного цикла фага, поэтому оба типа белков (anti-CRISPR и Aca1), по-видимому, работают вместе как единый механизм. [5]
После некоторых исследований была найдена аминокислотная последовательность, похожая на последовательность Aca1, что привело к открытию Aca2 , нового семейства белков Aca. Aca2 также выявил существование пяти новых групп белков типа IF анти-CRISPR из-за их геномной близости: AcrF6 , AcrF7 , AcrF8 , AcrF9 и AcrF10 . Эти белки присутствовали не только в фагах Pseudomonas aeruginosa , поскольку они также влияли на другие клетки Pseudomonadota (ранее Proteobacteria ). [6]
Благодаря использованию биоинформатических инструментов в 2016 году в Neisseria meningitidis (которая ранее была инфицирована фагами) были обнаружены семейства белков AcrIIC1 , AcrIIC2 и AcrIIC3 . Такие белки были первыми обнаруженными ингибиторами CRISPR–Cas типа II (конкретно, они препятствовали CRISPR–Cas9 типа II-C, типу механизма, используемого в генетическом издании человеческих клеток). [9] Год спустя исследование подтвердило наличие ингибиторов CRISPR–Cas9 типа II-A ( AcrIIA1 , AcrIIA2 , AcrIIA3 и AcrIIA4 ) в Listeria monocytogenes (инфицированной бактериофагами, которые ввели анти-CRISPR белки). Было показано, что два из этих белков (AcrIIA2 и AcrIIA4) работают должным образом против защитной системы CRISPR типа II-A Streptococcus pyogenes .
Результатом всех этих исследований стало открытие 21 различных семейств белков Anti-CRISPR, несмотря на то, что могут существовать и другие ингибиторы из-за быстрого процесса мутации фагов. Таким образом, необходимы дополнительные исследования, чтобы раскрыть сложность систем Anti-CRISPR.
Гены анти-CRISPR можно найти в разных частях ДНК фага: в капсиде, хвосте и на самом конце. Более того, было обнаружено, что многие MGE имеют два или даже три гена Acr в одном опероне , что предполагает, что они могли быть обменены между MGE. [10]
Как и все белки, белки семейства Acr образуются путем трансляции и трансдукции генов, и их классификация основана на типе системы CRISPR-Cas, которую они ингибируют, в связи с тем, что каждый анти-CRISPR белок ингибирует определенную систему CRISPR-Cas. Хотя было обнаружено не так много анти-CRISPR белков, вот те, которые были обнаружены на данный момент:
До настоящего времени гены, кодирующие анти-CRISPR-белки, были обнаружены в миофагах , сифофагах , предполагаемых конъюгативных элементах и островах патогенности .
Были предприняты попытки найти общие генетические особенности окружения генов анти-CRISPR, но безуспешно. Тем не менее, было обнаружено присутствие гена aca сразу под генами анти-CRISPR. [10]
Первыми обнаруженными семействами белков Acr были AcrF1, AcrF2, AcrF3, AcrF4 и AcrF5. [5] Эти ингибиторы в основном встречаются в фагах Pseudomonas , которые способны инфицировать Pseudomonas aeruginosas, обладающих системой CRISPR–Cas типа I‑F. Затем, в другом исследовании, было обнаружено, что семейства белков AcrE1, AcrE2, AcrE3 и AcrE4 также ингибируют CRISPR–Cas типа I‑F в Pseudomonas aeruginosas. [7]
Позднее было обнаружено, что семейства белков AcrF6, AcrF7, AcrF8, AcrF9 и AcrF10, которые также способны ингибировать тип I‑F CRISPR–Cas, очень распространены в МГЭ Pseudomonadota . [10]
Затем были обнаружены первые ингибиторы системы CRISPR–Cas типа II: AcrIIC1, AcrIIC2 и AcrIIC3, которые блокируют активность CRISPR–Cas9 типа II‑C Neisseria meningitidis . [9]
Наконец, были обнаружены AcrIIA1, AcrIIA2, AcrIIA3 и AcrIIA4. Эти семейства белков обладают способностью ингибировать систему CRISPR–Cas типа II‑A Listeria monocytogenes . [11]
Что касается соглашения об именовании белков семейства Acr, оно установлено следующим образом: во-первых, тип ингибируемой системы, затем числовое значение, относящееся к семейству белков, и, наконец, источник конкретного анти-CRISPR белка. Например, AcrF9 Vpa активен против системы CRISPR–Cas типа IF. Он также был девятым анти-CRISPR, описанным для этой системы, и он закодирован в интегрированном MGE в геноме Vibrio parahaemolyticus .
Как было показано выше, существует широкий спектр анти-CRISPR белков, но лишь немногие из них были глубоко изучены. Одним из наиболее изученных и хорошо определенных Acrs является AcrIIA4, который ингибирует Cas9, тем самым блокируя систему II-A CRISPR-Cas Streptococcus pyogenes .
Белок был определен с помощью ядерного магнитного резонанса (ЯМР); он содержит 87 остатков, а его молекулярная масса составляет 10,182 кДа. [13] AcrIIA4 содержит:
Существует хорошее определение вторичных структур, поскольку три α-спирали упакованы около трех β-нитей. Поразительно, что между β3-нитей, α2 и α3-спиралями находится гидрофобное ядро, образованное кластером ароматических боковых цепей, которые притягиваются нековалентными взаимодействиями, такими как pi-стэкинг . Более того, поскольку это кислый белок, существует высокая концентрация отрицательно заряженных остатков в петлях между β3 и α2, между α2 и α3 и в первой части α3, что может играть важную роль в ингибировании Cas9, поскольку отрицательные заряды могут имитировать фосфаты нуклеиновых кислот. [14]
С другой стороны, есть еще один Acr, AcrF1, который, возможно, не был так изучен, как объясненный выше, хотя есть хорошее описание его структуры. Он ингибирует систему IF CRISPR-Cas Pseudomonas aeruginosa . Максвелл и др. [15] решили 3D-структуру с помощью ЯМР.
Белок содержит 78 остатков, [6] между которыми происходит взаимодействие с образованием вторичных структур. Структура AcrF1 образована двумя антипараллельными α-спиралями и β-слоем, который содержит четыре антипараллельные β-тяжи. Этот β-слой расположен на противоположной стороне α-спиральной части, что создает гидрофобное ядро, образованное 13 аминокислотами. Повороты также могут быть обнаружены в различных частях белка, например, при соединении β-тяжей. [15] [16]
Существуют поверхностные остатки, которые активно участвуют в активном центре AcrF1, два из которых являются тирозинами (Y6 и Y20), а третья аминокислота - глутаминовой кислотой (E31), поскольку их мутация на аланин вызывает 100-кратное снижение активности белка (при мутациях Y20A и E31A), и 10 - кратное снижение при мутации Y6.
Различные структуры, образующие белок, создают странную комбинацию, поскольку Максвелл и др. провели поиск DALI, чтобы найти сходства между другими белками, и не нашли никаких информативных сходств. [15]
Основная функция анти-CRISPR белков заключается во взаимодействии со специфическими компонентами систем CRISPR-Cas, такими как эффекторные нуклеазы , чтобы избежать разрушения фаговой ДНК (путем связывания или расщепления). [17]
Фаг вводит свою ДНК в прокариотическую клетку, обычно клетка обнаруживает последовательность, известную как «цель», которая активирует иммунную систему CRISPR-Cas, но наличие начальной последовательности (до цели), кодирующей образование белков Acr, позволяет избежать разрушения фага. Белки Acr образуются до того, как считывается целевая последовательность. Таким образом, система CRISPR-Cas блокируется до того, как она сможет выработать ответ.
Процедура начинается с транскрибирования локуса CRISPR в crRNA (CRISPR RNA). CrRNA объединяются с белками Cas, образуя рибонуклеопротеиновый комплекс, называемый Cascade. Этот комплекс исследует клетку, чтобы найти комплементарные последовательности crRNA. Когда эта последовательность найдена, нуклеаза Cas3 привлекается к Cascade, и целевая ДНК из фага расщепляется. Но, например, когда найдены AcrF1 и AcrF2 (анти-CRISPR белки), они взаимодействуют с Cas7f и Cas8f-Cas5f, соответственно, не позволяя связываться с ДНК фага. Более того, расщепление цели предотвращается объединением AcrF3 и Cas3. [6]
Большинство генов Acr расположены рядом с генами, ассоциированными с анти-CRISPR (Aca), которые кодируют белки с ДНК-связывающим мотивом спираль-поворот-спираль. Гены Aca сохраняются, и исследователи используют их для идентификации генов Acr, но функция кодируемых ими белков не совсем ясна. Ассоциированный с Acr промотор производит высокие уровни транскрипции Acr сразу после того, как происходит инъекция ДНК фага в бактерию, и впоследствии белки Aca подавляют транскрипцию. Если бы это не было подавлено, постоянная транскрипция гена была бы летальной для фага. Поэтому активность Aca необходима для обеспечения его выживания. [18]
Более того, было подтверждено, что бактерии с системами CRISPR-Cas все еще частично невосприимчивы к Acr. Следовательно, первоначальные абортивные фаговые инфекции могут быть неспособны препятствовать иммунитету CRISPR, но кооперация фаг-фаг может все больше усиливать выработку Acr и способствовать иммуносупрессии, что может привести к повышению уязвимости клетки-хозяина к повторному заражению и, в конечном итоге, позволить успешное заражение и распространение второго фага. [17] Это сотрудничество создает эпидемиологическую точку перелома, в которой, в зависимости от начальной плотности Acr-фагов и прочности связывания CRISPR/Acr, фаги могут быть либо устранены, либо вызвать эпидемию фагов (количество бактериофагов увеличивается). [19] [20]
Если начальные уровни фагов достаточно высоки, плотность иммуносупрессированных хозяев достигает критической точки, где успешных инфекций больше, чем неуспешных. Затем начинается эпидемия. Если эта точка не достигнута, происходит вымирание фагов, и иммуносупрессированные хозяева восстанавливают свое исходное состояние. [19] [20]
Стало ясно, что белки Acr играют важную роль в обеспечении возможности уклонения фага от иммунного ответа, хотя до сих пор неясно, как синтез белков анти-CRISPR может преодолеть систему CRISPR-Cas хозяина, которая может разрушить геном фага в течение нескольких минут после заражения. [17]
Из всех обнаруженных до сих пор белков Anti-CRISPR механизмы описаны только для 15 из них. Эти механизмы можно разделить на три различных типа: помехи загрузки crRNA, блокировка связывания ДНК и предотвращение расщепления ДНК .
Механизм интерференции загрузки CrRNA (CRISPR RNA) в основном связан с семейством белков AcrIIC2. [22] Чтобы заблокировать активность Cas9 , он предотвращает правильную сборку комплекса crRNA-Cas9.
Было показано, что AcrIIC2 не единственный, способный блокировать связывание ДНК. Существует 11 других белков семейства Acr, которые также могут это делать. Некоторые из них — AcrIF1, AcrIF2 и AcrIF10, которые действуют на различные субъединицы каскадного эффекторного комплекса системы типа IF CRISPR-Cas, предотвращая связывание ДНК с комплексом. [23]
Кроме того, AcrIIC3 предотвращает связывание ДНК, способствуя димеризации Cas9 [22] [24] , а AcrIIA2 имитирует ДНК, тем самым блокируя остатки распознавания PAM и, следовательно, предотвращая распознавание и связывание dsDNA (двуцепочечной ДНК) . [25] [26]
AcrE1, AcrIF3 и AcrIIC1 могут предотвращать расщепление целевой ДНК. С помощью рентгеновской кристаллографии было обнаружено, что AcrE1 связывается с Cas3, связанным с CRISPR. [27] Аналогичным образом, биохимический и структурный анализ AcrIF3 показал его способность связываться с Cas3 в виде димера, чтобы предотвратить привлечение Cas3 в комплекс Cascade. [23] [28] [29] Наконец, благодаря биохимическим и структурным исследованиям AcrIIC1 было обнаружено, что он связывается с активным сайтом домена эндонуклеазы HNH в Cas9, что предотвращает расщепление ДНК. Таким образом, он переводит Cas9 в неактивное, но связанное с ДНК состояние. [24]
AcrIIA4 — один из белков, отвечающих за ингибирование системы CRISPR-Cas9, механизма, используемого в редакции клеток млекопитающих. Добавление AcrIIA4 в клетки человека позволяет избежать взаимодействия Cas9 с системой CRISPR, снижая ее способность разрезать ДНК. Однако различные исследования пришли к выводу, что добавление его в небольших количествах после редактирования генома снижает количество нецелевых разрезов в конкретных местах, в которых взаимодействует Cas9, что делает всю систему намного более точной. [25]
Одной из основных целей использования технологии CRISPR-Cas9 является искоренение болезней, некоторые из которых встречаются у переносчиков болезней , таких как комары. Анти-CRISPR-белки могут препятствовать генному драйву , что может привести к неопределенным и катастрофическим последствиям в экосистемах . [30]
Чтобы узнать, синтезирует ли определенная бактерия Cas9 и, следовательно, использует ли CRISPR-Cas9, или обнаружить случайное или недопустимое использование этой системы, можно использовать AcrIIC1. Поскольку вышеупомянутый белок связывается с Cas9, была разработана центробежная микрофлюидная платформа для его обнаружения и определения его каталитической активности. [30]
Устойчивость к антибиотикам — это проблема общественного здравоохранения, которая постоянно растет из-за неправильного использования антибиотиков. Фаговая терапия заключается в инфицировании бактерий с помощью фагов, которые гораздо более специфичны и вызывают меньше побочных эффектов, чем антибиотики. Acrs может ингибировать систему CRISPR-Cas9 некоторых бактерий и позволить этим фагам инфицировать бактериальные клетки, не подвергаясь атаке со стороны иммунной системы. [30]