Бактериофаг phi X 174 (или ΦX174 ) представляет собой вирус с одноцепочечной ДНК ( оцДНК ), который инфицирует Escherichia coli . Этот вирус был выделен в 1935 году Николя Булгаковым [1] в лаборатории Феликса д'Эреля в Институте Пастера из образцов, собранных в канализации Парижа. Его характеристика и изучение механизма репликации проводились с 1950-х годов. Это был первый геном на основе ДНК, который удалось секвенировать. Эта работа была завершена Фредом Сэнгером и его командой в 1977 году. [2] В 1962 году Уолтер Фирс и Роберт Синшеймер уже продемонстрировали физическую, ковалентно замкнутую кольцевость ДНК ΦX174. [3] Лауреат Нобелевской премии Артур Корнберг использовал ΦX174 в качестве модели, чтобы впервые доказать, что ДНК, синтезированная в пробирке с помощью очищенных ферментов, может производить все характеристики природного вируса, открывая эпоху синтетической биологии . [4] [5] В 1972–1974 годах Джерард Гурвиц , Сью Викнер и Рид Викнер с соавторами определили гены, необходимые для производства ферментов, катализирующих превращение одноцепочечной формы вируса в двухцепочечную репликативную форму. [6] В 2003 году группа Крейга Вентера сообщила, что геном ΦX174 был первым, который был полностью собран in vitro из синтезированных олигонуклеотидов. [7] Вирусная частица ΦX174 также была успешно собрана in vitro . [8] В 2012 году было показано, как его сильно перекрывающийся геном может быть полностью распакован и при этом оставаться функциональным. [9]
Этот бактериофаг имеет [+] смысловой кольцевой одноцепочечный геном ДНК длиной 5386 нуклеотидов . [10] Содержание GC в геноме составляет 44% и 95% нуклеотидов принадлежат кодирующим генам. Из-за сбалансированного характера оснований генома она используется в качестве контрольной ДНК для секвенаторов Illumina. [ нужна цитата ]
ΦX174 кодирует 11 генов, названных последовательными буквами алфавита в том порядке, в котором они были обнаружены, за исключением A*, который является альтернативным стартовым кодоном в больших генах A. Только гены А* и К считаются несущественными, хотя относительно А* есть некоторые сомнения, поскольку его стартовый кодон можно заменить на АТТ, но не на какую-либо другую последовательность. [11] Сейчас известно, что ATT, вероятно, все еще способен продуцировать белок [12] в E. coli , и поэтому этот ген на самом деле может быть важным.
Первая половина генома ΦX174 характеризуется высоким уровнем перекрывания генов [13] : восемь из 11 генов перекрываются как минимум на один нуклеотид. [2] Было показано, что эти перекрытия не являются существенными [9] , хотя рефакторинговый фаг с удаленными всеми перекрытиями генов имел меньшую приспособленность по сравнению с диким типом. [14]
Фаг ΦX174 использовался, чтобы попытаться установить отсутствие неоткрытой генетической информации с помощью подхода «доказательство путем синтеза». [15]
В 2020 году был создан транскриптом ΦX174. [16] Примечательными особенностями транскриптома ΦX174 является серия из четырех относительно слабых промоторов последовательно с четырьмя Rho-независимыми (внутренними) терминаторами и одним Rho-зависимым терминатором. [ нужна цитата ]
ΦX174 кодирует 11 белков .
Недавно сообщалось об идентификации всех белков ΦX174 с помощью масс-спектрометрии. [14]
Инфекция начинается, когда G-белок связывается с липополисахаридами на поверхности бактериальной клетки-хозяина. Белок H (или белок-пилот ДНК) направляет вирусный геном через бактериальную мембрану бактерий E.coli [18] , скорее всего, через предсказанную спираль N-концевого трансмембранного домена . [19] Однако стало очевидно, что белок H является многофункциональным белком. [20] Это единственный вирусный капсидный белок ΦX174, у которого отсутствует кристаллическая структура по нескольким причинам. Он имеет низкое содержание ароматических веществ и высокое содержание глицина , что делает структуру белка очень гибкой, и, кроме того, отдельные атомы водорода (группа R для глицинов) трудно обнаружить при кристаллографии белка. Кроме того, белок H индуцирует лизис бактериального хозяина в высоких концентрациях, поскольку предсказанная N-концевая трансмембранная спираль легко протыкает дыры в бактериальной стенке. По данным биоинформатики , этот белок содержит четыре предсказанных спиральных домена, которые имеют значительную гомологию с известными факторами транскрипции. Кроме того, было установлено, что белок H de novo необходим для оптимального синтеза других вирусных белков. [21] Мутации белка H, которые препятствуют внедрению вируса, можно преодолеть, если ввести избыточное количество белка B, внутреннего каркасного белка. [ нужна цитата ]
ДНК выбрасывается через гидрофильный канал в 5-кратной вершине. [22] Предполагается, что белок H находится в этой области, но экспериментальные данные не подтвердили его точное местоположение. Попав внутрь бактерии-хозяина, репликация генома [+] оцДНК происходит через промежуточную ДНК с отрицательным смыслом. Это происходит, когда фаговый геном скручивается, а вторичная структура, образованная в результате такой сверхскручивания, притягивает примосомный белковый комплекс. Он один раз транслоцируется по геному и синтезирует [-] оцДНК из положительного исходного генома. [+] Геномы оцДНК для упаковки в вирусы создаются на основе механизма вращающегося круга. Это механизм, с помощью которого двухцепочечный суперспиральный геном разрывается на положительной цепи кодируемым вирусом белком А, что также привлекает бактериальную ДНК-полимеразу (ДНАП) к месту расщепления. DNAP использует отрицательную цепь в качестве матрицы для придания ДНК положительного смысла. Транслоцируясь по геному, он вытесняет внешнюю цепь уже синтезированной ДНК, которая немедленно покрывается белками SSBP . Белок А расщепляет весь геном каждый раз, когда распознает исходную последовательность. [ нужна цитата ]
Поскольку белок D является наиболее распространенным транскриптом гена, его больше всего в вирусном прокапсиде. Аналогично, транскрипты генов F, J и G более распространены, чем H, поскольку стехиометрия этих структурных белков составляет 5:5:5:1. Примосомы представляют собой белковые комплексы, которые прикрепляют/связывают фермент геликазу с матрицей. Примосомы дают цепям РНК праймеры для синтеза ДНК. [ нужна цитата ]
ΦX174 тесно связан с другими микровирусами , особенно с фагом NC (например, NC1, NC7, NC11, NC16, NC37, NC5, NC41, NC56, NC51 и т. д.) и более отдаленно связан с G4-подобными фагами и еще более отдаленно связан с к α3-подобному фагу. Рокита и др. В 2006 г. было представлено филогенетическое древо их взаимоотношений. [23]
ΦX174 использовался в качестве модельного организма во многих эволюционных экспериментах. [24]
ФХ174 регулярно используется в качестве положительного контроля при секвенировании ДНК из-за его относительно небольшого размера генома по сравнению с другими организмами, относительно сбалансированного содержания нуклеотидов — около 23% G, 22% C, 24% A и 31% T, т.е. 45% G+C и 55% A+T, см. номер NC_001422.1 [10] для его последовательности длиной 5386 нуклеотидов. В инструментах секвенирования Illumina в качестве положительного контроля используется ΦX174, [25] и один цикл секвенирования Illumina может покрыть геном ΦX174 несколько миллионов раз, что делает его, весьма вероятно, наиболее тщательно секвенированным геномом в истории. [ нужна цитата ]
ΦX174 также используется для проверки устойчивости средств индивидуальной защиты к вирусам, передающимся через кровь. [26]
ΦX174 также был модифицирован для обеспечения пептидного дисплея (фагового дисплея) из белка вирусного капсида G. [27]
Геном ΦX174 был первым фагом, клонированным в дрожжах, [9] что обеспечивает удобный сухой док для модификаций генома. [28] ΦX174 также был первым геномом, который был полностью распакован, и все перекрытия генов были удалены. [13] Эффект этих изменений привел к значительному снижению прикрепления к хозяину, нарушению регуляции экспрессии белка и чувствительности к теплу. [14]