Искусственный синтез генов , или просто синтез генов , относится к группе методов, которые используются в синтетической биологии для конструирования и сборки генов из нуклеотидов de novo . В отличие от синтеза ДНК в живых клетках, искусственный синтез генов не требует шаблонной ДНК, что позволяет синтезировать практически любую последовательность ДНК в лаборатории. Он состоит из двух основных этапов, первый из которых — твердофазный синтез ДНК , иногда известный как ДНК-печать . [1] Это производит олигонуклеотидные фрагменты, которые обычно составляют менее 200 пар оснований. Затем второй этап включает соединение этих олигонуклеотидных фрагментов с использованием различных методов сборки ДНК. Поскольку искусственный синтез генов не требует шаблонной ДНК, теоретически возможно создать полностью синтетическую молекулу ДНК без ограничений по последовательности нуклеотидов или размеру.
Синтез первого полного гена, дрожжевой тРНК , был продемонстрирован Хар Гобиндом Кораной и его коллегами в 1972 году. [2] Синтез первых генов, кодирующих пептиды и белки , был выполнен в лабораториях Герберта Бойера и Александра Маркхэма соответственно. [3] [4] Совсем недавно были разработаны методы синтеза искусственных генов, которые позволят собирать целые хромосомы и геномы. Первая синтетическая хромосома дрожжей была синтезирована в 2014 году, а также были синтезированы целые функциональные бактериальные хромосомы. [5] Кроме того, в будущем искусственный синтез генов может использовать новые пары азотистых оснований (неестественные пары оснований). [6] [7] [8]
Олигонуклеотиды синтезируются химически с использованием строительных блоков, называемых нуклеозидными фосфорамидитами . Это могут быть нормальные или модифицированные нуклеозиды, которые имеют защитные группы для предотвращения неправильного взаимодействия их аминов, гидроксильных групп и фосфатных групп. За один раз добавляется один фосфорамидит, снимается защита с 5'-гидроксильной группы и добавляется новое основание и так далее. Цепь растет в направлении от 3' к 5', что является обратным по отношению к биосинтезу. В конце все защитные группы удаляются. Тем не менее, будучи химическим процессом, происходит несколько неправильных взаимодействий, приводящих к некоторым дефектным продуктам. Чем длиннее синтезируемая последовательность олигонуклеотида, тем больше в ней дефектов, поэтому этот процесс применим только для получения коротких последовательностей нуклеотидов . Текущий практический предел составляет около 200 п.н. ( пар оснований ) для олигонуклеотида достаточного качества, чтобы его можно было использовать непосредственно для биологического применения. ВЭЖХ можно использовать для выделения продуктов с правильной последовательностью. Между тем, большое количество олигонуклеотидов может быть синтезировано параллельно на генных чипах . Для оптимальной производительности в последующих процедурах генного синтеза их следует готовить индивидуально и в больших масштабах.
Обычно набор индивидуально разработанных олигонуклеотидов изготавливается на автоматизированных твердофазных синтезаторах, очищается и затем соединяется посредством специфического отжига и стандартных лигирующих или полимеразных реакций. Для повышения специфичности отжига олигонуклеотидов этап синтеза опирается на набор термостабильных ДНК- лигаз и полимеразных ферментов . На сегодняшний день описано несколько методов синтеза генов, таких как лигирование фосфорилированных перекрывающихся олигонуклеотидов, [2] [3] метод Fok I [4] и модифицированная форма лигазной цепной реакции для синтеза генов. Кроме того, описано несколько подходов к сборке ПЦР . [9] Обычно они используют олигонуклеотиды длиной 40-50 нуклеотидов, которые перекрывают друг друга. Эти олигонуклеотиды предназначены для покрытия большей части последовательности обеих цепей, а полноразмерная молекула генерируется постепенно с помощью ПЦР с перекрытием и удлинением (OE), [9] термодинамически сбалансированной ПЦР изнутри наружу (TBIO) [10] или комбинированных подходов. [11] Наиболее часто синтезируемые гены имеют размер от 600 до 1200 п.н., хотя гораздо более длинные гены были созданы путем соединения ранее собранных фрагментов размером менее 1000 п.н. В этом диапазоне размеров необходимо протестировать несколько клонов-кандидатов, подтверждающих последовательность клонированного синтетического гена с помощью методов автоматического секвенирования.
Более того, поскольку сборка полноразмерного генного продукта зависит от эффективного и специфического выравнивания длинных одноцепочечных олигонуклеотидов, критические параметры для успеха синтеза включают расширенные области последовательности, включающие вторичные структуры, вызванные инвертированными повторами, необычайно высоким или низким содержанием GC или повторяющимися структурами. Обычно эти сегменты конкретного гена могут быть синтезированы только путем разделения процедуры на несколько последовательных шагов и окончательной сборки более коротких подпоследовательностей, что, в свою очередь, приводит к значительному увеличению времени и трудозатрат, необходимых для его производства. Результат эксперимента по синтезу гена сильно зависит от качества используемых олигонуклеотидов. Для этих протоколов синтеза гена на основе отжига качество продукта напрямую и экспоненциально зависит от правильности используемых олигонуклеотидов. В качестве альтернативы, после выполнения синтеза гена с олигонуклеотидами более низкого качества необходимо приложить больше усилий для последующего обеспечения качества во время анализа клонов, что обычно выполняется с помощью трудоемких стандартных процедур клонирования и секвенирования. Другая проблема, связанная со всеми текущими методами синтеза генов, — это высокая частота ошибок последовательности из-за использования химически синтезированных олигонуклеотидов. Частота ошибок увеличивается с более длинными олигонуклеотидами, и, как следствие, процент правильного продукта резко уменьшается по мере использования большего количества олигонуклеотидов. Проблема мутации может быть решена с помощью более коротких олигонуклеотидов, используемых для сборки гена. Однако все методы сборки на основе отжига требуют смешивания праймеров в одной пробирке. В этом случае более короткие перекрытия не всегда позволяют точно и специфично отжигать комплементарные праймеры, что приводит к ингибированию образования полноразмерного продукта. Ручное проектирование олигонуклеотидов — это трудоемкая процедура, которая не гарантирует успешного синтеза нужного гена. Для оптимальной производительности почти всех методов на основе отжига предполагается, что температуры плавления перекрывающихся областей одинаковы для всех олигонуклеотидов. Необходимая оптимизация праймеров должна выполняться с использованием специализированных программ проектирования олигонуклеотидов. На данный момент представлено несколько решений для автоматизированного проектирования праймеров для синтеза генов. [12] [13] [14]
Для преодоления проблем, связанных с качеством олигонуклеотидов, было разработано несколько сложных стратегий, использующих либо отдельно приготовленные олигонуклеотиды для ловли [15] , либо ферменты связывания несоответствий семейства mutS [16] , либо специфические эндонуклеазы из бактерий или фагов [17] . Тем не менее, все эти стратегии увеличивают время и затраты на синтез генов, основанный на отжиге химически синтезированных олигонуклеотидов.
Массовое параллельное секвенирование также использовалось в качестве инструмента для скрининга сложных библиотек олигонуклеотидов и обеспечения возможности извлечения точных молекул. В одном подходе олигонуклеотиды секвенируются на платформе пиросеквенирования 454, а роботизированная система получает изображения и выбирает отдельные бусины, соответствующие точной последовательности. [18] В другом подходе сложная библиотека олигонуклеотидов модифицируется уникальными фланкирующими тегами перед массовым параллельным секвенированием. Затем направленные на теги праймеры обеспечивают извлечение молекул с желаемыми последовательностями с помощью ПЦР с набором номера. [19]
Все чаще гены упорядочиваются в наборы, включающие функционально связанные гены или множественные варианты последовательностей на одном гене. Практически все терапевтические белки в разработке, такие как моноклональные антитела, оптимизируются путем тестирования многих вариантов генов для улучшения функции или экспрессии.
В то время как традиционный синтез нуклеиновых кислот использует только 4 пары оснований — аденин, тимин, гуанин и цитозин, синтез олигонуклеотидов в будущем может включать использование неестественных пар оснований, которые представляют собой искусственно созданные и синтезированные нуклеиновые основания, не встречающиеся в природе.
В 2012 году группа американских ученых во главе с Флойдом Ромесбергом, химическим биологом из Научно-исследовательского института Скриппса в Сан-Диего, Калифорния, опубликовала, что его команда разработала неестественную пару оснований (UBP). Два новых искусственных нуклеотида или неестественная пара оснований (UBP) были названы d5SICS и dNaM . Более технически, эти искусственные нуклеотиды , несущие гидрофобные азотистые основания , имеют два слитых ароматических кольца , которые образуют комплекс (d5SICS–dNaM) или пару оснований в ДНК. В 2014 году та же группа из Научно-исследовательского института Скриппса сообщила, что они синтезировали участок кольцевой ДНК, известный как плазмида, содержащий естественные пары оснований TA и CG вместе с наиболее эффективным UBP, разработанным лабораторией Ромесберга, и вставили его в клетки распространенной бактерии E. coli , которая успешно реплицировала неестественные пары оснований на протяжении нескольких поколений. Это первый известный пример живого организма, передающего расширенный генетический код последующим поколениям. Это было частично достигнуто путем добавления поддерживающего гена водоросли, который экспрессирует транспортер нуклеотидтрифосфата , который эффективно импортирует трифосфаты как d5SICSTP, так и dNaMTP в бактерии E. coli . Затем естественные пути бактериальной репликации используют их для точной репликации плазмиды, содержащей d5SICS–dNaM.
Успешное включение третьей пары оснований является значительным прорывом на пути к цели значительного расширения числа аминокислот , которые могут быть закодированы ДНК, с существующих 20 аминокислот до теоретически возможных 172, тем самым расширяя потенциал живых организмов для производства новых белков . [20] В будущем эти неестественные пары оснований можно будет синтезировать и включать в олигонуклеотиды с помощью методов ДНК-печати.
Таким образом, печать ДНК может использоваться для производства частей ДНК, которые определяются как последовательности ДНК, кодирующие определенную биологическую функцию (например, промоторы , последовательности регуляции транскрипции или открытые рамки считывания ). [21] Однако, поскольку синтез олигонуклеотидов обычно не может точно производить последовательности олигонуклеотидов длиной более нескольких сотен пар оснований, необходимо использовать методы сборки ДНК для сборки этих частей вместе для создания функциональных генов, многогенных цепей или даже целых синтетических хромосом или геномов. Некоторые методы сборки ДНК определяют только протоколы для соединения частей ДНК, в то время как другие методы также определяют правила для формата частей ДНК, которые совместимы с ними. Эти процессы можно масштабировать, чтобы обеспечить сборку целых хромосом или геномов. В последние годы наблюдается рост числа различных стандартов сборки ДНК, и по состоянию на 2015 год было разработано 14 различных стандартов сборки, каждый из которых имеет свои плюсы и минусы. [22] В целом, разработка стандартов сборки ДНК значительно облегчила рабочий процесс синтетической биологии, способствовала обмену материалами между исследовательскими группами, а также позволила создавать модульные и многоразовые части ДНК. [22]
Различные методы сборки ДНК можно разделить на три основные категории: сборка с помощью эндонуклеазы, сайт-специфическая рекомбинация и сборка на основе длинных перекрытий. [22] Каждая группа методов имеет свои отличительные характеристики, а также свои преимущества и ограничения.
Эндонуклеазы — это ферменты, которые распознают и расщепляют сегменты нуклеиновых кислот, и их можно использовать для управления сборкой ДНК. Из различных типов рестриктаз наиболее доступны и используются рестриктазы типа II, поскольку их сайты расщепления расположены вблизи или в их сайтах распознавания. Следовательно, методы сборки с помощью эндонуклеазы используют это свойство для определения частей ДНК и протоколов сборки.
Стандарт сборки BioBricks был описан и представлен Томом Найтом в 2003 году и с тех пор постоянно обновляется. [23] В настоящее время наиболее часто используемым стандартом BioBricks является стандарт сборки 10, или BBF RFC 10. BioBricks определяет последовательности префиксов и суффиксов, необходимые для того, чтобы часть ДНК была совместима с методом сборки BioBricks, что позволяет объединять все части ДНК, имеющие формат BioBricks.
Префикс содержит сайты рестрикции для EcoRI, NotI и XBaI, в то время как суффикс содержит сайты рестрикции SpeI, NotI и PstI. За пределами областей префикса и суффикса часть ДНК не должна содержать этих сайтов рестрикции. Чтобы соединить две части BioBrick вместе, одна из плазмид расщепляется EcoRI и SpeI, в то время как вторая плазмида расщепляется EcoRI и XbaI. Два выступа EcoRI являются комплементарными и, таким образом, будут отжигаться вместе, в то время как SpeI и XbaI также образуют комплементарные выступы, которые также могут быть лигированы вместе. Поскольку полученная плазмида содержит исходные последовательности префикса и суффикса, ее можно использовать для соединения с большим количеством частей BioBricks. [24] Из-за этого свойства стандарт сборки BioBricks считается идемпотентным по своей природе. Однако между двумя слитыми BioBricks также будет образована последовательность «шрама» (либо TACTAG, либо TACTAGAG). Это предотвращает использование BioBricks для создания белков слияния, поскольку последовательность шрама 6bp кодирует тирозин и стоп-кодон, вызывая прекращение трансляции после экспрессии первого домена, в то время как последовательность шрама 8bp вызывает сдвиг рамки , предотвращая непрерывное считывание кодонов. Чтобы предложить альтернативные последовательности шрама, которые, например, дают шрам 6bp, или последовательности шрама, которые не содержат стоп-кодонов, были разработаны другие стандарты сборки, такие как BB-2 Assembly, BglBricks Assembly, Silver Assembly и Freiburg Assembly. [25] [26] [27] [28]
Хотя самый простой способ сборки деталей BioBrick описан выше, существуют также несколько других часто используемых методов сборки, которые предлагают несколько преимуществ по сравнению со стандартной сборкой. Сборка с 3 антибиотиками (3A) позволяет выбрать правильную сборку с помощью выбора антибиотика, в то время как усиленная сборка вставки стремится преодолеть низкую эффективность трансформации, наблюдаемую в сборке 3A. [29] [30]
Стандарт сборки BioBrick также послужил источником вдохновения для использования других типов эндонуклеаз для сборки ДНК. Например, как стандарт iBrick, так и стандарты сборки векторов HomeRun используют хоуминг-эндонуклеазы вместо рестриктаз типа II. [31] [32]
Некоторые методы сборки также используют эндонуклеазы рестрикции типа IIs. Они отличаются от других эндонуклеаз типа II тем, что они разрезают несколько пар оснований от сайта распознавания. В результате последовательность выступа может быть изменена так, чтобы она содержала желаемую последовательность. Это дает методам сборки типа IIs два преимущества — это позволяет производить сборку «без рубцов» и сборку из нескольких частей в одном сосуде. Методы сборки, которые используют эндонуклеазы типа IIs, включают Golden Gate и связанные с ним варианты.
Протокол сборки Golden Gate был определен Энглером и др. в 2008 году для определения метода сборки ДНК, который даст конечную конструкцию без последовательности рубцов, а также без исходных сайтов рестрикции. Это позволяет экспрессировать белок, не содержащий нежелательных последовательностей белка, которые могут негативно повлиять на сворачивание или экспрессию белка. Используя фермент рестрикции BsaI, который производит выступ из 4 пар оснований, для сборки можно использовать до 240 уникальных, непалиндромных последовательностей. [33]
Проектирование и сборка плазмиды
При клонировании Golden Gate каждый фрагмент ДНК, который должен быть собран, помещается в плазмиду, фланкированную обращенными внутрь сайтами рестрикции BsaI, содержащими запрограммированные последовательности выступов. Для каждого фрагмента ДНК последовательность 3'-выступа комплементарен 5'-выступу следующего нижестоящего фрагмента ДНК. Для первого фрагмента 5'-выступ комплементарен 5'-выступу целевой плазмиды, в то время как 3'-выступ конечного фрагмента комплементарен 3'-выступу целевой плазмиды. Такая конструкция позволяет собирать все фрагменты ДНК в реакции в одном сосуде (где все реагенты смешиваются вместе), при этом все фрагменты располагаются в правильной последовательности. Успешно собранные конструкции отбираются путем обнаружения потери функции кассеты скрининга, которая изначально была в целевой плазмиде. [33]
MoClo и Золотая коса
Оригинальная сборка Golden Gate допускает создание только одной конструкции в векторе назначения. Чтобы использовать эту конструкцию в последующей реакции в качестве вектора входа, были разработаны стандарты MoClo и Golden Braid. [34]
Стандарт MoClo предполагает определение нескольких уровней сборки ДНК:
Каждый уровень сборки чередует использование сайтов рестрикции BsaI и BpiI для минимизации количества запрещенных сайтов, а последовательная сборка для каждого уровня достигается путем следования дизайну плазмиды Golden Gate. В целом, стандарт MoClo позволяет собирать конструкцию, содержащую несколько единиц транскрипции, все собранные из разных частей ДНК, с помощью серии реакций Golden Gate в одном сосуде. Однако один из недостатков стандарта MoClo заключается в том, что он требует использования «фиктивных частей» без биологической функции, если для окончательной конструкции требуется менее четырех составных частей. [35] Стандарт Golden Braid, с другой стороны, ввел попарный стандарт сборки Golden Gate.
Стандарт Golden Braid использует ту же многоуровневую сборку, что и MoClo, но каждый уровень включает сборку только двух фрагментов ДНК, т. е. попарный подход. Таким образом, на каждом уровне пары генов клонируются в целевой фрагмент в желаемой последовательности, и они впоследствии собираются по два за раз в последовательных уровнях. Как и MoClo, стандарт Golden Braid чередует ферменты рестрикции BsaI и BpiI между каждым уровнем.
Разработка методов сборки Golden Gate и их вариантов позволила исследователям разработать наборы инструментов для ускорения рабочего процесса синтетической биологии. Например, EcoFlex был разработан как набор инструментов для E. Coli , который использует стандарт MoClo для своих частей ДНК, в то время как аналогичный набор инструментов был также разработан для инженерии микроводорослей Chlamydomonas reinhardtii . [36] [37]
Сайт-специфическая рекомбинация использует фаговые интегразы вместо ферментов рестрикции, устраняя необходимость иметь сайты рестрикции во фрагментах ДНК. Вместо этого интегразы используют уникальные сайты прикрепления (att) и катализируют перестройку ДНК между целевым фрагментом и вектором назначения. Система клонирования Invitrogen Gateway была изобретена в конце 1990-х годов и использует две запатентованные смеси ферментов, клоназу BP и клоназу LR. Смесь клоназы BP катализирует рекомбинацию между сайтами attB и attP, генерируя гибридные сайты attL и attR, в то время как смесь клоназы LR катализирует рекомбинацию сайтов attL и attR, давая сайты attB и attP. Поскольку каждая смесь ферментов распознает только определенные сайты att, рекомбинация является высокоспецифичной, и фрагменты могут быть собраны в желаемой последовательности. [38]
Векторный дизайн и сборка
Поскольку клонирование Gateway является запатентованной технологией, все реакции Gateway должны проводиться с помощью набора Gateway, предоставленного производителем. Реакцию можно обобщить в два этапа. Первый этап включает сборку входных клонов, содержащих интересующий фрагмент ДНК, в то время как второй этап включает вставку этого интересующего фрагмента в целевой клон.
Самые ранние итерации метода клонирования Gateway позволяли использовать только один клон входа для каждого произведенного клона назначения. Однако дальнейшие исследования показали, что можно сгенерировать еще четыре ортогональных последовательности att, что позволяет собирать до четырех различных фрагментов ДНК, и этот процесс теперь известен как технология Multisite Gateway. [39]
Помимо клонирования Gateway, были разработаны некоммерческие методы с использованием других интеграз. Например, метод Serine Integrase Recombinational Assembly (SIRA) использует интегразу ϕC31, в то время как метод Site-Specific Recombination-based Tandem Assembly (SSRTA) использует интегразу Streptomyces phage φBT1. [40] [41] Другие методы, такие как HomeRun Vector Assembly System (HVAS), основаны на системе клонирования Gateway и дополнительно включают хоуминговые эндонуклеазы для разработки протокола, который потенциально может поддерживать промышленный синтез синтетических конструкций ДНК. [31]
В последние годы было разработано множество методов сборки на основе длинных перекрытий. Один из наиболее часто используемых методов, метод сборки Гибсона, был разработан в 2009 году и обеспечивает метод сборки ДНК в одном сосуде, который не требует использования ферментов рестрикции или интеграз. [42] Другие похожие методы сборки на основе перекрытий включают кольцевое клонирование полимеразы (CPEC), клонирование, независимое от последовательности и лигазы (SLIC) и извлечение бесшовного лигирования клонирования (SLiCE). [43] [44] [45] Несмотря на наличие множества методов сборки на основе перекрытий, метод сборки Гибсона по-прежнему остается самым популярным. [46] Помимо методов, перечисленных выше, другие исследователи основывались на концепциях, используемых в сборке Гибсона и других методах сборки, для разработки новых стратегий сборки, таких как стратегия модульной сборки с направленным перекрытием и линкерами (MODAL) или метод стандарта сборки Biopart для идемпотентного клонирования (BASIC). [47] [48]
Метод сборки Гибсона — это относительно простой метод сборки ДНК, требующий всего нескольких дополнительных реагентов: 5' T5 экзонуклеаза , Phusion ДНК полимераза и Taq ДНК лигаза . Фрагменты ДНК, которые должны быть собраны, синтезируются так, чтобы иметь перекрывающиеся 5' и 3' концы в том порядке, в котором они должны быть собраны. Эти реагенты смешиваются с фрагментами ДНК, которые должны быть собраны, при температуре 50 °C, и происходят следующие реакции:
Поскольку экзонуклеаза T5 термолабильна, она инактивируется при 50 °C после начального этапа жевания. Таким образом, продукт стабилен, а фрагменты собираются в желаемом порядке. Этот однореакторный протокол может точно собрать до 5 различных фрагментов, в то время как у нескольких коммерческих поставщиков есть наборы для точной сборки до 15 различных фрагментов в двухэтапной реакции. [49] Однако, хотя протокол сборки Гибсона является быстрым и использует относительно мало реагентов, он требует индивидуального синтеза ДНК, поскольку каждый фрагмент должен быть разработан так, чтобы содержать перекрывающиеся последовательности с соседними фрагментами и амплифицирован с помощью ПЦР. Эта зависимость от ПЦР может также повлиять на точность реакции, когда используются длинные фрагменты, фрагменты с высоким содержанием GC или повторяющиеся последовательности. [48]
Стратегия MODAL определяет перекрывающиеся последовательности, известные как «линкеры», для уменьшения объема настройки, которую необходимо выполнить с каждым фрагментом ДНК. Линкеры были разработаны с использованием программного обеспечения R2oDNA Designer, а области перекрытия были разработаны длиной 45 п.н. для совместимости со сборкой Гибсона и другими методами перекрывающейся сборки. Чтобы прикрепить эти линкеры к частям, которые должны быть собраны, ПЦР проводится с использованием праймеров, специфичных для частей, содержащих префиксные и суффиксные последовательности адаптеров длиной 15 п.н. Затем линкеры присоединяются к последовательностям адаптеров с помощью второй реакции ПЦР. Для позиционирования фрагментов ДНК тот же линкер будет присоединен к суффиксу желаемого вышестоящего фрагмента и префиксу желаемых нижестоящих фрагментов. После присоединения линкеров можно использовать сборку Гибсона, CPEC или другие методы перекрывающейся сборки для сборки фрагментов ДНК в желаемом порядке.
Стратегия сборки BASIC была разработана в 2015 году и направлена на устранение ограничений предыдущих методов сборки, включив в себя шесть ключевых концепций из них: стандартные повторно используемые детали; одноуровневый формат (все детали имеют одинаковый формат и собираются с использованием одного и того же процесса); идемпотентное клонирование; параллельная (многокомпонентная) сборка ДНК; независимость от размера; автоматизируемость. [48]
Части ДНК и конструкция линкера
Части ДНК проектируются и клонируются в плазмиды хранения, причем часть фланкируется последовательностью интегрированного префикса ( i P) и интегрированного суффикса ( i S). Последовательности i P и i S содержат обращенные внутрь сайты рестрикции BsaI, которые содержат выступы, комплементарные линкерам BASIC. [48] Как и в MODAL, 7 стандартных линкеров, используемых в BASIC, были разработаны с помощью программного обеспечения R2oDNA Designer и проверены, чтобы гарантировать, что они не содержат последовательностей с гомологией с геномами шасси, и что они не содержат нежелательных последовательностей, таких как последовательности вторичной структуры, сайты рестрикции или сайты связывания рибосом. Каждая последовательность линкера разделена на две половины, каждая с выступом в 4 п.н., комплементарным сайту рестрикции BsaI, двухцепочечной последовательностью в 12 п.н. и общей последовательностью перекрытия в 21 п.н. с другой половиной. Половина, которая будет связываться с восходящей частью ДНК, известна как часть суффиксного линкера (например, L1S), а половина, которая связывается с нисходящей частью, известна как часть префиксного линкера (например, L1P). Эти линкеры формируют основу сборки частей ДНК вместе.
Помимо указания порядка сборки, стандартные линкеры BASIC также могут быть модифицированы для выполнения других функций. Для обеспечения идемпотентной сборки линкеры также были разработаны с дополнительными метилированными последовательностями i P и i S, вставленными для защиты их от распознавания BsaI. Это метилирование теряется после трансформации и репликации плазмиды in vivo, и плазмиды могут быть извлечены, очищены и использованы для дальнейших реакций.
Поскольку последовательность линкера относительно длинная (45 п.н. для стандартного линкера), есть возможность включить функциональные последовательности ДНК, чтобы уменьшить количество частей ДНК, необходимых во время сборки. Стандарт сборки BASIC предоставляет несколько линкеров, встроенных в RBS различной прочности. Аналогично, чтобы облегчить построение белков слияния, содержащих несколько доменов белка, также было разработано несколько линкеров слияния, чтобы обеспечить полное считывание конструкции ДНК. Эти линкеры слияния кодируют полипептид из 15 аминокислот глицина и серина, который является идеальным линкерным пептидом для белков слияния с несколькими доменами.
Сборка
Сборка готовой конструкции состоит из трех основных этапов.
Поскольку методы печати ДНК и сборки ДНК позволили коммерческому синтезу генов стать прогрессивно и экспоненциально дешевле за последние годы, [50] искусственный синтез генов представляет собой мощный и гибкий инженерный инструмент для создания и проектирования новых последовательностей ДНК и функций белков. Помимо синтетической биологии, различные области исследований, такие как области, связанные с гетерологичной экспрессией генов , разработкой вакцин , генной терапией и молекулярной инженерией, получили бы большую выгоду от наличия быстрых и дешевых методов синтеза ДНК для кодирования белков и пептидов. [51] Методы, используемые для печати и сборки ДНК, даже позволили использовать ДНК в качестве носителя информации .
28 июня 2007 года группа ученых из Института Дж. Крейга Вентера опубликовала статью в журнале Science Express , в которой говорилось, что им удалось успешно пересадить природную ДНК бактерии Mycoplasma mycoides в клетку Mycoplasma capricolum , создав бактерию, которая вела себя как M. mycoides . [52]
6 октября 2007 года Крейг Вентер объявил в интервью британской газете The Guardian , что та же команда искусственно синтезировала модифицированную версию единственной хромосомы Mycoplasma genitalium . Хромосома была модифицирована для устранения всех генов, которые, как показали испытания на живых бактериях, были ненужными. Следующим запланированным шагом в этом проекте минимального генома является трансплантация синтезированного минимального генома в бактериальную клетку с удаленной старой ДНК; полученная бактерия будет называться Mycoplasma laboratorium . На следующий день канадская группа по биоэтике ETC Group опубликовала заявление через своего представителя Пэта Муни , в котором говорилось, что «творение» Вентера было «шасси, на котором можно построить почти все». Синтезированный геном еще не был трансплантирован в рабочую клетку. [53]
21 мая 2010 года журнал Science сообщил, что группа Вентера успешно синтезировала геном бактерии Mycoplasma mycoides из компьютерной записи и пересадила синтезированный геном в существующую клетку бактерии Mycoplasma capricolum , из которой была удалена ДНК. «Синтетическая» бактерия оказалась жизнеспособной, то есть способной реплицироваться миллиарды раз. Первоначально команда планировала использовать бактерию M. genitalium , с которой они работали ранее, но переключилась на M. mycoides , поскольку последняя бактерия растет гораздо быстрее, что привело к более быстрым экспериментам. [54] Вентер описывает ее как «первый вид..., чьим родителем был компьютер». [55] Трансформированную бактерию ETC окрестила « Synthia ». Представитель Вентера отказался подтвердить какой-либо прорыв на момент написания этой статьи.
В рамках проекта Synthetic Yeast 2.0 различные исследовательские группы по всему миру приняли участие в проекте по синтезу синтетических геномов дрожжей и посредством этого процесса оптимизации генома модельного организма Saccharomyces cerevisiae . [56] Проект Yeast 2.0 применял различные методы сборки ДНК, которые обсуждались выше, и в марте 2014 года Джеф Бёке из Медицинского центра Лангоне при Нью-Йоркском университете сообщил, что его команда синтезировала хромосому III S. cerevisiae . [57] [58] Процедура включала замену генов в исходной хромосоме синтетическими версиями, а затем готовую синтетическую хромосому интегрировали в дрожжевую клетку. Для этого потребовалось разработать и создать 273 871 пару оснований ДНК — меньше, чем 316 667 пар в исходной хромосоме. В марте 2017 года синтез 6 из 16 хромосом был завершен, а синтез остальных все еще продолжался. [59]
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка )