Секвенирование ДНК — это процесс определения последовательности нуклеиновой кислоты — порядка нуклеотидов в ДНК . Он включает в себя любой метод или технологию, которая используется для определения порядка четырех оснований: аденина , гуанина , цитозина и тимина . Появление методов быстрого секвенирования ДНК значительно ускорило биологические и медицинские исследования и открытия. [1] [2]
Знание последовательностей ДНК стало незаменимым для фундаментальных биологических исследований, ДНК-генографических проектов и во многих прикладных областях, таких как медицинская диагностика , биотехнология , судебная биология , вирусология и биологическая систематика . Сравнение здоровых и мутированных последовательностей ДНК позволяет диагностировать различные заболевания, включая различные виды рака, [3] охарактеризовать репертуар антител [4] и может использоваться для определения лечения пациентов. [5] Наличие быстрого способа секвенирования ДНК позволяет оказывать более быструю и индивидуализированную медицинскую помощь, а также идентифицировать и каталогизировать больше организмов. [4]
Быстрая скорость секвенирования, достигаемая с помощью современной технологии секвенирования ДНК, сыграла важную роль в секвенировании полных последовательностей ДНК или геномов многочисленных типов и видов жизни, включая геном человека и другие полные последовательности ДНК многих животных, растений и микробов. разновидность.
Первые последовательности ДНК были получены в начале 1970-х годов академическими исследователями с помощью трудоемких методов, основанных на двумерной хроматографии . После разработки методов флуоресцентного секвенирования с помощью секвенатора ДНК [6] секвенирование ДНК стало проще и на несколько порядков быстрее. [7] [8]
Секвенирование ДНК может использоваться для определения последовательности отдельных генов , более крупных генетических областей (т.е. кластеров генов или оперонов ), полных хромосом или целых геномов любого организма. Секвенирование ДНК также является наиболее эффективным способом косвенного секвенирования РНК или белков (через их открытые рамки считывания ). Фактически, секвенирование ДНК стало ключевой технологией во многих областях биологии и других наук, таких как медицина, судебная экспертиза и антропология .
Секвенирование используется в молекулярной биологии для изучения геномов и белков, которые они кодируют. Информация, полученная с помощью секвенирования, позволяет исследователям выявлять изменения в генах и некодирующей ДНК (включая регуляторные последовательности), ассоциации с заболеваниями и фенотипами, а также идентифицировать потенциальные мишени лекарств.
Поскольку ДНК является информативной макромолекулой с точки зрения передачи от одного поколения к другому, секвенирование ДНК используется в эволюционной биологии для изучения того, как разные организмы связаны между собой и как они развивались. В феврале 2021 года ученые впервые сообщили о секвенировании ДНК останков животных , в данном случае мамонта , возрастом более миллиона лет, самой старой ДНК, секвенированной на сегодняшний день. [9] [10]
Область метагеномики включает идентификацию организмов, присутствующих в водоеме, сточных водах , грязи, мусоре, отфильтрованном из воздуха, или образцах мазков от организмов. Знание того, какие организмы присутствуют в конкретной среде, имеет решающее значение для исследований в области экологии , эпидемиологии , микробиологии и других областей. Например, секвенирование позволяет исследователям определить, какие типы микробов могут присутствовать в микробиоме .
Поскольку большинство вирусов слишком малы, чтобы их можно было увидеть в световой микроскоп, секвенирование является одним из основных инструментов в вирусологии для идентификации и изучения вируса. [11] Вирусные геномы могут быть основаны на ДНК или РНК. РНК-вирусы более чувствительны ко времени для секвенирования генома, поскольку они быстрее разлагаются в клинических образцах. [12] Традиционное секвенирование по Сэнгеру и секвенирование нового поколения используются для секвенирования вирусов в фундаментальных и клинических исследованиях, а также для диагностики новых вирусных инфекций, молекулярной эпидемиологии вирусных патогенов и тестирования лекарственной устойчивости. В GenBank хранится более 2,3 миллиона уникальных вирусных последовательностей . [11] Недавно NGS превзошел традиционный метод Сэнгера как самый популярный подход к созданию вирусных геномов. [11]
Во время вспышки птичьего гриппа в 1990 году секвенирование вируса показало, что подтип гриппа возник в результате реассортации между перепелами и домашней птицей. Это привело к принятию в Гонконге закона , запрещающего продажу на рынке вместе живых перепелов и домашней птицы. Секвенирование вируса также можно использовать для оценки момента начала вирусной вспышки с помощью метода молекулярных часов . [12]
Медицинские техники могут секвенировать гены (или, теоретически, полные геномы) пациентов, чтобы определить, существует ли риск генетических заболеваний. Это форма генетического тестирования , хотя некоторые генетические тесты могут не включать секвенирование ДНК.
Секвенирование ДНК также все чаще используется для диагностики и лечения редких заболеваний. Поскольку выявляется все больше и больше генов, вызывающих редкие генетические заболевания, молекулярная диагностика пациентов становится все более распространенной. Секвенирование ДНК позволяет клиницистам выявлять генетические заболевания, улучшать лечение заболеваний, предоставлять репродуктивное консультирование и назначать более эффективные методы лечения. [13]
Кроме того, секвенирование ДНК может быть полезно для определения конкретных бактерий, чтобы обеспечить более точное лечение антибиотиками , тем самым снижая риск создания устойчивости к противомикробным препаратам в популяциях бактерий. [14] [15] [16] [17] [18] [19]
Секвенирование ДНК может использоваться наряду с методами профилирования ДНК для судебно-медицинской идентификации [20] и установления отцовства . Тестирование ДНК значительно изменилось за последние несколько десятилетий, чтобы в конечном итоге связать отпечаток ДНК с тем, что расследуется. Образцы ДНК в отпечатках пальцев, слюне, волосяных фолликулах и т. д. однозначно отличают каждый живой организм от другого. Тестирование ДНК — это метод, позволяющий обнаружить определенные геномы в цепи ДНК для создания уникального и индивидуального рисунка.
Каноническая структура ДНК имеет четыре основания: тимин (Т), аденин (А), цитозин (Ц) и гуанин (G). Секвенирование ДНК — это определение физического порядка этих оснований в молекуле ДНК. Однако существует множество других оснований, которые могут присутствовать в молекуле. У некоторых вирусов (в частности, бактериофага ) цитозин может быть заменен гидроксиметилом или гидроксиметилглюкозоцитозином. [21] В ДНК млекопитающих могут быть обнаружены варианты оснований с метильными группами или фосфосульфатом. [22] [23] В зависимости от метода секвенирования, конкретная модификация, например, 5mC ( 5-метилцитозин ), распространенная у людей, может быть обнаружена или не обнаружена. [24]
Почти у всех организмов ДНК синтезируется in vivo с использованием только четырех канонических оснований; модификация, которая происходит после репликации, создает другие основания, такие как 5 метил С. Однако некоторые бактериофаги могут напрямую включать нестандартное основание. [25]
Помимо модификаций, ДНК подвергается постоянному воздействию факторов окружающей среды, таких как УФ-излучение и радикалы кислорода. В настоящее время наличие таких поврежденных оснований не обнаруживается большинством методов секвенирования ДНК, хотя PacBio опубликовала об этом https://www.pacb.com/publications/direct-detection-and-sequencing-of-damaged- ДНК-базы/
Дезоксирибонуклеиновая кислота ( ДНК ) была впервые обнаружена и выделена Фридрихом Мишером в 1869 году, но она оставалась недостаточно изученной в течение многих десятилетий, поскольку считалось, что белки, а не ДНК, поддерживают генетическую схему жизни. Эта ситуация изменилась после 1944 года в результате некоторых экспериментов Освальда Эйвери , Колина МакЛауда и Маклина Маккарти, продемонстрировавших, что очищенная ДНК может превращать один штамм бактерий в другой. Впервые было показано, что ДНК способна изменять свойства клеток.
В 1953 году Джеймс Уотсон и Фрэнсис Крик выдвинули свою модель двойной спирали ДНК, основанную на кристаллизованных рентгеновских структурах, изучаемых Розалиндой Франклин . Согласно модели, ДНК состоит из двух нитей нуклеотидов, скрученных друг вокруг друга, связанных между собой водородными связями и идущих в противоположных направлениях. Каждая цепь состоит из четырех комплементарных нуклеотидов — аденина (А), цитозина (С), гуанина (G) и тимина (Т) — причем буква А на одной цепи всегда соединена с Т на другой, а буква С всегда в паре с G. Они предположили, что такая структура позволяет использовать каждую нить для реконструкции другой — идея, центральная для передачи наследственной информации между поколениями. [26]
Основа секвенирования белков была впервые заложена работой Фредерика Сэнгера , который к 1955 году завершил последовательность всех аминокислот в инсулине , небольшом белке, секретируемом поджелудочной железой. Это стало первым убедительным доказательством того, что белки представляют собой химические образования с определенной молекулярной структурой, а не случайную смесь веществ, взвешенных в жидкости. Успех Сэнгера в секвенировании инсулина вдохновил рентгеновских кристаллографов, в том числе Уотсона и Крика, которые к тому времени пытались понять, как ДНК управляет образованием белков внутри клетки. Вскоре после посещения серии лекций, прочитанных Фредериком Сэнгером в октябре 1954 года, Крик начал разрабатывать теорию, утверждавшую, что расположение нуклеотидов в ДНК определяет последовательность аминокислот в белках, что, в свою очередь, помогает определить функцию белка. Он опубликовал эту теорию в 1958 году. [27]
Секвенирование РНК было одной из самых ранних форм секвенирования нуклеотидов. Главной вехой в секвенировании РНК является последовательность первого полного гена и полного генома бактериофага MS2 , идентифицированные и опубликованные Уолтером Фирсом и его коллегами из Университета Гента ( Гент , Бельгия ) в 1972 [28] и 1976 годах. [29] Традиционные методы секвенирования РНК требуют создания молекулы кДНК , которую необходимо секвенировать. [30]
Первый метод определения последовательностей ДНК включал стратегию локализованного удлинения праймеров, разработанную Рэем Ву из Корнелльского университета в 1970 году . слипшиеся концы ДНК фага лямбда. [32] [33] [34] Между 1970 и 1973 годами Ву, Р. Падманабхан и его коллеги продемонстрировали, что этот метод можно использовать для определения любой последовательности ДНК с использованием синтетических праймеров, специфичных для местоположения. [35] [36] [8] Фредерик Сэнгер затем принял эту стратегию удлинения праймера для разработки более быстрых методов секвенирования ДНК в Центре MRC , Кембридж , Великобритания, и опубликовал метод «секвенирования ДНК с ингибиторами обрыва цепи» в 1977 году. [37] Уолтер Гилберт и Аллан Максам из Гарварда также разработали методы секвенирования, в том числе метод «секвенирования ДНК путем химической деградации». [38] [39] В 1973 году Гилберт и Максам сообщили о последовательности из 24 пар оснований, используя метод, известный как анализ блуждающих пятен. [40] Прогрессу в секвенировании способствовало одновременное развитие технологии рекомбинантной ДНК , позволяющей изолировать образцы ДНК из других источников, помимо вирусов.
Первым полным геномом ДНК, который был секвенирован, был геном бактериофага φX174 в 1977 году . [41] Ученые Совета медицинских исследований расшифровали полную последовательность ДНК вируса Эпштейна-Барра в 1984 году, обнаружив, что она содержит 172 282 нуклеотида. Завершение секвенирования стало важным поворотным моментом в секвенировании ДНК, поскольку оно было достигнуто без предварительного знания генетического профиля вируса. [42] [8]
Нерадиоактивный метод переноса молекул ДНК из реакционных смесей секвенирования на иммобилизирующую матрицу во время электрофореза был разработан Гербертом Полем и его сотрудниками в начале 1980-х годов. [43] [44] После коммерциализации секвенатора ДНК «Direct-Blotting-Electrophoresis-System GATC 1500» компании GATC Biotech , который интенсивно использовался в рамках программы секвенирования генома ЕС, была получена полная последовательность ДНК хромосома II дрожжей Saccharomyces cerevisiae . [45] Лаборатория Лероя Э. Худа в Калифорнийском технологическом институте объявила о выпуске первого полуавтоматического аппарата для секвенирования ДНК в 1986 году. [46] За этим последовал маркетинг компании Applied Biosystems первого полностью автоматизированного секвенатора ABI 370. , в 1987 году, и компанией Dupont's Genesis 2000 [47] , в которой использовался новый метод флуоресцентного мечения, позволяющий идентифицировать все четыре дидезоксинуклеотида на одной дорожке. К 1990 году Национальные институты здравоохранения США (NIH) начали крупномасштабные испытания по секвенированию Mycoplasma capricolum , Escherichia coli , Caenorhabditis elegans и Saccharomyces cerevisiae по цене 0,75 доллара США за основу. Тем временем в лаборатории Крейга Вентера началось секвенирование последовательностей кДНК человека , называемых метками экспрессируемых последовательностей , — попытка уловить кодирующую часть генома человека . [48] В 1995 году Вентер, Гамильтон Смит и коллеги из Института геномных исследований (TIGR) опубликовали первый полный геном свободноживущего организма, бактерии Haemophilus influenzae . Кольцевая хромосома содержит 1 830 137 оснований, и ее публикация в журнале Science [49] ознаменовала первое опубликованное использование полногеномного секвенирования, устраняющее необходимость в первоначальных усилиях по картированию.
К 2001 году методы дробового секвенирования были использованы для создания чернового варианта последовательности человеческого генома. [50] [51]
Несколько новых методов секвенирования ДНК были разработаны в середине-конце 1990-х годов и к 2000 году были реализованы в коммерческих секвенаторах ДНК . Вместе они назывались методами секвенирования «следующего поколения» или «второго поколения» (NGS), чтобы различать их с помощью более ранних методов, включая секвенирование по Сэнгеру . В отличие от первого поколения секвенирования, технология NGS обычно характеризуется высокой масштабируемостью, позволяя секвенировать весь геном одновременно. Обычно это достигается путем фрагментации генома на небольшие части, случайной выборки фрагмента и его секвенирования с использованием одной из множества технологий, например описанных ниже. Целый геном возможен, потому что несколько фрагментов секвенируются одновременно (что дало этому название «массивно-параллельное» секвенирование) в автоматизированном процессе.
Технология NGS дала огромные возможности исследователям в поиске информации о здоровье, антропологам в изучении происхождения человека и стала катализатором движения « Персонализированной медицины ». Однако это также открыло больше возможностей для ошибок. Существует множество программных инструментов для проведения вычислительного анализа данных NGS, часто скомпилированных на онлайн-платформах, таких как CSI NGS Portal, каждый из которых имеет свой собственный алгоритм. Даже параметры в одном программном пакете могут изменить результат анализа. Кроме того, большие объемы данных, полученные с помощью секвенирования ДНК, также потребовали разработки новых методов и программ для анализа последовательностей. Для решения этих проблем было предпринято несколько усилий по разработке стандартов в области NGS, большинство из которых были небольшими усилиями, исходящими от отдельных лабораторий. Совсем недавно масштабная организованная работа, финансируемая FDA, завершилась созданием стандарта BioCompute .
26 октября 1990 года Роджер Цзянь , Пепи Росс, Маргарет Фэнсток и Аллан Дж. Джонстон подали патент, описывающий пошаговое («основание за основанием») секвенирование с использованием удаляемых 3'-блокаторов на массивах ДНК (блоты и отдельные молекулы ДНК). [53] В 1996 году Пол Нирен и его студент Мостафа Ронаги из Королевского технологического института в Стокгольме опубликовали свой метод пиросеквенирования . [54]
1 апреля 1997 года Паскаль Майер и Лоран Фаринелли подали во Всемирную организацию интеллектуальной собственности патенты, описывающие секвенирование колоний ДНК. [55] Методы подготовки образцов ДНК и рандомизированной поверхностной полимеразной цепной реакции (ПЦР), описанные в этом патенте, в сочетании с методом последовательного секвенирования Роджера Циена и др., теперь реализованы в компании Illumina . Секвенаторы генома Hi-Seq.
В 1998 году Фил Грин и Брент Юинг из Вашингтонского университета описали свою оценку качества phred для анализа данных секвенатора [56] — метод анализа, получивший широкое распространение и до сих пор являющийся наиболее распространенным показателем для оценки точности секвенирования. Платформа. [57]
В 2000 году компания Lynx Therapeutics опубликовала и начала массовое распространение параллельного сигнатурного секвенирования (MPSS). Этот метод включал в себя параллельную технологию секвенирования на основе шариков, опосредованную адаптером/лигированием, и стал первым коммерчески доступным методом секвенирования «следующего поколения». Секвенаторы ДНК были проданы независимым лабораториям. [58]
Аллан Максам и Уолтер Гилберт в 1977 году опубликовали метод секвенирования ДНК, основанный на химической модификации ДНК и последующем расщеплении по определенным основаниям. [38] Этот метод, также известный как химическое секвенирование, позволял использовать очищенные образцы двухцепочечной ДНК без дальнейшего клонирования. Использование в этом методе радиоактивной маркировки и его техническая сложность препятствовали его широкому использованию после того, как методы Сэнгера были усовершенствованы.
Секвенирование Максама-Гилберта требует радиоактивной метки на одном 5'-конце ДНК и очистки фрагмента ДНК, подлежащего секвенированию. Затем химическая обработка приводит к разрывам небольшой части одного или двух из четырех нуклеотидных оснований в каждой из четырех реакций (G, A+G, C, C+T). Концентрацию модифицирующих химикатов контролируют так, чтобы в среднем внести одну модификацию на молекулу ДНК. Таким образом генерируется серия меченых фрагментов, от меченого радиоактивным изотопом конца до первого «разрезанного» сайта в каждой молекуле. Фрагменты в четырех реакциях подвергают электрофорезу рядом в денатурирующих акриламидных гелях для разделения по размеру. Для визуализации фрагментов гель подвергают рентгеновской пленке для авторадиографии, в результате чего образуется серия темных полос, каждая из которых соответствует меченому радиоактивным изотопом фрагменту ДНК, по которому можно определить последовательность. [38]
Этот метод практически устарел по состоянию на 2023 год. [59]
Метод обрыва цепи, разработанный Фредериком Сэнгером и его коллегами в 1977 году, вскоре стал предпочтительным методом благодаря его относительной простоте и надежности. [37] [60] На момент изобретения метод терминатора цепи использовал меньше токсичных химикатов и меньшее количество радиоактивности, чем метод Максама и Гилберта. Из-за своей сравнительной простоты метод Сэнгера вскоре был автоматизирован и стал методом, использованным в первом поколении секвенаторов ДНК .
Секвенирование по Сэнгеру — это метод, который преобладал с 1980-х до середины 2000-х годов. За этот период в этой технике были достигнуты большие успехи, такие как флуоресцентное мечение, капиллярный электрофорез и общая автоматизация. Эти разработки позволили гораздо более эффективно секвенировать, что привело к снижению затрат. Метод Сэнгера в форме массового производства — это технология, которая позволила создать первый геном человека в 2001 году, ознаменовав начало эры геномики . Однако позже в том же десятилетии на рынок вышли радикально иные подходы, в результате чего стоимость генома снизилась со 100 миллионов долларов в 2001 году до 10 000 долларов в 2011 году. [61]
Целью последовательного секвенирования путем синтеза (SBS) является определение последовательности образца ДНК путем обнаружения включения нуклеотида ДНК - полимеразой . Сконструированная полимераза используется для синтеза копии одной цепи ДНК и контролируется включение каждого нуклеотида. Принцип секвенирования в реальном времени путем синтеза был впервые описан в 1993 году [62] , а улучшения были опубликованы несколько лет спустя. [63] Ключевые части очень схожи для всех вариантов реализации SBS и включают (1) амплификацию ДНК (для усиления последующего сигнала) и прикрепление ДНК, подлежащей секвенированию, к твердой подложке, (2) генерацию одноцепочечной ДНК на твердая подложка, (3) включение нуклеотидов с использованием сконструированной полимеразы и (4) обнаружение включения нуклеотида в реальном времени. Шаги 3-4 повторяются, и последовательность собирается из сигналов, полученных на этапе 4. Этот принцип Секвенирование путем синтеза в реальном времени использовалось практически для всех массовых инструментов параллельного секвенирования , включая 454 , PacBio , IonTorrent , Illumina и MGI .
Крупномасштабное секвенирование часто направлено на секвенирование очень длинных фрагментов ДНК, таких как целые хромосомы , хотя крупномасштабное секвенирование также может использоваться для создания очень большого количества коротких последовательностей, например, обнаруженных при фаговом дисплее . Для более длинных мишеней, таких как хромосомы, общие подходы заключаются в разрезании (с помощью ферментов рестрикции ) или разрезании (с помощью механических сил) больших фрагментов ДНК на более короткие фрагменты ДНК. Фрагментированную ДНК можно затем клонировать в ДНК-вектор и амплифицировать в бактериальном хозяине, таком как Escherichia coli . Короткие фрагменты ДНК, выделенные из отдельных бактериальных колоний, индивидуально секвенируются и собираются электронным способом в одну длинную непрерывную последовательность. Исследования показали, что добавление этапа выбора размера для сбора фрагментов ДНК одинакового размера может повысить эффективность секвенирования и точность сборки генома. В этих исследованиях автоматическое определение размера оказалось более воспроизводимым и точным, чем ручное определение размера геля. [64] [65] [66]
Термин « секвенирование de novo » конкретно относится к методам, используемым для определения последовательности ДНК без ранее известной последовательности. De novo переводится с латыни как «с самого начала». Пробелы в собранной последовательности могут быть заполнены путем прохождения праймера . Различные стратегии имеют разные компромиссы в скорости и точности; Методы «дробовика» часто используются для секвенирования больших геномов, но их сборка сложна и трудна, особенно из-за повторов последовательности, часто вызывающих пробелы в сборке генома.
Большинство подходов к секвенированию используют этап клонирования in vitro для амплификации отдельных молекул ДНК, поскольку их методы молекулярного обнаружения недостаточно чувствительны для секвенирования одной молекулы. Эмульсионная ПЦР [67] изолирует отдельные молекулы ДНК вместе с покрытыми праймером шариками в водных каплях внутри масляной фазы. Затем в ходе полимеразной цепной реакции (ПЦР) каждая гранула покрывается клональными копиями молекулы ДНК с последующей иммобилизацией для последующего секвенирования. Эмульсионная ПЦР используется в методах, разработанных Marguilis et al. (коммерциализация осуществляется компанией 454 Life Sciences ), Shendure and Porreca et al. (также известное как « секвенирование полоний ») и секвенирование SOLiD (разработано Agencourt , позже Applied Biosystems , теперь Life Technologies ). [68] [69] [70] Эмульсионный ПЦР также используется в платформах GemCode и Chromium, разработанных 10x Genomics . [71]
Секвенирование дробовиком — это метод секвенирования, предназначенный для анализа последовательностей ДНК длиной более 1000 пар оснований, включая целые хромосомы. Этот метод требует, чтобы целевая ДНК была разбита на случайные фрагменты. После секвенирования отдельных фрагментов с использованием метода терминации цепи последовательности можно собрать заново на основе перекрывающихся областей. [72]
Высокопроизводительное секвенирование, включающее методы секвенирования следующего поколения с «коротким чтением» и третьего поколения с «длинным чтением», [nt 1] применяется к секвенированию экзома , секвенированию генома, повторному секвенированию генома, профилированию транскриптома ( RNA-Seq ), ДНК-белковые взаимодействия ( ChIP-секвенирование ) и характеристика эпигенома . [73]
Высокий спрос на недорогое секвенирование привел к развитию технологий высокопроизводительного секвенирования, которые распараллеливают процесс секвенирования, создавая тысячи или миллионы последовательностей одновременно. [74] [75] [76] Технологии высокопроизводительного секвенирования призваны снизить стоимость секвенирования ДНК сверх того, что возможно при использовании стандартных методов красителя-терминатора. [77] При сверхвысокопроизводительном секвенировании может выполняться параллельно до 500 000 операций секвенирования-синтеза. [78] [79] [80] Такие технологии позволили секвенировать весь геном человека всего за один день. [81] По состоянию на 2019 год [обновлять]в число корпоративных лидеров в разработке продуктов для высокопроизводительного секвенирования входили Illumina , Qiagen и ThermoFisher Scientific . [81]
Секвенирование SMRT основано на подходе секвенирования путем синтеза. ДНК синтезируется в нулевых волноводах (ZMW) – небольших колодцеобразных контейнерах с инструментами для захвата, расположенными на дне колодца. Секвенирование проводят с использованием немодифицированной полимеразы (прикрепленной к нижней части ZMW) и флуоресцентно-меченных нуклеотидов, свободно перемещающихся в растворе. Лунки сконструированы таким образом, что детектируется только флуоресценция, возникающая на дне лунки. Флуоресцентная метка отделяется от нуклеотида при его включении в цепь ДНК, оставляя немодифицированную цепь ДНК. По данным компании Pacific Biosciences (PacBio), разработчика технологии SMRT, эта методология позволяет обнаруживать модификации нуклеотидов (например, метилирование цитозина). Это происходит путем наблюдения за кинетикой полимеразы. Этот подход позволяет читать 20 000 и более нуклеотидов со средней длиной чтения 5 килобаз. [88] [98] В 2015 году компания Pacific Biosciences объявила о выпуске нового инструмента для секвенирования под названием Sequel System с 1 миллионом ZMW по сравнению со 150 000 ZMW в приборе PacBio RS II. [99] [100] Секвенирование SMRT называют секвенированием « третьего поколения » или «длинным чтением».
ДНК, проходя через нанопору, меняет свой ионный ток. Это изменение зависит от формы, размера и длины последовательности ДНК. Каждый тип нуклеотида блокирует поток ионов через пору на разный период времени. Метод не требует модифицированных нуклеотидов и выполняется в режиме реального времени. Секвенирование нанопор наряду с секвенированием SMRT называют секвенированием « третьего поколения » или «длинным чтением».
Ранние промышленные исследования этого метода были основаны на методе, называемом «экзонуклеазное секвенирование», при котором считывание электрических сигналов происходило, когда нуклеотиды проходили через поры альфа(α)-гемолизина, ковалентно связанные с циклодекстрином . [101] Однако последующий коммерческий метод, «секвенирование цепи», секвенировал основания ДНК в неповрежденной цепи.
Двумя основными областями секвенирования нанопор, находящихся в разработке, являются твердотельное секвенирование нанопор и секвенирование нанопор на основе белков. При секвенировании нанопор белков используются мембранные белковые комплексы, такие как α-гемолизин, MspA ( Mycobacterium smegmatis Porin A) или CssG, которые демонстрируют большие перспективы, учитывая их способность различать отдельные нуклеотиды и группы нуклеотидов. [102] Напротив, в твердотельном секвенировании нанопор используются синтетические материалы, такие как нитрид кремния и оксид алюминия, и он предпочтителен из-за его превосходных механических свойств, а также термической и химической стабильности. [103] Метод изготовления имеет важное значение для этого типа секвенирования, учитывая, что массив нанопор может содержать сотни пор диаметром менее восьми нанометров. [102]
Эта концепция возникла из идеи о том, что одноцепочечные молекулы ДНК или РНК могут быть электрофоретически пропущены в строгой линейной последовательности через биологическую пору, размер которой может составлять менее восьми нанометров, и могут быть обнаружены, поскольку молекулы выделяют ионный ток при движении через пора. Пора содержит область обнаружения, способную распознавать различные основания, причем каждое основание генерирует различные сигналы, зависящие от времени, соответствующие последовательности оснований, когда они пересекают пору, которые затем оцениваются. [103] Точный контроль над транспортом ДНК через поры имеет решающее значение для успеха. Различные ферменты, такие как экзонуклеазы и полимеразы, использовались для замедления этого процесса, располагая их возле входа в пору. [104]
Первая из технологий высокопроизводительного секвенирования, массово-параллельное сигнатурное секвенирование (или MPSS), была разработана в 1990-х годах в компании Lynx Therapeutics, основанной в 1992 году Сидни Бреннером и Сэмом Элетром . MPSS представлял собой метод на основе шариков, в котором использовался сложный подход лигирования адаптера с последующим декодированием адаптера, считывающим последовательность с шагом в четыре нуклеотида. Этот метод сделал его чувствительным к систематической ошибке, связанной с конкретной последовательностью, или потере конкретных последовательностей. Поскольку технология была настолько сложной, MPSS выполнялась только «внутренними» компаниями Lynx Therapeutics, и никакие машины для секвенирования ДНК не продавались независимым лабораториям. Lynx Therapeutics объединилась с Solexa (позже приобретенной Illumina ) в 2004 году, что привело к развитию секвенирования путем синтеза, более простого подхода, приобретенного у Manteia Predictive Medicine , что сделало MPSS устаревшим. Однако основные свойства выходных данных MPSS были типичными для более поздних типов данных с высокой пропускной способностью, включая сотни тысяч коротких последовательностей ДНК. В случае MPSS их обычно использовали для секвенирования кДНК для измерения уровней экспрессии генов . [58]
Метод секвенирования полоний , разработанный в лаборатории Джорджа М. Черча в Гарварде, был одной из первых высокопроизводительных систем секвенирования и использовался для секвенирования полного генома E. coli в 2005 году . библиотека тегов с эмульсионной ПЦР, автоматическим микроскопом и химическим методом секвенирования на основе лигирования для секвенирования генома E. coli с точностью> 99,9999% и стоимостью примерно 1/9 стоимости секвенирования по Сэнгеру. [105] Лицензия на технологию была передана компании Agencourt Biosciences, впоследствии передана в компанию Agencourt Personal Genomics и в конечном итоге включена в платформу SOLiD Applied Biosystems . Позднее компания Applied Biosystems была приобретена компанией Life Technologies , ныне являющейся частью Thermo Fisher Scientific .
Параллельная версия пиросеквенирования была разработана компанией 454 Life Sciences , которая впоследствии была приобретена Roche Diagnostics . Этот метод амплифицирует ДНК внутри капель воды в масляном растворе (эмульсионная ПЦР), при этом каждая капля содержит одну матрицу ДНК, прикрепленную к одной покрытой праймером бусине, которая затем образует клональную колонию. Секвенатор содержит множество лунок пиколитрового объема, каждая из которых содержит одну гранулу и секвенирующие ферменты. При пиросеквенировании используется люцифераза для генерации света для обнаружения отдельных нуклеотидов, добавленных к зарождающейся ДНК, а объединенные данные используются для генерации считываний последовательности . [68] Эта технология обеспечивает промежуточную длину считывания и цену за базу по сравнению с секвенированием по Сэнгеру, с одной стороны, и Solexa и SOLiD, с другой. [77]
Компания Solexa , ныне являющаяся частью Illumina , была основана Шанкаром Баласубраманяном и Дэвидом Кленерманом в 1998 году и разработала метод секвенирования, основанный на технологии обратимых терминаторов красителя и сконструированных полимеразах. [106] Концепция обратимой терминированной химии была изобретена Бруно Канардом и Саймоном Сарфати в Институте Пастера в Париже. [107] [108] Он был разработан внутри компании Solexa лицами, указанными в соответствующих патентах. В 2004 году Solexa приобрела компанию Manteia Predictive Medicine , чтобы получить технологию массово-параллельного секвенирования, изобретенную в 1997 году Паскалем Майером и Лораном Фаринелли. [55] Он основан на «кластерах ДНК» или «колониях ДНК», что предполагает клональную амплификацию ДНК на поверхности. Кластерная технология была приобретена совместно с Lynx Therapeutics из Калифорнии. Позже Solexa Ltd. объединилась с Lynx и образовала Solexa Inc.
В этом методе молекулы ДНК и праймеры сначала прикрепляются к предметному стеклу или проточной кювете и амплифицируются с помощью полимеразы , так что образуются локальные колонии клональной ДНК, позже получившие название «кластеры ДНК». Для определения последовательности добавляются четыре типа обратимых терминаторных оснований (RT-оснований) и отмываются невключенные нуклеотиды. Камера делает изображения флуоресцентно меченных нуклеотидов. Затем краситель вместе с блокатором концевого 3'-конца химически удаляется из ДНК, позволяя начать следующий цикл. В отличие от пиросеквенирования, цепи ДНК удлиняются по одному нуклеотиду за раз, и получение изображений может выполняться с задержкой, что позволяет захватывать очень большие массивы колоний ДНК с помощью последовательных изображений, полученных с одной камеры.
Разделение ферментативной реакции и захвата изображения обеспечивает оптимальную производительность и теоретически неограниченную мощность секвенирования. Таким образом, при оптимальной конфигурации в конечном итоге достижимая производительность прибора определяется исключительно скоростью аналого-цифрового преобразования камеры, умноженной на количество камер и разделенной на количество пикселей на колонию ДНК, необходимое для их оптимальной визуализации (приблизительно 10 пикселей/колония). В 2012 году с камерами, работающими на частоте аналого-цифрового преобразования более 10 МГц, и доступной оптикой, жидкостной и ферментативной аппаратурой, пропускная способность может быть кратна 1 миллиону нуклеотидов в секунду, что соответствует примерно 1 эквиваленту генома человека при 1x охвате в час на один инструмент. и 1 геном человека, повторно секвенированный (приблизительно 30 раз) в день на каждый инструмент (оснащенный одной камерой). [109]
Этот метод представляет собой модернизированную модификацию технологии комбинаторного лигирования якоря зонда (cPAL), описанной компанией Complete Genomics [110] , которая с тех пор стала частью китайской геномной компании BGI в 2013 году. [111] Обе компании усовершенствовали технологию, чтобы обеспечить более длительное чтение. длины, сокращение времени реакции и более быстрое получение результатов. Кроме того, данные теперь генерируются как последовательные полноразмерные чтения в стандартном формате файлов FASTQ и могут использоваться без изменений в большинстве конвейеров биоинформатического анализа на основе короткого чтения. [112] [ нужна ссылка ]
Две технологии, которые составляют основу этой технологии высокопроизводительного секвенирования, — это наношарики ДНК (DNB) и структурированные массивы для прикрепления наношариков к твердой поверхности. [110] Наношарики ДНК образуются путем денатурации двухцепочечных библиотек с лигированием адаптера и лигирования прямой цепи только с шплинтовым олигонуклеотидом с образованием кольца оцДНК. Точные копии кругов, содержащих вставку ДНК, создаются с использованием амплификации катящегося круга, которая генерирует примерно 300–500 копий. Длинная цепь оцДНК складывается сама по себе, образуя трехмерную структуру наношаров диаметром примерно 220 нм. Создание DNB заменяет необходимость создания ПЦР-копий библиотеки в проточной кювете и, как таковое, может устранить большую часть повторяющихся считываний, лигирования адаптер-адаптер и ошибок, вызванных ПЦР. [112] [ нужна ссылка ]
Узорчатый массив положительно заряженных пятен изготавливается с помощью методов фотолитографии и травления с последующей химической модификацией для создания проточной ячейки для секвенирования. Каждое пятно на проточной кювете имеет диаметр примерно 250 нм, разделено на 700 нм (от центра к центру) и позволяет легко прикрепить один отрицательно заряженный DNB к проточной кювете и, таким образом, уменьшить недостаточную или чрезмерную кластеризацию на проточной кювете. [110] [ нужна ссылка ]
Затем выполняется секвенирование путем добавления олигонуклеотидного зонда, который в комбинации прикрепляется к определенным сайтам в DNB. Зонд действует как якорь, который затем позволяет одному из четырех одиночных обратимо инактивированных меченых нуклеотидов связываться после прохождения через проточную кювету. Несвязанные нуклеотиды смываются перед лазерным возбуждением прикрепленных меток, затем излучают флуоресценцию, и сигнал улавливается камерами, который преобразуется в цифровой выход для определения оснований. Прикрепленное основание имеет терминатор и метку, химически расщепляемую по завершении цикла. Цикл повторяется с другим потоком свободных меченых нуклеотидов через проточную ячейку, чтобы позволить следующему нуклеотиду связаться и захватить его сигнал. Этот процесс выполняется несколько раз (обычно от 50 до 300 раз) для определения последовательности вставленного фрагмента ДНК со скоростью примерно 40 миллионов нуклеотидов в секунду по состоянию на 2018 год .
Технология SOLiD компании Applied Biosystems (теперь бренд Life Technologies ) использует секвенирование путем лигирования . Здесь пул всех возможных олигонуклеотидов фиксированной длины помечен в соответствии с положением секвенирования. Олигонуклеотиды отжигают и лигируют; предпочтительное лигирование ДНК-лигазой для совпадающих последовательностей приводит к получению сигнала, информативного о нуклеотиде в этом положении. Каждое основание в шаблоне секвенируется дважды, а полученные данные декодируются в соответствии со схемой кодирования двух оснований , используемой в этом методе. Перед секвенированием ДНК амплифицируют с помощью эмульсионной ПЦР. Полученные шарики, каждая из которых содержит отдельные копии одной и той же молекулы ДНК, наносятся на предметное стекло. [113] В результате получаются последовательности величин и длин, сравнимые с секвенированием Illumina. [77] Сообщалось, что такое секвенирование методом лигирования имеет некоторые проблемы с секвенированием палиндромных последовательностей. [96]
Ion Torrent Systems Inc. (теперь принадлежащая Life Technologies ) разработала систему, основанную на использовании стандартной химии секвенирования, но с новой системой обнаружения на основе полупроводников. Этот метод секвенирования основан на обнаружении ионов водорода , которые высвобождаются во время полимеризации ДНК , в отличие от оптических методов, используемых в других системах секвенирования . Микролунка, содержащая матричную цепь ДНК, подлежащую секвенированию, заполняется нуклеотидом одного типа . Если введенный нуклеотид комплементарен ведущему матричному нуклеотиду, он включается в растущую комплементарную цепь. Это вызывает высвобождение ионов водорода, который запускает сверхчувствительный ионный датчик, указывающий на то, что реакция произошла. Если в матричной последовательности присутствуют гомополимерные повторы, в один цикл будут включены несколько нуклеотидов. Это приводит к соответствующему количеству высвободившихся атомов водорода и пропорционально более высокому электронному сигналу. [114]
Секвенирование ДНК наношариками — это тип технологии высокопроизводительного секвенирования, используемый для определения всей геномной последовательности организма. Компания Complete Genomics использует эту технологию для секвенирования образцов, представленных независимыми исследователями. Этот метод использует репликацию по катящемуся кругу для амплификации небольших фрагментов геномной ДНК в наношарики ДНК. Затем для определения нуклеотидной последовательности используют несцепленное секвенирование путем лигирования. [115] Этот метод секвенирования ДНК позволяет секвенировать большое количество наношариков ДНК за один цикл при низких затратах на реагенты по сравнению с другими высокопроизводительными платформами секвенирования. [116] Однако из каждого наношарика ДНК определяются только короткие последовательности ДНК, что затрудняет картирование коротких ридов с эталонным геномом . [115]
Секвенирование Хелископа — это метод секвенирования одиночных молекул, разработанный Helicos Biosciences . В нем используются фрагменты ДНК с добавленными хвостовыми адаптерами поли-А, которые прикрепляются к поверхности проточной кюветы. Следующие шаги включают секвенирование на основе расширения с циклическими промывками проточной кюветы флуоресцентно меченными нуклеотидами (по одному типу нуклеотидов за раз, как в методе Сэнгера). Чтения выполняются секвенатором Heliscope. [117] [118] Чтения короткие, в среднем 35 п.н. [119] Что сделало эту технологию особенно новой, так это то, что она была первой в своем классе, позволяющей секвенировать неамплифицированную ДНК, предотвращая тем самым любые ошибки чтения, связанные с этапами амплификации. [120] В 2009 году с помощью Heliscope секвенировали геном человека, однако в 2012 году компания обанкротилась. [121]
Существует две основные микрофлюидные системы, которые используются для секвенирования ДНК; капельная микрофлюидика и цифровая микрофлюидика . Микрофлюидные устройства решают многие текущие ограничения существующих массивов секвенирования.
Абате и др. изучал использование микрофлюидных устройств на основе капель для секвенирования ДНК. [4] Эти устройства способны формировать и обрабатывать капли размером в пиколитр со скоростью тысячи в секунду. Устройства были созданы из полидиметилсилоксана (ПДМС) и использовали резонансный перенос энергии Форстера и анализы FRET для считывания последовательностей ДНК, содержащихся в каплях. Каждая позиция в массиве проверена на наличие определенной последовательности из 15 оснований. [4]
Фэйр и др. использовал цифровые микрофлюидные устройства для изучения пиросеквенирования ДНК . [122] Значительные преимущества включают портативность устройства, объем реагента, скорость анализа, возможности массового производства и высокую производительность. Это исследование предоставило доказательство концепции, показывающей, что цифровые устройства можно использовать для пиросеквенирования; исследование включало использование синтеза, который включает расширение ферментов и добавление меченых нуклеотидов. [122]
Болес и др. также изучал пиросеквенирование на цифровых микрофлюидных устройствах. [123] Они использовали электросмачивающее устройство для создания, смешивания и разделения капель. При секвенировании используется трехферментный протокол и шаблоны ДНК, закрепленные магнитными шариками. Устройство было протестировано с использованием двух протоколов и показало 100% точность на основе необработанных уровней пирограммы. Преимущества этих цифровых микрофлюидных устройств включают размер, стоимость и достижимый уровень функциональной интеграции. [123]
Исследования секвенирования ДНК с использованием микрофлюидики также могут быть применены к секвенированию РНК с использованием аналогичных капельных микрофлюидных методов, таких как метод inDrops. [124] Это показывает, что многие из этих методов секвенирования ДНК можно будет применять и дальше и использовать для лучшего понимания геномов и транскриптомов.
Методы секвенирования ДНК, которые в настоящее время находятся в стадии разработки, включают считывание последовательности при прохождении цепи ДНК через нанопоры (метод, который сейчас является коммерческим, но последующие поколения, такие как твердотельные нанопоры, все еще находятся в разработке), [125] [126] и методы, основанные на микроскопии. , такие как атомно-силовая микроскопия или трансмиссионная электронная микроскопия , которые используются для идентификации положений отдельных нуклеотидов внутри длинных фрагментов ДНК (>5000 п.н.) путем мечения нуклеотидов более тяжелыми элементами (например, галогенами) для визуального обнаружения и регистрации. [127] [128] Технологии третьего поколения направлены на увеличение производительности и сокращение времени получения результата и затрат за счет устранения необходимости в чрезмерных реагентах и использования процессивности ДНК-полимеразы. [129]
Другой подход использует измерения электрических туннельных токов в одноцепочечной ДНК при ее движении по каналу. В зависимости от своей электронной структуры каждая база по-разному влияет на туннельный ток [130] , что позволяет различать разные базы. [131]
Использование туннельных токов может обеспечить секвенирование на несколько порядков быстрее, чем методы ионного тока, и секвенирование нескольких олигомеров ДНК и микро-РНК уже достигнуто. [132]
Секвенирование путем гибридизации — это неферментативный метод, в котором используется микрочип ДНК . Один пул ДНК, последовательность которого необходимо определить, флуоресцентно метят и гибридизуют с массивом, содержащим известные последовательности. Сильные сигналы гибридизации из данного места на массиве идентифицируют его последовательность в секвенируемой ДНК. [133]
Этот метод секвенирования использует характеристики связывания библиотеки коротких одноцепочечных молекул ДНК (олигонуклеотидов), также называемых ДНК-зондами, для реконструкции целевой последовательности ДНК. Неспецифические гибриды удаляют промыванием и элюируют целевую ДНК. [134] Гибриды перестраиваются так, что последовательность ДНК может быть реконструирована. Преимущество этого типа секвенирования заключается в его способности захватывать большое количество целей с однородным покрытием. [135] Обычно требуется большое количество химикатов и исходной ДНК. Однако с появлением гибридизации на основе растворов требуется гораздо меньше оборудования и химикатов. [134]
Масс-спектрометрию можно использовать для определения последовательностей ДНК. Времяпролетная масс-спектрометрия с лазерной десорбцией и ионизацией с матрицей, или MALDI-TOF MS , специально исследовалась как альтернативный метод гель-электрофореза для визуализации фрагментов ДНК. С помощью этого метода фрагменты ДНК, полученные в результате реакций секвенирования обрыва цепи, сравниваются по массе, а не по размеру. Масса каждого нуклеотида отличается от других, и эту разницу можно обнаружить с помощью масс-спектрометрии. Однонуклеотидные мутации во фрагменте легче обнаружить с помощью МС, чем только с помощью гель-электрофореза. MALDI-TOF MS позволяет легче обнаруживать различия между фрагментами РНК, поэтому исследователи могут косвенно секвенировать ДНК с помощью методов MS, сначала преобразуя ее в РНК. [136]
Более высокое разрешение фрагментов ДНК, допускаемое методами на основе МС, представляет особый интерес для исследователей в области судебной медицины, поскольку они могут захотеть найти однонуклеотидные полиморфизмы в образцах ДНК человека для идентификации людей. Эти образцы могут быть сильно разложившимися, поэтому судебно-медицинские эксперты часто отдают предпочтение митохондриальной ДНК из-за ее более высокой стабильности и возможности применения для изучения происхождения. Методы секвенирования на основе МС использовались для сравнения последовательностей митохондриальной ДНК человека из образцов в базе данных Федерального бюро расследований [137] и из костей, найденных в братских могилах солдат Первой мировой войны. [138]
Ранние методы обрыва цепи и TOF MS продемонстрировали длину чтения до 100 пар оснований. [139] Исследователи не смогли превысить этот средний размер чтения; Как и только секвенирование с обрывом цепи, секвенирование ДНК на основе MS может не подходить для крупных проектов секвенирования de novo . Несмотря на это, недавнее исследование использовало считывание коротких последовательностей и масс-спектроскопию для сравнения однонуклеотидных полиморфизмов в патогенных штаммах Streptococcus . [140]
При микрофлюидном секвенировании по Сэнгеру вся термоциклическая амплификация фрагментов ДНК, а также их разделение с помощью электрофореза выполняются на одной стеклянной пластине (диаметром примерно 10 см), что снижает расход реагентов и стоимость. [141] В некоторых случаях исследователи показали, что они могут увеличить производительность обычного секвенирования за счет использования микрочипов. [142] Для того, чтобы сделать такое использование технологий эффективным, все еще необходимо провести исследования.
Этот подход напрямую визуализирует последовательность молекул ДНК с помощью электронной микроскопии. Первая идентификация пар оснований ДНК в интактных молекулах ДНК путем ферментативного включения модифицированных оснований, которые содержат атомы с увеличенным атомным номером, прямая визуализация и идентификация индивидуально меченных оснований в синтетической молекуле ДНК из 3272 пар оснований и вирусном геноме из 7249 пар оснований. было продемонстрировано. [143]
Этот метод основан на использовании РНК-полимеразы (РНКП), которая прикреплена к шарику полистирола . Один конец ДНК, подлежащей секвенированию, прикрепляется к другой бусине, причем обе бусины помещаются в оптические ловушки. Движение РНКП во время транскрипции приближает шарики, и их относительное расстояние меняется, что затем можно записать с разрешением в один нуклеотид. Последовательность выводится на основе четырех показаний с пониженными концентрациями каждого из четырех типов нуклеотидов, аналогично методу Сэнгера. [144] Проводят сравнение между областями и получают информацию о последовательностях путем сравнения известных областей последовательности с неизвестными областями последовательности. [145]
Был разработан метод для анализа полных наборов белковых взаимодействий с использованием комбинации пиросеквенирования 454 и метода отображения вирусной мРНК in vitro . В частности, этот метод ковалентно связывает интересующие белки с кодирующими их мРНК, а затем обнаруживает фрагменты мРНК с помощью ПЦР с обратной транскрипцией . Затем мРНК можно амплифицировать и секвенировать. Комбинированный метод получил название IVV-HiTSeq и может быть реализован в бесклеточных условиях, хотя его результаты могут не быть репрезентативными для условий in vivo . [146]
Хотя существует множество различных способов секвенирования ДНК, лишь немногие из них доминируют на текущем рынке. Согласно этому, Illumina будет занимать около 80% рынка в 2022 году; остальную часть рынка занимают всего несколько игроков (PacBio, Oxford, 454, MGI) [147]
Успех любого протокола секвенирования ДНК зависит от экстракции и подготовки образцов ДНК или РНК из интересующего биологического материала.
После выделения ДНК или РНК образцы могут потребовать дальнейшей подготовки в зависимости от метода секвенирования. Для секвенирования по Сэнгеру перед секвенированием требуются либо процедуры клонирования, либо ПЦР. В случае методов секвенирования нового поколения перед обработкой требуется подготовка библиотеки. [149] Оценка качества и количества нуклеиновых кислот как после экстракции, так и после подготовки библиотеки позволяет выявить деградированные, фрагментированные и низкочистые образцы и получить высококачественные данные секвенирования. [150]
Высокая производительность современных технологий секвенирования ДНК/РНК создала проблему для масштабирования метода подготовки проб. Для подготовки большего количества проб с меньшим общим временем работы используются несколько инструментов для работы с жидкостями:
В октябре 2006 года Фонд X Prize выступил с инициативой по содействию развитию технологий полного секвенирования генома , получившей название Archon X Prize , намереваясь выделить 10 миллионов долларов «первой команде, которая сможет создать устройство и использовать его для секвенирования 100 геномов человека». в течение 10 дней или меньше, с точностью не более одной ошибки на каждые 100 000 секвенированных оснований, с последовательностями, точно охватывающими не менее 98% генома, и с периодическими затратами не более 10 000 долларов США за геном». [151]
Каждый год Национальный институт исследования генома человека (NHGRI) выделяет гранты на новые исследования и разработки в области геномики . Гранты 2010 года и кандидаты 2011 года включают продолжающуюся работу в области микрофлюидных, полонических методологий и методологий секвенирования с тяжелыми основаниями. [152]
Описанные здесь технологии секвенирования производят необработанные данные, которые необходимо собрать в более длинные последовательности, такие как полные геномы ( сборка последовательностей ). Для достижения этой цели существует множество вычислительных задач, таких как оценка необработанных данных последовательности, которая выполняется с помощью программ и алгоритмов, таких как Phred и Phrap . Другие проблемы связаны с повторяющимися последовательностями, которые часто препятствуют полной сборке генома, поскольку встречаются во многих местах генома. Как следствие, многие последовательности не могут быть отнесены к конкретным хромосомам . Получение необработанных данных о последовательностях — это только начало детального биоинформационного анализа. [153] Тем не менее, были разработаны новые методы секвенирования и исправления ошибок секвенирования. [154]
Иногда необработанные чтения, произведенные секвенатором, являются правильными и точными только на части их длины. Использование всего чтения может привести к появлению артефактов в последующих анализах, таких как сборка генома, вызов SNP или оценка экспрессии генов. Были введены два класса программ обрезки, основанные на классах алгоритмов на основе окон или алгоритмов с текущей суммой. [155] Это неполный список доступных в настоящее время алгоритмов обрезки с указанием класса алгоритмов, к которому они принадлежат:
Генетика человека была включена в область биоэтики с начала 1970-х годов [162] , а рост использования секвенирования ДНК (особенно высокопроизводительного секвенирования) породил ряд этических проблем. Одним из ключевых вопросов является право собственности на ДНК человека и данные, полученные при секвенировании этой ДНК. [163] Что касается самой молекулы ДНК, ведущим судебным делом по этой теме было дело Мур против Регентов Калифорнийского университета (1990 г.), постановившее, что люди не имеют прав собственности на выброшенные клетки или любую прибыль, полученную с использованием этих клеток (например, как запатентованная клеточная линия ). Однако люди имеют право на информированное согласие относительно удаления и использования клеток. Что касается данных, полученных с помощью секвенирования ДНК, Мур не дает человеку никаких прав на информацию, полученную из его ДНК. [163]
Поскольку секвенирование ДНК становится все более распространенным, хранение, безопасность и обмен геномными данными также становятся все более важными. [163] [164] Например, одна из проблем заключается в том, что страховщики могут использовать геномные данные человека для изменения своих расценок в зависимости от предполагаемого будущего здоровья человека на основе его ДНК. [164] [165] В мае 2008 года в США был подписан Закон о недискриминации генетической информации (GINA), запрещающий дискриминацию на основе генетической информации в отношении медицинского страхования и трудоустройства. [166] [167] В 2012 году Президентская комиссия США по изучению биоэтических проблем сообщила, что существующее законодательство о конфиденциальности данных секвенирования ДНК, такое как GINA и Закон о переносимости и отчетности медицинского страхования, было недостаточным, отметив, что данные полногеномного секвенирования были недостаточными. особенно чувствительны, поскольку с их помощью можно идентифицировать не только человека, от которого были созданы данные, но и его родственников. [168] [169]
На большей части территории Соединенных Штатов «брошенная» ДНК, например найденная на облизанной марке или конверте, кофейной чашке, сигарете, жевательной резинке, домашнем мусоре или волосах, упавших на общественный тротуар, может быть законно собрана. и секвенированы кем угодно, включая полицию, частных детективов, политических оппонентов или людей, участвующих в спорах об отцовстве. По состоянию на 2013 год в одиннадцати штатах действуют законы, которые можно интерпретировать как запрещающие «кражу ДНК». [170]
Этические проблемы также возникли в связи с увеличением использования скрининга генетических вариаций как у новорожденных, так и у взрослых такими компаниями, как 23andMe . [171] [172] Утверждалось, что скрининг генетических вариаций может быть вредным, увеличивая тревогу у людей, у которых был обнаружен повышенный риск заболеваний. [173] Например, в одном случае, отмеченном в Time , врачи, проверяющие больного ребенка на наличие генетических вариантов, решили не информировать родителей о несвязанном варианте, связанном с деменцией, из-за вреда, который он может нанести родителям. [174] Однако исследование 2011 года, опубликованное в Медицинском журнале Новой Англии, показало, что у людей, проходящих профилирование риска заболеваний, не наблюдалось повышенного уровня тревоги. [173] Кроме того, развитие технологий секвенирования следующего поколения, таких как секвенирование на основе нанопор, также вызвало дополнительные этические проблемы. [175]
Технологии секвенирования нового поколения (NGS) произвели революцию в геномных исследованиях. (вступительное предложение статьи)
{{cite press release}}
: |last=
имеет общее имя ( справка )