В генетике охват является одной из нескольких мер глубины или полноты секвенирования ДНК и более конкретно выражается одним из следующих терминов:
Охват последовательности (или глубина) — это количество уникальных прочтений, включающих заданный нуклеотид в реконструированной последовательности. [1] [2] Глубокое секвенирование относится к общей концепции, направленной на достижение большого количества уникальных прочтений каждой области последовательности. [3]
Физическое покрытие , совокупная длина прочтений или пар прочтений, выраженная как кратное размеру генома. [4]
Геномное покрытие — процент всех пар оснований или локусов генома , охваченных секвенированием.
Последовательность покрытия
Обоснование
Несмотря на то, что точность секвенирования для каждого отдельного нуклеотида очень высока, очень большое количество нуклеотидов в геноме означает, что если отдельный геном секвенируется только один раз, будет значительное количество ошибок секвенирования. Кроме того, многие позиции в геноме содержат редкие однонуклеотидные полиморфизмы (SNP). Следовательно, чтобы отличить ошибки секвенирования от истинных SNP, необходимо еще больше повысить точность секвенирования, секвенируя отдельные геномы большое количество раз.
Сверхглубокое секвенирование
Термин «сверхглубокий» иногда может также относиться к более высокому покрытию (>100-кратному), что позволяет обнаруживать варианты последовательностей в смешанных популяциях. [5] [6] [7] В экстремальном случае подходы к секвенированию с коррекцией ошибок, такие как секвенирование на максимальной глубине, могут сделать так, что покрытие заданной области приблизится к пропускной способности машины для секвенирования, обеспечивая покрытие >10^8. [8]
Секвенирование транскриптома
Глубокое секвенирование транскриптомов , также известное как RNA-Seq , обеспечивает как последовательность, так и частоту молекул РНК, которые присутствуют в определенное время в определенном типе клеток, ткани или органе. [9] Подсчет количества мРНК, которые кодируются отдельными генами, дает показатель потенциала кодирования белка, основного фактора фенотипа . [10] Улучшение методов секвенирования РНК является активной областью исследований как с точки зрения экспериментальных, так и вычислительных методов. [11]
Расчет
Средний охват для всего генома может быть рассчитан из длины исходного генома ( G ), количества прочтений ( N ) и средней длины прочтения ( L ) как . Например, гипотетический геном с 2000 парами оснований, реконструированный из 8 прочтений со средней длиной 500 нуклеотидов, будет иметь 2-кратную избыточность. Этот параметр также позволяет оценить другие величины, такие как процент генома, покрытого прочтениями (иногда также называемый шириной покрытия). Высокий охват при дробовом секвенировании желателен, поскольку он может преодолеть ошибки в вызове и сборке оснований . Предмет теории секвенирования ДНК рассматривает взаимосвязи таких величин. [2]
Физическое покрытие
Иногда проводится различие между покрытием последовательностей и физическим покрытием . Если покрытие последовательностей — это среднее количество раз, когда база считывается, то физическое покрытие — это среднее количество раз, когда база считывается или охватывается парными чтениями. [2] [12] [4]
Геномное покрытие
С точки зрения геномного покрытия и точности, секвенирование всего генома можно в целом разделить на следующие категории: [13]
Проект последовательности , охватывающий приблизительно 90% генома с точностью приблизительно 99,9%
Завершенная последовательность , охватывающая более 95% генома с точностью приблизительно 99,99%
Создание действительно высококачественной готовой последовательности по этому определению очень дорого. Таким образом, большинство результатов " полного геномного секвенирования " человека представляют собой черновые последовательности (иногда выше, а иногда ниже точности, определенной выше). [13]
^ abc Sims, David; Sudbery, Ian; Ilott, Nicholas E.; Heger, Andreas; Ponting, Chris P. (2014). «Глубина и покрытие секвенирования: ключевые соображения в геномном анализе». Nature Reviews Genetics . 15 (2): 121–132. doi :10.1038/nrg3642. PMID 24434847. S2CID 13325739.
^ Мардис, Элейн Р. (2008-09-01). «Методы секвенирования ДНК следующего поколения». Annual Review of Genomics and Human Genetics . 9 (1): 387–402. doi :10.1146/annurev.genom.9.081307.164359. ISSN 1527-8204. PMID 18576944.
^ ab Ekblom, Robert; Wolf, Jochen BW (2014). «Полевое руководство по секвенированию, сборке и аннотации всего генома». Evolutionary Applications . 7 (9): 1026–42. Bibcode : 2014EvApp...7.1026E. doi : 10.1111/eva.12178. PMC 4231593. PMID 25553065 .
^ Ajay SS, Parker SC, Abaan HO, Fajardo KV, Margulies EH (сентябрь 2011 г.). «Точное и всеобъемлющее секвенирование персональных геномов». Genome Res . 21 (9): 1498–505. doi :10.1101/gr.123638.111. PMC 3166834. PMID 21771779 .
^ Миребрагим, Хамид; Клоуз, Тимоти Дж.; Лонарди, Стефано (2015-06-15). «Метасборка данных сверхглубокого секвенирования de novo». Биоинформатика . 31 (12): i9–i16. doi :10.1093/bioinformatics/btv226. ISSN 1367-4803. PMC 4765875. PMID 26072514 .
^ Beerenwinkel, Niko ; Zagordi, Osvaldo (2011-11-01). «Сверхглубокое секвенирование для анализа вирусных популяций». Current Opinion in Virology . 1 (5): 413–418. doi :10.1016/j.coviro.2011.07.008. PMID 22440844.
^ Jee, J.; Rasouly, A.; Shamovsky, I.; Akivis, Y.; Steinman, S.; Mishra, B.; Nudler, E. (2016). «Скорости и механизмы бактериального мутагенеза при максимально глубоком секвенировании». Nature . 534 (7609): 693–696. Bibcode :2016Natur.534..693J. doi :10.1038/nature18313. PMC 4940094 . PMID 27338792.
^ Hampton M, Melvin RG, Kendall AH, Kirkpatrick BR, Peterson N, Andrews MT (2011). «Глубокое секвенирование транскриптома выявляет сезонные адаптивные механизмы у млекопитающих, впадающих в спячку». PLOS ONE . 6 (10): e27021. Bibcode : 2011PLoSO...627021H. doi : 10.1371/journal.pone.0027021 . PMC 3203946. PMID 22046435 .
^ Heyer EE, Ozadam H, Ricci EP, Cenik C, Moore MJ (2015). «Оптимизированный метод без набора для создания библиотек глубокого секвенирования, специфичных для цепей, из фрагментов РНК». Nucleic Acids Res . 43 (1): e2. doi :10.1093/nar/gku1235. PMC 4288154. PMID 25505164 .
^ Мейерсон, М.; Габриэль, С.; Гетц, Г. (2010). «Достижения в понимании геномов рака посредством секвенирования второго поколения». Nature Reviews Genetics . 11 (10): 685–696. doi :10.1038/nrg2841. PMID 20847746. S2CID 2544266.