В генетике покрытие является одним из нескольких показателей глубины или полноты секвенирования ДНК и более конкретно выражается в любом из следующих терминов:
Покрытие последовательности (или глубина) — это количество уникальных прочтений, которые включают данный нуклеотид в реконструированную последовательность. [1] [2] Глубокое секвенирование относится к общей концепции стремления к большому количеству уникальных прочтений каждой области последовательности. [3]
Физическое покрытие — совокупная длина чтений или пар чтений, выраженная как кратное размеру генома. [4]
Несмотря на то, что точность секвенирования каждого отдельного нуклеотида очень высока, очень большое количество нуклеотидов в геноме означает, что если отдельный геном секвенировать только один раз, возникнет значительное количество ошибок секвенирования. Более того, многие позиции генома содержат редкие однонуклеотидные полиморфизмы (SNP). Следовательно, чтобы отличить ошибки секвенирования от истинных SNP, необходимо еще больше повысить точность секвенирования за счет секвенирования отдельных геномов большое количество раз.
Сверхглубокое секвенирование
Термин «сверхглубокий» иногда также может относиться к более высокому охвату (> 100-кратному), что позволяет обнаруживать варианты последовательностей в смешанных популяциях. [5] [6] [7] В крайнем случае, подходы секвенирования с коррекцией ошибок, такие как секвенирование максимальной глубины, могут сделать так, что охват заданной области приближается к пропускной способности секвенатора, обеспечивая покрытие> 10 ^ 8. [8]
Секвенирование транскриптома
Глубокое секвенирование транскриптомов , также известное как RNA-Seq , обеспечивает как последовательность, так и частоту молекул РНК, которые присутствуют в любой конкретный момент времени в определенном типе клеток, ткани или органе. [9] Подсчет количества мРНК, кодируемых отдельными генами, является индикатором потенциала кодирования белка, что является основным фактором, влияющим на фенотип . [10] Совершенствование методов секвенирования РНК является активной областью исследований как с точки зрения экспериментальных, так и вычислительных методов. [11]
Расчет
Среднее покрытие для всего генома можно рассчитать на основе длины исходного генома ( G ), количества чтений ( N ) и средней длины чтения ( L ) как . Например, гипотетический геном с 2000 парами оснований, реконструированный из 8 ридов со средней длиной 500 нуклеотидов, будет иметь 2-кратную избыточность. Этот параметр также позволяет оценить другие величины, такие как процент генома, охваченного чтениями (иногда его также называют широтой охвата). Желателен широкий охват последовательности дробовиков, поскольку это может устранить ошибки в вызове и сборке баз. Предмет теории секвенирования ДНК касается взаимоотношений таких величин. [2]
Физическое покрытие
Иногда проводится различие между последовательным покрытием и физическим покрытием . Если покрытие последовательности представляет собой среднее количество раз считывания основания, то физическое покрытие представляет собой среднее количество раз, когда основание считывается или охватывается парными чтениями. [2] [12] [4]
Геномный охват
С точки зрения геномного охвата и точности полногеномное секвенирование можно в общих чертах разделить на одно из следующих: [13]
Черновой вариант последовательности , охватывающий примерно 90% генома с точностью примерно 99,9%.
Готовая последовательность , охватывающая более 95% генома с точностью примерно 99,99%.
Производство по-настоящему качественного готового эпизода по этому определению обходится очень дорого. Таким образом, большинство результатов « полного секвенирования генома » человека представляют собой черновые последовательности (иногда выше, а иногда ниже точности, определенной выше). [13]
Рекомендации
^ «Охват секвенирования». Illumina.com . Образование Иллюмина . Проверено 8 октября 2020 г.
^ Мардис, Элейн Р. (1 сентября 2008 г.). «Методы секвенирования ДНК нового поколения». Ежегодный обзор геномики и генетики человека . 9 (1): 387–402. дои : 10.1146/annurev.genom.9.081307.164359. ISSN 1527-8204. ПМИД 18576944.
^ Аб Экблом, Роберт; Вольф, Йохен Б.В. (2014). «Полевое руководство по полногеномному секвенированию, сборке и аннотированию». Эволюционные приложения . 7 (9): 1026–42. дои : 10.1111/eva.12178. ПМЦ 4231593 . ПМИД 25553065.
^ Миребрагим, Хамид; Клоуз, Тимоти Дж.; Лонарди, Стефано (15 июня 2015 г.). «Мета-сборка данных сверхглубокого секвенирования de novo». Биоинформатика . 31 (12): i9–i16. doi : 10.1093/биоинформатика/btv226. ISSN 1367-4803. ПМЦ 4765875 . ПМИД 26072514.
^ Беренвинкель, Нико ; Загорди, Освальдо (1 ноября 2011 г.). «Сверхглубокое секвенирование для анализа вирусных популяций». Современное мнение в вирусологии . 1 (5): 413–418. дои : 10.1016/j.coviro.2011.07.008. ПМИД 22440844.