Технологии транскриптомики — это методы, используемые для изучения транскриптома организма , суммы всех его РНК-транскриптов . Информационное содержание организма записывается в ДНК его генома и выражается посредством транскрипции . Здесь мРНК служит временной промежуточной молекулой в информационной сети, в то время как некодирующие РНК выполняют дополнительные разнообразные функции. Транскриптом фиксирует моментальный снимок во времени всех транскриптов, присутствующих в клетке . Технологии транскриптомики предоставляют широкий отчет о том, какие клеточные процессы активны, а какие находятся в состоянии покоя. Основной проблемой молекулярной биологии является понимание того, как один геном дает начало различным клеткам. Другой проблемой является то, как регулируется экспрессия генов.
Первые попытки изучения целых транскриптомов начались в начале 1990-х годов. Последующие технологические достижения с конца 1990-х годов неоднократно трансформировали эту область и сделали транскриптомику широко распространенной дисциплиной в биологических науках. В этой области есть два ключевых современных метода: микрочипы , которые количественно определяют набор предопределенных последовательностей, и РНК-Seq , который использует высокопроизводительное секвенирование для записи всех транскриптов. По мере совершенствования технологий объем данных, получаемых в ходе каждого эксперимента с транскриптомом, увеличивался. В результате методы анализа данных неуклонно адаптировались для более точного и эффективного анализа все больших объемов данных. Базы данных транскриптомов становятся больше и полезнее, поскольку исследователи продолжают собирать и совместно использовать транскриптомы. Было бы практически невозможно интерпретировать информацию, содержащуюся в транскриптоме, без знаний предыдущих экспериментов.
Измерение экспрессии генов организма в различных тканях или состояниях , или в разное время, дает информацию о том, как гены регулируются , и раскрывает детали биологии организма. Его также можно использовать для вывода функций ранее неаннотированных генов. Транскриптомный анализ позволил изучить, как экспрессия генов изменяется в различных организмах, и сыграл важную роль в понимании болезней человека . Анализ экспрессии генов в целом позволяет обнаружить широкие скоординированные тенденции, которые не могут быть распознаны более целенаправленными анализами .
История
Транскриптомика характеризуется разработкой новых методов, которые переопределяют то, что возможно, примерно каждые десять лет и делают предыдущие технологии устаревшими. Первая попытка захвата частичного человеческого транскриптома была опубликована в 1991 году и сообщила о 609 последовательностях мРНК из человеческого мозга . [2] В 2008 году были опубликованы два человеческих транскриптома, состоящих из миллионов последовательностей, полученных из транскриптов, охватывающих 16 000 генов, [3] [4] и к 2015 году были опубликованы транскриптомы для сотен людей. [5] [6] Транскриптомы различных болезненных состояний, тканей или даже отдельных клеток теперь генерируются регулярно. [6] [7] [8] Этот взрыв в транскриптомике был обусловлен быстрым развитием новых технологий с улучшенной чувствительностью и экономичностью. [9] [10] [11] [12]
Слово «транскриптом» впервые было использовано в 1990-х годах. [19] [20] В 1995 году был разработан один из самых ранних методов транскриптомики на основе секвенирования — последовательный анализ экспрессии генов (SAGE), который работал по методу Сэнгера, основанному на конкатенированных случайных фрагментах транскриптов. [21] Транскрипты количественно определялись путем сопоставления фрагментов с известными генами. Также некоторое время использовался вариант SAGE, использующий высокопроизводительные методы секвенирования, называемый цифровым анализом экспрессии генов. [9] [22] Однако эти методы были в значительной степени вытеснены высокопроизводительным секвенированием целых транскриптов, которое предоставляло дополнительную информацию о структуре транскрипта, такую как варианты сплайсинга . [9]
Развитие современных технологий
Доминирующие современные методы, микрочипы и РНК-Seq , были разработаны в середине 1990-х и 2000-х годов. [9] [33] Микрочипы, которые измеряют распространенность определенного набора транскриптов посредством их гибридизации с массивом комплементарных зондов, были впервые опубликованы в 1995 году. [34] [35] Технология микрочипов позволила проводить анализ тысяч транскриптов одновременно и при значительном снижении затрат на ген и экономии труда. [36] Как точечные олигонуклеотидные массивы , так и массивы высокой плотности Affymetrix были методом выбора для транскрипционного профилирования до конца 2000-х годов. [12] [33] За этот период был произведен ряд микрочипов для покрытия известных генов в модельных или экономически важных организмах. Достижения в области проектирования и производства массивов улучшили специфичность зондов и позволили тестировать больше генов на одном массиве. Достижения в области обнаружения флуоресценции повысили чувствительность и точность измерения для транскриптов с низкой распространенностью. [35] [37]
RNA-Seq выполняется путем обратной транскрипции РНК in vitro и секвенирования полученных кДНК . [10] Распространенность транскриптов определяется по количеству подсчетов для каждого транскрипта. Поэтому на эту технику оказало сильное влияние развитие технологий высокопроизводительного секвенирования . [9] [11] Массовое параллельное секвенирование сигнатур (MPSS) было ранним примером, основанным на создании последовательностей длиной 16–20 п.н. с помощью сложной серии гибридизаций , [38] [примечание 1] и использовалось в 2004 году для подтверждения экспрессии десяти тысяч генов в Arabidopsis thaliana . [39] Самая ранняя работа по RNA-Seq была опубликована в 2006 году с сотней тысяч транскриптов, секвенированных с использованием технологии 454. [40] Этого было достаточно для количественной оценки относительной распространенности транскриптов . RNA-Seq начал набирать популярность после 2008 года, когда новые технологии Solexa/Illumina позволили записать один миллиард последовательностей транскриптов. [4] [10] [41] [42] Этот результат теперь позволяет проводить количественную оценку и сравнение человеческих транскриптомов. [43]
Сбор данных
Получение данных о транскриптах РНК может быть достигнуто с помощью одного из двух основных принципов: секвенирования отдельных транскриптов ( EST или RNA-Seq) или гибридизации транскриптов с упорядоченным массивом нуклеотидных зондов (микрочипы). [23]
Выделение РНК
Все транскриптомные методы требуют, чтобы РНК была сначала выделена из экспериментального организма, прежде чем транскрипты могут быть записаны. Хотя биологические системы невероятно разнообразны, методы извлечения РНК в целом схожи и включают механическое разрушение клеток или тканей, разрушение РНКазы хаотропными солями , [44] разрушение макромолекул и нуклеотидных комплексов, отделение РНК от нежелательных биомолекул, включая ДНК, и концентрирование РНК путем осаждения из раствора или элюирования из твердой матрицы . [44] [45] Изолированную РНК можно дополнительно обработать ДНКазой для переваривания любых следов ДНК. [46] Необходимо обогатить информационную РНК, поскольку общие экстракты РНК обычно на 98% состоят из рибосомальной РНК . [47] Обогащение транскриптов можно выполнить методами поли-А- аффинности или путем истощения рибосомальной РНК с использованием зондов, специфичных для последовательности. [48] Деградированная РНК может повлиять на результаты последующих исследований; например, обогащение мРНК из деградированных образцов приведет к истощению 5'-концов мРНК и неравномерному сигналу по всей длине транскрипта. Мгновенное замораживание ткани перед выделением РНК является типичным, и принимаются меры для снижения воздействия ферментов РНКазы после завершения выделения. [45]
Теги экспрессированной последовательности
Экспрессированная последовательность тега (EST) представляет собой короткую нуклеотидную последовательность, полученную из одного транскрипта РНК. РНК сначала копируется как комплементарная ДНК (кДНК) ферментом обратной транскриптазы, а затем полученная кДНК секвенируется. [16] Поскольку EST могут быть собраны без предварительного знания организма, из которого они получены, их можно изготавливать из смесей организмов или образцов окружающей среды. [49] [16] Хотя сейчас используются методы с более высокой пропускной способностью, библиотеки EST обычно предоставляли информацию о последовательностях для ранних разработок микрочипов; например, микрочип ячменя был разработан из 350 000 ранее секвенированных EST. [50]
Серийный и кэп-анализ экспрессии генов (SAGE/CAGE)
Последовательный анализ экспрессии генов (SAGE) был развитием методологии EST для увеличения пропускной способности генерируемых тегов и обеспечения некоторой количественной оценки распространенности транскриптов. [21] кДНК генерируется из РНК , но затем расщепляется на фрагменты «тегов» размером 11 п.н. с использованием рестриктаз , которые разрезают ДНК в определенной последовательности, и 11 пар оснований вдоль этой последовательности. Затем эти теги кДНК соединяются голова к хвосту в длинные нити (>500 п.н.) и секвенируются с использованием низкопроизводительных, но длинных методов считывания, таких как секвенирование по Сэнгеру . Затем последовательности разделяются обратно на их исходные теги размером 11 п.н. с использованием компьютерного программного обеспечения в процессе, называемом деконволюцией . [21] Если доступен высококачественный референсный геном , эти теги могут быть сопоставлены с соответствующим им геном в геноме. Если референсный геном недоступен, теги могут быть напрямую использованы в качестве диагностических маркеров, если обнаружено, что они дифференциально экспрессируются в состоянии болезни. [21]
Методы SAGE и CAGE дают информацию о большем количестве генов, чем это было возможно при секвенировании отдельных EST, но подготовка образцов и анализ данных, как правило, более трудоемки. [52]
Микрочипы
Принципы и достижения
Микрочипы обычно состоят из сетки коротких нуклеотидных олигомеров , известных как « зонды », обычно расположенных на предметном стекле. [53] Распространенность транскриптов определяется путем гибридизации флуоресцентно меченых транскриптов с этими зондами. [54] Интенсивность флуоресценции в каждом месте зонда на массиве указывает распространенность транскриптов для этой последовательности зонда. [54] Группы зондов, разработанные для измерения одного и того же транскрипта (т. е. гибридизации определенного транскрипта в разных положениях), обычно называются «наборами зондов».
Микрочипы требуют некоторых геномных знаний от интересующего организма, например, в форме аннотированной последовательности генома или библиотеки EST, которые можно использовать для генерации зондов для массива. [36]
Методы
Микрочипы для транскриптомики обычно попадают в одну из двух широких категорий: точечные массивы низкой плотности или массивы коротких зондов высокой плотности. Изобилие транскриптов выводится из интенсивности флуоресценции, полученной от транскриптов, помеченных флуорофором, которые связываются с массивом. [36]
Точечные массивы низкой плотности обычно содержат пиколитровые [примечание 2] капли ряда очищенных кДНК, выстроенных на поверхности предметного стекла. [55] Эти зонды длиннее, чем зонды массивов высокой плотности, и не могут идентифицировать альтернативные события сплайсинга. Точечные массивы используют два разных флуорофора для маркировки тестовых и контрольных образцов, а отношение флуоресценции используется для расчета относительной меры распространенности. [56] Высокоплотные массивы используют одну флуоресцентную метку, и каждый образец гибридизуется и обнаруживается индивидуально. [57] Высокоплотные массивы были популяризированы массивом Affymetrix GeneChip , где каждый транскрипт количественно определяется несколькими короткими 25- мерными зондами, которые вместе анализируют один ген. [58]
Массивы NimbleGen представляли собой массив высокой плотности, произведенный методом безмасковой фотохимии , что позволяло гибко изготавливать массивы в малых или больших количествах. Эти массивы имели 100 000 зондов длиной от 45 до 85 меров и были гибридизированы с образцом с одноцветной меткой для анализа экспрессии. [59] Некоторые конструкции включали до 12 независимых массивов на слайд.
РНК-Seq
Принципы и достижения
RNA-Seq относится к комбинации высокопроизводительной методологии секвенирования с вычислительными методами для захвата и количественной оценки транскриптов, присутствующих в экстракте РНК. [10] Сгенерированные нуклеотидные последовательности обычно имеют длину около 100 п.н., но могут варьироваться от 30 п.н. до более 10 000 п.н. в зависимости от используемого метода секвенирования. RNA-Seq использует глубокую выборку транскриптома с множеством коротких фрагментов из транскриптома, чтобы обеспечить вычислительную реконструкцию исходного транскрипта РНК путем выравнивания прочтений с референсным геномом или друг с другом ( сборка de novo ). [9] Как малочисленные, так и высокочисленные РНК могут быть количественно определены в эксперименте RNA-Seq ( динамический диапазон 5 порядков величины ) — ключевое преимущество перед транскриптомами на основе микрочипов. Кроме того, количество входной РНК для RNA-Seq (количество нанограммов) намного ниже, чем для микрочипов (количество микрограммов), которые позволяют исследовать транскриптом даже при разрешении одной клетки в сочетании с амплификацией кДНК. [25] [60] Теоретически, не существует верхнего предела количественной оценки в RNA-Seq, а фоновый шум очень низок для считываний 100 п.н. в неповторяющихся областях. [10]
RNA-Seq может использоваться для идентификации генов в геноме или определения того, какие гены активны в определенный момент времени, а количество прочтений может использоваться для точного моделирования относительного уровня экспрессии генов. Методология RNA-Seq постоянно совершенствовалась, в первую очередь за счет разработки технологий секвенирования ДНК для повышения пропускной способности, точности и длины прочтений. [61] С момента первых описаний в 2006 и 2008 годах [40] [62] RNA-Seq быстро внедрялся и обогнал микрочипы в качестве доминирующей техники транскриптомики в 2015 году. [63]
Поиск данных транскриптома на уровне отдельных клеток привел к прогрессу в методах подготовки библиотеки РНК-Seq, что привело к резкому повышению чувствительности. Транскриптомы отдельных клеток теперь хорошо описаны и даже были расширены до in situ РНК-Seq, где транскриптомы отдельных клеток напрямую исследуются в фиксированных тканях. [64]
Методы
RNA-Seq был создан в сочетании с быстрым развитием ряда высокопроизводительных технологий секвенирования ДНК. [65] Однако, прежде чем извлеченные транскрипты РНК будут секвенированы, выполняется несколько ключевых этапов обработки. Методы различаются по использованию обогащения транскрипта, фрагментации, амплификации, секвенирования с одним или двумя концами, а также по тому, следует ли сохранять информацию о цепях. [65]
Чувствительность эксперимента RNA-Seq может быть увеличена путем обогащения классов РНК, представляющих интерес, и истощения известных обильных РНК. Молекулы мРНК могут быть разделены с помощью олигонуклеотидных зондов, которые связывают их поли-А-хвосты . В качестве альтернативы, рибодеплеция может быть использована для специфического удаления обильных, но неинформативных рибосомальных РНК (рРНК) путем гибридизации с зондами, адаптированными к специфическим последовательностям рРНК таксона (например, рРНК млекопитающих, рРНК растений). Однако рибодеплеция также может вносить некоторую предвзятость посредством неспецифического истощения нецелевых транскриптов. [66] Малые РНК, такие как микроРНК , могут быть очищены на основе их размера с помощью гель-электрофореза и экстракции.
Во время подготовки к секвенированию копии кДНК транскриптов могут быть амплифицированы с помощью ПЦР для обогащения фрагментов, содержащих ожидаемые последовательности адаптеров 5' и 3'. [69] Амплификация также используется для обеспечения возможности секвенирования очень малых количеств входной РНК, вплоть до 50 пг в экстремальных приложениях. [70] Контрольные образцы известных РНК могут использоваться для оценки контроля качества, чтобы проверить подготовку библиотеки и секвенирование с точки зрения содержания GC , длины фрагмента, а также смещения из-за положения фрагмента в транскрипте. [71] Уникальные молекулярные идентификаторы (UMI) представляют собой короткие случайные последовательности, которые используются для индивидуальной маркировки фрагментов последовательности во время подготовки библиотеки, чтобы каждый помеченный фрагмент был уникальным. [72] UMI предоставляют абсолютную шкалу для количественной оценки, возможность скорректировать последующее смещение амплификации, внесенное во время построения библиотеки, и точно оценить начальный размер образца. UMI особенно хорошо подходят для транскриптомики РНК-Seq отдельных клеток, где количество входной РНК ограничено и требуется расширенная амплификация образца. [73] [74] [75]
После подготовки молекул транскрипта их можно секвенировать только в одном направлении (одноконцевое) или в обоих направлениях (парноконцевое). Одноконцевая последовательность обычно производится быстрее, дешевле, чем парноконцевое секвенирование, и достаточна для количественной оценки уровней экспрессии генов. Парноконцевое секвенирование дает более надежные выравнивания/сборки, что полезно для аннотации генов и обнаружения изоформ транскриптов . [10] Методы РНК-Seq, специфичные для нитей, сохраняют информацию о цепях секвенированного транскрипта. [76] Без информации о цепях считывания могут быть выровнены с локусом гена, но не сообщают, в каком направлении транскрибируется ген. Stranded-RNA-Seq полезен для расшифровки транскрипции для генов, которые перекрываются в разных направлениях, и для более надежных предсказаний генов в немодельных организмах. [76]
Условные обозначения: NCBI SRA – Национальный центр информации о биотехнологиях, архив прочтений последовательностей.
В настоящее время RNA-Seq полагается на копирование молекул РНК в молекулы кДНК перед секвенированием; поэтому последующие платформы одинаковы для транскриптомных и геномных данных. Следовательно, разработка технологий секвенирования ДНК стала определяющей чертой RNA-Seq. [78] [80] [81] Прямое секвенирование РНК с использованием нанопорового секвенирования представляет собой современный современный метод RNA-Seq. [82] [83] Нанопоровое секвенирование РНК может обнаруживать модифицированные основания , которые в противном случае были бы замаскированы при секвенировании кДНК, а также устраняет этапы амплификации , которые в противном случае могли бы внести смещение. [11] [84]
Чувствительность и точность эксперимента RNA-Seq зависят от количества прочтений , полученных из каждого образца. [85] [86] Большое количество прочтений необходимо для обеспечения достаточного покрытия транскриптома, что позволяет обнаруживать транскрипты с низкой распространенностью. Экспериментальный дизайн еще больше усложняется технологиями секвенирования с ограниченным выходным диапазоном, переменной эффективностью создания последовательностей и переменным качеством последовательностей. К этим соображениям добавляется то, что у каждого вида разное количество генов и, следовательно, требуется индивидуальный выход последовательности для эффективного транскриптома. Ранние исследования определяли подходящие пороговые значения эмпирически, но по мере развития технологии подходящее покрытие предсказывалось вычислительно по насыщению транскриптома. Несколько противоречащее интуиции, наиболее эффективный способ улучшить обнаружение дифференциальной экспрессии в генах с низкой экспрессией — это добавить больше биологических репликатов , а не больше прочтений. [87] Текущие контрольные показатели, рекомендуемые проектом «Энциклопедия элементов ДНК » (ENCODE), составляют 70-кратное покрытие экзома для стандартного РНК-Seq и до 500-кратное покрытие экзома для обнаружения редких транскриптов и изоформ. [88] [89] [90]
Анализ данных
Методы транскриптомики высокопараллельны и требуют значительных вычислений для получения значимых данных как для экспериментов с микрочипами, так и для экспериментов с РНК-Seq. [91] [92] [93] [94] [95] Данные микрочипов записываются в виде изображений с высоким разрешением , требующих обнаружения признаков и спектрального анализа. [96] Файлы необработанных изображений микрочипов имеют размер около 750 МБ, в то время как обработанные интенсивности имеют размер около 60 МБ. Несколько коротких зондов, соответствующих одному транскрипту, могут раскрыть детали о структуре интрон - экзон , требуя статистических моделей для определения подлинности полученного сигнала. Исследования РНК-Seq производят миллиарды коротких последовательностей ДНК, которые должны быть выровнены с референсными геномами, состоящими из миллионов или миллиардов пар оснований. Сборка прочтений de novo в наборе данных требует построения очень сложных графов последовательностей . [97] Операции RNA-Seq являются многократно повторяющимися и выигрывают от параллельных вычислений , но современные алгоритмы означают, что потребительское вычислительное оборудование достаточно для простых экспериментов по транскриптомике, которые не требуют сборки считываний de novo . [98] Человеческий транскриптом может быть точно получен с помощью RNA-Seq с 30 миллионами последовательностей по 100 п.н. на образец. [85] [86] Этот пример потребует приблизительно 1,8 гигабайта дискового пространства на образец при хранении в сжатом формате fastq . Обработанные данные подсчета для каждого гена будут намного меньше, эквивалентно обработанным интенсивностям микрочипов. Данные о последовательностях могут храниться в публичных репозиториях, таких как Архив прочтений последовательностей (SRA). [99] Наборы данных RNA-Seq могут быть загружены через Gene Expression Omnibus. [100]
Обработка изображений
Обработка изображений микрочипов должна правильно идентифицировать регулярную сетку признаков в пределах изображения и независимо количественно определять интенсивность флуоресценции для каждого признака. Артефакты изображения должны быть дополнительно идентифицированы и удалены из общего анализа. Интенсивность флуоресценции напрямую указывает на распространенность каждой последовательности, поскольку последовательность каждого зонда на массиве уже известна. [102]
Первые шаги РНК-секвенирования также включают в себя похожую обработку изображений; однако преобразование изображений в данные последовательности обычно выполняется автоматически программным обеспечением прибора. Метод секвенирования синтезом Illumina приводит к массиву кластеров, распределенных по поверхности проточной ячейки. [103] Проточная ячейка визуализируется до четырех раз в течение каждого цикла секвенирования, всего от десятков до сотен циклов. Кластеры проточной ячейки аналогичны пятнам микроматрицы и должны быть правильно идентифицированы на ранних стадиях процесса секвенирования. В методе пиросеквенирования Roche интенсивность испускаемого света определяет количество последовательных нуклеотидов в гомополимерном повторе. Существует много вариантов этих методов, каждый из которых имеет свой профиль ошибок для полученных данных. [104]
Анализ данных РНК-Seq
Эксперименты RNA-Seq генерируют большой объем необработанных последовательностей, которые должны быть обработаны для получения полезной информации. Анализ данных обычно требует комбинации программных средств биоинформатики (см. также Список инструментов биоинформатики RNA-Seq ), которые различаются в зависимости от экспериментального дизайна и целей. Процесс можно разбить на четыре этапа: контроль качества, выравнивание, количественная оценка и дифференциальное выражение. [105] Большинство популярных программ RNA-Seq запускаются из интерфейса командной строки , либо в среде Unix , либо в статистической среде R / Bioconductor . [94]
Контроль качества
Считывания последовательностей не идеальны, поэтому точность каждого основания в последовательности должна быть оценена для последующих анализов. Необработанные данные проверяются, чтобы убедиться: оценки качества для вызовов оснований высоки, содержание GC соответствует ожидаемому распределению, короткие мотивы последовательностей ( k-меры ) не перепредставлены, а скорость дупликации прочтений приемлемо низка. [86] Существует несколько вариантов программного обеспечения для анализа качества последовательностей, включая FastQC и FaQCs. [106] [107] Аномалии могут быть удалены (обрезка) или помечены для специальной обработки во время последующих процессов.
Выравнивание
Чтобы связать распространенность прочтений последовательностей с экспрессией конкретного гена, последовательности транскриптов выравниваются с референтным геномом или de novo выравниваются друг с другом, если референт недоступен. [108] [109] [110] Основные проблемы программного обеспечения для выравнивания включают достаточную скорость, чтобы позволить миллиардам коротких последовательностей быть выровненными в значимые временные рамки, гибкость для распознавания и обработки интронного сплайсинга эукариотической мРНК и правильное назначение прочтений, которые отображаются в нескольких местах. Достижения программного обеспечения в значительной степени решили эти проблемы, а увеличение длины прочтений секвенирования снижает вероятность неоднозначных выравниваний прочтений. Список доступных в настоящее время высокопроизводительных выравнивателей последовательностей поддерживается EBI . [ 111] [112]
Выравнивание последовательностей первичного транскрипта мРНК , полученных от эукариот , с референтным геномом требует специализированной обработки последовательностей интронов , которые отсутствуют в зрелой мРНК. [113] Короткие выравниватели прочтений выполняют дополнительный раунд выравниваний, специально разработанных для идентификации соединений сплайсинга , на основе канонических последовательностей сайтов сплайсинга и известной информации о сайте сплайсинга интронов. Идентификация соединений сплайсинга интронов предотвращает несоответствие прочтений друг другу по соединениям сплайсинга или ошибочное отбрасывание, что позволяет выровнять больше прочтений с референтным геномом и повысить точность оценок экспрессии генов. Поскольку регуляция генов может происходить на уровне изоформ мРНК , выравнивания с учетом сплайсинга также позволяют обнаруживать изменения в изоформах, которые в противном случае были бы потеряны при объемном анализе. [114]
Сборка de novo может использоваться для выравнивания прочтений друг с другом для построения полноразмерных последовательностей транскриптов без использования референсного генома. [115] Проблемы, характерные для сборки de novo , включают большие вычислительные требования по сравнению с референсным транскриптомом, дополнительную проверку вариантов или фрагментов генов и дополнительную аннотацию собранных транскриптов. Первые метрики, используемые для описания сборок транскриптома, такие как N50 , оказались обманчивыми [116] , и теперь доступны улучшенные методы оценки. [117] [118] Метрики на основе аннотаций являются лучшими оценками полноты сборки, такими как contig reciprocal best hit count. После сборки de novo сборку можно использовать в качестве эталона для последующих методов выравнивания последовательностей и количественного анализа экспрессии генов.
Условные обозначения: RAM – оперативное запоминающее устройство; MPI – интерфейс передачи сообщений; EST – тег выраженной последовательности.
Количественная оценка
Количественная оценка выравниваний последовательностей может быть выполнена на уровне гена, экзона или транскрипта. [91] [87] Типичные выходные данные включают таблицу количества прочтений для каждой функции, предоставленной программному обеспечению; например, для генов в файле общего формата функций . Количество прочтений генов и экзонов может быть довольно легко рассчитано с помощью, например, HTSeq. [130] Количественная оценка на уровне транскрипта более сложна и требует вероятностных методов для оценки распространенности изоформ транскрипта из короткой информации о прочтении; например, с помощью программного обеспечения cufflinks. [114] Чтения, которые одинаково хорошо выравниваются с несколькими местоположениями, должны быть идентифицированы и либо удалены, либо выровнены с одним из возможных местоположений, либо выровнены с наиболее вероятным местоположением.
Некоторые методы количественной оценки могут обойти необходимость точного выравнивания прочтения с референтной последовательностью вообще. Метод программного обеспечения kallisto объединяет псевдовыравнивание и количественную оценку в один шаг, который выполняется на 2 порядка быстрее, чем современные методы, такие как те, которые используются программным обеспечением tophat/cufflinks, с меньшей вычислительной нагрузкой. [131]
Дифференциальное выражение
После того, как количественные подсчеты каждого транскрипта доступны, дифференциальная экспрессия генов измеряется путем нормализации, моделирования и статистического анализа данных. [108] Большинство инструментов будут считывать таблицу генов и считывать подсчеты в качестве своих входных данных, но некоторые программы, такие как cuffdiff, будут принимать считываемые выравнивания в формате бинарной карты выравнивания в качестве входных данных. Конечными результатами этих анализов являются списки генов с соответствующими парными тестами на дифференциальную экспрессию между обработками и оценками вероятности этих различий. [132]
Условные обозначения: мРНК — информационная РНК.
Проверка
Транскриптомные анализы могут быть проверены с использованием независимой методики, например, количественной ПЦР (qPCR), которая распознаваема и статистически оцениваема. [135] Экспрессия гена измеряется по определенным стандартам как для интересующего гена, так и для контрольных генов. Измерение с помощью qPCR похоже на измерение, полученное с помощью RNA-Seq, где значение может быть рассчитано для концентрации целевого региона в данном образце. qPCR, однако, ограничена ампликонами размером менее 300 п.н., обычно ближе к 3'-концу кодирующей области, избегая 3'UTR . [136] Если требуется проверка изоформ транскриптов, проверка выравниваний прочтений RNA-Seq должна указать, где можно разместить праймеры qPCR для максимальной дискриминации. Измерение нескольких контрольных генов вместе с интересующими генами дает стабильную ссылку в биологическом контексте. [137] Проверка данных РНК-Seq с помощью ПЦР в целом показала, что различные методы РНК-Seq имеют высокую степень корреляции. [62] [138] [139]
Функциональная валидация ключевых генов является важным соображением для посттранскриптомного планирования. Наблюдаемые паттерны экспрессии генов могут быть функционально связаны с фенотипом с помощью независимого исследования нокдауна / спасения в интересующем организме. [140]
Приложения
Диагностика и профилирование заболеваний
Транскриптомные стратегии нашли широкое применение в различных областях биомедицинских исследований, включая диагностику и профилирование заболеваний . [10] [141] Подходы РНК-Seq позволили провести крупномасштабную идентификацию сайтов начала транскрипции , обнаружить альтернативное использование промотора и новые изменения сплайсинга . Эти регуляторные элементы важны для заболеваний человека, и поэтому определение таких вариантов имеет решающее значение для интерпретации исследований ассоциации заболеваний . [142] РНК-Seq также может идентифицировать ассоциированные с заболеваниями однонуклеотидные полиморфизмы (SNP), аллель-специфическую экспрессию и слияния генов , что способствует пониманию причинных вариантов заболеваний. [143]
Ретротранспозоны — это мобильные элементы , которые размножаются в эукариотических геномах посредством процесса, включающего обратную транскрипцию . РНК-Seq может предоставить информацию о транскрипции эндогенных ретротранспозонов, которые могут влиять на транскрипцию соседних генов посредством различных эпигенетических механизмов , приводящих к заболеванию. [144] Аналогичным образом, потенциал использования РНК-Seq для понимания заболеваний, связанных с иммунитетом, быстро расширяется благодаря возможности рассекать популяции иммунных клеток и секвенировать репертуары рецепторов Т- и В-клеток у пациентов. [145] [146]
Транскриптомный анализ преимущественно фокусировался либо на хозяине, либо на патогене. Двойной РНК-Seq применялся для одновременного профилирования экспрессии РНК как у патогена, так и у хозяина на протяжении всего процесса инфекции. Этот метод позволяет изучать динамический ответ и межвидовые сети генной регуляции у обоих партнеров взаимодействия от начального контакта до вторжения и окончательного сохранения патогена или его устранения иммунной системой хозяина. [149] [150]
Реакции на окружающую среду
Транскриптомика позволяет идентифицировать гены и пути , которые реагируют на биотические и абиотические экологические стрессы и противодействуют им. [151] [140] Нецелевая природа транскриптомики позволяет идентифицировать новые транскрипционные сети в сложных системах. Например, сравнительный анализ ряда линий нута на разных стадиях развития выявил различные транскрипционные профили, связанные со стрессами засухи и засоления , включая идентификацию роли транскриптовых изоформ AP2 - EREBP . [151] Исследование экспрессии генов во время формирования биопленки грибковым патогеном Candida albicans выявило совместно регулируемый набор генов, критически важных для установления и поддержания биопленки. [152]
Использование транскриптомики также важно для изучения реакций в морской среде. [155] В морской экологии « стресс » и « адаптация » были одними из самых распространенных тем исследований, особенно связанных с антропогенным стрессом, таким как глобальные изменения и загрязнение . [155] Большинство исследований в этой области были проведены на животных , хотя беспозвоночные были недостаточно представлены. [155] Одной из проблем по-прежнему является недостаток функциональных генетических исследований, что затрудняет аннотации генов , особенно для немодельных видов, и может привести к неопределенным выводам о влиянии изучаемых реакций. [155]
Аннотация функции гена
Все транскриптомные методы были особенно полезны для определения функций генов и идентификации тех, которые отвечают за определенные фенотипы. Транскриптомика экотипов Arabidopsis , которые гипераккумулируют металлы , коррелировала гены, участвующие в поглощении металлов , толерантности и гомеостазе с фенотипом. [156] Интеграция наборов данных RNA-Seq в различных тканях использовалась для улучшения аннотации функций генов в коммерчески важных организмах (например, огурец ) [157] или находящихся под угрозой исчезновения видах (например, коала ). [158]
Сборка считываний РНК-Seq не зависит от референтного генома [122] и поэтому идеально подходит для исследований экспрессии генов немодельных организмов с несуществующими или плохо развитыми геномными ресурсами. Например, база данных SNP, используемых в программах разведения пихты Дугласа, была создана с помощью анализа транскриптома de novo при отсутствии секвенированного генома . [159] Аналогичным образом, гены, которые функционируют в развитии сердечной, мышечной и нервной ткани у омаров, были идентифицированы путем сравнения транскриптомов различных типов тканей без использования последовательности генома. [160] РНК-Seq также может использоваться для идентификации ранее неизвестных областей кодирования белков в существующих секвенированных геномах.
Некодирующая РНК
Транскриптомика чаще всего применяется к содержанию мРНК в клетке. Однако те же методы в равной степени применимы к некодирующим РНК (нкРНК), которые не транслируются в белок, но вместо этого имеют прямые функции (например, роли в трансляции белка , репликации ДНК , сплайсинге РНК и регуляции транскрипции ). [161] [162] [163] [164] Многие из этих нкРНК влияют на болезненные состояния, включая рак, сердечно-сосудистые и неврологические заболевания. [165]
Базы данных транскриптома
Транскриптомные исследования генерируют большие объемы данных, которые имеют потенциальное применение далеко за пределами первоначальных целей эксперимента. Таким образом, необработанные или обработанные данные могут быть помещены в публичные базы данных , чтобы обеспечить их полезность для более широкого научного сообщества. Например, по состоянию на 2018 год Gene Expression Omnibus содержал миллионы экспериментов. [166]
Условные обозначения: NCBI — Национальный центр биотехнологической информации; EBI — Европейский институт биоинформатики; DDBJ — Банк данных ДНК Японии; ENA — Европейский архив нуклеотидов; MIAME — Минимальная информация об эксперименте с микрочипами; MINSEQE — Минимальная информация об эксперименте по высокопроизводительному секвенированию нуклеотидов.
Эта статья была адаптирована из следующего источника по лицензии CC BY 4.0 (2017) (отчеты рецензентов): Rohan Lowe; Neil Shirley; Mark Bleackley; Stephen Dolan; Thomas Shafee (18 мая 2017 г.). "Transcriptomics technologies". PLOS Computational Biology . 13 (5): e1005457. doi : 10.1371/JOURNAL.PCBI.1005457 . ISSN 1553-734X. PMC 5436640. PMID 28545146. S2CID 3714586. Wikidata Q33703532 .
^ "Тенденция Medline: автоматизированная ежегодная статистика результатов PubMed для любого запроса". dan.corlan.net . Получено 2016-10-05 .
^ ab Adams MD, Kelley JM, Gocayne JD, Dubnick M, Polymeropoulos MH, Xiao H, et al. (июнь 1991 г.). «Комплементарное секвенирование ДНК: экспрессируемые метки последовательностей и проект генома человека». Science . 252 (5013): 1651–6. Bibcode :1991Sci...252.1651A. doi :10.1126/science.2047873. PMID 2047873. S2CID 13436211.
^ Pan Q, Shai O, Lee LJ, Frey BJ, Blencowe BJ (декабрь 2008 г.). «Глубокое исследование сложности альтернативного сплайсинга в транскриптоме человека с помощью высокопроизводительного секвенирования». Nature Genetics . 40 (12): 1413–5. doi :10.1038/ng.259. PMID 18978789. S2CID 9228930.
^ ab Sultan M, Schulz MH, Richard H, Magen A, Klingenhoff A, Scherf M, et al. (август 2008 г.). «Глобальный взгляд на активность генов и альтернативный сплайсинг с помощью глубокого секвенирования человеческого транскриптома». Science . 321 (5891): 956–60. Bibcode :2008Sci...321..956S. doi :10.1126/science.1160342. PMID 18599741. S2CID 10013179.
^ Lappalainen T, Sammeth M, Friedländer MR, 't Hoen PA, Monlong J, Rivas MA и др. (сентябрь 2013 г.). «Секвенирование транскриптома и генома раскрывает функциональные вариации у людей». Nature . 501 (7468): 506–11. Bibcode :2013Natur.501..506L. doi :10.1038/nature12531. PMC 3918453 . PMID 24037378.
^ ab Melé M, Ferreira PG, Reverter F, DeLuca DS, Monlong J, Sammeth M и др. (май 2015 г.). «Геномика человека. Транскриптом человека в тканях и у отдельных лиц». Science . 348 (6235): 660–5. Bibcode :2015Sci...348..660M. doi :10.1126/science.aaa0355. PMC 4547472 . PMID 25954002.
^ Sandberg R (январь 2014 г.). «Вступление в эру транскриптомики отдельных клеток в биологии и медицине». Nature Methods . 11 (1): 22–4. doi :10.1038/nmeth.2764. PMID 24524133. S2CID 27632439.
^ Kolodziejczyk AA, Kim JK, Svensson V, Marioni JC, Teichmann SA (май 2015 г.). «Технология и биология секвенирования РНК отдельных клеток». Molecular Cell . 58 (4): 610–20. doi : 10.1016/j.molcel.2015.04.005 . PMID 26000846.
^ abcdef McGettigan PA (февраль 2013 г.). «Транскриптомика в эпоху секвенирования РНК». Современное мнение в области химической биологии . 17 (1): 4–11. дои : 10.1016/j.cbpa.2012.12.008. ПМИД 23290152.
^ abcdefghijkl Ван З., Герштейн М., Снайдер М. (январь 2009 г.). «РНК-Seq: революционный инструмент для транскриптомики». Nature Reviews Genetics . 10 (1): 57–63. doi :10.1038/nrg2484. PMC 2949280. PMID 19015660 .
^ abc Ozsolak F, Milos PM (февраль 2011 г.). «Секвенирование РНК: достижения, проблемы и возможности». Nature Reviews Genetics . 12 (2): 87–98. doi :10.1038/nrg2934. PMC 3031867. PMID 21191423 .
^ abc Морозова О., Хирст М., Марра МА. (2009). «Применение новых технологий секвенирования для анализа транскриптома». Annual Review of Genomics and Human Genetics . 10 : 135–51. doi :10.1146/annurev-genom-082908-145957. PMID 19715439.
^ Sim GK, Kafatos FC, Jones CW, Koehler MD, Efstratiadis A, Maniatis T (декабрь 1979 г.). «Использование библиотеки кДНК для исследований эволюции и экспрессии в развитии мультигенных семейств хориона». Cell . 18 (4): 1303–16. doi : 10.1016/0092-8674(79)90241-1 . PMID 519770.
^ Sutcliffe JG, Milner RJ, Bloom FE, Lerner RA (август 1982 г.). «Общая 82-нуклеотидная последовательность, уникальная для РНК мозга». Труды Национальной академии наук Соединенных Штатов Америки . 79 (16): 4942–6. Bibcode : 1982PNAS...79.4942S. doi : 10.1073 /pnas.79.16.4942 . PMC 346801. PMID 6956902.
^ Putney SD, Herlihy WC, Schimmel P (апрель 1983 г.). «Новый тропонин T и клоны кДНК для 13 различных мышечных белков, обнаруженные методом дробовика». Nature . 302 (5910): 718–21. Bibcode :1983Natur.302..718P. doi :10.1038/302718a0. PMID 6687628. S2CID 4364361.
^ abcd Marra MA, Hillier L, Waterston RH (январь 1998). "Теги экспрессируемых последовательностей — установление мостов между геномами". Trends in Genetics . 14 (1): 4–7. doi :10.1016/S0168-9525(97)01355-3. PMID 9448457.
^ Alwine JC, Kemp DJ, Stark GR (декабрь 1977 г.). «Метод обнаружения специфических РНК в агарозных гелях путем переноса на диазобензилоксиметил-бумагу и гибридизации с ДНК-зондами». Труды Национальной академии наук Соединенных Штатов Америки . 74 (12): 5350–4. Bibcode : 1977PNAS...74.5350A. doi : 10.1073/pnas.74.12.5350 . PMC 431715. PMID 414220 .
^ Беккер-Андре М., Халброк К. (ноябрь 1989 г.). «Абсолютная количественная оценка мРНК с использованием полимеразной цепной реакции (ПЦР). Новый подход с использованием анализа титрования транскриптов с помощью ПЦР (PATTY)». Nucleic Acids Research . 17 (22): 9437–46. doi :10.1093/nar/17.22.9437. PMC 335144. PMID 2479917 .
^ Piétu G, Mariage-Samson R, Fayein NA, Matingou C, Eveno E, Houlgatte R, Decraene C, Vandenbrouck Y, Tahi F, Devignes MD, Wirkner U, Ansorge W, Cox D, Nagase T, Nomura N, Auffray C (февраль 1999 г.). «База знаний Genexpress IMAGE транскриптома человеческого мозга: прототип интегрированного ресурса для функциональной и вычислительной геномики». Genome Research . 9 (2): 195–209. doi :10.1101/gr.9.2.195. PMC 310711 . PMID 10022985.
^ abcd Velculescu VE, Zhang L, Vogelstein B, Kinzler KW (октябрь 1995 г.). "Серийный анализ экспрессии генов". Science . 270 (5235): 484–7. Bibcode :1995Sci...270..484V. doi :10.1126/science.270.5235.484. PMID 7570003. S2CID 16281846.
^ Audic S, Claverie JM (октябрь 1997 г.). «Значение цифровых профилей экспрессии генов». Genome Research . 7 (10): 986–95. doi : 10.1101/gr.7.10.986 . PMID 9331369.
^ abcdef Mantione KJ, Kream RM, Kuzelova H, Ptacek R, Raboch J, Samuel JM, Stefano GB (август 2014 г.). «Сравнение методов биоинформатического профилирования экспрессии генов: микрочипы и РНК-Seq». Medical Science Monitor Basic Research . 20 : 138–42. doi :10.12659/MSMBR.892101. PMC 4152252. PMID 25149683 .
^ Zhao S, Fung-Leung WP, Bittner A, Ngo K, Liu X (2014). "Сравнение РНК-Seq и микрочипов в профилировании транскриптома активированных Т-клеток". PLOS ONE . 9 (1): e78644. Bibcode : 2014PLoSO...978644Z. doi : 10.1371/journal.pone.0078644 . PMC 3894192. PMID 24454679 .
^ ab Hashimshony T, Wagner F, Sher N, Yanai I (сентябрь 2012 г.). "CEL-Seq: одноклеточное РНК-Seq с помощью мультиплексной линейной амплификации". Cell Reports . 2 (3): 666–73. doi : 10.1016/j.celrep.2012.08.003 . PMID 22939981.
^ Стирс Р. Л., Геттс Р. К., Гулланс С. Р. (август 2000 г.). «Новая чувствительная система обнаружения для микрочипов высокой плотности с использованием технологии дендримеров». Physiological Genomics . 3 (2): 93–9. doi :10.1152/physiolgenomics.2000.3.2.93. PMID 11015604.
^ abcdef Illumina (2011-07-11). "Сравнение данных РНК-Seq с микрочипами экспрессии генов" (PDF) . European Pharmaceutical Review.
^ ab Black MB, Parks BB, Pluta L, Chu TM, Allen BC, Wolfinger RD, Thomas RS (февраль 2014 г.). «Сравнение микрочипов и РНК-секвенирования для анализа экспрессии генов в экспериментах по дозозависимому ответу». Toxicological Sciences . 137 (2): 385–403. doi :10.1093/toxsci/kft249. PMID 24194394.
^ Marioni JC, Mason CE, Mane SM, Stephens M, Gilad Y (сентябрь 2008 г.). «РНК-секвенирование: оценка технической воспроизводимости и сравнение с массивами экспрессии генов». Genome Research . 18 (9): 1509–17. doi :10.1101/gr.079558.108. PMC 2527709 . PMID 18550803.
^ Консорциум SEQC/MAQC-III (сентябрь 2014 г.). «Комплексная оценка точности, воспроизводимости и информационного содержания РНК-секвенирования Консорциумом по контролю качества секвенирования». Nature Biotechnology . 32 (9): 903–14. doi :10.1038/nbt.2957. PMC 4321899 . PMID 25150838.
^ Chen JJ, Hsueh HM, Delongchamp RR, Lin CJ, Tsai CA (октябрь 2007 г.). «Воспроизводимость данных микрочипов: дальнейший анализ данных контроля качества микрочипов (MAQC)». BMC Bioinformatics . 8 : 412. doi : 10.1186/1471-2105-8-412 . PMC 2204045 . PMID 17961233.
^ Larkin JE, Frank BC, Gavras H, Sultana R, Quackenbush J (май 2005 г.). «Независимость и воспроизводимость на платформах микрочипов». Nature Methods . 2 (5): 337–44. doi :10.1038/nmeth757. PMID 15846360. S2CID 16088782.
^ ab Nelson NJ (апрель 2001 г.). «Микрочипы прибыли: инструмент экспрессии генов созревает». Журнал Национального института рака . 93 (7): 492–4. doi :10.1093/jnci/93.7.492. PMID 11287436.
^ Schena M, Shalon D, Davis RW, Brown PO (октябрь 1995 г.). «Количественный мониторинг паттернов экспрессии генов с помощью комплементарного ДНК-микрочипа». Science . 270 (5235): 467–70. Bibcode :1995Sci...270..467S. doi :10.1126/science.270.5235.467. PMID 7569999. S2CID 6720459.
^ ab Pozhitkov AE, Tautz D, Noble PA (июнь 2007 г.). «Олигонуклеотидные микроматрицы: широко применяются — плохо понимаются». Briefings in Functional Genomics & Proteomics . 6 (2): 141–8. doi : 10.1093/bfgp/elm014 . hdl : 11858/00-001M-0000-000F-D7B3-3 . PMID 17644526.
^ abc Heller MJ (2002). «Технология ДНК-микрочипов: устройства, системы и приложения». Annual Review of Biomedical Engineering . 4 : 129–53. doi :10.1146/annurev.bioeng.4.020702.153438. PMID 12117754.
^ McLachlan GJ, Do KA , Ambroise C (2005). Анализ данных экспрессии генов с помощью микрочипов . Hoboken: John Wiley & Sons. ISBN978-0-471-72612-8.[ нужна страница ]
^ Brenner S, Johnson M, Bridgham J, Golda G, Lloyd DH, Johnson D, Luo S, McCurdy S, Foy M, Ewan M, Roth R, George D, Eletr S, Albrecht G, Vermaas E, Williams SR, Moon K, Burcham T, Pallas M, DuBridge RB, Kirchner J, Fearon K, Mao J, Corcoran K (июнь 2000 г.). "Анализ экспрессии генов методом массивного параллельного секвенирования сигнатур (MPSS) на микроматрицах". Nature Biotechnology . 18 (6): 630–4. doi :10.1038/76469. PMID 10835600. S2CID 13884154.
^ Meyers BC, Vu TH, Tej SS, Ghazal H, Matvienko M, Agrawal V, Ning J, Haudenschild CD (август 2004 г.). «Анализ транскрипционной сложности Arabidopsis thaliana методом массивного параллельного секвенирования сигнатур». Nature Biotechnology . 22 (8): 1006–11. doi :10.1038/nbt992. PMID 15247925. S2CID 15336496.
^ ab Bainbridge MN, Warren RL, Hirst M, Romanuik T, Zeng T, Go A, Delaney A, Griffith M, Hickenbotham M, Magrini V, Mardis ER, Sadar MD, Siddiqui AS, Marra MA, Jones SJ (сентябрь 2006 г.). "Анализ транскриптома линии клеток рака простаты LNCaP с использованием подхода секвенирования через синтез". BMC Genomics . 7 : 246. doi : 10.1186/1471-2164-7-246 . PMC 1592491 . PMID 17010196.
^ Mortazavi A, Williams BA, McCue K, Schaeffer L, Wold B (июль 2008 г.). «Картирование и количественная оценка транскриптомов млекопитающих с помощью РНК-Seq». Nature Methods . 5 (7): 621–8. doi :10.1038/nmeth.1226. PMID 18516045. S2CID 205418589.
^ Wilhelm BT, Marguerat S, Watt S, Schubert F, Wood V, Goodhead I, Penkett CJ, Rogers J, Bähler J (июнь 2008 г.). «Динамический репертуар эукариотического транскриптома, исследованный с разрешением по одному нуклеотиду». Nature . 453 (7199): 1239–43. Bibcode :2008Natur.453.1239W. doi :10.1038/nature07002. PMID 18488015. S2CID 205213499.
^ Султан М, Шульц МХ, Ричард Х, Маген А, Клингенхофф А, Шерф М, Сейферт М, Бородина Т, Солдатов А, Пархомчук Д, Шмидт Д, О'Кифф С, Хаас С, Вингрон М, Лехрах Х, Яспо МЛ (август 2008 г.). «Глобальный взгляд на активность генов и альтернативный сплайсинг с помощью глубокого секвенирования человеческого транскриптома». Science . 321 (5891): 956–60. Bibcode :2008Sci...321..956S. doi :10.1126/science.1160342. PMID 18599741. S2CID 10013179.
^ ab Chomczynski P, Sacchi N (апрель 1987 г.). «Одношаговый метод выделения РНК с помощью экстракции тиоцианатом гуанидиния-фенолом-хлороформом». Аналитическая биохимия . 162 (1): 156–9. doi :10.1016/0003-2697(87)90021-2. PMID 2440339.
^ ab Chomczynski P, Sacchi N (2006). «Одношаговый метод выделения РНК с помощью экстракции тиоцианатом гуанидиния-фенолом-хлороформом: двадцать с чем-то лет спустя». Nature Protocols . 1 (2): 581–5. doi :10.1038/nprot.2006.83. PMID 17406285. S2CID 28653075.
^ Grillo M, Margolis FL (сентябрь 1990 г.). «Использование полимеразной цепной реакции с обратной транскриптазой для мониторинга экспрессии генов без интронов». BioTechniques . 9 (3): 262, 264, 266–8. PMID 1699561.
^ Брайант С., Мэннинг Д. Л. (1998). "Выделение РНК-мессенджера". Протоколы выделения и характеристики РНК . Методы в молекулярной биологии. Т. 86. С. 61–4. doi :10.1385/0-89603-494-1:61. ISBN978-0-89603-494-5. PMID 9664454.
^ Zhao W, He X, Hoadley KA, Parker JS, Hayes DN, Perou CM (июнь 2014 г.). «Сравнение РНК-Seq с помощью захвата поли (A), истощения рибосомной РНК и микрочипа ДНК для профилирования экспрессии». BMC Genomics . 15 (1): 419. doi : 10.1186/1471-2164-15-419 . PMC 4070569 . PMID 24888378.
^ Некоторые примеры образцов окружающей среды включают: морскую воду, почву или воздух.
^ Close TJ, Wanamaker SI, Caldo RA, Turner SM, Ashlock DA, Dickerson JA, Wing RA, Muehlbauer GJ, Kleinhofs A, Wise RP (март 2004 г.). «Новый ресурс для геномики злаков: 22K ячменный GeneChip достигает зрелости». Физиология растений . 134 (3): 960–8. doi :10.1104/pp.103.034462. PMC 389919. PMID 15020760 .
^ abcde Lowe R, Shirley N, Bleackley M, Dolan S, Shafee T (май 2017 г.). «Транскриптомные технологии». PLOS Computational Biology . 13 (5): e1005457. Bibcode : 2017PLSCB..13E5457L. doi : 10.1371/journal.pcbi.1005457 . PMC 5436640. PMID 28545146 .
^ ab Shiraki T, Kondo S, Katayama S, Waki K, Kasukawa T, Kawaji H, Kodzius R, Watahiki A, Nakamura M, Arakawa T, Fukuda S, Sasaki D, Podhajska A, Harbers M, Kawai J, Carninci P, Hayashizaki Y (декабрь 2003 г.). "Анализ экспрессии генов с помощью кэпа для высокопроизводительного анализа начальной точки транскрипции и идентификации использования промотора". Труды Национальной академии наук Соединенных Штатов Америки . 100 (26): 15776–81. Bibcode : 2003PNAS..10015776S. doi : 10.1073/pnas.2136655100 . PMC 307644. PMID 14663149 .
^ Романов В., Давидофф С. Н., Майлз А. Р., Грейнджер Д. В., Гейл Б. К., Брукс Б. Д. (март 2014 г.). «Критическое сравнение технологий изготовления белковых микрочипов». The Analyst . 139 (6): 1303–26. Bibcode :2014Ana...139.1303R. doi :10.1039/c3an01577g. PMID 24479125.
^ ab Barbulovic-Nad I, Lucente M, Sun Y, Zhang M, Wheeler AR, Bussmann M (2006-10-01). "Методы изготовления биомикрочипов — обзор". Critical Reviews in Biotechnology . 26 (4): 237–59. CiteSeerX 10.1.1.661.6833 . doi :10.1080/07388550600978358. PMID 17095434. S2CID 13712888.
^ Auburn RP, Kreil DP, Meadows LA, Fischer B, Matilla SS, Russell S (июль 2005 г.). «Роботизированное обнаружение микрочипов кДНК и олигонуклеотидов». Trends in Biotechnology . 23 (7): 374–9. doi :10.1016/j.tibtech.2005.04.002. PMID 15978318.
^ Shalon D, Smith SJ, Brown PO (июль 1996 г.). «Система ДНК-микрочипов для анализа сложных образцов ДНК с использованием гибридизации двухцветных флуоресцентных зондов». Genome Research . 6 (7): 639–45. doi : 10.1101/gr.6.7.639 . PMID 8796352.
^ Lockhart DJ, Dong H, Byrne MC, Follettie MT, Gallo MV, Chee MS, Mittmann M, Wang C, Kobayashi M, Horton H, Brown EL (декабрь 1996 г.). «Мониторинг экспрессии путем гибридизации с массивами олигонуклеотидов высокой плотности». Nature Biotechnology . 14 (13): 1675–80. doi :10.1038/nbt1296-1675. PMID 9634850. S2CID 35232673.
^ Irizarry RA, Bolstad BM, Collin F, Cope LM, Hobbs B, Speed TP (февраль 2003 г.). «Резюме данных уровня зонда Affymetrix GeneChip». Nucleic Acids Research . 31 (4): 15e–15. doi :10.1093/nar/gng015. PMC 150247. PMID 12582260 .
^ Selzer RR, Richmond TA, Pofahl NJ, Green RD, Eis PS, Nair P, Brothman AR, Stallings RL (ноябрь 2005 г.). «Анализ точек разрыва хромосом в нейробластоме при субкилобазном разрешении с использованием тонкого олигонуклеотидного массива CGH». Гены, хромосомы и рак . 44 (3): 305–19. doi :10.1002/gcc.20243. PMID 16075461. S2CID 39437458.
^ Свенссон В., Венто-Тормо Р., Тейхманн СА (апрель 2018 г.). «Экспоненциальное масштабирование секвенирования РНК отдельных клеток за последнее десятилетие». Nature Protocols . 13 (4): 599–604. doi :10.1038/nprot.2017.149. PMID 29494575. S2CID 3560001.
^ Тачибана С (2015-08-18). «Транскриптомика сегодня: микрочипы, РНК-секвенирование и многое другое». Science . 349 (6247): 544. Bibcode :2015Sci...349..544T. doi : 10.1126/science.opms.p1500095 .
^ ab Nagalakshmi U, Wang Z, Waern K, Shou C, Raha D, Gerstein M, Snyder M (июнь 2008 г.). «Транскрипционный ландшафт генома дрожжей, определенный с помощью секвенирования РНК». Science . 320 (5881): 1344–9. Bibcode :2008Sci...320.1344N. doi :10.1126/science.1158441. PMC 2951732 . PMID 18451266.
^ Su Z, Fang H, Hong H, Shi L, Zhang W, Zhang W, Zhang Y, Dong Z, Lancashire LJ, Bessarabova M, Yang X, Ning B, Gong B, Meehan J, Xu J, Ge W, Perkins R, Fischer M, Tong W (декабрь 2014 г.). «Исследование биомаркеров, полученных из устаревших данных микрочипов, для их полезности в эпоху РНК-секвенирования». Genome Biology . 15 (12): 523. doi : 10.1186/s13059-014-0523-y . PMC 4290828 . PMID 25633159.
^ Lee JH, Daugharthy ER, Scheiman J, Kalhor R, Yang JL, Ferrante TC, Terry R, Jeanty SS, Li C, Amamoto R, Peters DT, Turczyk BM, Marblestone AH, Inverso SA, Bernard A, Mali P, Rios X, Aach J, Church GM (март 2014 г.). «Высокомультиплексное субклеточное секвенирование РНК in situ». Science . 343 (6177): 1360–3. Bibcode :2014Sci...343.1360L. doi :10.1126/science.1250212. PMC 4140943 . PMID 24578530.
^ ab Shendure J, Ji H (октябрь 2008 г.). «Секвенирование ДНК следующего поколения». Nature Biotechnology . 26 (10): 1135–45. doi :10.1038/nbt1486. PMID 18846087. S2CID 6384349.
^ Lahens NF, Kavakli IH, Zhang R, Hayer K, Black MB, Dueck H, Pizarro A, Kim J, Irizarry R, Thomas RS, Grant GR, Hogenesch JB (июнь 2014 г.). "IVT-seq обнаруживает экстремальную предвзятость в секвенировании РНК". Genome Biology . 15 (6): R86. doi : 10.1186/gb-2014-15-6-r86 . PMC 4197826 . PMID 24981968.
^ ab Knierim E, Lucke B, Schwarz JM, Schuelke M, Seelow D (2011). "Систематическое сравнение трех методов фрагментации продуктов ПЦР дальнего действия для секвенирования следующего поколения". PLOS ONE . 6 (11): e28240. Bibcode :2011PLoSO...628240K. doi : 10.1371/journal.pone.0028240 . PMC 3227650 . PMID 22140562.
^ Routh A, Head SR, Ordoukhanian P, Johnson JE (август 2015 г.). «ClickSeq: свободное от фрагментации секвенирование следующего поколения с помощью клик-лигирования адаптеров к стохастически терминированным 3'-азидо кДНК». Журнал молекулярной биологии . 427 (16): 2610–6. doi : 10.1016/j.jmb.2015.06.011. PMC 4523409. PMID 26116762 .
^ Parekh S, Ziegenhain C, Vieth B, Enard W, Hellmann I (май 2016 г.). "Влияние амплификации на анализ дифференциальной экспрессии с помощью РНК-секвенирования". Scientific Reports . 6 : 25533. Bibcode :2016NatSR...625533P. doi :10.1038/srep25533. PMC 4860583 . PMID 27156886.
^ Shanker S, Paulson A, Edenberg HJ, Peak A, Perera A, Alekseyev YO, Beckloff N, Bivens NJ, Donnelly R, Gillaspy AF, Grove D, Gu W, Jafari N, Kerley-Hamilton JS, Lyons RH, Tepper C, Nicolet CM (апрель 2015 г.). «Оценка коммерчески доступных наборов для амплификации РНК для секвенирования РНК с использованием очень низких входных количеств общей РНК». Journal of Biomolecular Techniques . 26 (1): 4–18. doi :10.7171/jbt.15-2601-001. PMC 4310221 . PMID 25649271.
^ Jiang L, Schlesinger F, Davis CA, Zhang Y, Li R, Salit M, Gingeras TR, Oliver B (сентябрь 2011 г.). «Синтетические стандарты внесения для экспериментов по секвенированию РНК». Genome Research . 21 (9): 1543–51. doi :10.1101/gr.121095.111. PMC 3166838 . PMID 21816910.
^ Kivioja T, Vähärautio A, Karlsson K, Bonke M, Enge M, Linnarsson S, Taipale J (ноябрь 2011 г.). «Подсчет абсолютного числа молекул с использованием уникальных молекулярных идентификаторов». Nature Methods . 9 (1): 72–4. doi :10.1038/nmeth.1778. PMID 22101854. S2CID 39225091.
^ Tang F, Barbacioru C, Wang Y, Nordman E, Lee C, Xu N, Wang X, Bodeau J, Tuch BB, Siddiqui A, Lao K, Surani MA (май 2009 г.). "mRNA-Seq анализ всего транскриптома отдельной клетки". Nature Methods . 6 (5): 377–82. doi :10.1038/nmeth.1315. PMID 19349980. S2CID 16570747.
^ Ислам С., Цайсель А., Йост С., Ла Манно Г., Заяц П., Каспер М., Лённерберг П., Линнарссон С. (февраль 2014 г.). «Количественное секвенирование РНК отдельных клеток с уникальными молекулярными идентификаторами». Nature Methods . 11 (2): 163–6. doi :10.1038/nmeth.2772. PMID 24363023. S2CID 6765530.
^ Jaitin DA, Kenigsberg E, Keren-Shaul H, Elefant N, Paul F, Zaretsky I, Mildner A, Cohen N, Jung S, Tanay A, Amit I (февраль 2014 г.). «Массовое параллельное секвенирование РНК отдельных клеток для безмаркерного разложения тканей на типы клеток». Science . 343 (6172): 776–9. Bibcode :2014Sci...343..776J. doi :10.1126/science.1247651. PMC 4412462 . PMID 24531970.
^ ab Levin JZ, Yassour M, Adiconis X, Nusbaum C, Thompson DA, Friedman N, Gnirke A, Regev A (сентябрь 2010 г.). «Комплексный сравнительный анализ методов секвенирования РНК, специфичных для определенной цепи». Nature Methods . 7 (9): 709–15. doi :10.1038/nmeth.1491. PMC 3005310 . PMID 20711195.
^ Quail MA, Smith M, Coupland P, Otto TD, Harris SR, Connor TR, Bertoni A, Swerdlow HP, Gu Y (июль 2012 г.). «Рассказ о трех платформах секвенирования следующего поколения: сравнение секвенаторов Ion Torrent, Pacific Biosciences и Illumina MiSeq». BMC Genomics . 13 : 341. doi : 10.1186/1471-2164-13-341 . PMC 3431227 . PMID 22827831.
^ ab Liu L, Li Y, Li S, Hu N, He Y, Pong R, Lin D, Lu L, Law M (2012). "Сравнение систем секвенирования следующего поколения". Журнал биомедицины и биотехнологии . 2012 : 251364. doi : 10.1155/2012/251364 . PMC 3398667. PMID 22829749 .
^ "SRA" . Получено 2016-10-06 .Поиск в архиве считывания последовательностей NCBI (SRA) проводился с использованием «RNA-Seq[стратегия]» и одной из «LS454[платформа]», «Illumina[платформа]», «ABI Solid[платформа]», «Ion Torrent[платформа]», «PacBio SMRT»[платформа]» для отчета о количестве запусков RNA-Seq, сохраненных для каждой платформы.
^ Goodwin S, McPherson JD, McCombie WR (май 2016 г.). «Совершеннолетие: десять лет технологий секвенирования следующего поколения». Nature Reviews Genetics . 17 (6): 333–51. doi :10.1038/nrg.2016.49. PMC 10373632. PMID 27184599. S2CID 8295541 .
^ Гаральде Д.Р., Снелл Э.А., Яхимович Д., Сипос Б., Ллойд Дж.Х., Брюс М., Пантич Н., Адмассу Т., Джеймс П., Варланд А., Джордан М., Чикконе Дж., Серра С., Кинан Дж., Мартин С., Макнил Л., Уоллес Э.Дж., Джаясингхе Л., Райт С., Бласко Дж., Янг С., Броклебанк Д., Юул С., Кларк Дж., Херон Эй.Дж., Тернер DJ (март 2018 г.). «Высокопараллельное прямое секвенирование РНК на массиве нанопор». Природные методы . 15 (3): 201–206. дои : 10.1038/nmeth.4577. PMID 29334379. S2CID 3589823.
^ Loman NJ, Quick J, Simpson JT (август 2015 г.). «Полный бактериальный геном, собранный de novo с использованием только данных нанопорового секвенирования». Nature Methods . 12 (8): 733–5. doi :10.1038/nmeth.3444. PMID 26076426. S2CID 15053702.
^ Ozsolak F, Platt AR, Jones DR, Reifenberger JG, Sass LE, McInerney P, Thompson JF, Bowers J, Jarosz M, Milos PM (октябрь 2009 г.). «Прямое секвенирование РНК». Nature . 461 (7265): 814–8. Bibcode :2009Natur.461..814O. doi :10.1038/nature08390. PMID 19776739. S2CID 4426760.
^ ab Hart SN, Therneau TM, Zhang Y, Poland GA, Kocher JP (декабрь 2013 г.). «Вычисление оценок размера выборки для данных секвенирования РНК». Журнал вычислительной биологии . 20 (12): 970–8. doi :10.1089/cmb.2012.0283. PMC 3842884. PMID 23961961 .
^ abc Конеса А, Мадригал П, Таразона С, Гомес-Кабреро Д, Сервера А, Макферсон А, Щесняк М.В., Гаффни DJ, Эло ЛЛ, Чжан X, Мортазави А (январь 2016 г.). «Обзор лучших практик анализа данных секвенирования РНК». Геномная биология . 17:13 . дои : 10.1186/s13059-016-0881-8 . ПМЦ 4728800 . ПМИД 26813401.
^ ab Рапапорт Ф., Ханин Р., Лян Ю., Пирун М., Крек А., Зумбо П., Мейсон CE, Соччи Н.Д., Бетель Д. (2013). «Комплексная оценка методов анализа дифференциальной экспрессии генов для данных секвенирования РНК». Геномная биология . 14 (9): 95 рандов. дои : 10.1186/gb-2013-14-9-r95 . ПМЦ 4054597 . ПМИД 24020486.
^ Консорциум проекта ENCODE; Олдред, Шелли Ф.; Коллинз, Патрик Дж.; Дэвис, Кэрри А.; Дойл, Фрэнсис; Эпштейн, Чарльз Б.; Фритце, Сет; Харроу, Дженнифер; Кауль, Раджиндер; Хатун, Джейнаб; Ладжуа, Брайан Р.; Ландт, Стивен Г.; Ли, Бум-Кью; Паули, Флоренсия; Розенблум, Кейт Р.; Сабо, Питер; Сафи, Алексиас; Саньял, Амартья; Шореш, Ноам; Саймон, Джереми М.; Сонг, Линъюнь; Альтшулер, Роберт К.; Бирни, Эван; Браун, Джеймс Б.; Ченг, Чао; Джебали, Сара; Донг, Сяньцзюнь; Данхэм, Ян; Эрнст, Джейсон; и др. (сентябрь 2012 г.). «Интегрированная энциклопедия элементов ДНК в геноме человека». Nature . 489 (7414): 57–74. Bibcode :2012Natur.489...57T. doi :10.1038/nature11247. PMC 3439153 . PMID 22955616.
^ Sloan CA, Chan ET, Davidson JM, Malladi VS, Strattan JS, Hitz BC и др. (январь 2016 г.). «Данные ENCODE на портале ENCODE». Nucleic Acids Research . 44 (D1): D726–32. doi :10.1093/nar/gkv1160. PMC 4702836. PMID 26527727 .
^ "ENCODE: Энциклопедия элементов ДНК". encodeproject.org .
^ ab Thind AS, Monga I, Thakur PK, Kumari P, Dindhoria K, Krzak M, Ranson M, Ashford B (ноябрь 2021 г.). «Демистификация новых приложений bulk RNA-Seq: применение и полезность биоинформатической методологии». Briefings in Bioinformatics . 22 (6). doi :10.1093/bib/bbab259. PMID 34329375.
^ ab Ritchie ME, Phipson B, Wu D, Hu Y, Law CW, Shi W, Smyth GK (апрель 2015 г.). "limma обеспечивает дифференциальный анализ экспрессии для РНК-секвенирования и исследований микрочипов". Nucleic Acids Research . 43 (7): e47. doi :10.1093/nar/gkv007. PMC 4402510. PMID 25605792.
^ ab Robinson MD, McCarthy DJ, Smyth GK (январь 2010 г.). "edgeR: пакет Bioconductor для анализа дифференциальной экспрессии цифровых данных по экспрессии генов". Биоинформатика . 26 (1): 139–40. doi :10.1093/bioinformatics/btp616. PMC 2796818. PMID 19910308 .
^ ab Huber W, Carey VJ, Gentleman R, Anders S, Carlson M, Carvalho BS, et al. (Февраль 2015). «Организация высокопроизводительного геномного анализа с помощью Bioconductor». Nature Methods . 12 (2): 115–21. doi :10.1038/nmeth.3252. PMC 4509590 . PMID 25633503.
^ Смит, Г. К. (2005). «Лимма: линейные модели для данных микрочипов». Решения в области биоинформатики и вычислительной биологии с использованием R и Bioconductor . Статистика для биологии и здравоохранения. Springer, Нью-Йорк, штат Нью-Йорк. С. 397–420. CiteSeerX 10.1.1.361.8519 . doi :10.1007/0-387-29362-0_23. ISBN9780387251462.
^ Стив., Рассел (2008). Технология микрочипов на практике . Медоуз, Лиза А. Берлингтон: Elsevier. ISBN9780080919768. OCLC 437246554.
^ ab Haas BJ, Papanicolaou A, Yassour M, Grabherr M, Blood PD, Bowden J, Couger MB, Eccles D, Li B, Lieber M, MacManes MD, Ott M, Orvis J, Pochet N, Strozzi F, Weeks N, Westerman R, William T, Dewey CN, Henschel R, LeDuc RD, Friedman N, Regev A (август 2013 г.). «Реконструкция последовательности транскриптов de novo из РНК-секвенирования с использованием платформы Trinity для генерации и анализа ссылок». Nature Protocols . 8 (8): 1494–512. doi :10.1038/nprot.2013.084. PMC 3875132 . PMID 23845962.
^ ab Pertea M, Pertea GM, Antonescu CM, Chang TC, Mendell JT, Salzberg SL (март 2015 г.). «StringTie позволяет улучшить реконструкцию транскриптома с помощью прочтений РНК-секвенирования». Nature Biotechnology . 33 (3): 290–5. doi :10.1038/nbt.3122. PMC 4643835 . PMID 25690850.
^ Кодама Y, Шамвэй M, Лейнонен R (январь 2012 г.). «Архив прочтений последовательностей: взрывной рост данных секвенирования». Nucleic Acids Research . 40 (выпуск базы данных): D54–6. doi :10.1093/nar/gkr854. PMC 3245110. PMID 22009675 .
^ ab Edgar R, Domrachev M, Lash AE (январь 2002 г.). "Gene Expression Omnibus: хранилище данных по экспрессии генов и гибридизации NCBI". Nucleic Acids Research . 30 (1): 207–10. doi :10.1093/nar/30.1.207. PMC 99122 . PMID 11752295.
^ Петров А, Шамс С (2004-11-01). «Обработка изображений микроматриц и контроль качества». Журнал «Системы обработки сигналов СБИС для технологий сигналов, изображений и видео» . 38 (3): 211–226. doi :10.1023/B:VLSI.0000042488.08307.ad. S2CID 31598448.
^ Петров А, Шамс С (2004). «Обработка изображений микроматриц и контроль качества». Журнал VLSI Signal Processing-Systems for Signal, Image, and Video Technology . 38 (3): 211–226. doi :10.1023/B:VLSI.0000042488.08307.ad. S2CID 31598448.
^ Kwon YM, Ricke S (2011). Высокопроизводительное секвенирование следующего поколения . Методы в молекулярной биологии. Том 733. SpringerLink. doi :10.1007/978-1-61779-089-8. ISBN978-1-61779-088-1. S2CID 3684245.
^ Nakamura K, Oshima T, Morimoto T, Ikeda S, Yoshikawa H, Shiwa Y, Ishikawa S, Linak MC, Hirai A, Takahashi H, Altaf-Ul-Amin M, Ogasawara N, Kanaya S (июль 2011 г.). "Профиль ошибок, специфичный для последовательности, секвенаторов Illumina". Nucleic Acids Research . 39 (13): e90. doi :10.1093/nar/gkr344. PMC 3141275. PMID 21576222 .
^ Van Verk MC, Hickman R, Pieterse CM, Van Wees SC (апрель 2013 г.). «RNA-Seq: открытие посланников». Trends in Plant Science . 18 (4): 175–9. doi :10.1016/j.tplants.2013.02.001. hdl : 1874/309456 . PMID 23481128. S2CID 205453732.
^ Эндрюс С. (2010). "FastQC: инструмент контроля качества для высокопроизводительных данных последовательностей". Babraham Bioinformatics . Получено 23.05.2017 .
^ Lo CC, Chain PS (ноябрь 2014 г.). «Быстрая оценка и контроль качества данных секвенирования следующего поколения с помощью FaQCs». BMC Bioinformatics . 15 (1): 366. doi : 10.1186/s12859-014-0366-2 . PMC 4246454. PMID 25408143 .
^ abc Trapnell C, Hendrickson DG, Sauvageau M, Goff L, Rinn JL, Pachter L (январь 2013 г.). «Дифференциальный анализ регуляции генов при разрешении транскриптов с помощью РНК-секвенирования». Nature Biotechnology . 31 (1): 46–53. doi :10.1038/nbt.2450. PMC 3869392 . PMID 23222703.
^ ab Xie Y, Wu G, Tang J, Luo R, Patterson J, Liu S, Huang W, He G, Gu S, Li S, Zhou X, Lam TW, Li Y, Xu X, Wong GK, Wang J (июнь 2014 г.). "SOAPdenovo-Trans: de novo сборка транскриптома с короткими прочтениями РНК-Seq". Биоинформатика . 30 (12): 1660–6. arXiv : 1305.6760 . doi : 10.1093/bioinformatics/btu077. PMID 24532719. S2CID 5152689.
^ Siadjeu, Christian; Mayland-Quellhorst, Eike; Pande, Shruti; Laubinger, Sascha; Albach, Dirk C. (2021). «Транскриптомная последовательность выявляет гены-кандидаты, участвующие в закалке после сбора урожая трехлистного ямса Dioscorea dumetorum». Растения . 10 (4): 787. doi : 10.3390/plants10040787 . PMC 8074181. PMID 33923758 .
^ Fonseca NA, Rung J, Brazma A, Marioni JC (декабрь 2012 г.). «Инструменты для картирования данных высокопроизводительного секвенирования». Биоинформатика . 28 (24): 3169–77. doi : 10.1093/bioinformatics/bts605 . PMID 23060614.
^ Trapnell C, Pachter L, Salzberg SL (май 2009). "TopHat: обнаружение сплайс-соединений с помощью RNA-Seq". Биоинформатика . 25 (9): 1105–11. doi :10.1093/bioinformatics/btp120. PMC 2672628. PMID 19289445 .
^ ab Trapnell C, Williams BA, Pertea G, Mortazavi A, Kwan G, van Baren MJ, Salzberg SL, Wold BJ, Pachter L (май 2010 г.). «Сборка и количественная оценка транскриптов с помощью РНК-Seq выявляет неаннотированные транскрипты и переключение изоформ во время дифференциации клеток». Nature Biotechnology . 28 (5): 511–5. doi :10.1038/nbt.1621. PMC 3146043 . PMID 20436464.
^ Miller JR, Koren S, Sutton G (июнь 2010 г.). «Алгоритмы сборки для данных секвенирования следующего поколения». Genomics . 95 (6): 315–27. doi :10.1016/j.ygeno.2010.03.001. PMC 2874646 . PMID 20211242.
^ O'Neil ST, Emrich SJ (июль 2013 г.). «Оценка метрик сборки транскриптома De Novo для согласованности и полезности». BMC Genomics . 14 : 465. doi : 10.1186/1471-2164-14-465 . PMC 3733778. PMID 23837739 .
^ Смит-Унна Р., Бурснелл К., Патро Р., Хибберд Дж. М., Келли С. (август 2016 г.). «TransRate: безреферентная оценка качества сборок транскриптома de novo». Genome Research . 26 (8): 1134–44. doi :10.1101/gr.196469.115. PMC 4971766. PMID 27252236 .
^ Ли Б., Филлмор Н., Бай Ю., Коллинз М., Томсон Дж.А., Стюарт Р., Дьюи С.Н. (декабрь 2014 г.). «Оценка сборок транскриптома de novo на основе данных RNA-Seq». Геномная биология . 15 (12): 553. дои : 10.1186/s13059-014-0553-5 . ПМК 4298084 . ПМИД 25608678.
^ Zerbino DR, Birney E (май 2008). «Velvet: алгоритмы для сборки коротких прочтений de novo с использованием графов де Брейна». Genome Research . 18 (5): 821–9. doi :10.1101/gr.074492.107. PMC 2336801. PMID 18349386 .
^ Schulz MH, Zerbino DR, Vingron M, Birney E (апрель 2012 г.). «Оазисы: надежная сборка de novo РНК-секвенирования в динамическом диапазоне уровней экспрессии». Биоинформатика . 28 (8): 1086–92. doi :10.1093/bioinformatics/bts094. PMC 3324515. PMID 22368243 .
^ Robertson G, Schein J, Chiu R, Corbett R, Field M, Jackman SD и др. (ноябрь 2010 г.). «Сборка de novo и анализ данных РНК-секвенирования». Nature Methods . 7 (11): 909–12. doi :10.1038/nmeth.1517. hdl : 1885/51040 . PMID 20935650. S2CID 1034682.
^ ab Grabherr MG, Haas BJ, Yassour M, Levin JZ, Thompson DA, Amit I, Adiconis X, Fan L, Raychowdhury R, Zeng Q, Chen Z, Mauceli E, Hacohen N, Gnirke A, Rhind N, di Palma F, Birren BW, Nusbaum C, Lindblad-Toh K, Friedman N, Regev A (май 2011 г.). "Сборка полноразмерного транскриптома из данных RNA-Seq без референсного генома". Nature Biotechnology . 29 (7): 644–52. doi :10.1038/nbt.1883. PMC 3571712 . PMID 21572440.
^ Chevreux B, Pfisterer T, Drescher B, Driesel AJ, Müller WE, Wetter T, Suhai S (июнь 2004 г.). «Использование ассемблера miraEST для надежной и автоматизированной сборки транскриптов мРНК и обнаружения однонуклеотидных полиморфизмов в секвенированных EST». Genome Research . 14 (6): 1147–59. doi :10.1101/gr.1917404. PMC 419793 . PMID 15140833.
^ Маргулис М., Эгхольм М., Альтман В.Е., Аттия С., Бадер Дж.С., Бембен Л.А. и др. (сентябрь 2005 г.). «Секвенирование генома в микропроизводных пиколитровых реакторах высокой плотности». Природа . 437 (7057): 376–80. Бибкод : 2005Natur.437..376M. дои : 10.1038/nature03959. ПМЦ 1464427 . ПМИД 16056220.
^ Kumar S, Blaxter ML (октябрь 2010 г.). «Сравнение ассемблеров de novo для данных транскриптома 454». BMC Genomics . 11 : 571. doi : 10.1186/1471-2164-11-571 . PMC 3091720. PMID 20950480 .
^ Банкевич А, Нурк С, Антипов Д, Гуревич АА, Дворкин М, Куликов АС, Лесин ВМ, Николенко СИ, Фам С, Пржибельский АД, Пышкин АВ, Сироткин АВ, Вяххи Н, Теслер Г, Алексеев МА, Певзнер ПА (май 2012). "SPAdes: новый алгоритм сборки генома и его применение в секвенировании отдельных клеток". Журнал вычислительной биологии . 19 (5): 455–77. doi :10.1089/cmb.2012.0021. PMC 3342519. PMID 22506599 .
^ Li B, Dewey CN (август 2011 г.). «RSEM: точная количественная оценка транскриптов из данных RNA-Seq с референсным геномом или без него». BMC Bioinformatics . 12 : 323. doi : 10.1186/1471-2105-12-323 . PMC 3163565. PMID 21816040 .
^ Ковака, Сэм; Зимин, Алексей В.; Пертеа, Гео М.; Разаги, Рохам; Зальцберг, Стивен Л.; Пертеа, Михаэла (2019-07-08). "Сборка транскриптома из выравниваний длинных РНК-секвенирований с помощью StringTie2". bioRxiv : 694554. doi : 10.1101/694554 . Получено 27 августа 2019 г.
^ Gehlenborg N, O'Donoghue SI, Baliga NS, Goesmann A, Hibbs MA, Kitano H, Kohlbacher O, Neuweger H, Schneider R, Tenenbaum D, Gavin AC (март 2010 г.). «Визуализация данных омикс для системной биологии». Nature Methods . 7 (3 Suppl): S56–68. doi :10.1038/nmeth.1436. PMID 20195258. S2CID 205419270.
^ Андерс С., Пайл ПТ., Хубер В. (январь 2015 г.). «HTSeq — фреймворк Python для работы с данными высокопроизводительного секвенирования». Биоинформатика . 31 (2): 166–9. doi :10.1093/bioinformatics/btu638. PMC 4287950. PMID 25260700 .
^ Bray NL, Pimentel H, Melsted P, Pachter L (май 2016 г.). «Почти оптимальная вероятностная квантификация РНК-секвенирования». Nature Biotechnology . 34 (5): 525–7. doi :10.1038/nbt.3519. PMID 27043002. S2CID 205282743.
^ Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R (август 2009 г.). «Формат выравнивания последовательностей/карты и SAMtools». Биоинформатика . 25 (16): 2078–9. doi :10.1093/bioinformatics/btp352. PMC 2723002. PMID 19505943 .
^ Love MI, Huber W, Anders S (2014). "Модерируемая оценка кратности изменения и дисперсии для данных РНК-секвенирования с DESeq2". Genome Biology . 15 (12): 550. doi : 10.1186/s13059-014-0550-8 . PMC 4302049. PMID 25516281 .
^ Frazee AC, Pertea G, Jaffe AE, Langmead B, Salzberg SL, Leek JT (март 2015 г.). «Ballgown устраняет разрыв между сборкой транскриптома и анализом экспрессии». Nature Biotechnology . 33 (3): 243–6. doi :10.1038/nbt.3172. PMC 4792117 . PMID 25748911.
^ Fang Z, Cui X (май 2011). «Проблемы проектирования и проверки в экспериментах по секвенированию РНК». Briefings in Bioinformatics . 12 (3): 280–7. doi : 10.1093/bib/bbr004 . PMID 21498551.
^ Ramsköld D, Wang ET, Burge CB, Sandberg R (декабрь 2009 г.). «Обилие повсеместно экспрессируемых генов, выявленное с помощью данных о последовательностях транскриптомов тканей». PLOS Computational Biology . 5 (12): e1000598. Bibcode : 2009PLSCB ...5E0598R. doi : 10.1371/journal.pcbi.1000598 . PMC 2781110. PMID 20011106.
^ Vandesompele J, De Preter K, Pattyn F, Poppe B, Van Roy N, De Paepe A, Speleman F (июнь 2002 г.). «Точная нормализация количественных данных ОТ-ПЦР в реальном времени путем геометрического усреднения нескольких внутренних контрольных генов». Genome Biology . 3 (7): RESEARCH0034. doi : 10.1186/gb-2002-3-7-research0034 . PMC 126239 . PMID 12184808.
^ Core LJ, Waterfall JJ, Lis JT (декабрь 2008 г.). «Nascent RNA sequencing reveals broaden pausing and divergent initiation at human promoters». Science . 322 (5909): 1845–8. Bibcode :2008Sci...322.1845C. doi :10.1126/science.1162228. PMC 2833333 . PMID 19056941.
^ Camarena L, Bruno V, Euskirchen G, Poggio S, Snyder M (апрель 2010 г.). «Молекулярные механизмы патогенеза, вызванного этанолом, выявленные с помощью секвенирования РНК». PLOS Pathogens . 6 (4): e1000834. doi : 10.1371/journal.ppat.1000834 . PMC 2848557. PMID 20368969 .
^ аб Говинд Г., Харшавардхан В.Т., ТаммеГовда Х.В., Патрисия Дж.К., Калайараси П.Дж., Дханалакшми Р., Айер Д.Р., Сентил Кумар М., Мутаппа С.К., Шринивасулу Н., Несе С., Удаякумар М., Макарла Великобритания (июнь 2009 г.). «Идентификация и функциональная проверка уникального набора генов, вызванных засухой, преимущественно экспрессируемых в ответ на постепенный водный стресс у арахиса». Молекулярная генетика и геномика . 281 (6): 591–605. дои : 10.1007/s00438-009-0432-z. ПМК 2757612 . ПМИД 19224247.
^ Тавассоли, Иман; Гольдфарб, Джозеф; Айенгар, Рави (2018-10-04). «Системная биология в учебнике: основные методы и подходы». Очерки по биохимии . 62 (4): 487–500. doi :10.1042/EBC20180003. ISSN 0071-1365. PMID 30287586. S2CID 52922135.
^ Коста В., Априле М., Эспозито Р., Чиккодикола А. (февраль 2013 г.). «РНК-Seq и сложные заболевания человека: последние достижения и перспективы на будущее». Европейский журнал генетики человека . 21 (2): 134–42. doi :10.1038/ejhg.2012.129. PMC 3548270. PMID 22739340 .
^ Khurana E, Fu Y, Chakravarty D, Demichelis F, Rubin MA, Gerstein M (февраль 2016 г.). «Роль вариантов некодирующей последовательности при раке». Nature Reviews Genetics . 17 (2): 93–108. doi :10.1038/nrg.2015.17. PMID 26781813. S2CID 14433306.
^ Slotkin RK, Martienssen R (апрель 2007 г.). «Транспозируемые элементы и эпигенетическая регуляция генома». Nature Reviews Genetics . 8 (4): 272–85. doi :10.1038/nrg2072. PMID 17363976. S2CID 9719784.
^ Просерпио В., Махата Б. (февраль 2016 г.). «Технологии одиночных клеток для изучения иммунной системы». Иммунология . 147 (2): 133–40. doi :10.1111/imm.12553. PMC 4717243. PMID 26551575 .
^ ab Byron SA, Van Keuren-Jensen KR, Engelthaler DM, Carpten JD, Craig DW (май 2016 г.). «Трансляция секвенирования РНК в клиническую диагностику: возможности и проблемы». Nature Reviews Genetics . 17 (5): 257–71. doi :10.1038/nrg.2016.10. PMC 7097555. PMID 26996076 .
^ Wu HJ, Wang AH, Jennings MP (февраль 2008 г.). «Открытие факторов вирулентности патогенных бактерий» (PDF) . Current Opinion in Chemical Biology . 12 (1): 93–101. doi :10.1016/j.cbpa.2008.01.023. PMID 18284925.
^ Suzuki S, Horinouchi T, Furusawa C (декабрь 2014 г.). «Прогнозирование устойчивости к антибиотикам по профилям экспрессии генов». Nature Communications . 5 : 5792. Bibcode :2014NatCo...5.5792S. doi :10.1038/ncomms6792. PMC 4351646 . PMID 25517437.
^ Westermann AJ, Gorski SA, Vogel J (сентябрь 2012 г.). «Двойное РНК-секвенирование патогена и хозяина» (PDF) . Nature Reviews. Микробиология . 10 (9): 618–30. doi :10.1038/nrmicro2852. PMID 22890146. S2CID 205498287.
^ Дурмуш С., Чакыр Т., Озгюр А., Гутке Р. (2015). «Обзор вычислительной системной биологии взаимодействий патоген-хозяин». Frontiers in Microbiology . 6 : 235. doi : 10.3389/fmicb.2015.00235 . PMC 4391036. PMID 25914674.
^ ab Garg R, Shankar R, Thakkar B, Kudapa H, Krishnamurthy L, Mantri N, Varshney RK, Bhatia S, Jain M (январь 2016 г.). «Транскриптомные анализы выявляют специфические для генотипа и стадии развития молекулярные ответы на стрессы засухи и засоления у нута». Scientific Reports . 6 : 19228. Bibcode :2016NatSR...619228G. doi :10.1038/srep19228. PMC 4725360 . PMID 26759178.
^ García-Sánchez S, Aubert S, Iraqui I, Janbon G, Ghigo JM, d'Enfert C (апрель 2004 г.). "Биопленки Candida albicans: состояние развития, связанное со специфическими и стабильными паттернами экспрессии генов". Eukaryotic Cell . 3 (2): 536–45. doi :10.1128/EC.3.2.536-545.2004. PMC 387656 . PMID 15075282.
^ Rich SM, Leendertz FH, Xu G, LeBreton M, Djoko CF, Aminake MN, Takang EE, Diffo JL, Pike BL, Rosenthal BM, Formenty P, Boesch C, Ayala FJ, Wolfe ND (сентябрь 2009 г.). «Происхождение злокачественной малярии». Труды Национальной академии наук Соединенных Штатов Америки . 106 (35): 14902–7. Bibcode : 2009PNAS..10614902R. doi : 10.1073/pnas.0907740106 . PMC 2720412. PMID 19666593 .
^ Mok S, Ashley EA, Ferreira PE, Zhu L, Lin Z, Yeo T и др. (январь 2015 г.). «Лекарственная устойчивость. Популяционная транскриптомика паразитов человеческой малярии раскрывает механизм устойчивости к артемизинину». Science . 347 (6220): 431–5. Bibcode :2015Sci...347..431M. doi :10.1126/science.1260403. PMC 5642863 . PMID 25502316.
^ abcd Page, Тесса М.; Лоули, Джонатан У. (2022). «Следующее поколение уже здесь: обзор транскриптомных подходов в морской экологии». Frontiers in Marine Science . 9. doi : 10.3389/fmars.2022.757921 . hdl : 10072/428702 . ISSN 2296-7745.
^ Verbruggen N, Hermans C, Schat H (март 2009). «Молекулярные механизмы гипераккумуляции металлов в растениях» (PDF) . The New Phytologist . 181 (4): 759–76. doi :10.1111/j.1469-8137.2008.02748.x. PMID 19192189.
^ Li Z, Zhang Z, Yan P, Huang S, Fei Z, Lin K (ноябрь 2011 г.). «RNA-Seq улучшает аннотацию генов, кодирующих белок, в геноме огурца». BMC Genomics . 12 : 540. doi : 10.1186/1471-2164-12-540 . PMC 3219749. PMID 22047402 .
^ Hobbs M, Pavasovic A, King AG, Prentis PJ, Eldridge MD, Chen Z, Colgan DJ, Polkinghorne A, Wilkins MR, Flanagan C, Gillett A, Hanger J, Johnson RN, Timms P (сентябрь 2014 г.). "Ресурс транскриптома для коалы (Phascolarctos cinereus): взгляд на транскрипцию ретровируса коалы и разнообразие последовательностей". BMC Genomics . 15 (1): 786. doi : 10.1186/1471-2164-15-786 . PMC 4247155 . PMID 25214207.
^ Howe GT, Yu J, Knaus B, Cronn R, Kolpak S, Dolan P, Lorenz WW, Dean JF (февраль 2013 г.). "Ресурс SNP для пихты Дугласа: сборка транскриптома de novo, обнаружение и проверка SNP". BMC Genomics . 14 : 137. doi : 10.1186/1471-2164-14-137 . PMC 3673906 . PMID 23445355.
^ McGrath LL, Vollmer SV, Kaluziak ST, Ayers J (январь 2016 г.). «Сборка транскриптома de novo для омара Homarus americanus и характеристика дифференциальной экспрессии генов в тканях нервной системы». BMC Genomics . 17 : 63. doi : 10.1186/s12864-016-2373-3 . PMC 4715275 . PMID 26772543.
^ Noller HF (1991). «Рибосомальная РНК и трансляция». Annual Review of Biochemistry . 60 : 191–227. doi :10.1146/annurev.bi.60.070191.001203. PMID 1883196.
^ Christov CP, Gardiner TJ, Szüts D, Krude T (сентябрь 2006 г.). «Функциональное требование некодирующих Y-РНК для репликации хромосомной ДНК человека». Молекулярная и клеточная биология . 26 (18): 6993–7004. doi :10.1128/MCB.01060-06. PMC 1592862. PMID 16943439 .
^ Hüttenhofer A, Schattner P, Polacek N (май 2005 г.). «Некодирующие РНК: надежда или шумиха?». Trends in Genetics . 21 (5): 289–97. doi :10.1016/j.tig.2005.03.007. PMID 15851066.
^ Esteller M (ноябрь 2011 г.). «Некодирующие РНК при заболеваниях человека». Nature Reviews Genetics . 12 (12): 861–74. doi :10.1038/nrg3074. PMID 22094949. S2CID 13036469.
^ ab Brazma A, Hingamp P, Quackenbush J, Sherlock G, Spellman P, Stoeckert C, Aach J, Ansorge W, Ball CA, Causton HC, Gaasterland T, Glenisson P, Holstege FC, Kim IF, Markowitz V, Matese JC, Parkinson H, Robinson A, Sarkans U, Schulze-Kremer S, Stewart J, Taylor R, Vilo J, Vingron M (декабрь 2001 г.). "Минимальная информация об эксперименте с микрочипами (MIAME) — к стандартам для данных с микрочипами". Nature Genetics . 29 (4): 365–71. doi : 10.1038/ng1201-365 . PMID 11726920. S2CID 6994467.
^ ab Brazma A (май 2009 г.). «Минимальная информация об эксперименте с микрочипами (MIAME) — успехи, неудачи, проблемы». TheScientificWorldJournal . 9 : 420–3. doi : 10.1100/tsw.2009.57 . PMC 5823224. PMID 19484163.
^ Колесников Н, Гастингс Э, Кейс М, Мельничук О, Тан Я., Уильямс Э, Дилаг М, Курбатова Н, Брандизи М, Бердетт Т, Меги К, Пиличева Е, Рустичи Г, Тихонов А, Паркинсон Х, Петришак Р, Сарканс У, Бразма А (январь 2015 г.). «Обновление ArrayExpress — упрощение отправки данных». Исследования нуклеиновых кислот . 43 (Проблема с базой данных): D1113–6. дои : 10.1093/nar/gku1057. ПМЦ 4383899 . ПМИД 25361974.
^ Petryszak R, Keays M, Tang YA, Fonseca NA, Barrera E, Burdett T, Füllgrabe A, Fuentes AM, Jupp S, Koskinen S, Mannion O, Huerta L, Megy K, Snow C, Williams E, Barzine M, Hastings E, Weisser H, Wright J, Jaiswal P, Huber W, Choudhary J, Parkinson HE, Brazma A (январь 2016 г.). «Обновление атласа экспрессии — интегрированная база данных экспрессии генов и белков у людей, животных и растений». Nucleic Acids Research . 44 (D1): D746–52. doi :10.1093/nar/gkv1045. PMC 4702781. PMID 26481351 .
^ Hruz T, Laule O, Szabo G, Wessendorp F, Bleuler S, Oertle L, Widmayer P, Gruissem W, Zimmermann P (2008). "Genevestigator v3: справочная база данных выражений для метаанализа транскриптомов". Advances in Bioinformatics . 2008 : 420747. doi : 10.1155/2008/420747 . PMC 2777001. PMID 19956698 .
^ Мицухаши Н, Фуджиэда К, Тамура Т, Кавамото С, Такаги Т, Окубо К (январь 2009 г.). «BodyParts3D: база данных трехмерных структур для анатомических концепций». Nucleic Acids Research . 37 (выпуск базы данных): D782–5. doi :10.1093/nar/gkn613. PMC 2686534. PMID 18835852 .
^ Zhao Y, Li H, Fang S, Kang Y, Wu W, Hao Y, Li Z, Bu D, Sun N, Zhang MQ, Chen R (январь 2016 г.). "NONCODE 2016: информативный и ценный источник данных о длинных некодирующих РНК". Nucleic Acids Research . 44 (D1): D203–8. doi :10.1093/nar/gkv1252. PMC 4702886. PMID 26586799 .
Примечания
^ В молекулярной биологии гибридизация — это явление, при котором одноцепочечные молекулы дезоксирибонуклеиновой кислоты ( ДНК ) или рибонуклеиновой кислоты ( РНК ) отжигаются с комплементарной ДНК или РНК .
^ Один пиколитр примерно в 30 миллионов раз меньше капли воды.
Дальнейшее чтение
Lowe R, Shirley N, Bleackley M, Dolan S, Shafee T (май 2017 г.). «Транскриптомные технологии». PLOS Computational Biology . 13 (5): e1005457. Bibcode : 2017PLSCB..13E5457L . doi : 10.1371/journal.pcbi.1005457 . PMC 5436640. PMID 28545146.
Сравнительный транскриптомный анализ в справочном модуле по естественным наукам
Программное обеспечение, используемое в транскриптомике: