stringtranslate.com

Технологии транскриптомики

Технологии транскриптомики — это методы, используемые для изучения транскриптома организма , суммы всех его РНК-транскриптов . Информационное содержание организма записывается в ДНК его генома и выражается посредством транскрипции . Здесь мРНК служит временной промежуточной молекулой в информационной сети, в то время как некодирующие РНК выполняют дополнительные разнообразные функции. Транскриптом фиксирует моментальный снимок во времени всех транскриптов, присутствующих в клетке . Технологии транскриптомики предоставляют широкий отчет о том, какие клеточные процессы активны, а какие находятся в состоянии покоя. Основной проблемой молекулярной биологии является понимание того, как один геном дает начало различным клеткам. Другой проблемой является то, как регулируется экспрессия генов.

Первые попытки изучения целых транскриптомов начались в начале 1990-х годов. Последующие технологические достижения с конца 1990-х годов неоднократно трансформировали эту область и сделали транскриптомику широко распространенной дисциплиной в биологических науках. В этой области есть два ключевых современных метода: микрочипы , которые количественно определяют набор предопределенных последовательностей, и РНК-Seq , который использует высокопроизводительное секвенирование для записи всех транскриптов. По мере совершенствования технологий объем данных, получаемых в ходе каждого эксперимента с транскриптомом, увеличивался. В результате методы анализа данных неуклонно адаптировались для более точного и эффективного анализа все больших объемов данных. Базы данных транскриптомов становятся больше и полезнее, поскольку исследователи продолжают собирать и совместно использовать транскриптомы. Было бы практически невозможно интерпретировать информацию, содержащуюся в транскриптоме, без знаний предыдущих экспериментов.

Измерение экспрессии генов организма в различных тканях или состояниях , или в разное время, дает информацию о том, как гены регулируются , и раскрывает детали биологии организма. Его также можно использовать для вывода функций ранее неаннотированных генов. Транскриптомный анализ позволил изучить, как экспрессия генов изменяется в различных организмах, и сыграл важную роль в понимании болезней человека . Анализ экспрессии генов в целом позволяет обнаружить широкие скоординированные тенденции, которые не могут быть распознаны более целенаправленными анализами .

История

Использование метода транскриптомики с течением времени. Опубликованные статьи, относящиеся к РНК-Seq (черный), РНК-микрочипу (красный), экспрессируемой последовательности тега (синий), цифровому дифференциальному отображению (зеленый) и последовательному/кэп-анализу экспрессии генов (желтый) с 1990 года. [1]

Транскриптомика характеризуется разработкой новых методов, которые переопределяют то, что возможно, примерно каждые десять лет и делают предыдущие технологии устаревшими. Первая попытка захвата частичного человеческого транскриптома была опубликована в 1991 году и сообщила о 609 последовательностях мРНК из человеческого мозга . [2] В 2008 году были опубликованы два человеческих транскриптома, состоящих из миллионов последовательностей, полученных из транскриптов, охватывающих 16 000 генов, [3] [4] и к 2015 году были опубликованы транскриптомы для сотен людей. [5] [6] Транскриптомы различных болезненных состояний, тканей или даже отдельных клеток теперь генерируются регулярно. [6] [7] [8] Этот взрыв в транскриптомике был обусловлен быстрым развитием новых технологий с улучшенной чувствительностью и экономичностью. [9] [10] [11] [12]

До транскриптомики

Исследования отдельных транскриптов проводились за несколько десятилетий до того, как стали доступны какие-либо транскриптомные подходы. Библиотеки транскриптов мРНК шелкопряда были собраны и преобразованы в комплементарную ДНК (кДНК) для хранения с использованием обратной транскриптазы в конце 1970-х годов. [13] В 1980-х годах низкопроизводительное секвенирование с использованием метода Сэнгера использовалось для секвенирования случайных транскриптов, создавая экспрессированные метки последовательностей (EST). [2] [14] [15] [16] Метод секвенирования Сэнгера был преобладающим до появления высокопроизводительных методов , таких как секвенирование путем синтеза (Solexa/Illumina). EST приобрели известность в 1990-х годах как эффективный метод определения содержания генов в организме без секвенирования всего генома . [16] Количество отдельных транскриптов было количественно определено с помощью нозерн-блоттинга , нейлоновых мембранных матриц и более поздних методов количественной ПЦР с обратной транскриптазой (RT-qPCR), [17] [18], но эти методы трудоемки и могут охватить только крошечную часть транскриптома. [12] Следовательно, способ, которым транскриптом в целом экспрессируется и регулируется, оставался неизвестным до тех пор, пока не были разработаны более производительные методы.

Ранние попытки

Слово «транскриптом» впервые было использовано в 1990-х годах. [19] [20] В 1995 году был разработан один из самых ранних методов транскриптомики на основе секвенирования — последовательный анализ экспрессии генов (SAGE), который работал по методу Сэнгера, основанному на конкатенированных случайных фрагментах транскриптов. [21] Транскрипты количественно определялись путем сопоставления фрагментов с известными генами. Также некоторое время использовался вариант SAGE, использующий высокопроизводительные методы секвенирования, называемый цифровым анализом экспрессии генов. [9] [22] Однако эти методы были в значительной степени вытеснены высокопроизводительным секвенированием целых транскриптов, которое предоставляло дополнительную информацию о структуре транскрипта, такую ​​как варианты сплайсинга . [9]

Развитие современных технологий

Доминирующие современные методы, микрочипы и РНК-Seq , были разработаны в середине 1990-х и 2000-х годов. [9] [33] Микрочипы, которые измеряют распространенность определенного набора транскриптов посредством их гибридизации с массивом комплементарных зондов, были впервые опубликованы в 1995 году. [34] [35] Технология микрочипов позволила проводить анализ тысяч транскриптов одновременно и при значительном снижении затрат на ген и экономии труда. [36] Как точечные олигонуклеотидные массивы , так и массивы высокой плотности Affymetrix были методом выбора для транскрипционного профилирования до конца 2000-х годов. [12] [33] За этот период был произведен ряд микрочипов для покрытия известных генов в модельных или экономически важных организмах. Достижения в области проектирования и производства массивов улучшили специфичность зондов и позволили тестировать больше генов на одном массиве. Достижения в области обнаружения флуоресценции повысили чувствительность и точность измерения для транскриптов с низкой распространенностью. [35] [37]

RNA-Seq выполняется путем обратной транскрипции РНК in vitro и секвенирования полученных кДНК . [10] Распространенность транскриптов определяется по количеству подсчетов для каждого транскрипта. Поэтому на эту технику оказало сильное влияние развитие технологий высокопроизводительного секвенирования . [9] [11] Массовое параллельное секвенирование сигнатур (MPSS) было ранним примером, основанным на создании последовательностей длиной 16–20  п.н. с помощью сложной серии гибридизаций , [38] [примечание 1] и использовалось в 2004 году для подтверждения экспрессии десяти тысяч генов в Arabidopsis thaliana . [39] Самая ранняя работа по RNA-Seq была опубликована в 2006 году с сотней тысяч транскриптов, секвенированных с использованием технологии 454. [40] Этого было достаточно для количественной оценки относительной распространенности транскриптов . RNA-Seq начал набирать популярность после 2008 года, когда новые технологии Solexa/Illumina позволили записать один миллиард последовательностей транскриптов. [4] [10] [41] [42] Этот результат теперь позволяет проводить количественную оценку и сравнение человеческих транскриптомов. [43]

Сбор данных

Получение данных о транскриптах РНК может быть достигнуто с помощью одного из двух основных принципов: секвенирования отдельных транскриптов ( EST или RNA-Seq) или гибридизации транскриптов с упорядоченным массивом нуклеотидных зондов (микрочипы). [23]

Выделение РНК

Все транскриптомные методы требуют, чтобы РНК была сначала выделена из экспериментального организма, прежде чем транскрипты могут быть записаны. Хотя биологические системы невероятно разнообразны, методы извлечения РНК в целом схожи и включают механическое разрушение клеток или тканей, разрушение РНКазы хаотропными солями , [44] разрушение макромолекул и нуклеотидных комплексов, отделение РНК от нежелательных биомолекул, включая ДНК, и концентрирование РНК путем осаждения из раствора или элюирования из твердой матрицы . [44] [45] Изолированную РНК можно дополнительно обработать ДНКазой для переваривания любых следов ДНК. [46] Необходимо обогатить информационную РНК, поскольку общие экстракты РНК обычно на 98% состоят из рибосомальной РНК . [47] Обогащение транскриптов можно выполнить методами поли-А- аффинности или путем истощения рибосомальной РНК с использованием зондов, специфичных для последовательности. [48] Деградированная РНК может повлиять на результаты последующих исследований; например, обогащение мРНК из деградированных образцов приведет к истощению 5'-концов мРНК и неравномерному сигналу по всей длине транскрипта. Мгновенное замораживание ткани перед выделением РНК является типичным, и принимаются меры для снижения воздействия ферментов РНКазы после завершения выделения. [45]

Теги экспрессированной последовательности

Экспрессированная последовательность тега (EST) представляет собой короткую нуклеотидную последовательность, полученную из одного транскрипта РНК. РНК сначала копируется как комплементарная ДНК (кДНК) ферментом обратной транскриптазы, а затем полученная кДНК секвенируется. [16] Поскольку EST могут быть собраны без предварительного знания организма, из которого они получены, их можно изготавливать из смесей организмов или образцов окружающей среды. [49] [16] Хотя сейчас используются методы с более высокой пропускной способностью, библиотеки EST обычно предоставляли информацию о последовательностях для ранних разработок микрочипов; например, микрочип ячменя был разработан из 350 000 ранее секвенированных EST. [50]

Серийный и кэп-анализ экспрессии генов (SAGE/CAGE)

Краткое описание SAGE . В организмах гены транскрибируются и сплайсируются ( у эукариот ) для получения зрелых транскриптов мРНК (красные). МРНК извлекается из организма, и обратная транскриптаза используется для копирования мРНК в стабильную двухцепочечную кДНК ( ds - cDNA ; синяя). В SAGE ds-cDNA расщепляется рестриктазами (в положении «X» и «X»+11) для получения 11-нуклеотидных фрагментов «тегов». Эти теги объединяются и секвенируются с помощью длинного считывания по Сэнгеру (разные оттенки синего указывают на теги из разных генов). Последовательности деконволюцируются для нахождения частоты каждого тега. Частоту тега можно использовать для отчета о транскрипции гена, из которого произошел тег. [51]

Последовательный анализ экспрессии генов (SAGE) был развитием методологии EST для увеличения пропускной способности генерируемых тегов и обеспечения некоторой количественной оценки распространенности транскриптов. [21] кДНК генерируется из РНК , но затем расщепляется на фрагменты «тегов» размером 11 п.н. с использованием рестриктаз , которые разрезают ДНК в определенной последовательности, и 11 пар оснований вдоль этой последовательности. Затем эти теги кДНК соединяются голова к хвосту в длинные нити (>500 п.н.) и секвенируются с использованием низкопроизводительных, но длинных методов считывания, таких как секвенирование по Сэнгеру . Затем последовательности разделяются обратно на их исходные теги размером 11 п.н. с использованием компьютерного программного обеспечения в процессе, называемом деконволюцией . [21] Если доступен высококачественный референсный геном , эти теги могут быть сопоставлены с соответствующим им геном в геноме. Если референсный геном недоступен, теги могут быть напрямую использованы в качестве диагностических маркеров, если обнаружено, что они дифференциально экспрессируются в состоянии болезни. [21]

Метод анализа экспрессии генов с помощью cap (CAGE) является вариантом SAGE, который секвенирует теги только с 5'-конца транскрипта мРНК. [52] Таким образом, сайт начала транскрипции генов может быть идентифицирован, когда теги выровнены с референтным геномом. Определение сайтов начала генов полезно для анализа промотора и для клонирования полноразмерных кДНК.

Методы SAGE и CAGE дают информацию о большем количестве генов, чем это было возможно при секвенировании отдельных EST, но подготовка образцов и анализ данных, как правило, более трудоемки. [52]

Микрочипы

Краткое описание ДНК-микрочипов . Внутри организмов гены транскрибируются и сплайсируются (у эукариот) для получения зрелых транскриптов мРНК (красные). МРНК извлекается из организма, и обратная транскриптаза используется для копирования мРНК в стабильную ds-cDNA (синюю). В микрочипах ds-cDNA фрагментируется и флуоресцентно маркируется (оранжевая). Меченые фрагменты связываются с упорядоченным массивом комплементарных олигонуклеотидов, а измерение интенсивности флуоресценции по всему массиву указывает на распространенность предопределенного набора последовательностей. Эти последовательности обычно специально выбираются для сообщения о генах, представляющих интерес, в геноме организма. [51]

Принципы и достижения

Микрочипы обычно состоят из сетки коротких нуклеотидных олигомеров , известных как « зонды », обычно расположенных на предметном стекле. [53] Распространенность транскриптов определяется путем гибридизации флуоресцентно меченых транскриптов с этими зондами. [54] Интенсивность флуоресценции в каждом месте зонда на массиве указывает распространенность транскриптов для этой последовательности зонда. [54] Группы зондов, разработанные для измерения одного и того же транскрипта (т. е. гибридизации определенного транскрипта в разных положениях), обычно называются «наборами зондов».

Микрочипы требуют некоторых геномных знаний от интересующего организма, например, в форме аннотированной последовательности генома или библиотеки EST, которые можно использовать для генерации зондов для массива. [36]

Методы

Микрочипы для транскриптомики обычно попадают в одну из двух широких категорий: точечные массивы низкой плотности или массивы коротких зондов высокой плотности. Изобилие транскриптов выводится из интенсивности флуоресценции, полученной от транскриптов, помеченных флуорофором, которые связываются с массивом. [36]

Точечные массивы низкой плотности обычно содержат пиколитровые [примечание 2] капли ряда очищенных кДНК, выстроенных на поверхности предметного стекла. [55] Эти зонды длиннее, чем зонды массивов высокой плотности, и не могут идентифицировать альтернативные события сплайсинга. Точечные массивы используют два разных флуорофора для маркировки тестовых и контрольных образцов, а отношение флуоресценции используется для расчета относительной меры распространенности. [56] Высокоплотные массивы используют одну флуоресцентную метку, и каждый образец гибридизуется и обнаруживается индивидуально. [57] Высокоплотные массивы были популяризированы массивом Affymetrix GeneChip , где каждый транскрипт количественно определяется несколькими короткими 25- мерными зондами, которые вместе анализируют один ген. [58]

Массивы NimbleGen представляли собой массив высокой плотности, произведенный методом безмасковой фотохимии , что позволяло гибко изготавливать массивы в малых или больших количествах. Эти массивы имели 100 000 зондов длиной от 45 до 85 меров и были гибридизированы с образцом с одноцветной меткой для анализа экспрессии. [59] Некоторые конструкции включали до 12 независимых массивов на слайд.

РНК-Seq

Краткое изложение RNA-Seq . Внутри организмов гены транскрибируются и сплайсируются (у эукариот) для получения зрелых транскриптов мРНК (красный). мРНК извлекается из организма, фрагментируется и копируется в стабильную ds-cDNA (синий). ds-cDNA секвенируется с использованием высокопроизводительных методов секвенирования с коротким считыванием. Затем эти последовательности можно выровнять с референтной последовательностью генома, чтобы реконструировать, какие области генома транскрибировались. Эти данные можно использовать для аннотирования, где находятся экспрессированные гены, их относительных уровней экспрессии и любых альтернативных вариантов сплайсинга. [51]

Принципы и достижения

RNA-Seq относится к комбинации высокопроизводительной методологии секвенирования с вычислительными методами для захвата и количественной оценки транскриптов, присутствующих в экстракте РНК. [10] Сгенерированные нуклеотидные последовательности обычно имеют длину около 100 п.н., но могут варьироваться от 30 п.н. до более 10 000 п.н. в зависимости от используемого метода секвенирования. RNA-Seq использует глубокую выборку транскриптома с множеством коротких фрагментов из транскриптома, чтобы обеспечить вычислительную реконструкцию исходного транскрипта РНК путем выравнивания прочтений с референсным геномом или друг с другом ( сборка de novo ). [9] Как малочисленные, так и высокочисленные РНК могут быть количественно определены в эксперименте RNA-Seq ( динамический диапазон 5 порядков величины ) — ключевое преимущество перед транскриптомами на основе микрочипов. Кроме того, количество входной РНК для RNA-Seq (количество нанограммов) намного ниже, чем для микрочипов (количество микрограммов), которые позволяют исследовать транскриптом даже при разрешении одной клетки в сочетании с амплификацией кДНК. [25] [60] Теоретически, не существует верхнего предела количественной оценки в RNA-Seq, а фоновый шум очень низок для считываний 100 п.н. в неповторяющихся областях. [10]

RNA-Seq может использоваться для идентификации генов в геноме или определения того, какие гены активны в определенный момент времени, а количество прочтений может использоваться для точного моделирования относительного уровня экспрессии генов. Методология RNA-Seq постоянно совершенствовалась, в первую очередь за счет разработки технологий секвенирования ДНК для повышения пропускной способности, точности и длины прочтений. [61] С момента первых описаний в 2006 и 2008 годах [40] [62] RNA-Seq быстро внедрялся и обогнал микрочипы в качестве доминирующей техники транскриптомики в 2015 году. [63]

Поиск данных транскриптома на уровне отдельных клеток привел к прогрессу в методах подготовки библиотеки РНК-Seq, что привело к резкому повышению чувствительности. Транскриптомы отдельных клеток теперь хорошо описаны и даже были расширены до in situ РНК-Seq, где транскриптомы отдельных клеток напрямую исследуются в фиксированных тканях. [64]

Методы

RNA-Seq был создан в сочетании с быстрым развитием ряда высокопроизводительных технологий секвенирования ДНК. [65] Однако, прежде чем извлеченные транскрипты РНК будут секвенированы, выполняется несколько ключевых этапов обработки. Методы различаются по использованию обогащения транскрипта, фрагментации, амплификации, секвенирования с одним или двумя концами, а также по тому, следует ли сохранять информацию о цепях. [65]

Чувствительность эксперимента RNA-Seq может быть увеличена путем обогащения классов РНК, представляющих интерес, и истощения известных обильных РНК. Молекулы мРНК могут быть разделены с помощью олигонуклеотидных зондов, которые связывают их поли-А-хвосты . В качестве альтернативы, рибодеплеция может быть использована для специфического удаления обильных, но неинформативных рибосомальных РНК (рРНК) путем гибридизации с зондами, адаптированными к специфическим последовательностям рРНК таксона (например, рРНК млекопитающих, рРНК растений). Однако рибодеплеция также может вносить некоторую предвзятость посредством неспецифического истощения нецелевых транскриптов. [66] Малые РНК, такие как микроРНК , могут быть очищены на основе их размера с помощью гель-электрофореза и экстракции.

Поскольку мРНК длиннее, чем длина прочтения типичных методов высокопроизводительного секвенирования, транскрипты обычно фрагментируются перед секвенированием. [67] Метод фрагментации является ключевым аспектом построения библиотеки секвенирования. Фрагментация может быть достигнута путем химического гидролиза , распыления , обработки ультразвуком или обратной транскрипции с нуклеотидами, завершающими цепь . [67] В качестве альтернативы фрагментация и маркировка кДНК могут быть выполнены одновременно с использованием ферментов транспозазы . [68]

Во время подготовки к секвенированию копии кДНК транскриптов могут быть амплифицированы с помощью ПЦР для обогащения фрагментов, содержащих ожидаемые последовательности адаптеров 5' и 3'. [69] Амплификация также используется для обеспечения возможности секвенирования очень малых количеств входной РНК, вплоть до 50 пг в экстремальных приложениях. [70] Контрольные образцы известных РНК могут использоваться для оценки контроля качества, чтобы проверить подготовку библиотеки и секвенирование с точки зрения содержания GC , длины фрагмента, а также смещения из-за положения фрагмента в транскрипте. [71] Уникальные молекулярные идентификаторы (UMI) представляют собой короткие случайные последовательности, которые используются для индивидуальной маркировки фрагментов последовательности во время подготовки библиотеки, чтобы каждый помеченный фрагмент был уникальным. [72] UMI предоставляют абсолютную шкалу для количественной оценки, возможность скорректировать последующее смещение амплификации, внесенное во время построения библиотеки, и точно оценить начальный размер образца. UMI особенно хорошо подходят для транскриптомики РНК-Seq отдельных клеток, где количество входной РНК ограничено и требуется расширенная амплификация образца. [73] [74] [75]

После подготовки молекул транскрипта их можно секвенировать только в одном направлении (одноконцевое) или в обоих направлениях (парноконцевое). Одноконцевая последовательность обычно производится быстрее, дешевле, чем парноконцевое секвенирование, и достаточна для количественной оценки уровней экспрессии генов. Парноконцевое секвенирование дает более надежные выравнивания/сборки, что полезно для аннотации генов и обнаружения изоформ транскриптов . [10] Методы РНК-Seq, специфичные для нитей, сохраняют информацию о цепях секвенированного транскрипта. [76] Без информации о цепях считывания могут быть выровнены с локусом гена, но не сообщают, в каком направлении транскрибируется ген. Stranded-RNA-Seq полезен для расшифровки транскрипции для генов, которые перекрываются в разных направлениях, и для более надежных предсказаний генов в немодельных организмах. [76]

Условные обозначения: NCBI SRA – Национальный центр информации о биотехнологиях, архив прочтений последовательностей.

В настоящее время RNA-Seq полагается на копирование молекул РНК в молекулы кДНК перед секвенированием; поэтому последующие платформы одинаковы для транскриптомных и геномных данных. Следовательно, разработка технологий секвенирования ДНК стала определяющей чертой RNA-Seq. [78] [80] [81] Прямое секвенирование РНК с использованием нанопорового секвенирования представляет собой современный современный метод RNA-Seq. [82] [83] Нанопоровое секвенирование РНК может обнаруживать модифицированные основания , которые в противном случае были бы замаскированы при секвенировании кДНК, а также устраняет этапы амплификации , которые в противном случае могли бы внести смещение. [11] [84]

Чувствительность и точность эксперимента RNA-Seq зависят от количества прочтений , полученных из каждого образца. [85] [86] Большое количество прочтений необходимо для обеспечения достаточного покрытия транскриптома, что позволяет обнаруживать транскрипты с низкой распространенностью. Экспериментальный дизайн еще больше усложняется технологиями секвенирования с ограниченным выходным диапазоном, переменной эффективностью создания последовательностей и переменным качеством последовательностей. К этим соображениям добавляется то, что у каждого вида разное количество генов и, следовательно, требуется индивидуальный выход последовательности для эффективного транскриптома. Ранние исследования определяли подходящие пороговые значения эмпирически, но по мере развития технологии подходящее покрытие предсказывалось вычислительно по насыщению транскриптома. Несколько противоречащее интуиции, наиболее эффективный способ улучшить обнаружение дифференциальной экспрессии в генах с низкой экспрессией — это добавить больше биологических репликатов , а не больше прочтений. [87] Текущие контрольные показатели, рекомендуемые проектом «Энциклопедия элементов ДНК » (ENCODE), составляют 70-кратное покрытие экзома для стандартного РНК-Seq и до 500-кратное покрытие экзома для обнаружения редких транскриптов и изоформ. [88] [89] [90]

Анализ данных

Методы транскриптомики высокопараллельны и требуют значительных вычислений для получения значимых данных как для экспериментов с микрочипами, так и для экспериментов с РНК-Seq. [91] [92] [93] [94] [95] Данные микрочипов записываются в виде изображений с высоким разрешением , требующих обнаружения признаков и спектрального анализа. [96] Файлы необработанных изображений микрочипов имеют размер около 750 МБ, в то время как обработанные интенсивности имеют размер около 60 МБ. Несколько коротких зондов, соответствующих одному транскрипту, могут раскрыть детали о структуре интрон - экзон , требуя статистических моделей для определения подлинности полученного сигнала. Исследования РНК-Seq производят миллиарды коротких последовательностей ДНК, которые должны быть выровнены с референсными геномами, состоящими из миллионов или миллиардов пар оснований. Сборка прочтений de novo в наборе данных требует построения очень сложных графов последовательностей . [97] Операции RNA-Seq являются многократно повторяющимися и выигрывают от параллельных вычислений , но современные алгоритмы означают, что потребительское вычислительное оборудование достаточно для простых экспериментов по транскриптомике, которые не требуют сборки считываний de novo . [98] Человеческий транскриптом может быть точно получен с помощью RNA-Seq с 30 миллионами последовательностей по 100 п.н. на образец. [85] [86] Этот пример потребует приблизительно 1,8 гигабайта дискового пространства на образец при хранении в сжатом формате fastq . Обработанные данные подсчета для каждого гена будут намного меньше, эквивалентно обработанным интенсивностям микрочипов. Данные о последовательностях могут храниться в публичных репозиториях, таких как Архив прочтений последовательностей (SRA). [99] Наборы данных RNA-Seq могут быть загружены через Gene Expression Omnibus. [100]

Обработка изображений

Микрочипы и проточная ячейка секвенирования . Микрочипы и РНК-секвенирование по-разному опираются на анализ изображений. В микрочипе каждое пятно на чипе представляет собой определенный олигонуклеотидный зонд, а интенсивность флуоресценции напрямую определяет распространенность определенной последовательности (Affymetrix). В высокопроизводительной проточной ячейке секвенирования пятна секвенируются по одному нуклеотиду за раз, причем цвет в каждом раунде указывает на следующий нуклеотид в последовательности (Illumina Hiseq). Другие вариации этих методов используют большее или меньшее количество цветовых каналов. [51] [101]

Обработка изображений микрочипов должна правильно идентифицировать регулярную сетку признаков в пределах изображения и независимо количественно определять интенсивность флуоресценции для каждого признака. Артефакты изображения должны быть дополнительно идентифицированы и удалены из общего анализа. Интенсивность флуоресценции напрямую указывает на распространенность каждой последовательности, поскольку последовательность каждого зонда на массиве уже известна. [102]

Первые шаги РНК-секвенирования также включают в себя похожую обработку изображений; однако преобразование изображений в данные последовательности обычно выполняется автоматически программным обеспечением прибора. Метод секвенирования синтезом Illumina приводит к массиву кластеров, распределенных по поверхности проточной ячейки. [103] Проточная ячейка визуализируется до четырех раз в течение каждого цикла секвенирования, всего от десятков до сотен циклов. Кластеры проточной ячейки аналогичны пятнам микроматрицы и должны быть правильно идентифицированы на ранних стадиях процесса секвенирования. В методе пиросеквенирования Roche интенсивность испускаемого света определяет количество последовательных нуклеотидов в гомополимерном повторе. Существует много вариантов этих методов, каждый из которых имеет свой профиль ошибок для полученных данных. [104]

Анализ данных РНК-Seq

Эксперименты RNA-Seq генерируют большой объем необработанных последовательностей, которые должны быть обработаны для получения полезной информации. Анализ данных обычно требует комбинации программных средств биоинформатики (см. также Список инструментов биоинформатики RNA-Seq ), которые различаются в зависимости от экспериментального дизайна и целей. Процесс можно разбить на четыре этапа: контроль качества, выравнивание, количественная оценка и дифференциальное выражение. [105] Большинство популярных программ RNA-Seq запускаются из интерфейса командной строки , либо в среде Unix , либо в статистической среде R / Bioconductor . [94]

Контроль качества

Считывания последовательностей не идеальны, поэтому точность каждого основания в последовательности должна быть оценена для последующих анализов. Необработанные данные проверяются, чтобы убедиться: оценки качества для вызовов оснований высоки, содержание GC соответствует ожидаемому распределению, короткие мотивы последовательностей ( k-меры ) не перепредставлены, а скорость дупликации прочтений приемлемо низка. [86] Существует несколько вариантов программного обеспечения для анализа качества последовательностей, включая FastQC и FaQCs. [106] [107] Аномалии могут быть удалены (обрезка) или помечены для специальной обработки во время последующих процессов.

Выравнивание

Чтобы связать распространенность прочтений последовательностей с экспрессией конкретного гена, последовательности транскриптов выравниваются с референтным геномом или de novo выравниваются друг с другом, если референт недоступен. [108] [109] [110] Основные проблемы программного обеспечения для выравнивания включают достаточную скорость, чтобы позволить миллиардам коротких последовательностей быть выровненными в значимые временные рамки, гибкость для распознавания и обработки интронного сплайсинга эукариотической мРНК и правильное назначение прочтений, которые отображаются в нескольких местах. Достижения программного обеспечения в значительной степени решили эти проблемы, а увеличение длины прочтений секвенирования снижает вероятность неоднозначных выравниваний прочтений. Список доступных в настоящее время высокопроизводительных выравнивателей последовательностей поддерживается EBI . [ 111] [112]

Выравнивание последовательностей первичного транскрипта мРНК , полученных от эукариот , с референтным геномом требует специализированной обработки последовательностей интронов , которые отсутствуют в зрелой мРНК. [113] Короткие выравниватели прочтений выполняют дополнительный раунд выравниваний, специально разработанных для идентификации соединений сплайсинга , на основе канонических последовательностей сайтов сплайсинга и известной информации о сайте сплайсинга интронов. Идентификация соединений сплайсинга интронов предотвращает несоответствие прочтений друг другу по соединениям сплайсинга или ошибочное отбрасывание, что позволяет выровнять больше прочтений с референтным геномом и повысить точность оценок экспрессии генов. Поскольку регуляция генов может происходить на уровне изоформ мРНК , выравнивания с учетом сплайсинга также позволяют обнаруживать изменения в изоформах, которые в противном случае были бы потеряны при объемном анализе. [114]

Сборка de novo может использоваться для выравнивания прочтений друг с другом для построения полноразмерных последовательностей транскриптов без использования референсного генома. [115] Проблемы, характерные для сборки de novo , включают большие вычислительные требования по сравнению с референсным транскриптомом, дополнительную проверку вариантов или фрагментов генов и дополнительную аннотацию собранных транскриптов. Первые метрики, используемые для описания сборок транскриптома, такие как N50 , оказались обманчивыми [116] , и теперь доступны улучшенные методы оценки. [117] [118] Метрики на основе аннотаций являются лучшими оценками полноты сборки, такими как contig reciprocal best hit count. После сборки de novo сборку можно использовать в качестве эталона для последующих методов выравнивания последовательностей и количественного анализа экспрессии генов.

Условные обозначения: RAM – оперативное запоминающее устройство; MPI – интерфейс передачи сообщений; EST – тег выраженной последовательности.

Количественная оценка

Тепловая карта идентификации паттернов коэкспрессии генов в разных образцах. Каждый столбец содержит измерения изменения экспрессии генов для одного образца. Относительная экспрессия генов обозначена цветом: высокая экспрессия (красный), средняя экспрессия (белый) и низкая экспрессия (синий). Гены и образцы со схожими профилями экспрессии могут быть автоматически сгруппированы (левое и верхнее деревья). Образцы могут быть разными людьми, тканями, средами или состояниями здоровья. В этом примере экспрессия набора генов 1 высокая, а экспрессия набора генов 2 низкая в образцах 1, 2 и 3. [51] [129]

Количественная оценка выравниваний последовательностей может быть выполнена на уровне гена, экзона или транскрипта. [91] [87] Типичные выходные данные включают таблицу количества прочтений для каждой функции, предоставленной программному обеспечению; например, для генов в файле общего формата функций . Количество прочтений генов и экзонов может быть довольно легко рассчитано с помощью, например, HTSeq. [130] Количественная оценка на уровне транскрипта более сложна и требует вероятностных методов для оценки распространенности изоформ транскрипта из короткой информации о прочтении; например, с помощью программного обеспечения cufflinks. [114] Чтения, которые одинаково хорошо выравниваются с несколькими местоположениями, должны быть идентифицированы и либо удалены, либо выровнены с одним из возможных местоположений, либо выровнены с наиболее вероятным местоположением.

Некоторые методы количественной оценки могут обойти необходимость точного выравнивания прочтения с референтной последовательностью вообще. Метод программного обеспечения kallisto объединяет псевдовыравнивание и количественную оценку в один шаг, который выполняется на 2 порядка быстрее, чем современные методы, такие как те, которые используются программным обеспечением tophat/cufflinks, с меньшей вычислительной нагрузкой. [131]

Дифференциальное выражение

После того, как количественные подсчеты каждого транскрипта доступны, дифференциальная экспрессия генов измеряется путем нормализации, моделирования и статистического анализа данных. [108] Большинство инструментов будут считывать таблицу генов и считывать подсчеты в качестве своих входных данных, но некоторые программы, такие как cuffdiff, будут принимать считываемые выравнивания в формате бинарной карты выравнивания в качестве входных данных. Конечными результатами этих анализов являются списки генов с соответствующими парными тестами на дифференциальную экспрессию между обработками и оценками вероятности этих различий. [132]

Условные обозначения: мРНК — информационная РНК.

Проверка

Транскриптомные анализы могут быть проверены с использованием независимой методики, например, количественной ПЦР (qPCR), которая распознаваема и статистически оцениваема. [135] Экспрессия гена измеряется по определенным стандартам как для интересующего гена, так и для контрольных генов. Измерение с помощью qPCR похоже на измерение, полученное с помощью RNA-Seq, где значение может быть рассчитано для концентрации целевого региона в данном образце. qPCR, однако, ограничена ампликонами размером менее 300 п.н., обычно ближе к 3'-концу кодирующей области, избегая 3'UTR . [136] Если требуется проверка изоформ транскриптов, проверка выравниваний прочтений RNA-Seq должна указать, где можно разместить праймеры qPCR для максимальной дискриминации. Измерение нескольких контрольных генов вместе с интересующими генами дает стабильную ссылку в биологическом контексте. [137] Проверка данных РНК-Seq с помощью ПЦР в целом показала, что различные методы РНК-Seq имеют высокую степень корреляции. [62] [138] [139]

Функциональная валидация ключевых генов является важным соображением для посттранскриптомного планирования. Наблюдаемые паттерны экспрессии генов могут быть функционально связаны с фенотипом с помощью независимого исследования нокдауна / спасения в интересующем организме. [140]

Приложения

Диагностика и профилирование заболеваний

Транскриптомные стратегии нашли широкое применение в различных областях биомедицинских исследований, включая диагностику и профилирование заболеваний . [10] [141] Подходы РНК-Seq позволили провести крупномасштабную идентификацию сайтов начала транскрипции , обнаружить альтернативное использование промотора и новые изменения сплайсинга . Эти регуляторные элементы важны для заболеваний человека, и поэтому определение таких вариантов имеет решающее значение для интерпретации исследований ассоциации заболеваний . [142] РНК-Seq также может идентифицировать ассоциированные с заболеваниями однонуклеотидные полиморфизмы (SNP), аллель-специфическую экспрессию и слияния генов , что способствует пониманию причинных вариантов заболеваний. [143]

Ретротранспозоны — это мобильные элементы , которые размножаются в эукариотических геномах посредством процесса, включающего обратную транскрипцию . РНК-Seq может предоставить информацию о транскрипции эндогенных ретротранспозонов, которые могут влиять на транскрипцию соседних генов посредством различных эпигенетических механизмов , приводящих к заболеванию. [144] Аналогичным образом, потенциал использования РНК-Seq для понимания заболеваний, связанных с иммунитетом, быстро расширяется благодаря возможности рассекать популяции иммунных клеток и секвенировать репертуары рецепторов Т- и В-клеток у пациентов. [145] [146]

Транскриптомы человека и патогенов

РНК-секвенирование человеческих патогенов стало общепринятым методом количественной оценки изменений экспрессии генов, выявления новых факторов вирулентности , прогнозирования устойчивости к антибиотикам и раскрытия иммунных взаимодействий хозяина и патогена . [147] [148] Основной целью этой технологии является разработка оптимизированных мер контроля инфекций и целевого индивидуализированного лечения . [146]

Транскриптомный анализ преимущественно фокусировался либо на хозяине, либо на патогене. Двойной РНК-Seq применялся для одновременного профилирования экспрессии РНК как у патогена, так и у хозяина на протяжении всего процесса инфекции. Этот метод позволяет изучать динамический ответ и межвидовые сети генной регуляции у обоих партнеров взаимодействия от начального контакта до вторжения и окончательного сохранения патогена или его устранения иммунной системой хозяина. [149] [150]

Реакции на окружающую среду

Транскриптомика позволяет идентифицировать гены и пути , которые реагируют на биотические и абиотические экологические стрессы и противодействуют им. [151] [140] Нецелевая природа транскриптомики позволяет идентифицировать новые транскрипционные сети в сложных системах. Например, сравнительный анализ ряда линий нута на разных стадиях развития выявил различные транскрипционные профили, связанные со стрессами засухи и засоления , включая идентификацию роли транскриптовых изоформ AP2 - EREBP . [151] Исследование экспрессии генов во время формирования биопленки грибковым патогеном Candida albicans выявило совместно регулируемый набор генов, критически важных для установления и поддержания биопленки. [152]

Транскриптомное профилирование также предоставляет важную информацию о механизмах лекарственной устойчивости . Анализ более 1000 изолятов Plasmodium falciparum , вирулентного паразита, ответственного за малярию у людей, [153] выявил, что повышение регуляции развернутого белкового ответа и более медленное прогрессирование на ранних стадиях бесполого внутриэритроцитарного цикла развития были связаны с устойчивостью к артемизинину в изолятах из Юго-Восточной Азии . [154]

Использование транскриптомики также важно для изучения реакций в морской среде. [155] В морской экологии « стресс » и « адаптация » были одними из самых распространенных тем исследований, особенно связанных с антропогенным стрессом, таким как глобальные изменения и загрязнение . [155] Большинство исследований в этой области были проведены на животных , хотя беспозвоночные были недостаточно представлены. [155] Одной из проблем по-прежнему является недостаток функциональных генетических исследований, что затрудняет аннотации генов , особенно для немодельных видов, и может привести к неопределенным выводам о влиянии изучаемых реакций. [155]

Аннотация функции гена

Все транскриптомные методы были особенно полезны для определения функций генов и идентификации тех, которые отвечают за определенные фенотипы. Транскриптомика экотипов Arabidopsis , которые гипераккумулируют металлы , коррелировала гены, участвующие в поглощении металлов , толерантности и гомеостазе с фенотипом. [156] Интеграция наборов данных RNA-Seq в различных тканях использовалась для улучшения аннотации функций генов в коммерчески важных организмах (например, огурец ) [157] или находящихся под угрозой исчезновения видах (например, коала ). [158]

Сборка считываний РНК-Seq не зависит от референтного генома [122] и поэтому идеально подходит для исследований экспрессии генов немодельных организмов с несуществующими или плохо развитыми геномными ресурсами. Например, база данных SNP, используемых в программах разведения пихты Дугласа, была создана с помощью анализа транскриптома de novo при отсутствии секвенированного генома . [159] Аналогичным образом, гены, которые функционируют в развитии сердечной, мышечной и нервной ткани у омаров, были идентифицированы путем сравнения транскриптомов различных типов тканей без использования последовательности генома. [160] РНК-Seq также может использоваться для идентификации ранее неизвестных областей кодирования белков в существующих секвенированных геномах.

Некодирующая РНК

Транскриптомика чаще всего применяется к содержанию мРНК в клетке. Однако те же методы в равной степени применимы к некодирующим РНК (нкРНК), которые не транслируются в белок, но вместо этого имеют прямые функции (например, роли в трансляции белка , репликации ДНК , сплайсинге РНК и регуляции транскрипции ). [161] [162] [163] [164] Многие из этих нкРНК влияют на болезненные состояния, включая рак, сердечно-сосудистые и неврологические заболевания. [165]

Базы данных транскриптома

Транскриптомные исследования генерируют большие объемы данных, которые имеют потенциальное применение далеко за пределами первоначальных целей эксперимента. Таким образом, необработанные или обработанные данные могут быть помещены в публичные базы данных , чтобы обеспечить их полезность для более широкого научного сообщества. Например, по состоянию на 2018 год Gene Expression Omnibus содержал миллионы экспериментов. [166]

Условные обозначения: NCBI — Национальный центр биотехнологической информации; EBI — Европейский институт биоинформатики; DDBJ — Банк данных ДНК Японии; ENA — Европейский архив нуклеотидов; MIAME — Минимальная информация об эксперименте с микрочипами; MINSEQE — Минимальная информация об эксперименте по высокопроизводительному секвенированию нуклеотидов.

Смотрите также

Ссылки

Эта статья была адаптирована из следующего источника по лицензии CC BY 4.0 (2017) (отчеты рецензентов): Rohan Lowe; Neil Shirley; Mark Bleackley; Stephen Dolan; Thomas Shafee (18 мая 2017 г.). "Transcriptomics technologies". PLOS Computational Biology . 13 (5): e1005457. doi : 10.1371/JOURNAL.PCBI.1005457 . ISSN  1553-734X. PMC 5436640.  PMID 28545146.  S2CID 3714586.  Wikidata Q33703532  .

  1. ^ "Тенденция Medline: автоматизированная ежегодная статистика результатов PubMed для любого запроса". dan.corlan.net . Получено 2016-10-05 .
  2. ^ ab Adams MD, Kelley JM, Gocayne JD, Dubnick M, Polymeropoulos MH, Xiao H, et al. (июнь 1991 г.). «Комплементарное секвенирование ДНК: экспрессируемые метки последовательностей и проект генома человека». Science . 252 (5013): 1651–6. Bibcode :1991Sci...252.1651A. doi :10.1126/science.2047873. PMID  2047873. S2CID  13436211.
  3. ^ Pan Q, Shai O, Lee LJ, Frey BJ, Blencowe BJ (декабрь 2008 г.). «Глубокое исследование сложности альтернативного сплайсинга в транскриптоме человека с помощью высокопроизводительного секвенирования». Nature Genetics . 40 (12): 1413–5. doi :10.1038/ng.259. PMID  18978789. S2CID  9228930.
  4. ^ ab Sultan M, Schulz MH, Richard H, Magen A, Klingenhoff A, Scherf M, et al. (август 2008 г.). «Глобальный взгляд на активность генов и альтернативный сплайсинг с помощью глубокого секвенирования человеческого транскриптома». Science . 321 (5891): 956–60. Bibcode :2008Sci...321..956S. doi :10.1126/science.1160342. PMID  18599741. S2CID  10013179.
  5. ^ Lappalainen T, Sammeth M, Friedländer MR, 't Hoen PA, Monlong J, Rivas MA и др. (сентябрь 2013 г.). «Секвенирование транскриптома и генома раскрывает функциональные вариации у людей». Nature . 501 (7468): 506–11. Bibcode :2013Natur.501..506L. doi :10.1038/nature12531. PMC 3918453 . PMID  24037378. 
  6. ^ ab Melé M, Ferreira PG, Reverter F, DeLuca DS, Monlong J, Sammeth M и др. (май 2015 г.). «Геномика человека. Транскриптом человека в тканях и у отдельных лиц». Science . 348 (6235): 660–5. Bibcode :2015Sci...348..660M. doi :10.1126/science.aaa0355. PMC 4547472 . PMID  25954002. 
  7. ^ Sandberg R (январь 2014 г.). «Вступление в эру транскриптомики отдельных клеток в биологии и медицине». Nature Methods . 11 (1): 22–4. doi :10.1038/nmeth.2764. PMID  24524133. S2CID  27632439.
  8. ^ Kolodziejczyk AA, Kim JK, Svensson V, Marioni JC, Teichmann SA (май 2015 г.). «Технология и биология секвенирования РНК отдельных клеток». Molecular Cell . 58 (4): 610–20. doi : 10.1016/j.molcel.2015.04.005 . PMID  26000846.
  9. ^ abcdef McGettigan PA (февраль 2013 г.). «Транскриптомика в эпоху секвенирования РНК». Современное мнение в области химической биологии . 17 (1): 4–11. дои : 10.1016/j.cbpa.2012.12.008. ПМИД  23290152.
  10. ^ abcdefghijkl Ван З., Герштейн М., Снайдер М. (январь 2009 г.). «РНК-Seq: революционный инструмент для транскриптомики». Nature Reviews Genetics . 10 (1): 57–63. doi :10.1038/nrg2484. PMC 2949280. PMID  19015660 . 
  11. ^ abc Ozsolak F, Milos PM (февраль 2011 г.). «Секвенирование РНК: достижения, проблемы и возможности». Nature Reviews Genetics . 12 (2): 87–98. doi :10.1038/nrg2934. PMC 3031867. PMID 21191423  . 
  12. ^ abc Морозова О., Хирст М., Марра МА. (2009). «Применение новых технологий секвенирования для анализа транскриптома». Annual Review of Genomics and Human Genetics . 10 : 135–51. doi :10.1146/annurev-genom-082908-145957. PMID  19715439.
  13. ^ Sim GK, Kafatos FC, Jones CW, Koehler MD, Efstratiadis A, Maniatis T (декабрь 1979 г.). «Использование библиотеки кДНК для исследований эволюции и экспрессии в развитии мультигенных семейств хориона». Cell . 18 (4): 1303–16. doi : 10.1016/0092-8674(79)90241-1 . PMID  519770.
  14. ^ Sutcliffe JG, Milner RJ, Bloom FE, Lerner RA (август 1982 г.). «Общая 82-нуклеотидная последовательность, уникальная для РНК мозга». Труды Национальной академии наук Соединенных Штатов Америки . 79 (16): 4942–6. Bibcode : 1982PNAS...79.4942S. doi : 10.1073 /pnas.79.16.4942 . PMC 346801. PMID  6956902. 
  15. ^ Putney SD, Herlihy WC, Schimmel P (апрель 1983 г.). «Новый тропонин T и клоны кДНК для 13 различных мышечных белков, обнаруженные методом дробовика». Nature . 302 (5910): 718–21. Bibcode :1983Natur.302..718P. doi :10.1038/302718a0. PMID  6687628. S2CID  4364361.
  16. ^ abcd Marra MA, Hillier L, Waterston RH (январь 1998). "Теги экспрессируемых последовательностей — установление мостов между геномами". Trends in Genetics . 14 (1): 4–7. doi :10.1016/S0168-9525(97)01355-3. PMID  9448457.
  17. ^ Alwine JC, Kemp DJ, Stark GR (декабрь 1977 г.). «Метод обнаружения специфических РНК в агарозных гелях путем переноса на диазобензилоксиметил-бумагу и гибридизации с ДНК-зондами». Труды Национальной академии наук Соединенных Штатов Америки . 74 (12): 5350–4. Bibcode : 1977PNAS...74.5350A. doi : 10.1073/pnas.74.12.5350 . PMC 431715. PMID  414220 . 
  18. ^ Беккер-Андре М., Халброк К. (ноябрь 1989 г.). «Абсолютная количественная оценка мРНК с использованием полимеразной цепной реакции (ПЦР). Новый подход с использованием анализа титрования транскриптов с помощью ПЦР (PATTY)». Nucleic Acids Research . 17 (22): 9437–46. doi :10.1093/nar/17.22.9437. PMC 335144. PMID  2479917 . 
  19. ^ Piétu G, Mariage-Samson R, Fayein NA, Matingou C, Eveno E, Houlgatte R, Decraene C, Vandenbrouck Y, Tahi F, Devignes MD, Wirkner U, Ansorge W, Cox D, Nagase T, Nomura N, Auffray C (февраль 1999 г.). «База знаний Genexpress IMAGE транскриптома человеческого мозга: прототип интегрированного ресурса для функциональной и вычислительной геномики». Genome Research . 9 (2): 195–209. doi :10.1101/gr.9.2.195. PMC 310711 . PMID  10022985. 
  20. ^ Велкулеску В.Е., Чжан Л., Чжоу В., Фогельштейн Дж., Басрай М.А., Бассетт Д.Е., Хитер П., Фогельштейн Б., Кинцлер К.В. (январь 1997 г.). «Характеристика транскриптома дрожжей». Клетка . 88 (2): 243–51. дои : 10.1016/S0092-8674(00)81845-0 . PMID  9008165. S2CID  11430660.
  21. ^ abcd Velculescu VE, Zhang L, Vogelstein B, Kinzler KW (октябрь 1995 г.). "Серийный анализ экспрессии генов". Science . 270 (5235): 484–7. Bibcode :1995Sci...270..484V. doi :10.1126/science.270.5235.484. PMID  7570003. S2CID  16281846.
  22. ^ Audic S, Claverie JM (октябрь 1997 г.). «Значение цифровых профилей экспрессии генов». Genome Research . 7 (10): 986–95. doi : 10.1101/gr.7.10.986 . PMID  9331369.
  23. ^ abcdef Mantione KJ, Kream RM, Kuzelova H, Ptacek R, Raboch J, Samuel JM, Stefano GB (август 2014 г.). «Сравнение методов биоинформатического профилирования экспрессии генов: микрочипы и РНК-Seq». Medical Science Monitor Basic Research . 20 : 138–42. doi :10.12659/MSMBR.892101. PMC 4152252. PMID  25149683 . 
  24. ^ Zhao S, Fung-Leung WP, Bittner A, Ngo K, Liu X (2014). "Сравнение РНК-Seq и микрочипов в профилировании транскриптома активированных Т-клеток". PLOS ONE . 9 (1): e78644. Bibcode : 2014PLoSO...978644Z. doi : 10.1371/journal.pone.0078644 . PMC 3894192. PMID  24454679 . 
  25. ^ ab Hashimshony T, Wagner F, Sher N, Yanai I (сентябрь 2012 г.). "CEL-Seq: одноклеточное РНК-Seq с помощью мультиплексной линейной амплификации". Cell Reports . 2 (3): 666–73. doi : 10.1016/j.celrep.2012.08.003 . PMID  22939981.
  26. ^ Стирс Р. Л., Геттс Р. К., Гулланс С. Р. (август 2000 г.). «Новая чувствительная система обнаружения для микрочипов высокой плотности с использованием технологии дендримеров». Physiological Genomics . 3 (2): 93–9. doi :10.1152/physiolgenomics.2000.3.2.93. PMID  11015604.
  27. ^ abcdef Illumina (2011-07-11). "Сравнение данных РНК-Seq с микрочипами экспрессии генов" (PDF) . European Pharmaceutical Review.
  28. ^ ab Black MB, Parks BB, Pluta L, Chu TM, Allen BC, Wolfinger RD, Thomas RS (февраль 2014 г.). «Сравнение микрочипов и РНК-секвенирования для анализа экспрессии генов в экспериментах по дозозависимому ответу». Toxicological Sciences . 137 (2): 385–403. doi :10.1093/toxsci/kft249. PMID  24194394.
  29. ^ Marioni JC, Mason CE, Mane SM, Stephens M, Gilad Y (сентябрь 2008 г.). «РНК-секвенирование: оценка технической воспроизводимости и сравнение с массивами экспрессии генов». Genome Research . 18 (9): 1509–17. doi :10.1101/gr.079558.108. PMC 2527709 . PMID  18550803. 
  30. ^ Консорциум SEQC/MAQC-III (сентябрь 2014 г.). «Комплексная оценка точности, воспроизводимости и информационного содержания РНК-секвенирования Консорциумом по контролю качества секвенирования». Nature Biotechnology . 32 (9): 903–14. doi :10.1038/nbt.2957. PMC 4321899 . PMID  25150838. 
  31. ^ Chen JJ, Hsueh HM, Delongchamp RR, Lin CJ, Tsai CA (октябрь 2007 г.). «Воспроизводимость данных микрочипов: дальнейший анализ данных контроля качества микрочипов (MAQC)». BMC Bioinformatics . 8 : 412. doi : 10.1186/1471-2105-8-412 . PMC 2204045 . PMID  17961233. 
  32. ^ Larkin JE, Frank BC, Gavras H, Sultana R, Quackenbush J (май 2005 г.). «Независимость и воспроизводимость на платформах микрочипов». Nature Methods . 2 (5): 337–44. doi :10.1038/nmeth757. PMID  15846360. S2CID  16088782.
  33. ^ ab Nelson NJ (апрель 2001 г.). «Микрочипы прибыли: инструмент экспрессии генов созревает». Журнал Национального института рака . 93 (7): 492–4. doi :10.1093/jnci/93.7.492. PMID  11287436.
  34. ^ Schena M, Shalon D, Davis RW, Brown PO (октябрь 1995 г.). «Количественный мониторинг паттернов экспрессии генов с помощью комплементарного ДНК-микрочипа». Science . 270 (5235): 467–70. Bibcode :1995Sci...270..467S. doi :10.1126/science.270.5235.467. PMID  7569999. S2CID  6720459.
  35. ^ ab Pozhitkov AE, Tautz D, Noble PA (июнь 2007 г.). «Олигонуклеотидные микроматрицы: широко применяются — плохо понимаются». Briefings in Functional Genomics & Proteomics . 6 (2): 141–8. doi : 10.1093/bfgp/elm014 . hdl : 11858/00-001M-0000-000F-D7B3-3 . PMID  17644526.
  36. ^ abc Heller MJ (2002). «Технология ДНК-микрочипов: устройства, системы и приложения». Annual Review of Biomedical Engineering . 4 : 129–53. doi :10.1146/annurev.bioeng.4.020702.153438. PMID  12117754.
  37. ^ McLachlan GJ, Do KA , Ambroise C (2005). Анализ данных экспрессии генов с помощью микрочипов . Hoboken: John Wiley & Sons. ISBN 978-0-471-72612-8.[ нужна страница ]
  38. ^ Brenner S, Johnson M, Bridgham J, Golda G, Lloyd DH, Johnson D, Luo S, McCurdy S, Foy M, Ewan M, Roth R, George D, Eletr S, Albrecht G, Vermaas E, Williams SR, Moon K, Burcham T, Pallas M, DuBridge RB, Kirchner J, Fearon K, Mao J, Corcoran K (июнь 2000 г.). "Анализ экспрессии генов методом массивного параллельного секвенирования сигнатур (MPSS) на микроматрицах". Nature Biotechnology . 18 (6): 630–4. doi :10.1038/76469. PMID  10835600. S2CID  13884154.
  39. ^ Meyers BC, Vu TH, Tej SS, Ghazal H, Matvienko M, Agrawal V, Ning J, Haudenschild CD (август 2004 г.). «Анализ транскрипционной сложности Arabidopsis thaliana методом массивного параллельного секвенирования сигнатур». Nature Biotechnology . 22 (8): 1006–11. doi :10.1038/nbt992. PMID  15247925. S2CID  15336496.
  40. ^ ab Bainbridge MN, Warren RL, Hirst M, Romanuik T, Zeng T, Go A, Delaney A, Griffith M, Hickenbotham M, Magrini V, Mardis ER, Sadar MD, Siddiqui AS, Marra MA, Jones SJ (сентябрь 2006 г.). "Анализ транскриптома линии клеток рака простаты LNCaP с использованием подхода секвенирования через синтез". BMC Genomics . 7 : 246. doi : 10.1186/1471-2164-7-246 . PMC 1592491 . PMID  17010196. 
  41. ^ Mortazavi A, Williams BA, McCue K, Schaeffer L, Wold B (июль 2008 г.). «Картирование и количественная оценка транскриптомов млекопитающих с помощью РНК-Seq». Nature Methods . 5 (7): 621–8. doi :10.1038/nmeth.1226. PMID  18516045. S2CID  205418589.
  42. ^ Wilhelm BT, Marguerat S, Watt S, Schubert F, Wood V, Goodhead I, Penkett CJ, Rogers J, Bähler J (июнь 2008 г.). «Динамический репертуар эукариотического транскриптома, исследованный с разрешением по одному нуклеотиду». Nature . 453 (7199): 1239–43. Bibcode :2008Natur.453.1239W. doi :10.1038/nature07002. PMID  18488015. S2CID  205213499.
  43. ^ Султан М, Шульц МХ, Ричард Х, Маген А, Клингенхофф А, Шерф М, Сейферт М, Бородина Т, Солдатов А, Пархомчук Д, Шмидт Д, О'Кифф С, Хаас С, Вингрон М, Лехрах Х, Яспо МЛ (август 2008 г.). «Глобальный взгляд на активность генов и альтернативный сплайсинг с помощью глубокого секвенирования человеческого транскриптома». Science . 321 (5891): 956–60. Bibcode :2008Sci...321..956S. doi :10.1126/science.1160342. PMID  18599741. S2CID  10013179.
  44. ^ ab Chomczynski P, Sacchi N (апрель 1987 г.). «Одношаговый метод выделения РНК с помощью экстракции тиоцианатом гуанидиния-фенолом-хлороформом». Аналитическая биохимия . 162 (1): 156–9. doi :10.1016/0003-2697(87)90021-2. PMID  2440339.
  45. ^ ab Chomczynski P, Sacchi N (2006). «Одношаговый метод выделения РНК с помощью экстракции тиоцианатом гуанидиния-фенолом-хлороформом: двадцать с чем-то лет спустя». Nature Protocols . 1 (2): 581–5. doi :10.1038/nprot.2006.83. PMID  17406285. S2CID  28653075.
  46. ^ Grillo M, Margolis FL (сентябрь 1990 г.). «Использование полимеразной цепной реакции с обратной транскриптазой для мониторинга экспрессии генов без интронов». BioTechniques . 9 (3): 262, 264, 266–8. PMID  1699561.
  47. ^ Брайант С., Мэннинг Д. Л. (1998). "Выделение РНК-мессенджера". Протоколы выделения и характеристики РНК . Методы в молекулярной биологии. Т. 86. С. 61–4. doi :10.1385/0-89603-494-1:61. ISBN 978-0-89603-494-5. PMID  9664454.
  48. ^ Zhao W, He X, Hoadley KA, Parker JS, Hayes DN, Perou CM (июнь 2014 г.). «Сравнение РНК-Seq с помощью захвата поли (A), истощения рибосомной РНК и микрочипа ДНК для профилирования экспрессии». BMC Genomics . 15 (1): 419. doi : 10.1186/1471-2164-15-419 . PMC 4070569 . PMID  24888378. 
  49. ^ Некоторые примеры образцов окружающей среды включают: морскую воду, почву или воздух.
  50. ^ Close TJ, Wanamaker SI, Caldo RA, Turner SM, Ashlock DA, Dickerson JA, Wing RA, Muehlbauer GJ, Kleinhofs A, Wise RP (март 2004 г.). «Новый ресурс для геномики злаков: 22K ячменный GeneChip достигает зрелости». Физиология растений . 134 (3): 960–8. doi :10.1104/pp.103.034462. PMC 389919. PMID  15020760 . 
  51. ^ abcde Lowe R, Shirley N, Bleackley M, Dolan S, Shafee T (май 2017 г.). «Транскриптомные технологии». PLOS Computational Biology . 13 (5): e1005457. Bibcode : 2017PLSCB..13E5457L. doi : 10.1371/journal.pcbi.1005457 . PMC 5436640. PMID  28545146 . 
  52. ^ ab Shiraki T, Kondo S, Katayama S, Waki ​​K, Kasukawa T, Kawaji H, Kodzius R, Watahiki A, Nakamura M, Arakawa T, Fukuda S, Sasaki D, Podhajska A, Harbers M, Kawai J, Carninci P, Hayashizaki Y (декабрь 2003 г.). "Анализ экспрессии генов с помощью кэпа для высокопроизводительного анализа начальной точки транскрипции и идентификации использования промотора". Труды Национальной академии наук Соединенных Штатов Америки . 100 (26): 15776–81. Bibcode : 2003PNAS..10015776S. doi : 10.1073/pnas.2136655100 . PMC 307644. PMID  14663149 . 
  53. ^ Романов В., Давидофф С. Н., Майлз А. Р., Грейнджер Д. В., Гейл Б. К., Брукс Б. Д. (март 2014 г.). «Критическое сравнение технологий изготовления белковых микрочипов». The Analyst . 139 (6): 1303–26. Bibcode :2014Ana...139.1303R. doi :10.1039/c3an01577g. PMID  24479125.
  54. ^ ab Barbulovic-Nad I, Lucente M, Sun Y, Zhang M, Wheeler AR, Bussmann M (2006-10-01). "Методы изготовления биомикрочипов — обзор". Critical Reviews in Biotechnology . 26 (4): 237–59. CiteSeerX 10.1.1.661.6833 . doi :10.1080/07388550600978358. PMID  17095434. S2CID  13712888. 
  55. ^ Auburn RP, Kreil DP, Meadows LA, Fischer B, Matilla SS, Russell S (июль 2005 г.). «Роботизированное обнаружение микрочипов кДНК и олигонуклеотидов». Trends in Biotechnology . 23 (7): 374–9. doi :10.1016/j.tibtech.2005.04.002. PMID  15978318.
  56. ^ Shalon D, Smith SJ, Brown PO (июль 1996 г.). «Система ДНК-микрочипов для анализа сложных образцов ДНК с использованием гибридизации двухцветных флуоресцентных зондов». Genome Research . 6 (7): 639–45. doi : 10.1101/gr.6.7.639 . PMID  8796352.
  57. ^ Lockhart DJ, Dong H, Byrne MC, Follettie MT, Gallo MV, Chee MS, Mittmann M, Wang C, Kobayashi M, Horton H, Brown EL (декабрь 1996 г.). «Мониторинг экспрессии путем гибридизации с массивами олигонуклеотидов высокой плотности». Nature Biotechnology . 14 (13): 1675–80. doi :10.1038/nbt1296-1675. PMID  9634850. S2CID  35232673.
  58. ^ Irizarry RA, Bolstad BM, Collin F, Cope LM, Hobbs B, Speed ​​TP (февраль 2003 г.). «Резюме данных уровня зонда Affymetrix GeneChip». Nucleic Acids Research . 31 (4): 15e–15. doi :10.1093/nar/gng015. PMC 150247. PMID  12582260 . 
  59. ^ Selzer RR, Richmond TA, Pofahl NJ, Green RD, Eis PS, Nair P, Brothman AR, Stallings RL (ноябрь 2005 г.). «Анализ точек разрыва хромосом в нейробластоме при субкилобазном разрешении с использованием тонкого олигонуклеотидного массива CGH». Гены, хромосомы и рак . 44 (3): 305–19. doi :10.1002/gcc.20243. PMID  16075461. S2CID  39437458.
  60. ^ Свенссон В., Венто-Тормо Р., Тейхманн СА (апрель 2018 г.). «Экспоненциальное масштабирование секвенирования РНК отдельных клеток за последнее десятилетие». Nature Protocols . 13 (4): 599–604. doi :10.1038/nprot.2017.149. PMID  29494575. S2CID  3560001.
  61. ^ Тачибана С (2015-08-18). «Транскриптомика сегодня: микрочипы, РНК-секвенирование и многое другое». Science . 349 (6247): 544. Bibcode :2015Sci...349..544T. doi : 10.1126/science.opms.p1500095 .
  62. ^ ab Nagalakshmi U, Wang Z, Waern K, Shou C, Raha D, Gerstein M, Snyder M (июнь 2008 г.). «Транскрипционный ландшафт генома дрожжей, определенный с помощью секвенирования РНК». Science . 320 (5881): 1344–9. Bibcode :2008Sci...320.1344N. doi :10.1126/science.1158441. PMC 2951732 . PMID  18451266. 
  63. ^ Su Z, Fang H, Hong H, Shi L, Zhang W, Zhang W, Zhang Y, Dong Z, Lancashire LJ, Bessarabova M, Yang X, Ning B, Gong B, Meehan J, Xu J, Ge W, Perkins R, Fischer M, Tong W (декабрь 2014 г.). «Исследование биомаркеров, полученных из устаревших данных микрочипов, для их полезности в эпоху РНК-секвенирования». Genome Biology . 15 (12): 523. doi : 10.1186/s13059-014-0523-y . PMC 4290828 . PMID  25633159. 
  64. ^ Lee JH, Daugharthy ER, Scheiman J, Kalhor R, Yang JL, Ferrante TC, Terry R, ​​Jeanty SS, Li C, Amamoto R, Peters DT, Turczyk BM, Marblestone AH, Inverso SA, Bernard A, Mali P, Rios X, Aach J, Church GM (март 2014 г.). «Высокомультиплексное субклеточное секвенирование РНК in situ». Science . 343 (6177): 1360–3. Bibcode :2014Sci...343.1360L. doi :10.1126/science.1250212. PMC 4140943 . PMID  24578530. 
  65. ^ ab Shendure J, Ji H (октябрь 2008 г.). «Секвенирование ДНК следующего поколения». Nature Biotechnology . 26 (10): 1135–45. doi :10.1038/nbt1486. ​​PMID  18846087. S2CID  6384349.
  66. ^ Lahens NF, Kavakli IH, Zhang R, Hayer K, Black MB, Dueck H, Pizarro A, Kim J, Irizarry R, ​​Thomas RS, Grant GR, Hogenesch JB (июнь 2014 г.). "IVT-seq обнаруживает экстремальную предвзятость в секвенировании РНК". Genome Biology . 15 (6): R86. doi : 10.1186/gb-2014-15-6-r86 . PMC 4197826 . PMID  24981968. 
  67. ^ ab Knierim E, Lucke B, Schwarz JM, Schuelke M, Seelow D (2011). "Систематическое сравнение трех методов фрагментации продуктов ПЦР дальнего действия для секвенирования следующего поколения". PLOS ONE . ​​6 (11): e28240. Bibcode :2011PLoSO...628240K. doi : 10.1371/journal.pone.0028240 . PMC 3227650 . PMID  22140562. 
  68. ^ Routh A, Head SR, Ordoukhanian P, Johnson JE (август 2015 г.). «ClickSeq: свободное от фрагментации секвенирование следующего поколения с помощью клик-лигирования адаптеров к стохастически терминированным 3'-азидо кДНК». Журнал молекулярной биологии . 427 (16): 2610–6. doi : 10.1016/j.jmb.2015.06.011. PMC 4523409. PMID 26116762  . 
  69. ^ Parekh S, Ziegenhain C, Vieth B, Enard W, Hellmann I (май 2016 г.). "Влияние амплификации на анализ дифференциальной экспрессии с помощью РНК-секвенирования". Scientific Reports . 6 : 25533. Bibcode :2016NatSR...625533P. doi :10.1038/srep25533. PMC 4860583 . PMID  27156886. 
  70. ^ Shanker S, Paulson A, Edenberg HJ, Peak A, Perera A, Alekseyev YO, Beckloff N, Bivens NJ, Donnelly R, Gillaspy AF, Grove D, Gu W, Jafari N, Kerley-Hamilton JS, Lyons RH, Tepper C, Nicolet CM (апрель 2015 г.). «Оценка коммерчески доступных наборов для амплификации РНК для секвенирования РНК с использованием очень низких входных количеств общей РНК». Journal of Biomolecular Techniques . 26 (1): 4–18. doi :10.7171/jbt.15-2601-001. PMC 4310221 . PMID  25649271. 
  71. ^ Jiang L, Schlesinger F, Davis CA, Zhang Y, Li R, Salit M, Gingeras TR, Oliver B (сентябрь 2011 г.). «Синтетические стандарты внесения для экспериментов по секвенированию РНК». Genome Research . 21 (9): 1543–51. doi :10.1101/gr.121095.111. PMC 3166838 . PMID  21816910. 
  72. ^ Kivioja T, Vähärautio A, Karlsson K, Bonke M, Enge M, Linnarsson S, Taipale J (ноябрь 2011 г.). «Подсчет абсолютного числа молекул с использованием уникальных молекулярных идентификаторов». Nature Methods . 9 (1): 72–4. doi :10.1038/nmeth.1778. PMID  22101854. S2CID  39225091.
  73. ^ Tang F, Barbacioru C, Wang Y, Nordman E, Lee C, Xu N, Wang X, Bodeau J, Tuch BB, Siddiqui A, Lao K, Surani MA (май 2009 г.). "mRNA-Seq анализ всего транскриптома отдельной клетки". Nature Methods . 6 (5): 377–82. doi :10.1038/nmeth.1315. PMID  19349980. S2CID  16570747.
  74. ^ Ислам С., Цайсель А., Йост С., Ла Манно Г., Заяц П., Каспер М., Лённерберг П., Линнарссон С. (февраль 2014 г.). «Количественное секвенирование РНК отдельных клеток с уникальными молекулярными идентификаторами». Nature Methods . 11 (2): 163–6. doi :10.1038/nmeth.2772. PMID  24363023. S2CID  6765530.
  75. ^ Jaitin DA, Kenigsberg E, Keren-Shaul H, Elefant N, Paul F, Zaretsky I, Mildner A, Cohen N, Jung S, Tanay A, Amit I (февраль 2014 г.). «Массовое параллельное секвенирование РНК отдельных клеток для безмаркерного разложения тканей на типы клеток». Science . 343 (6172): 776–9. Bibcode :2014Sci...343..776J. doi :10.1126/science.1247651. PMC 4412462 . PMID  24531970. 
  76. ^ ab Levin JZ, Yassour M, Adiconis X, Nusbaum C, Thompson DA, Friedman N, Gnirke A, Regev A (сентябрь 2010 г.). «Комплексный сравнительный анализ методов секвенирования РНК, специфичных для определенной цепи». Nature Methods . 7 (9): 709–15. doi :10.1038/nmeth.1491. PMC 3005310 . PMID  20711195. 
  77. ^ Quail MA, Smith M, Coupland P, Otto TD, Harris SR, Connor TR, Bertoni A, Swerdlow HP, Gu Y (июль 2012 г.). «Рассказ о трех платформах секвенирования следующего поколения: сравнение секвенаторов Ion Torrent, Pacific Biosciences и Illumina MiSeq». BMC Genomics . 13 : 341. doi : 10.1186/1471-2164-13-341 . PMC 3431227 . PMID  22827831. 
  78. ^ ab Liu L, Li Y, Li S, Hu N, He Y, Pong R, Lin D, Lu L, Law M (2012). "Сравнение систем секвенирования следующего поколения". Журнал биомедицины и биотехнологии . 2012 : 251364. doi : 10.1155/2012/251364 . PMC 3398667. PMID  22829749 . 
  79. ^ "SRA" . Получено 2016-10-06 .Поиск в архиве считывания последовательностей NCBI (SRA) проводился с использованием «RNA-Seq[стратегия]» и одной из «LS454[платформа]», «Illumina[платформа]», «ABI Solid[платформа]», «Ion Torrent[платформа]», «PacBio SMRT»[платформа]» для отчета о количестве запусков RNA-Seq, сохраненных для каждой платформы.
  80. ^ Loman NJ, Misra RV, Dallman TJ, Constantinidou C, Gharbia SE, Wain J, Pallen MJ (май 2012 г.). «Сравнение производительности настольных платформ высокопроизводительного секвенирования». Nature Biotechnology . 30 (5): 434–9. doi :10.1038/nbt.2198. PMID  22522955. S2CID  5300923.
  81. ^ Goodwin S, McPherson JD, McCombie WR (май 2016 г.). «Совершеннолетие: десять лет технологий секвенирования следующего поколения». Nature Reviews Genetics . 17 (6): 333–51. doi :10.1038/nrg.2016.49. PMC 10373632. PMID 27184599.  S2CID 8295541  . 
  82. ^ Гаральде Д.Р., Снелл Э.А., Яхимович Д., Сипос Б., Ллойд Дж.Х., Брюс М., Пантич Н., Адмассу Т., Джеймс П., Варланд А., Джордан М., Чикконе Дж., Серра С., Кинан Дж., Мартин С., Макнил Л., Уоллес Э.Дж., Джаясингхе Л., Райт С., Бласко Дж., Янг С., Броклебанк Д., Юул С., Кларк Дж., Херон Эй.Дж., Тернер DJ (март 2018 г.). «Высокопараллельное прямое секвенирование РНК на массиве нанопор». Природные методы . 15 (3): 201–206. дои : 10.1038/nmeth.4577. PMID  29334379. S2CID  3589823.
  83. ^ Loman NJ, Quick J, Simpson JT (август 2015 г.). «Полный бактериальный геном, собранный de novo с использованием только данных нанопорового секвенирования». Nature Methods . 12 (8): 733–5. doi :10.1038/nmeth.3444. PMID  26076426. S2CID  15053702.
  84. ^ Ozsolak F, Platt AR, Jones DR, Reifenberger JG, Sass LE, McInerney P, Thompson JF, Bowers J, Jarosz M, Milos PM (октябрь 2009 г.). «Прямое секвенирование РНК». Nature . 461 (7265): 814–8. Bibcode :2009Natur.461..814O. doi :10.1038/nature08390. PMID  19776739. S2CID  4426760.
  85. ^ ab Hart SN, Therneau TM, Zhang Y, Poland GA, Kocher JP (декабрь 2013 г.). «Вычисление оценок размера выборки для данных секвенирования РНК». Журнал вычислительной биологии . 20 (12): 970–8. doi :10.1089/cmb.2012.0283. PMC 3842884. PMID  23961961 . 
  86. ^ abc Конеса А, Мадригал П, Таразона С, Гомес-Кабреро Д, Сервера А, Макферсон А, Щесняк М.В., Гаффни DJ, Эло ЛЛ, Чжан X, Мортазави А (январь 2016 г.). «Обзор лучших практик анализа данных секвенирования РНК». Геномная биология . 17:13 . дои : 10.1186/s13059-016-0881-8 . ПМЦ 4728800 . ПМИД  26813401. 
  87. ^ ab Рапапорт Ф., Ханин Р., Лян Ю., Пирун М., Крек А., Зумбо П., Мейсон CE, Соччи Н.Д., Бетель Д. (2013). «Комплексная оценка методов анализа дифференциальной экспрессии генов для данных секвенирования РНК». Геномная биология . 14 (9): 95 рандов. дои : 10.1186/gb-2013-14-9-r95 . ПМЦ 4054597 . ПМИД  24020486. 
  88. ^ Консорциум проекта ENCODE; Олдред, Шелли Ф.; Коллинз, Патрик Дж.; Дэвис, Кэрри А.; Дойл, Фрэнсис; Эпштейн, Чарльз Б.; Фритце, Сет; Харроу, Дженнифер; Кауль, Раджиндер; Хатун, Джейнаб; Ладжуа, Брайан Р.; Ландт, Стивен Г.; Ли, Бум-Кью; Паули, Флоренсия; Розенблум, Кейт Р.; Сабо, Питер; Сафи, Алексиас; Саньял, Амартья; Шореш, Ноам; Саймон, Джереми М.; Сонг, Линъюнь; Альтшулер, Роберт К.; Бирни, Эван; Браун, Джеймс Б.; Ченг, Чао; Джебали, Сара; Донг, Сяньцзюнь; Данхэм, Ян; Эрнст, Джейсон; и др. (сентябрь 2012 г.). «Интегрированная энциклопедия элементов ДНК в геноме человека». Nature . 489 (7414): 57–74. Bibcode :2012Natur.489...57T. doi :10.1038/nature11247. PMC 3439153 . PMID  22955616. 
  89. ^ Sloan CA, Chan ET, Davidson JM, Malladi VS, Strattan JS, Hitz BC и др. (январь 2016 г.). «Данные ENCODE на портале ENCODE». Nucleic Acids Research . 44 (D1): D726–32. doi :10.1093/nar/gkv1160. PMC 4702836. PMID 26527727  . 
  90. ^ "ENCODE: Энциклопедия элементов ДНК". encodeproject.org .
  91. ^ ab Thind AS, Monga I, Thakur PK, Kumari P, Dindhoria K, Krzak M, Ranson M, Ashford B (ноябрь 2021 г.). «Демистификация новых приложений bulk RNA-Seq: применение и полезность биоинформатической методологии». Briefings in Bioinformatics . 22 (6). doi :10.1093/bib/bbab259. PMID  34329375.
  92. ^ ab Ritchie ME, Phipson B, Wu D, Hu Y, Law CW, Shi W, Smyth GK (апрель 2015 г.). "limma обеспечивает дифференциальный анализ экспрессии для РНК-секвенирования и исследований микрочипов". Nucleic Acids Research . 43 (7): e47. doi :10.1093/nar/gkv007. PMC 4402510. PMID  25605792. 
  93. ^ ab Robinson MD, McCarthy DJ, Smyth GK (январь 2010 г.). "edgeR: пакет Bioconductor для анализа дифференциальной экспрессии цифровых данных по экспрессии генов". Биоинформатика . 26 (1): 139–40. doi :10.1093/bioinformatics/btp616. PMC 2796818. PMID  19910308 . 
  94. ^ ab Huber W, Carey VJ, Gentleman R, Anders S, Carlson M, Carvalho BS, et al. (Февраль 2015). «Организация высокопроизводительного геномного анализа с помощью Bioconductor». Nature Methods . 12 (2): 115–21. doi :10.1038/nmeth.3252. PMC 4509590 . PMID  25633503. 
  95. ^ Смит, Г. К. (2005). «Лимма: линейные модели для данных микрочипов». Решения в области биоинформатики и вычислительной биологии с использованием R и Bioconductor . Статистика для биологии и здравоохранения. Springer, Нью-Йорк, штат Нью-Йорк. С. 397–420. CiteSeerX 10.1.1.361.8519 . doi :10.1007/0-387-29362-0_23. ISBN  9780387251462.
  96. ^ Стив., Рассел (2008). Технология микрочипов на практике . Медоуз, Лиза А. Берлингтон: Elsevier. ISBN 9780080919768. OCLC  437246554.
  97. ^ ab Haas BJ, Papanicolaou A, Yassour M, Grabherr M, Blood PD, Bowden J, Couger MB, Eccles D, Li B, Lieber M, MacManes MD, Ott M, Orvis J, Pochet N, Strozzi F, Weeks N, Westerman R, William T, Dewey CN, Henschel R, LeDuc RD, Friedman N, Regev A (август 2013 г.). «Реконструкция последовательности транскриптов de novo из РНК-секвенирования с использованием платформы Trinity для генерации и анализа ссылок». Nature Protocols . 8 (8): 1494–512. doi :10.1038/nprot.2013.084. PMC 3875132 . PMID  23845962. 
  98. ^ ab Pertea M, Pertea GM, Antonescu CM, Chang TC, Mendell JT, Salzberg SL (март 2015 г.). «StringTie позволяет улучшить реконструкцию транскриптома с помощью прочтений РНК-секвенирования». Nature Biotechnology . 33 (3): 290–5. doi :10.1038/nbt.3122. PMC 4643835 . PMID  25690850. 
  99. ^ Кодама Y, Шамвэй M, Лейнонен R (январь 2012 г.). «Архив прочтений последовательностей: взрывной рост данных секвенирования». Nucleic Acids Research . 40 (выпуск базы данных): D54–6. doi :10.1093/nar/gkr854. PMC 3245110. PMID  22009675 . 
  100. ^ ab Edgar R, Domrachev M, Lash AE (январь 2002 г.). "Gene Expression Omnibus: хранилище данных по экспрессии генов и гибридизации NCBI". Nucleic Acids Research . 30 (1): 207–10. doi :10.1093/nar/30.1.207. PMC 99122 . PMID  11752295. 
  101. ^ Петров А, Шамс С (2004-11-01). «Обработка изображений микроматриц и контроль качества». Журнал «Системы обработки сигналов СБИС для технологий сигналов, изображений и видео» . 38 (3): 211–226. doi :10.1023/B:VLSI.0000042488.08307.ad. S2CID  31598448.
  102. ^ Петров А, Шамс С (2004). «Обработка изображений микроматриц и контроль качества». Журнал VLSI Signal Processing-Systems for Signal, Image, and Video Technology . 38 (3): 211–226. doi :10.1023/B:VLSI.0000042488.08307.ad. S2CID  31598448.
  103. ^ Kwon YM, Ricke S (2011). Высокопроизводительное секвенирование следующего поколения . Методы в молекулярной биологии. Том 733. SpringerLink. doi :10.1007/978-1-61779-089-8. ISBN 978-1-61779-088-1. S2CID  3684245.
  104. ^ Nakamura K, Oshima T, Morimoto T, Ikeda S, Yoshikawa H, Shiwa Y, Ishikawa S, Linak MC, Hirai A, Takahashi H, Altaf-Ul-Amin M, Ogasawara N, Kanaya S (июль 2011 г.). "Профиль ошибок, специфичный для последовательности, секвенаторов Illumina". Nucleic Acids Research . 39 (13): e90. doi :10.1093/nar/gkr344. PMC 3141275. PMID  21576222 . 
  105. ^ Van Verk MC, Hickman R, Pieterse CM, Van Wees SC (апрель 2013 г.). «RNA-Seq: открытие посланников». Trends in Plant Science . 18 (4): 175–9. doi :10.1016/j.tplants.2013.02.001. hdl : 1874/309456 . PMID  23481128. S2CID  205453732.
  106. ^ Эндрюс С. (2010). "FastQC: инструмент контроля качества для высокопроизводительных данных последовательностей". Babraham Bioinformatics . Получено 23.05.2017 .
  107. ^ Lo CC, Chain PS (ноябрь 2014 г.). «Быстрая оценка и контроль качества данных секвенирования следующего поколения с помощью FaQCs». BMC Bioinformatics . 15 (1): 366. doi : 10.1186/s12859-014-0366-2 . PMC 4246454. PMID  25408143 . 
  108. ^ abc Trapnell C, Hendrickson DG, Sauvageau M, Goff L, Rinn JL, Pachter L (январь 2013 г.). «Дифференциальный анализ регуляции генов при разрешении транскриптов с помощью РНК-секвенирования». Nature Biotechnology . 31 (1): 46–53. doi :10.1038/nbt.2450. PMC 3869392 . PMID  23222703. 
  109. ^ ab Xie Y, Wu G, Tang J, Luo R, Patterson J, Liu S, Huang W, He G, Gu S, Li S, Zhou X, Lam TW, Li Y, Xu X, Wong GK, Wang J (июнь 2014 г.). "SOAPdenovo-Trans: de novo сборка транскриптома с короткими прочтениями РНК-Seq". Биоинформатика . 30 (12): 1660–6. arXiv : 1305.6760 . doi : 10.1093/bioinformatics/btu077. PMID  24532719. S2CID  5152689.
  110. ^ Siadjeu, Christian; Mayland-Quellhorst, Eike; Pande, Shruti; Laubinger, Sascha; Albach, Dirk C. (2021). «Транскриптомная последовательность выявляет гены-кандидаты, участвующие в закалке после сбора урожая трехлистного ямса Dioscorea dumetorum». Растения . 10 (4): 787. doi : 10.3390/plants10040787 . PMC 8074181. PMID  33923758 . 
  111. ^ Картографы HTS. http://www.ebi.ac.uk/~nf/hts_mappers/
  112. ^ Fonseca NA, Rung J, Brazma A, Marioni JC (декабрь 2012 г.). «Инструменты для картирования данных высокопроизводительного секвенирования». Биоинформатика . 28 (24): 3169–77. doi : 10.1093/bioinformatics/bts605 . PMID  23060614.
  113. ^ Trapnell C, Pachter L, Salzberg SL (май 2009). "TopHat: обнаружение сплайс-соединений с помощью RNA-Seq". Биоинформатика . 25 (9): 1105–11. doi :10.1093/bioinformatics/btp120. PMC 2672628. PMID  19289445 . 
  114. ^ ab Trapnell C, Williams BA, Pertea G, Mortazavi A, Kwan G, van Baren MJ, Salzberg SL, Wold BJ, Pachter L (май 2010 г.). «Сборка и количественная оценка транскриптов с помощью РНК-Seq выявляет неаннотированные транскрипты и переключение изоформ во время дифференциации клеток». Nature Biotechnology . 28 (5): 511–5. doi :10.1038/nbt.1621. PMC 3146043 . PMID  20436464. 
  115. ^ Miller JR, Koren S, Sutton G (июнь 2010 г.). «Алгоритмы сборки для данных секвенирования следующего поколения». Genomics . 95 (6): 315–27. doi :10.1016/j.ygeno.2010.03.001. PMC 2874646 . PMID  20211242. 
  116. ^ O'Neil ST, Emrich SJ (июль 2013 г.). «Оценка метрик сборки транскриптома De Novo для согласованности и полезности». BMC Genomics . 14 : 465. doi : 10.1186/1471-2164-14-465 . PMC 3733778. PMID  23837739 . 
  117. ^ Смит-Унна Р., Бурснелл К., Патро Р., Хибберд Дж. М., Келли С. (август 2016 г.). «TransRate: безреферентная оценка качества сборок транскриптома de novo». Genome Research . 26 (8): 1134–44. doi :10.1101/gr.196469.115. PMC 4971766. PMID  27252236 . 
  118. ^ Ли Б., Филлмор Н., Бай Ю., Коллинз М., Томсон Дж.А., Стюарт Р., Дьюи С.Н. (декабрь 2014 г.). «Оценка сборок транскриптома de novo на основе данных RNA-Seq». Геномная биология . 15 (12): 553. дои : 10.1186/s13059-014-0553-5 . ПМК 4298084 . ПМИД  25608678. 
  119. ^ Zerbino DR, Birney E (май 2008). «Velvet: алгоритмы для сборки коротких прочтений de novo с использованием графов де Брейна». Genome Research . 18 (5): 821–9. doi :10.1101/gr.074492.107. PMC 2336801. PMID 18349386  . 
  120. ^ Schulz MH, Zerbino DR, Vingron M, Birney E (апрель 2012 г.). «Оазисы: надежная сборка de novo РНК-секвенирования в динамическом диапазоне уровней экспрессии». Биоинформатика . 28 (8): 1086–92. doi :10.1093/bioinformatics/bts094. PMC 3324515. PMID  22368243 . 
  121. ^ Robertson G, Schein J, Chiu R, Corbett R, Field M, Jackman SD и др. (ноябрь 2010 г.). «Сборка de novo и анализ данных РНК-секвенирования». Nature Methods . 7 (11): 909–12. doi :10.1038/nmeth.1517. hdl : 1885/51040 . PMID  20935650. S2CID  1034682.
  122. ^ ab Grabherr MG, Haas BJ, Yassour M, Levin JZ, Thompson DA, Amit I, Adiconis X, Fan L, Raychowdhury R, ​​Zeng Q, Chen Z, Mauceli E, Hacohen N, Gnirke A, Rhind N, di Palma F, Birren BW, Nusbaum C, Lindblad-Toh K, Friedman N, Regev A (май 2011 г.). "Сборка полноразмерного транскриптома из данных RNA-Seq без референсного генома". Nature Biotechnology . 29 (7): 644–52. doi :10.1038/nbt.1883. PMC 3571712 . PMID  21572440. 
  123. ^ Chevreux B, Pfisterer T, Drescher B, Driesel AJ, Müller WE, Wetter T, Suhai S (июнь 2004 г.). «Использование ассемблера miraEST для надежной и автоматизированной сборки транскриптов мРНК и обнаружения однонуклеотидных полиморфизмов в секвенированных EST». Genome Research . 14 (6): 1147–59. doi :10.1101/gr.1917404. PMC 419793 . PMID  15140833. 
  124. ^ Маргулис М., Эгхольм М., Альтман В.Е., Аттия С., Бадер Дж.С., Бембен Л.А. и др. (сентябрь 2005 г.). «Секвенирование генома в микропроизводных пиколитровых реакторах высокой плотности». Природа . 437 (7057): 376–80. Бибкод : 2005Natur.437..376M. дои : 10.1038/nature03959. ПМЦ 1464427 . ПМИД  16056220. 
  125. ^ Kumar S, Blaxter ML (октябрь 2010 г.). «Сравнение ассемблеров de novo для данных транскриптома 454». BMC Genomics . 11 : 571. doi : 10.1186/1471-2164-11-571 . PMC 3091720. PMID  20950480 . 
  126. ^ Банкевич А, Нурк С, Антипов Д, Гуревич АА, Дворкин М, Куликов АС, Лесин ВМ, Николенко СИ, Фам С, Пржибельский АД, Пышкин АВ, Сироткин АВ, Вяххи Н, Теслер Г, Алексеев МА, Певзнер ПА (май 2012). "SPAdes: новый алгоритм сборки генома и его применение в секвенировании отдельных клеток". Журнал вычислительной биологии . 19 (5): 455–77. doi :10.1089/cmb.2012.0021. PMC 3342519. PMID  22506599 . 
  127. ^ Li B, Dewey CN (август 2011 г.). «RSEM: точная количественная оценка транскриптов из данных RNA-Seq с референсным геномом или без него». BMC Bioinformatics . 12 : 323. doi : 10.1186/1471-2105-12-323 . PMC 3163565. PMID  21816040 . 
  128. ^ Ковака, Сэм; Зимин, Алексей В.; Пертеа, Гео М.; Разаги, Рохам; Зальцберг, Стивен Л.; Пертеа, Михаэла (2019-07-08). "Сборка транскриптома из выравниваний длинных РНК-секвенирований с помощью StringTie2". bioRxiv : 694554. doi : 10.1101/694554 . Получено 27 августа 2019 г.
  129. ^ Gehlenborg N, O'Donoghue SI, Baliga NS, Goesmann A, Hibbs MA, Kitano H, Kohlbacher O, Neuweger H, Schneider R, Tenenbaum D, Gavin AC (март 2010 г.). «Визуализация данных омикс для системной биологии». Nature Methods . 7 (3 Suppl): S56–68. doi :10.1038/nmeth.1436. PMID  20195258. S2CID  205419270.
  130. ^ Андерс С., Пайл ПТ., Хубер В. (январь 2015 г.). «HTSeq — фреймворк Python для работы с данными высокопроизводительного секвенирования». Биоинформатика . 31 (2): 166–9. doi :10.1093/bioinformatics/btu638. PMC 4287950. PMID  25260700 . 
  131. ^ Bray NL, Pimentel H, Melsted P, Pachter L (май 2016 г.). «Почти оптимальная вероятностная квантификация РНК-секвенирования». Nature Biotechnology . 34 (5): 525–7. doi :10.1038/nbt.3519. PMID  27043002. S2CID  205282743.
  132. ^ Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R (август 2009 г.). «Формат выравнивания последовательностей/карты и SAMtools». Биоинформатика . 25 (16): 2078–9. doi :10.1093/bioinformatics/btp352. PMC 2723002. PMID  19505943 . 
  133. ^ Love MI, Huber W, Anders S (2014). "Модерируемая оценка кратности изменения и дисперсии для данных РНК-секвенирования с DESeq2". Genome Biology . 15 (12): 550. doi : 10.1186/s13059-014-0550-8 . PMC 4302049. PMID  25516281 . 
  134. ^ Frazee AC, Pertea G, Jaffe AE, Langmead B, Salzberg SL, Leek JT (март 2015 г.). «Ballgown устраняет разрыв между сборкой транскриптома и анализом экспрессии». Nature Biotechnology . 33 (3): 243–6. doi :10.1038/nbt.3172. PMC 4792117 . PMID  25748911. 
  135. ^ Fang Z, Cui X (май 2011). «Проблемы проектирования и проверки в экспериментах по секвенированию РНК». Briefings in Bioinformatics . 12 (3): 280–7. doi : 10.1093/bib/bbr004 . PMID  21498551.
  136. ^ Ramsköld D, Wang ET, Burge CB, Sandberg R (декабрь 2009 г.). «Обилие повсеместно экспрессируемых генов, выявленное с помощью данных о последовательностях транскриптомов тканей». PLOS Computational Biology . 5 (12): e1000598. Bibcode : 2009PLSCB ...5E0598R. doi : 10.1371/journal.pcbi.1000598 . PMC 2781110. PMID  20011106. 
  137. ^ Vandesompele J, De Preter K, Pattyn F, Poppe B, Van Roy N, De Paepe A, Speleman F (июнь 2002 г.). «Точная нормализация количественных данных ОТ-ПЦР в реальном времени путем геометрического усреднения нескольких внутренних контрольных генов». Genome Biology . 3 (7): RESEARCH0034. doi : 10.1186/gb-2002-3-7-research0034 . PMC 126239 . PMID  12184808. 
  138. ^ Core LJ, Waterfall JJ, Lis JT (декабрь 2008 г.). «Nascent RNA sequencing reveals broaden pausing and divergent initiation at human promoters». Science . 322 (5909): 1845–8. Bibcode :2008Sci...322.1845C. doi :10.1126/science.1162228. PMC 2833333 . PMID  19056941. 
  139. ^ Camarena L, Bruno V, Euskirchen G, Poggio S, Snyder M (апрель 2010 г.). «Молекулярные механизмы патогенеза, вызванного этанолом, выявленные с помощью секвенирования РНК». PLOS Pathogens . 6 (4): e1000834. doi : 10.1371/journal.ppat.1000834 . PMC 2848557. PMID  20368969 . 
  140. ^ аб Говинд Г., Харшавардхан В.Т., ТаммеГовда Х.В., Патрисия Дж.К., Калайараси П.Дж., Дханалакшми Р., Айер Д.Р., Сентил Кумар М., Мутаппа С.К., Шринивасулу Н., Несе С., Удаякумар М., Макарла Великобритания (июнь 2009 г.). «Идентификация и функциональная проверка уникального набора генов, вызванных засухой, преимущественно экспрессируемых в ответ на постепенный водный стресс у арахиса». Молекулярная генетика и геномика . 281 (6): 591–605. дои : 10.1007/s00438-009-0432-z. ПМК 2757612 . ПМИД  19224247. 
  141. ^ Тавассоли, Иман; Гольдфарб, Джозеф; Айенгар, Рави (2018-10-04). «Системная биология в учебнике: основные методы и подходы». Очерки по биохимии . 62 (4): 487–500. doi :10.1042/EBC20180003. ISSN  0071-1365. PMID  30287586. S2CID  52922135.
  142. ^ Коста В., Априле М., Эспозито Р., Чиккодикола А. (февраль 2013 г.). «РНК-Seq и сложные заболевания человека: последние достижения и перспективы на будущее». Европейский журнал генетики человека . 21 (2): 134–42. doi :10.1038/ejhg.2012.129. PMC 3548270. PMID  22739340 . 
  143. ^ Khurana E, Fu Y, Chakravarty D, Demichelis F, Rubin MA, Gerstein M (февраль 2016 г.). «Роль вариантов некодирующей последовательности при раке». Nature Reviews Genetics . 17 (2): 93–108. doi :10.1038/nrg.2015.17. PMID  26781813. S2CID  14433306.
  144. ^ Slotkin RK, Martienssen R (апрель 2007 г.). «Транспозируемые элементы и эпигенетическая регуляция генома». Nature Reviews Genetics . 8 (4): 272–85. doi :10.1038/nrg2072. PMID  17363976. S2CID  9719784.
  145. ^ Просерпио В., Махата Б. (февраль 2016 г.). «Технологии одиночных клеток для изучения иммунной системы». Иммунология . 147 (2): 133–40. doi :10.1111/imm.12553. PMC 4717243. PMID  26551575 . 
  146. ^ ab Byron SA, Van Keuren-Jensen KR, Engelthaler DM, Carpten JD, Craig DW (май 2016 г.). «Трансляция секвенирования РНК в клиническую диагностику: возможности и проблемы». Nature Reviews Genetics . 17 (5): 257–71. doi :10.1038/nrg.2016.10. PMC 7097555. PMID 26996076  . 
  147. ^ Wu HJ, Wang AH, Jennings MP (февраль 2008 г.). «Открытие факторов вирулентности патогенных бактерий» (PDF) . Current Opinion in Chemical Biology . 12 (1): 93–101. doi :10.1016/j.cbpa.2008.01.023. PMID  18284925.
  148. ^ Suzuki S, Horinouchi T, Furusawa C (декабрь 2014 г.). «Прогнозирование устойчивости к антибиотикам по профилям экспрессии генов». Nature Communications . 5 : 5792. Bibcode :2014NatCo...5.5792S. doi :10.1038/ncomms6792. PMC 4351646 . PMID  25517437. 
  149. ^ Westermann AJ, Gorski SA, Vogel J (сентябрь 2012 г.). «Двойное РНК-секвенирование патогена и хозяина» (PDF) . Nature Reviews. Микробиология . 10 (9): 618–30. doi :10.1038/nrmicro2852. PMID  22890146. S2CID  205498287.
  150. ^ Дурмуш С., Чакыр Т., Озгюр А., Гутке Р. (2015). «Обзор вычислительной системной биологии взаимодействий патоген-хозяин». Frontiers in Microbiology . 6 : 235. doi : 10.3389/fmicb.2015.00235 . PMC 4391036. PMID  25914674. 
  151. ^ ab Garg R, Shankar R, Thakkar B, Kudapa H, Krishnamurthy L, Mantri N, Varshney RK, Bhatia S, Jain M (январь 2016 г.). «Транскриптомные анализы выявляют специфические для генотипа и стадии развития молекулярные ответы на стрессы засухи и засоления у нута». Scientific Reports . 6 : 19228. Bibcode :2016NatSR...619228G. doi :10.1038/srep19228. PMC 4725360 . PMID  26759178. 
  152. ^ García-Sánchez S, Aubert S, Iraqui I, Janbon G, Ghigo JM, d'Enfert C (апрель 2004 г.). "Биопленки Candida albicans: состояние развития, связанное со специфическими и стабильными паттернами экспрессии генов". Eukaryotic Cell . 3 (2): 536–45. doi :10.1128/EC.3.2.536-545.2004. PMC 387656 . PMID  15075282. 
  153. ^ Rich SM, Leendertz FH, Xu G, LeBreton M, Djoko CF, Aminake MN, Takang EE, Diffo JL, Pike BL, Rosenthal BM, Formenty P, Boesch C, Ayala FJ, Wolfe ND (сентябрь 2009 г.). «Происхождение злокачественной малярии». Труды Национальной академии наук Соединенных Штатов Америки . 106 (35): 14902–7. Bibcode : 2009PNAS..10614902R. doi : 10.1073/pnas.0907740106 . PMC 2720412. PMID  19666593 . 
  154. ^ Mok S, Ashley EA, Ferreira PE, Zhu L, Lin Z, Yeo T и др. (январь 2015 г.). «Лекарственная устойчивость. Популяционная транскриптомика паразитов человеческой малярии раскрывает механизм устойчивости к артемизинину». Science . 347 (6220): 431–5. Bibcode :2015Sci...347..431M. doi :10.1126/science.1260403. PMC 5642863 . PMID  25502316. 
  155. ^ abcd Page, Тесса М.; Лоули, Джонатан У. (2022). «Следующее поколение уже здесь: обзор транскриптомных подходов в морской экологии». Frontiers in Marine Science . 9. doi : 10.3389/fmars.2022.757921 . hdl : 10072/428702 . ISSN  2296-7745.
  156. ^ Verbruggen N, Hermans C, Schat H (март 2009). «Молекулярные механизмы гипераккумуляции металлов в растениях» (PDF) . The New Phytologist . 181 (4): 759–76. doi :10.1111/j.1469-8137.2008.02748.x. PMID  19192189.
  157. ^ Li Z, Zhang Z, Yan P, Huang S, Fei Z, Lin K (ноябрь 2011 г.). «RNA-Seq улучшает аннотацию генов, кодирующих белок, в геноме огурца». BMC Genomics . 12 : 540. doi : 10.1186/1471-2164-12-540 . PMC 3219749. PMID  22047402 . 
  158. ^ Hobbs M, Pavasovic A, King AG, Prentis PJ, Eldridge MD, Chen Z, Colgan DJ, Polkinghorne A, Wilkins MR, Flanagan C, Gillett A, Hanger J, Johnson RN, Timms P (сентябрь 2014 г.). "Ресурс транскриптома для коалы (Phascolarctos cinereus): взгляд на транскрипцию ретровируса коалы и разнообразие последовательностей". BMC Genomics . 15 (1): 786. doi : 10.1186/1471-2164-15-786 . PMC 4247155 . PMID  25214207. 
  159. ^ Howe GT, Yu J, Knaus B, Cronn R, Kolpak S, Dolan P, Lorenz WW, ​​Dean JF (февраль 2013 г.). "Ресурс SNP для пихты Дугласа: сборка транскриптома de novo, обнаружение и проверка SNP". BMC Genomics . 14 : 137. doi : 10.1186/1471-2164-14-137 . PMC 3673906 . PMID  23445355. 
  160. ^ McGrath LL, Vollmer SV, Kaluziak ST, Ayers J (январь 2016 г.). «Сборка транскриптома de novo для омара Homarus americanus и характеристика дифференциальной экспрессии генов в тканях нервной системы». BMC Genomics . 17 : 63. doi : 10.1186/s12864-016-2373-3 . PMC 4715275 . PMID  26772543. 
  161. ^ Noller HF (1991). «Рибосомальная РНК и трансляция». Annual Review of Biochemistry . 60 : 191–227. doi :10.1146/annurev.bi.60.070191.001203. PMID  1883196.
  162. ^ Christov CP, Gardiner TJ, Szüts D, Krude T (сентябрь 2006 г.). «Функциональное требование некодирующих Y-РНК для репликации хромосомной ДНК человека». Молекулярная и клеточная биология . 26 (18): 6993–7004. doi :10.1128/MCB.01060-06. PMC 1592862. PMID  16943439 . 
  163. ^ Кишор С., Стамм С. (январь 2006 г.). «МЯРНК HBII-52 регулирует альтернативный сплайсинг рецептора серотонина 2C». Science . 311 (5758): 230–2. Bibcode :2006Sci...311..230K. doi : 10.1126/science.1118265 . PMID  16357227. S2CID  44527461.
  164. ^ Hüttenhofer A, Schattner P, Polacek N (май 2005 г.). «Некодирующие РНК: надежда или шумиха?». Trends in Genetics . 21 (5): 289–97. doi :10.1016/j.tig.2005.03.007. PMID  15851066.
  165. ^ Esteller M (ноябрь 2011 г.). «Некодирующие РНК при заболеваниях человека». Nature Reviews Genetics . 12 (12): 861–74. doi :10.1038/nrg3074. PMID  22094949. S2CID  13036469.
  166. ^ "Gene Expression Omnibus". www.ncbi.nlm.nih.gov . Получено 26.03.2018 .
  167. ^ ab Brazma A, Hingamp P, Quackenbush J, Sherlock G, Spellman P, Stoeckert C, Aach J, Ansorge W, Ball CA, Causton HC, Gaasterland T, Glenisson P, Holstege FC, Kim IF, Markowitz V, Matese JC, Parkinson H, Robinson A, Sarkans U, Schulze-Kremer S, Stewart J, Taylor R, Vilo J, Vingron M (декабрь 2001 г.). "Минимальная информация об эксперименте с микрочипами (MIAME) — к стандартам для данных с микрочипами". Nature Genetics . 29 (4): 365–71. doi : 10.1038/ng1201-365 . PMID  11726920. S2CID  6994467.
  168. ^ ab Brazma A (май 2009 г.). «Минимальная информация об эксперименте с микрочипами (MIAME) — успехи, неудачи, проблемы». TheScientificWorldJournal . 9 : 420–3. doi : 10.1100/tsw.2009.57 . PMC 5823224. PMID  19484163. 
  169. ^ Колесников Н, Гастингс Э, Кейс М, Мельничук О, Тан Я., Уильямс Э, Дилаг М, Курбатова Н, Брандизи М, Бердетт Т, Меги К, Пиличева Е, Рустичи Г, Тихонов А, Паркинсон Х, Петришак Р, Сарканс У, Бразма А (январь 2015 г.). «Обновление ArrayExpress — упрощение отправки данных». Исследования нуклеиновых кислот . 43 (Проблема с базой данных): D1113–6. дои : 10.1093/nar/gku1057. ПМЦ 4383899 . ПМИД  25361974. 
  170. ^ Petryszak R, Keays M, Tang YA, Fonseca NA, Barrera E, Burdett T, Füllgrabe A, Fuentes AM, Jupp S, Koskinen S, Mannion O, Huerta L, Megy K, Snow C, Williams E, Barzine M, Hastings E, Weisser H, Wright J, Jaiswal P, Huber W, Choudhary J, Parkinson HE, Brazma A (январь 2016 г.). «Обновление атласа экспрессии — интегрированная база данных экспрессии генов и белков у людей, животных и растений». Nucleic Acids Research . 44 (D1): D746–52. doi :10.1093/nar/gkv1045. PMC 4702781. PMID  26481351 . 
  171. ^ Hruz T, Laule O, Szabo G, Wessendorp F, Bleuler S, Oertle L, Widmayer P, Gruissem W, Zimmermann P (2008). "Genevestigator v3: справочная база данных выражений для метаанализа транскриптомов". Advances in Bioinformatics . 2008 : 420747. doi : 10.1155/2008/420747 . PMC 2777001. PMID  19956698 . 
  172. ^ Мицухаши Н, Фуджиэда К, Тамура Т, Кавамото С, Такаги Т, Окубо К (январь 2009 г.). «BodyParts3D: база данных трехмерных структур для анатомических концепций». Nucleic Acids Research . 37 (выпуск базы данных): D782–5. doi :10.1093/nar/gkn613. PMC 2686534. PMID  18835852 . 
  173. ^ Zhao Y, Li H, Fang S, Kang Y, Wu W, Hao Y, Li Z, Bu D, Sun N, Zhang MQ, Chen R (январь 2016 г.). "NONCODE 2016: информативный и ценный источник данных о длинных некодирующих РНК". Nucleic Acids Research . 44 (D1): D203–8. doi :10.1093/nar/gkv1252. PMC 4702886. PMID  26586799 . 

Примечания

  1. ^ В молекулярной биологии  гибридизация — это явление, при котором одноцепочечные молекулы  дезоксирибонуклеиновой кислоты ( ДНК ) или рибонуклеиновой кислоты ( РНК ) отжигаются  с  комплементарной ДНК или РНК .
  2. ^ Один пиколитр примерно в 30 миллионов раз меньше капли воды.

Дальнейшее чтение