Транскриптом — это набор всех транскриптов РНК , включая кодирующие и некодирующие , в индивидууме или популяции клеток . Термин также может иногда использоваться для обозначения всех РНК или только мРНК , в зависимости от конкретного эксперимента. Термин транскриптом — это словосочетание слов транскрипт и геном ; он связан с процессом производства транскрипта во время биологического процесса транскрипции .
Ранние этапы аннотаций транскриптома начались с библиотек кДНК , опубликованных в 1980-х годах. Впоследствии появление высокопроизводительной технологии привело к более быстрым и эффективным способам получения данных о транскриптоме. Для изучения транскриптома используются два биологических метода, а именно ДНК-микрочип , метод, основанный на гибридизации, и РНК-секвенирование , подход, основанный на последовательности. [1] РНК-секвенирование является предпочтительным методом и является доминирующим методом транскриптомики с 2010-х годов. Транскриптомика отдельных клеток позволяет отслеживать изменения транскриптов с течением времени в отдельных клетках.
Данные, полученные из транскриптома, используются в исследованиях для получения информации о таких процессах, как клеточная дифференциация , канцерогенез , регуляция транскрипции и открытие биомаркеров среди других. Данные, полученные из транскриптома, также находят применение в установлении филогенетических связей в процессе эволюции и при экстракорпоральном оплодотворении . Транскриптом тесно связан с другими биологическими областями изучения, основанными на -оме ; он дополняет протеом и метаболом и охватывает транслатом , экзом , мейом и танатотранскриптом , которые можно рассматривать как оме-области, изучающие определенные типы транскриптов РНК. Существуют количественные и консервативные связи между транскриптомом и другими -омами, и данные транскриптомики можно эффективно использовать для прогнозирования других молекулярных видов, таких как метаболиты. [2] Существует множество общедоступных баз данных транскриптомов.
Слово транскриптом является портманто слов транскрипт и геном . Оно появилось вместе с другими неологизмами, образованными с помощью суффиксов -оме и -омика, для обозначения всех исследований, проводимых в масштабе генома в областях наук о жизни и технологий. Таким образом, транскриптом и транскриптомика были одними из первых слов, появившихся вместе с геномом и протеомом. [3] Первое исследование, представляющее случай коллекции библиотеки кДНК для мРНК шелкопряда, было опубликовано в 1979 году. [4] Первое основополагающее исследование, упоминающее и исследующее транскриптом организма, было опубликовано в 1997 году, и в нем было описано 60 633 транскрипта, экспрессированных в S. cerevisiae с использованием последовательного анализа экспрессии генов (SAGE). [5] С появлением высокопроизводительных технологий и биоинформатики и последующим увеличением вычислительной мощности стало все более эффективно и легко характеризовать и анализировать огромные объемы данных. [3] Попытки охарактеризовать транскриптом стали более заметными с появлением автоматизированного секвенирования ДНК в 1980-х годах. [6] В 1990-х годах для идентификации генов и их фрагментов использовалось секвенирование экспрессируемых последовательностей . [7] За этим последовали такие методы, как последовательный анализ экспрессии генов (SAGE), кэп-анализ экспрессии генов (CAGE) и массивное параллельное сигнатурное секвенирование (MPSS).
Транскриптом охватывает все транскрипты рибонуклеиновой кислоты (РНК), присутствующие в данном организме или экспериментальном образце. [8] РНК является основным носителем генетической информации, которая отвечает за процесс преобразования ДНК в фенотип организма. Ген может дать начало одноцепочечной информационной РНК (мРНК) посредством молекулярного процесса, известного как транскрипция ; эта мРНК комплементарна цепи ДНК, из которой она произошла. [6] Фермент РНК-полимераза II прикрепляется к цепи ДНК-матрицы и катализирует добавление рибонуклеотидов к 3'-концу растущей последовательности транскрипта мРНК. [9]
Для того чтобы инициировать свою функцию, РНК-полимераза II должна распознать последовательность промотора , расположенную выше (5') гена. У эукариот этот процесс опосредован факторами транскрипции , в первую очередь фактором транскрипции II D (TFIID), который распознает бокс TATA и помогает позиционировать РНК-полимеразу в соответствующем месте начала. Чтобы завершить производство транскрипта РНК, обычно происходит терминация в нескольких сотнях нуклеотидов от последовательности терминации и происходит расщепление. [9] Этот процесс происходит в ядре клетки вместе с процессингом РНК , посредством которого молекулы мРНК кэпируются , сплайсируются и полиаденилируются для повышения их стабильности перед последующим переносом в цитоплазму. мРНК дает начало белкам посредством процесса трансляции , который происходит в рибосомах .
Почти все функциональные транскрипты получены из известных генов. Исключение составляют лишь небольшое количество транскриптов, которые могут играть прямую роль в регуляции экспрессии генов вблизи суфлер известных генов. (См. Enhancer RNA .)
Гены занимают большую часть прокариотических геномов, поэтому большая часть их геномов транскрибируется. Многие эукариотические геномы очень большие, и известные гены могут занимать лишь часть генома. Например, у млекопитающих известные гены составляют лишь 40–50 % генома. [10] Тем не менее, идентифицированные транскрипты часто сопоставляются с гораздо большей частью генома, что позволяет предположить, что транскриптом содержит ложные транскрипты, которые не происходят от генов. Известно, что некоторые из этих транскриптов нефункциональны, поскольку они сопоставляются с транскрибированными псевдогенами или дегенеративными транспозонами и вирусами. Другие сопоставляются с неидентифицированными областями генома, которые могут быть мусорной ДНК.
Ложная транскрипция очень распространена у эукариот, особенно у тех, у которых большие геномы, которые могут содержать много мусорной ДНК . [11] [12] [13] [14] Некоторые ученые утверждают, что если транскрипт не был назначен известному гену, то по умолчанию следует предполагать, что это мусорная РНК, пока не будет доказано, что она функциональна. [11] [15] Это означало бы, что большая часть транскриптома у видов с большими геномами, вероятно, представляет собой мусорную РНК. (См. Некодирующая РНК )
Транскриптом включает транскрипты генов, кодирующих белки (мРНК плюс интроны), а также транскрипты некодирующих генов (функциональные РНК плюс интроны).
В геноме человека все гены транскрибируются в РНК, поскольку именно так определяется молекулярный ген. (См. Ген .) Транскриптом состоит из кодирующих областей мРНК, а также некодирующих НТО, интронов, некодирующих РНК и ложных нефункциональных транскриптов.
Несколько факторов затрудняют установление содержания транскриптома. К ним относятся альтернативный сплайсинг , редактирование РНК и альтернативная транскрипция среди прочих. [17] Кроме того, методы транскриптома способны фиксировать транскрипцию, происходящую в образце в определенный момент времени, хотя содержание транскриптома может меняться в процессе дифференциации. [6] Основные цели транскриптомики следующие: «каталогизировать все виды транскриптов, включая мРНК, некодирующие РНК и малые РНК; определить транскрипционную структуру генов с точки зрения их стартовых участков, 5′ и 3′ концов, паттернов сплайсинга и других посттранскрипционных модификаций; и количественно оценить изменяющиеся уровни экспрессии каждого транскрипта в процессе развития и в различных условиях». [1]
Термин может применяться к общему набору транскриптов в данном организме или к определенному подмножеству транскриптов, присутствующих в определенном типе клеток. В отличие от генома , который приблизительно фиксирован для данной клеточной линии (исключая мутации ), транскриптом может меняться в зависимости от внешних условий окружающей среды. Поскольку он включает все транскрипты мРНК в клетке, транскриптом отражает гены , которые активно экспрессируются в любой момент времени, за исключением явлений деградации мРНК, таких как транскрипционное ослабление . Изучение транскриптомики (которое включает профилирование экспрессии , анализ вариантов сплайсинга и т. д.) изучает уровень экспрессии РНК в данной популяции клеток, часто фокусируясь на мРНК, но иногда включая и другие, такие как тРНК и мРНК.
Транскриптомика — это количественная наука, которая охватывает назначение списка строк («чтений») объекту («транскриптам» в геноме). Для расчета силы экспрессии подсчитывается плотность чтений, соответствующих каждому объекту. [18] Первоначально транскриптомы анализировались и изучались с использованием библиотек экспрессируемых последовательностей тегов и последовательного и кэп-анализа экспрессии генов (SAGE).
В настоящее время два основных метода транскриптомики включают ДНК-микрочипы и РНК-Seq . Оба метода требуют выделения РНК с помощью методов экстракции РНК , за которыми следует ее отделение от других клеточных компонентов и обогащение мРНК. [19] [20]
Существует два общих метода выведения последовательностей транскриптома. Один подход картирует считывания последовательностей на референтный геном, либо самого организма (чей транскриптом изучается), либо близкородственного вида. Другой подход, de novo сборка транскриптома , использует программное обеспечение для выведения транскриптов непосредственно из коротких считываний последовательностей и применяется в организмах с геномами, которые не секвенированы. [21]
Первые исследования транскриптома были основаны на методах микрочипов (также известных как ДНК-чипы). Микрочипы состоят из тонких стеклянных слоев с пятнами, на которых выстроены олигонуклеотиды , известные как «зонды»; каждое пятно содержит известную последовательность ДНК. [22]
При выполнении анализа микрочипов мРНК собирается из контрольного и экспериментального образца, последний обычно представляет заболевание. Интересующая РНК преобразуется в кДНК для повышения ее стабильности и маркируется флуорофорами двух цветов, обычно зеленого и красного, для двух групп. кДНК распределяется по поверхности микрочипа, где она гибридизуется с олигонуклеотидами на чипе, а для сканирования используется лазер. Интенсивность флуоресценции в каждой точке микрочипа соответствует уровню экспрессии гена, и на основе цвета выбранных флуорофоров можно определить, какой из образцов демонстрирует более высокие уровни интересующей мРНК. [7]
Один микрочип обычно содержит достаточно олигонуклеотидов для представления всех известных генов; однако данные, полученные с помощью микрочипов, не предоставляют информации о неизвестных генах. В 2010-х годах микрочипы были почти полностью заменены методами следующего поколения, основанными на секвенировании ДНК.
Секвенирование РНК — это технология секвенирования следующего поколения ; как таковая, она требует лишь небольшого количества РНК и не требует никаких предварительных знаний о геноме. [3] Она позволяет проводить как качественный, так и количественный анализ транскриптов РНК, первый позволяет обнаруживать новые транскрипты, а второй — измерять относительные количества транскриптов в образце. [16]
Три основных этапа секвенирования транскриптомов любых биологических образцов включают очистку РНК, синтез библиотеки РНК или кДНК и секвенирование библиотеки. [16] Процесс очистки РНК отличается для коротких и длинных РНК. [16] За этим этапом обычно следует оценка качества РНК с целью избежания загрязнений, таких как ДНК или технические загрязнения, связанные с обработкой образца. Качество РНК измеряется с помощью УФ-спектрометрии с пиком поглощения 260 нм. [23] Целостность РНК также можно проанализировать количественно, сравнивая соотношение и интенсивность 28S РНК к 18S РНК , указанную в показателе целостности РНК (RIN). [23] Поскольку интересующим видом является мРНК, и она составляет всего 3% от ее общего содержания, образец РНК следует обработать для удаления рРНК и тРНК, а также тканеспецифичных РНК-транскриптов. [23]
Этап подготовки библиотеки с целью получения коротких фрагментов кДНК начинается с фрагментации РНК до транскриптов длиной от 50 до 300 пар оснований . Фрагментация может быть ферментативной (РНК- эндонуклеазы ), химической (трисмагниевый солевой буфер, химический гидролиз ) или механической ( ультразвуковая обработка , распыление). [24] Обратная транскрипция используется для преобразования шаблонов РНК в кДНК, и для этого можно использовать три метода праймирования, включая олиго-ДТ, использование случайных праймеров или лигирование специальных адаптерных олигонуклеотидов.
Транскрипцию также можно изучать на уровне отдельных клеток с помощью транскриптомики отдельных клеток . Секвенирование РНК отдельных клеток (scRNA-seq) — это недавно разработанная методика, которая позволяет анализировать транскриптом отдельных клеток, включая бактерии . [25] При транскриптомике отдельных клеток также учитываются субпопуляции типов клеток, которые составляют интересующую ткань. [26] Этот подход позволяет определить, вызваны ли изменения в экспериментальных образцах фенотипическими клеточными изменениями, а не пролиферацией, при которой определенный тип клеток может быть сверхэкспрессирован в образце. [27] Кроме того, при оценке клеточного прогрессирования посредством дифференциации средние профили экспрессии способны упорядочивать клетки только по времени, а не по стадии их развития, и, следовательно, не могут показать тенденции в уровнях экспрессии генов, характерных для определенных стадий. [28] Методы транскриптомики отдельных клеток использовались для характеристики редких популяций клеток, таких как циркулирующие опухолевые клетки , раковые стволовые клетки в солидных опухолях и эмбриональные стволовые клетки (ЭСК) в бластоцистах млекопитающих . [29]
Хотя не существует стандартизированных методов для транскриптомики отдельных клеток, необходимо предпринять несколько шагов. Первый шаг включает в себя изоляцию клеток, которая может быть выполнена с использованием низко- и высокопроизводительных методов. Затем следует этап ПЦР-анализа, а затем РНК-секвенирование отдельных клеток, где интересующая РНК преобразуется в кДНК. Новейшие разработки в транскриптомике отдельных клеток позволяют сохранять локализацию тканей и субклеток с помощью криосечения тонких срезов тканей и секвенирования транскриптома в каждом срезе. Другой метод позволяет визуализировать отдельные транскрипты под микроскопом, сохраняя пространственную информацию каждой отдельной клетки, в которой они экспрессируются. [29]
Был создан и аннотирован ряд баз данных транскриптомов, специфичных для конкретных организмов, для помощи в идентификации генов, которые по-разному экспрессируются в различных популяциях клеток.
РНК-секвенирование (2013) становится методом выбора для измерения транскриптомов организмов, хотя старая техника ДНК-микрочипов все еще используется. [1] РНК-секвенирование измеряет транскрипцию определенного гена путем преобразования длинных РНК в библиотеку фрагментов кДНК . Затем фрагменты кДНК секвенируются с использованием высокопроизводительной технологии секвенирования и выравниваются с референсным геномом или транскриптомом, который затем используется для создания профиля экспрессии генов. [1]
Транскриптомы стволовых и раковых клеток представляют особый интерес для исследователей, которые стремятся понять процессы клеточной дифференциации и канцерогенеза . Конвейер, использующий данные РНК-секвенирования или генного массива, может использоваться для отслеживания генетических изменений, происходящих в стволовых и предшественниках клеток , и требует по крайней мере трех независимых данных об экспрессии генов из прежнего типа клеток и зрелых клеток. [30]
Анализ транскриптомов человеческих ооцитов и эмбрионов используется для понимания молекулярных механизмов и сигнальных путей, контролирующих раннее эмбриональное развитие, и теоретически может быть мощным инструментом для правильного выбора эмбрионов при экстракорпоральном оплодотворении . [ требуется ссылка ] Анализ транскриптомного содержимого плаценты в первом триместре беременности при экстракорпоральном оплодотворении и переносе эмбрионов (IVT-ET) выявил различия в генетической экспрессии, которые связаны с более высокой частотой неблагоприятных перинатальных исходов. Такое понимание может быть использовано для оптимизации практики. [31] Анализ транскриптома также может быть использован для оптимизации криоконсервации ооцитов за счет снижения травм, связанных с этим процессом. [32]
Транскриптомика — это новая и постоянно развивающаяся область в области открытия биомаркеров для использования при оценке безопасности лекарственных препаратов или оценки химического риска . [33]
Транскриптомы также могут использоваться для определения филогенетических связей между особями или для обнаружения эволюционных закономерностей сохранения транскриптома. [34]
Транскриптомные анализы использовались для обнаружения частоты антисмысловой транскрипции, их роли в экспрессии генов посредством взаимодействия с окружающими генами и их распространенности в различных хромосомах. [35] РНК-секвенирование также использовалось для того, чтобы показать, как изоформы РНК, транскрипты, происходящие от одного и того же гена, но с разной структурой, могут производить сложные фенотипы из ограниченных геномов. [21]
Транскриптомный анализ использовался для изучения эволюции и процесса диверсификации видов растений. В 2014 году был завершен проект 1000 геномов растений , в котором были секвенированы транскриптомы 1124 видов растений из семейств viridiplantae , glaucophyta и rhodophyta . Затем последовательности кодирования белков сравнивались для определения филогенетических связей между растениями и для характеристики времени их диверсификации в процессе эволюции. [36] Транскриптомные исследования использовались для характеристики и количественной оценки экспрессии генов в зрелой пыльце . Было обнаружено, что гены, участвующие в метаболизме клеточной стенки и цитоскелете, сверхэкспрессируются. Транскриптомные подходы также позволили отслеживать изменения в экспрессии генов на разных стадиях развития пыльцы, от микроспор до зрелых пыльцевых зерен; кроме того, такие стадии можно было сравнивать между видами разных растений, включая Arabidopsis , рис и табак . [37]
Подобно другим технологиям, основанным на -оме , анализ транскриптома позволяет использовать беспристрастный подход при экспериментальной проверке гипотез. Этот подход также позволяет открывать новые медиаторы в сигнальных путях. [18] Как и в случае с другими технологиями, основанными на -омике, транскриптом может быть проанализирован в рамках подхода мультиомики . Он дополняет метаболомику, но в отличие от протеомики, прямая связь между транскриптомом и метаболитом не может быть установлена.
Существует несколько полей -ome, которые можно рассматривать как подкатегории транскриптома. Экзом отличается от транскриптома тем, что включает только те молекулы РНК, которые обнаружены в определенной популяции клеток, и обычно включает количество или концентрацию каждой молекулы РНК в дополнение к молекулярным идентичностям. Кроме того, транскриптом также отличается от транслатома , который представляет собой набор РНК, подвергающихся трансляции.
Термин мейом используется в функциональной геномике для описания мейотического транскриптома или набора транскриптов РНК, произведенных в процессе мейоза . [38] Мейоз является ключевой особенностью эукариот , размножающихся половым путем , и включает в себя спаривание гомологичных хромосом , синапсов и рекомбинацию. Поскольку мейоз у большинства организмов происходит в течение короткого периода времени, профилирование мейотического транскрипта затруднено из-за проблемы изоляции (или обогащения) мейотических клеток ( мейоцитов ). Как и в случае с анализами транскриптома, мейом можно изучать на уровне всего генома с использованием крупномасштабных транскриптомных методов. [39] Мейом хорошо охарактеризован в системах млекопитающих и дрожжей и несколько менее подробно охарактеризован в растениях. [40]
Танатотранскриптом состоит из всех транскриптов РНК, которые продолжают экспрессироваться или начинают повторно экспрессироваться во внутренних органах мертвого тела через 24–48 часов после смерти. Некоторые гены включают те, которые ингибируются после развития плода . Если танатотранскриптом связан с процессом запрограммированной гибели клеток ( апоптоз ) , его можно назвать апоптотическим танатотранскриптомом. Анализы танатотранскриптома используются в судебной медицине . [41]
Картирование eQTL можно использовать для дополнения геномики транскриптомикой; генетические варианты на уровне ДНК и измерения экспрессии генов на уровне РНК. [42]
Транскриптом можно рассматривать как подмножество протеома , то есть всего набора белков, экспрессируемых геномом.
Однако анализ относительных уровней экспрессии мРНК может быть осложнен тем фактом, что относительно небольшие изменения в экспрессии мРНК могут вызывать большие изменения в общем количестве соответствующего белка, присутствующего в клетке. Один из методов анализа, известный как анализ обогащения набора генов , идентифицирует сети корегулируемых генов, а не отдельные гены, которые активируются или деактивируются в различных популяциях клеток. [1]
Хотя исследования с использованием микрочипов позволяют выявить относительное количество различных мРНК в клетке, уровни мРНК не прямо пропорциональны уровню экспрессии кодируемых ими белков . [43] Количество молекул белка, синтезированных с использованием данной молекулы мРНК в качестве шаблона, в значительной степени зависит от особенностей инициации трансляции последовательности мРНК; в частности, способность инициации трансляции последовательности является ключевым фактором в привлечении рибосом для трансляции белка .