stringtranslate.com

Тег экспрессируемой последовательности

В генетике экспрессируемая последовательность тега ( EST ) представляет собой короткую подпоследовательность последовательности кДНК . [1] EST могут использоваться для идентификации транскриптов генов и сыграли важную роль в открытии генов и определении последовательности генов. [2] Идентификация EST быстро продвигалась, и в настоящее время в общедоступных базах данных (например, GenBank 1 января 2013 г., все виды) доступно около 74,2 миллионов EST. Подходы EST в значительной степени были вытеснены секвенированием всего генома и транскриптома и секвенированием метагенома.

EST получается в результате одноразового секвенирования клонированной кДНК . КДНК, используемые для генерации EST, обычно представляют собой отдельные клоны из библиотеки кДНК . Полученная последовательность представляет собой относительно низкокачественный фрагмент, длина которого ограничена современной технологией приблизительно 500–800 нуклеотидами . Поскольку эти клоны состоят из ДНК, комплементарной мРНК, EST представляют собой части экспрессируемых генов. Они могут быть представлены в базах данных либо как последовательность кДНК/мРНК, либо как обратный комплемент мРНК, шаблонной цепи .

Можно сопоставить EST с определенными локациями хромосом, используя физические методы картирования, такие как гибридное картирование с излучением , картирование HAPPY или FISH . В качестве альтернативы, если геном организма, который создал EST, был секвенирован, можно выровнять последовательность EST с этим геномом, используя компьютер.

Текущее понимание набора генов человека (по состоянию на 2006 год ) включает существование тысяч генов, основанных исключительно на доказательствах EST. В этом отношении EST стали инструментом для уточнения предсказанных транскриптов для этих генов, что приводит к предсказанию их белковых продуктов и, в конечном счете, их функции. Более того, ситуация, в которой эти EST получены (ткань, орган, болезненное состояние - например, рак ), дает информацию об условиях, в которых действует соответствующий ген. EST содержат достаточно информации, чтобы позволить разработать точные зонды для ДНК-микрочипов , которые затем могут быть использованы для определения профилей экспрессии генов .

Некоторые авторы используют термин «EST» для описания генов, о которых существует мало или вообще нет никакой дополнительной информации, кроме тега. [3]

История

В 1979 году группы ученых из Гарварда и Калифорнийского технологического института расширили основную идею создания копий ДНК мРНК in vitro, чтобы амплифицировать библиотеку таких копий в бактериальных плазмидах. [4]

В 1982 году Грег Сатклифф и его коллеги исследовали идею выбора случайных или полуслучайных клонов из такой библиотеки кДНК для секвенирования. [5]

В 1983 году Патни и др. секвенировали 178 клонов из библиотеки ДНК мышц кролика. [6]

В 1991 году Адамс и его коллеги ввели термин EST и инициировали более систематическое секвенирование в качестве проекта (начав с 600 кДНК мозга). [2]

Источники данных и аннотации

дбEST

dbEST — это подразделение Genbank, основанное в 1992 году. Что касается GenBank , данные в dbEST поступают напрямую из лабораторий по всему миру и не курируются.

Контиги EST

Из-за способа секвенирования EST, многие отдельные экспрессированные теги последовательностей часто являются частичными последовательностями, которые соответствуют одной и той же мРНК организма. В попытке сократить количество экспрессированных тегов последовательностей для анализа обнаружения генов ниже по течению, несколько групп собрали экспрессированные теги последовательностей в контиги EST . Примеры ресурсов, которые предоставляют контиги EST, включают: индексы генов TIGR, [7] Unigene, [8] и STACK [9]

Построение контигов EST не является тривиальной задачей и может привести к появлению артефактов (контигов, содержащих два различных генных продукта). Когда доступна полная последовательность генома организма и транскрипты аннотированы, можно обойти сборку контигов и напрямую сопоставить транскрипты с EST. Этот подход используется в системе TissueInfo (см. ниже) и позволяет легко связать аннотации в геномной базе данных с информацией о тканях, предоставленной данными EST.

Информация о тканях

Высокопроизводительные анализы EST часто сталкиваются с аналогичными проблемами управления данными. Первая проблема заключается в том, что происхождение тканей библиотек EST описывается на простом английском языке в dbEST. [10] Это затрудняет написание программ, которые могут однозначно определить, что две библиотеки EST были секвенированы из одной и той же ткани. Аналогичным образом, состояния болезни для ткани не аннотируются в вычислительно-дружественной манере. Например, раковое происхождение библиотеки часто смешивается с названием ткани (например, название ткани « глиобластома » указывает на то, что библиотека EST была секвенирована из мозговой ткани, а состояние болезни — рак). [11] За исключением рака, состояние болезни часто не регистрируется в записях dbEST. Проект TissueInfo был начат в 2000 году, чтобы помочь с этими проблемами. Проект предоставляет тщательно отобранные данные (обновляемые ежедневно) для устранения неоднозначности происхождения ткани и состояния заболевания (рак/не рак), предлагает онтологию тканей, которая связывает ткани и органы отношениями «является частью» (т. е. формализует знание о том, что гипоталамус является частью мозга, а мозг является частью центральной нервной системы) и распространяет программное обеспечение с открытым исходным кодом для связывания аннотаций транскриптов из секвенированных геномов с профилями экспрессии тканей, рассчитанными с использованием данных в dbEST. [12]

Смотрите также

Ссылки

  1. ^ Информационный листок EST. Национальный центр биотехнологической информации .
  2. ^ ab Adams MD, Kelley JM, Gocayne JD, et al. (июнь 1991 г.). «Комплементарное секвенирование ДНК: экспрессируемые метки последовательностей и проект генома человека». Science . 252 (5013): 1651–6. Bibcode :1991Sci...252.1651A. doi :10.1126/science.2047873. PMID  2047873. S2CID  13436211.
  3. ^ dbEST
  4. ^ Sim GK, Kafatos FC, Jones CW, Koehler MD, Efstratiadis A, Maniatis T (декабрь 1979 г.). «Использование библиотеки кДНК для исследований эволюции и экспрессии в развитии мультигенных семейств хориона». Cell . 18 (4): 1303–16. doi : 10.1016/0092-8674(79)90241-1 . PMID  519770.
  5. ^ Sutcliffe JG, Milner RJ, Bloom FE, Lerner RA (август 1982 г.). «Общая 82-нуклеотидная последовательность, уникальная для РНК мозга». Proc Natl Acad Sci USA . 79 (16): 4942–6. Bibcode : 1982PNAS ...79.4942S. doi : 10.1073/pnas.79.16.4942 . PMC 346801. PMID  6956902. 
  6. ^ Putney SD, Herlihy WC, Schimmel P (1983). «Новый тропонин T и клоны кДНК для 13 различных мышечных белков, обнаруженные методом дробовика». Nature . 302 (5910): 718–21. Bibcode :1983Natur.302..718P. doi :10.1038/302718a0. PMID  6687628. S2CID  4364361.
  7. ^ Lee Y, Tsai J, Sunkara S и др. (январь 2005 г.). «Индексы генов TIGR: кластеризация и сборка EST и известных генов и интеграция с эукариотическими геномами». Nucleic Acids Res . 33 (выпуск базы данных): D71–4. doi :10.1093/nar/gki064. PMC 540018. PMID  15608288 . 
  8. ^ Stanton JA, Macgregor AB, Green DP (2003). «Идентификация экспрессии генов, обогащенных тканями мышей, с использованием базы данных NIH UniGene». Appl Bioinform . 2 (3 Suppl): S65–73. PMID  15130819.
  9. ^ Christoffels A, van Gelder A, Greyling G, Miller R, Hide T, Hide W (январь 2001 г.). "STACK: Sequence Tag Alignment and Consensus Knowledgebase". Nucleic Acids Res . 29 (1): 234–8. doi :10.1093/nar/29.1.234. PMC 29830. PMID  11125101 . 
  10. ^ Skrabanek L, Campagne F (ноябрь 2001 г.). "TissueInfo: высокопроизводительная идентификация профилей и специфичности экспрессии тканей". Nucleic Acids Res . 29 (21): E102–2. doi :10.1093/nar/29.21.e102. PMC 60201. PMID  11691939 . 
  11. ^ Кампань Ф., Скрабанек Л. (2006). «Изучение экспрессируемых последовательностей меток идентифицирует маркеры рака, представляющие клинический интерес». BMC Bioinformatics . 7 : 481. doi : 10.1186/1471-2105-7-481 . PMC 1635568 . PMID  17078886. 
  12. ^ :institute for computingal biomedicine::TissueInfo Архивировано 4 июня 2008 г. на Wayback Machine

Внешние ссылки

Информация о ткани