stringtranslate.com

РефСек

База данных Reference Sequence ( RefSeq ) [1] представляет собой открытый доступ , аннотированную и курируемую коллекцию общедоступных нуклеотидных последовательностей ( ДНК , РНК ) и их белковых продуктов. RefSeq был представлен в 2000 году. [2] [3] Эта база данных создана Национальным центром биотехнологической информации (NCBI) и, в отличие от GenBank , предоставляет только одну запись для каждой естественной биологической молекулы (т. е. ДНК, РНК или белок) для основных организмов, от вирусов до бактерий и эукариот .

Для каждого модельного организма RefSeq стремится предоставить отдельные и связанные записи для геномной ДНК, генных транскриптов и белков, возникающих из этих транскриптов. RefSeq ограничен основными организмами, для которых доступно достаточно данных (121 461 отдельных «именованных» организмов по состоянию на июль 2022 года), [4] в то время как GenBank включает последовательности для любого представленного организма (приблизительно 504 000 формально описанных видов ). [5]

Категории RefSeq

Коллекция RefSeq содержит различные типы данных с различным происхождением, поэтому необходимо установить стандартные категории и идентификаторы для хранения каждого типа данных. Наиболее важными категориями являются:

Более подробную информацию и другие категории см. в таблице 1 в главе 18 книги «База данных референтных последовательностей (RefSeq)».

Проекты RefSeq

В настоящее время NCBI разрабатывает несколько проектов по улучшению сервисов RefSeq , часто в сотрудничестве с исследовательскими центрами, такими как EMBL-EBI:

Статистика

Согласно выпуску RefSeq 213 (июль 2022 г.), количество видов, представленных в базе данных путем подсчета отдельных таксономических идентификаторов, следующее: [4]

Количество присоединений и пар оснований на тип молекулы составляет: [4]

Смотрите также

Ссылки

  1. ^ ab Pruitt KD , Tatusova T, Maglott DR (январь 2005 г.). "NCBI Reference Sequence (RefSeq): курируемая неизбыточная база данных последовательностей геномов, транскриптов и белков". Nucleic Acids Research . 33 (выпуск базы данных): D501–D504. doi :10.1093/nar/gki025. PMC  539979. PMID  15608248 .
  2. ^ Maglott DR , Katz KS, Sicotte H, Pruitt KD (январь 2000 г.). "NCBI's LocusLink and RefSeq". Nucleic Acids Research . 28 (1): 126–128. doi : 10.1093/nar/28.1.126. PMC 102393. PMID  10592200. 
  3. ^ Pruitt KD, Katz KS, Sicotte H, Maglott DR (январь 2000 г.). «Введение в RefSeq и LocusLink: кураторские ресурсы по геному человека в NCBI». Trends in Genetics . 16 (1): 44–47. doi :10.1016/s0168-9525(99)01882-x. PMID  10637631.
  4. ^ Статистика abc RefSeq Release 213 (отчет). Национальная медицинская библиотека . 11 июля 2022 г. Получено 20 июля 2022 г.
  5. ^ Sayers EW, Cavanaugh M, Clark K, Pruitt KD, Schoch CL, Sherry ST, Karsch-Mizrachi I (январь 2022 г.). "GenBank". Nucleic Acids Research . 50 (D1): D161–D164. doi : 10.1093 /nar/gkab1135 . PMC 8690257. PMID  34850943. 
  6. ^ Pruitt KD, Harrow J, Harte RA, Wallin C, Diekhans M, Maglott DR и др. (июль 2009 г.). «Проект консенсусной кодирующей последовательности (CCDS): определение общего набора генов, кодирующих белок, для геномов человека и мыши». Genome Research . 19 (7): 1316–1323. doi :10.1101/gr.080531.108. PMC 2704439 . PMID  19498102. 
  7. ^ Pujar S, O'Leary NA, Farrell CM, Loveland JE, Mudge JM, Wallin C и др. (январь 2018 г.). «База данных консенсусной кодирующей последовательности (CCDS): стандартизированный набор областей кодирования белков человека и мыши, поддерживаемый экспертным кураторством». Nucleic Acids Research . 46 (D1): D221–D228. doi :10.1093/nar/gkx1031. PMC 5753299 . PMID  29126148. 
  8. ^ Farrell CM, Goldfarb T, Rangwala SH, Astashyn A, Ermolaeva OD, Hem V и др. (Январь 2022 г.). «Функциональные элементы RefSeq как экспериментально проанализированные негенные эталонные стандарты и функциональные взаимодействия у человека и мыши». Genome Research . 32 (1): 175–188. doi :10.1101/gr.275819.121. PMC 8744684 . PMID  34876495. 
  9. ^ Gulley ML, Braziel RM, Halling KC, Hsi ED, Kant JA, Nikiforova MN и др. (июнь 2007 г.). «Клинические лабораторные отчеты по молекулярной патологии». Архивы патологии и лабораторной медицины . 131 (6): 852–863. doi :10.5858/2007-131-852-CLRIMP. PMID  17550311.
  10. ^ "Проект целевых локусов NCBI RefSeq". www.ncbi.nlm.nih.gov . Получено 27.07.2022 .
  11. ^ Hatcher EL, Zhdanov SA, Bao Y, Blinkova O, Nawrocki EP, Ostapchuck Y и др. (январь 2017 г.). «Ресурс вариаций вирусов — улучшенный ответ на возникающие вирусные вспышки». Nucleic Acids Research . 45 (D1): D482–D490. doi :10.1093/nar/gkw1065. PMC 5210549. PMID 27899678  . 
  12. ^ "NCBI RefSeq Select". www.ncbi.nlm.nih.gov . Получено 2022-07-27 .
  13. ^ Моралес Дж., Пуджар С., Лавленд Дж. Э., Асташин А., Беннетт Р., Берри А. и др. (апрель 2022 г.). «Совместный набор транскриптов NCBI и EMBL-EBI для клинической геномики и исследований». Nature . 604 (7905): 310–315. Bibcode :2022Natur.604..310M. doi :10.1038/s41586-022-04558-8. PMC 9007741 . PMID  35388217. 

Источники

Внешние ссылки