stringtranslate.com

Национальный центр биотехнологической информации

Национальный центр биотехнологической информации ( NCBI ) [1] [2] является частью Национальной медицинской библиотеки США (NLM), филиала Национальных институтов здравоохранения (NIH). Он одобрен и финансируется правительством Соединенных Штатов . NCBI расположен в Бетесде, штат Мэриленд , и был основан в 1988 году в соответствии с законодательством, спонсируемым конгрессменом США Клодом Пеппером .

В NCBI хранится ряд баз данных, имеющих отношение к биотехнологии и биомедицине , и он является важным ресурсом для инструментов и услуг биоинформатики. Основные базы данных включают GenBank для последовательностей ДНК и PubMed , библиографическую базу данных биомедицинской литературы. Другие базы данных включают базу данных NCBI Epigenomics . Все эти базы данных доступны в Интернете через поисковую систему Entrez . NCBI возглавлял Дэвид Липман , [2] один из первых авторов программы выравнивания последовательностей BLAST [3] и широко уважаемый деятель в области биоинформатики .

ГенБанк

NCBI отвечал за предоставление доступа к базе данных последовательностей ДНК GenBank с 1992 года. [4] GenBank координирует свои действия с отдельными лабораториями и другими базами данных последовательностей, такими как базы данных Европейской лаборатории молекулярной биологии (EMBL) и Банка данных ДНК Японии (DDBJ). [4]

С 1992 года NCBI расширилась и теперь предоставляет другие базы данных в дополнение к GenBank. NCBI предоставляет базу данных генов, онлайн-менделевское наследование у человека , базу данных молекулярного моделирования (3D-структуры белков), dbSNP (базу данных однонуклеотидных полиморфизмов ), коллекцию эталонных последовательностей, карту генома человека и браузер таксономии . и координирует работу с Национальным институтом рака для реализации проекта анатомии генома рака. NCBI присваивает уникальный идентификатор (идентификатор таксономии) каждому виду организма. [5]

У NCBI есть программные инструменты, доступные через интернет-браузеры или по FTP . Например, BLAST — это программа поиска сходства последовательностей. BLAST может выполнять сравнение последовательностей с базой данных ДНК GenBank менее чем за 15 секунд.

Книжная полка NCBI

Книжная полка NCBI [6] представляет собой коллекцию свободно доступных для скачивания онлайн-версий избранных биомедицинских книг. Книжная полка охватывает широкий спектр тем, включая молекулярную биологию , биохимию , клеточную биологию , генетику , микробиологию , болезненные состояния с молекулярной и клеточной точки зрения, методы исследования и вирусологию . Некоторые из книг представляют собой онлайн-версии ранее опубликованных книг, а другие, такие как Coffee Break , написаны и отредактированы сотрудниками NCBI. Книжная полка является дополнением к репозиторию рефератов рецензируемых публикаций Entrez PubMed , поскольку содержимое книжной полки обеспечивает устоявшиеся взгляды на развивающиеся области исследований и контекст, в котором могут быть организованы многие разрозненные отдельные части опубликованных исследований. [ нужна цитата ]

Базовый инструмент поиска локального выравнивания (BLAST)

BLAST — это алгоритм, используемый для расчета сходства последовательностей между биологическими последовательностями, такими как нуклеотидные последовательности ДНК и аминокислотные последовательности белков. [7] BLAST — мощный инструмент для поиска последовательностей, похожих на последовательность запроса, внутри одного и того же организма или в разных организмах. Он выполняет поиск последовательности запросов в базах данных и серверах NCBI и отправляет результаты обратно в браузер человека в выбранном формате. Входные последовательности в BLAST в основном имеют формат FASTA или GenBank, тогда как выходные данные могут быть доставлены в различных форматах, таких как HTML, форматирование XML и простой текст. HTML является форматом вывода по умолчанию для веб-страницы NCBI. Результаты для NCBI-BLAST представлены в графическом формате со всеми найденными совпадениями, таблицей с идентификаторами последовательностей для совпадений, имеющих данные, связанные с оценкой, а также выравниванием интересующей последовательности и полученных совпадений с аналогичными оценками BLAST для них. [8]

Энтрез

Система межбазового поиска Entrez Global Query используется в NCBI для всех основных баз данных, таких как нуклеотидные и белковые последовательности, белковые структуры, PubMed, Taxonomy, Complete Genomes, OMIM и некоторых других . [9] Entrez — это система индексирования и поиска данных из различных источников для биомедицинских исследований. NCBI распространил первую версию Entrez в 1991 году, состоящую из нуклеотидных последовательностей из PDB и GenBank , белковых последовательностей из SWISS-PROT, транслированных GenBank, PIR, PRF, PDB, а также связанных с ними рефератов и цитат из PubMed. Entrez специально разработан для интеграции данных из нескольких различных источников, баз данных и форматов в единую информационную модель и систему поиска, которая может эффективно извлекать соответствующие ссылки, последовательности и структуры. [10]

Ген

Ген был реализован в NCBI для характеристики и организации информации о генах. Он служит основным узлом в связке геномной карты, экспрессии, последовательности, функции белка, структуры и данных о гомологии. Каждой записи гена присваивается уникальный GeneID, который можно отслеживать в циклах пересмотра. Генные записи для известных или предсказанных генов устанавливаются здесь и разграничиваются положениями на карте или нуклеотидными последовательностями. Gene имеет ряд преимуществ перед своим предшественником LocusLink, в том числе лучшую интеграцию с другими базами данных в NCBI, более широкую таксономическую область применения и расширенные возможности запроса и поиска, предоставляемые системой Entrez. [11]

Белок

В базе данных белков хранятся текстовые записи для отдельных последовательностей белков, полученные из множества различных ресурсов, таких как проект NCBI Reference Sequence (RefSeq), GenBank, PDB и UniProtKB/SWISS-Prot. Записи о белках представлены в различных форматах, включая FASTA и XML , и связаны с другими ресурсами NCBI. Белок предоставляет пользователям соответствующие данные, такие как гены, последовательности ДНК/РНК, биологические пути, данные об экспрессии и вариациях, а также литературу. Он также предоставляет заранее определенные наборы похожих и идентичных белков для каждой последовательности, рассчитанные с помощью BLAST. База данных структур NCBI содержит наборы трехмерных координат для экспериментально определенных структур в PDB, которые импортируются NCBI. База данных консервативных доменов ( CDD ) белков содержит профили последовательностей, которые характеризуют высококонсервативные домены в последовательностях белков. Он также имеет записи из внешних ресурсов, таких как SMART и Pfam . Существует еще одна база данных белков, известная как база данных белковых кластеров, которая содержит наборы последовательностей белков, сгруппированных в соответствии с максимальным выравниванием между отдельными последовательностями, рассчитанным с помощью BLAST. [12]

База данных Пабхем

База данных PubChem NCBI — это общедоступный ресурс по молекулам и их активности в отношении биологических анализов. PubChem доступен для поиска и доступен через информационно-поисковую систему Entrez . [13]

Смотрите также

Рекомендации

  1. ^ «Проект генома человека». Нью-Йорк Таймс .
  2. ^ ab «Научно-исследовательский институт публикует генные данные в Интернете». Нью-Йорк Таймс . 26 июня 1997 г.
  3. ^ «Смысл последовательностей: Стивен Ф. Альтшул об улучшении BLAST» . 2000. Архивировано из оригинала 7 октября 2007 года.
  4. ↑ Аб Мизрахи, Илен (22 августа 2007 г.). GenBank: База данных нуклеотидных последовательностей. Национальный центр биотехнологической информации (США) – через www.ncbi.nlm.nih.gov.
  5. ^ "Главная - Таксономия - NCBI" . www.ncbi.nlm.nih.gov .
  6. США (6 мая 2019 г.). «Главная - Книги - NCBI». ncbi.nlm.nih.gov . Проверено 12 июня 2019 г.
  7. ^ Альтшул Стивен; Гиш Уоррен; Миллер Уэбб; Майерс Юджин; Липман Дэвид (1990). «Базовый инструмент поиска локального выравнивания». Журнал молекулярной биологии . 215 (3): 403–410. дои : 10.1016/s0022-2836(05)80360-2. PMID  2231712. S2CID  14441902.
  8. ^ Мэдден, Т. (2013). «Инструмент анализа последовательности BLAST». Справочник NCBI (2-е изд.). Бетесда, Мэриленд: Национальный центр биотехнологической информации.
  9. ^ Координаторы ресурсов NCBI (2012). «Ресурсы базы данных Национального центра биотехнологической информации». Исследования нуклеиновых кислот 41 (выпуск базы данных): D8–D20.
  10. ^ Остелл Дж. (2002). Справочник NCBI, 2-е издание, глава 15, Поисково-поисковая система Entrez
  11. ^ Маглотт Д. , Прюитт К. и Татусова Т. (2005). Справочник NCBI, 2-е издание, глава 19, Ген: Справочник генов.
  12. ^ Сэйерс Э. (2013). Справочник NCBI, 2-е издание, Белковые ресурсы NCBI
  13. ^ Ван Ю. и Брайант С.Х. (2014). Справочник NCBI, 2-е издание, база данных биоанализов NCBI PubChem.

Внешние ссылки