Национальный центр биотехнологической информации

Национальный центр биотехнологической информации ( NCBI ) ^[1]^[2] является частью Национальной медицинской библиотеки США (NLM), филиала Национальных институтов здравоохранения (NIH). Он одобрен и финансируется правительством Соединенных Штатов . NCBI расположен в Бетесде, штат Мэриленд , и был основан в 1988 году в соответствии с законодательством, спонсируемым конгрессменом США Клодом Пеппером .

В NCBI хранится ряд баз данных, имеющих отношение к биотехнологии и биомедицине , и он является важным ресурсом для инструментов и услуг биоинформатики. Основные базы данных включают GenBank для последовательностей ДНК и PubMed , библиографическую базу данных биомедицинской литературы. Другие базы данных включают базу данных NCBI Epigenomics . Все эти базы данных доступны в Интернете через поисковую систему Entrez . NCBI возглавлял Дэвид Липман , ^[2] один из первых авторов программы выравнивания последовательностей BLAST ^[3] и широко уважаемый деятель в области биоинформатики .

ГенБанк

NCBI отвечал за предоставление доступа к базе данных последовательностей ДНК GenBank с 1992 года. ^[4] GenBank координирует свои действия с отдельными лабораториями и другими базами данных последовательностей, такими как базы данных Европейской лаборатории молекулярной биологии (EMBL) и Банка данных ДНК Японии (DDBJ). ^[4]

С 1992 года NCBI расширилась и теперь предоставляет другие базы данных в дополнение к GenBank. NCBI предоставляет базу данных генов, онлайн-менделевское наследование у человека , базу данных молекулярного моделирования (3D-структуры белков), dbSNP (базу данных однонуклеотидных полиморфизмов ), коллекцию эталонных последовательностей, карту генома человека и браузер таксономии . и координирует работу с Национальным институтом рака для реализации проекта анатомии генома рака. NCBI присваивает уникальный идентификатор (идентификатор таксономии) каждому виду организма. ^[5]

У NCBI есть программные инструменты, доступные через интернет-браузеры или по FTP . Например, BLAST — это программа поиска сходства последовательностей. BLAST может выполнять сравнение последовательностей с базой данных ДНК GenBank менее чем за 15 секунд.

Книжная полка NCBI

Книжная полка NCBI ^[6] представляет собой коллекцию свободно доступных для скачивания онлайн-версий избранных биомедицинских книг. Книжная полка охватывает широкий спектр тем, включая молекулярную биологию , биохимию , клеточную биологию , генетику , микробиологию , болезненные состояния с молекулярной и клеточной точки зрения, методы исследования и вирусологию . Некоторые из книг представляют собой онлайн-версии ранее опубликованных книг, а другие, такие как Coffee Break , написаны и отредактированы сотрудниками NCBI. Книжная полка является дополнением к репозиторию рефератов рецензируемых публикаций Entrez PubMed , поскольку содержимое книжной полки обеспечивает устоявшиеся взгляды на развивающиеся области исследований и контекст, в котором могут быть организованы многие разрозненные отдельные части опубликованных исследований. ^[^{нужна цитата}^]

Базовый инструмент поиска локального выравнивания (BLAST)

BLAST — это алгоритм, используемый для расчета сходства последовательностей между биологическими последовательностями, такими как нуклеотидные последовательности ДНК и аминокислотные последовательности белков. ^[7] BLAST — мощный инструмент для поиска последовательностей, похожих на последовательность запроса, внутри одного и того же организма или в разных организмах. Он выполняет поиск последовательности запросов в базах данных и серверах NCBI и отправляет результаты обратно в браузер человека в выбранном формате. Входные последовательности в BLAST в основном имеют формат FASTA или GenBank, тогда как выходные данные могут быть доставлены в различных форматах, таких как HTML, форматирование XML и простой текст. HTML является форматом вывода по умолчанию для веб-страницы NCBI. Результаты для NCBI-BLAST представлены в графическом формате со всеми найденными совпадениями, таблицей с идентификаторами последовательностей для совпадений, имеющих данные, связанные с оценкой, а также выравниванием интересующей последовательности и полученных совпадений с аналогичными оценками BLAST для них. ^[8]

Энтрез

Система межбазового поиска Entrez Global Query используется в NCBI для всех основных баз данных, таких как нуклеотидные и белковые последовательности, белковые структуры, PubMed, Taxonomy, Complete Genomes, OMIM и некоторых других . ^[9] Entrez — это система индексирования и поиска данных из различных источников для биомедицинских исследований. NCBI распространил первую версию Entrez в 1991 году, состоящую из нуклеотидных последовательностей из PDB и GenBank , белковых последовательностей из SWISS-PROT, транслированных GenBank, PIR, PRF, PDB, а также связанных с ними рефератов и цитат из PubMed. Entrez специально разработан для интеграции данных из нескольких различных источников, баз данных и форматов в единую информационную модель и систему поиска, которая может эффективно извлекать соответствующие ссылки, последовательности и структуры. ^[10]

Ген

Ген был реализован в NCBI для характеристики и организации информации о генах. Он служит основным узлом в связке геномной карты, экспрессии, последовательности, функции белка, структуры и данных о гомологии. Каждой записи гена присваивается уникальный GeneID, который можно отслеживать в циклах пересмотра. Генные записи для известных или предсказанных генов устанавливаются здесь и разграничиваются положениями на карте или нуклеотидными последовательностями. Gene имеет ряд преимуществ перед своим предшественником LocusLink, в том числе лучшую интеграцию с другими базами данных в NCBI, более широкую таксономическую область применения и расширенные возможности запроса и поиска, предоставляемые системой Entrez. ^[11]

Белок

В базе данных белков хранятся текстовые записи для отдельных последовательностей белков, полученные из множества различных ресурсов, таких как проект NCBI Reference Sequence (RefSeq), GenBank, PDB и UniProtKB/SWISS-Prot. Записи о белках представлены в различных форматах, включая FASTA и XML , и связаны с другими ресурсами NCBI. Белок предоставляет пользователям соответствующие данные, такие как гены, последовательности ДНК/РНК, биологические пути, данные об экспрессии и вариациях, а также литературу. Он также предоставляет заранее определенные наборы похожих и идентичных белков для каждой последовательности, рассчитанные с помощью BLAST. База данных структур NCBI содержит наборы трехмерных координат для экспериментально определенных структур в PDB, которые импортируются NCBI. База данных консервативных доменов ( CDD ) белков содержит профили последовательностей, которые характеризуют высококонсервативные домены в последовательностях белков. Он также имеет записи из внешних ресурсов, таких как SMART и Pfam . Существует еще одна база данных белков, известная как база данных белковых кластеров, которая содержит наборы последовательностей белков, сгруппированных в соответствии с максимальным выравниванием между отдельными последовательностями, рассчитанным с помощью BLAST. ^[12]

База данных Пабхем

База данных PubChem NCBI — это общедоступный ресурс по молекулам и их активности в отношении биологических анализов. PubChem доступен для поиска и доступен через информационно-поисковую систему Entrez . ^[13]

Смотрите также

Внешние ссылки

Викиданные обладают свойством:

Идентификатор таксономии NCBI (P685) (см. использование )

Официальный веб-сайт
Официальный сайт Национальной медицинской библиотеки]
Официальный сайт Национальных институтов здравоохранения