stringtranslate.com

Банк данных по белкам

Protein Data Bank ( PDB ) [1] — это база данных для трехмерных структурных данных больших биологических молекул, таких как белки и нуклеиновые кислоты , которая курируется Всемирным банком данных о белках (wwPDB). Эти структурные данные получаются и хранятся биологами и биохимиками по всему миру с использованием экспериментальных методик, таких как рентгеновская кристаллография , ЯМР-спектроскопия и, все чаще, криоэлектронная микроскопия . Все представленные данные проверяются экспертами -биокураторами и после одобрения становятся свободно доступными в Интернете в соответствии с лицензией CC0 Public Domain Dedication. [2] Глобальный доступ к данным предоставляется веб-сайтами организаций-членов wwPDB (PDBe, [3] PDBj, [4] RCSB PDB, [5] и BMRB [6] ).

PDB является ключом в областях структурной биологии , таких как структурная геномика . Большинство крупных научных журналов и некоторые финансирующие агентства теперь требуют от ученых предоставления своих структурных данных в PDB. Многие другие базы данных используют структуры белков, размещенные в PDB. Например, SCOP и CATH классифицируют структуры белков, в то время как PDBsum предоставляет графический обзор записей PDB, используя информацию из других источников, таких как Gene Ontology . [7] [8]

История

Две силы сошлись, чтобы инициировать PDB: небольшая, но растущая коллекция наборов данных о структуре белков, определенных с помощью рентгеновской дифракции; и недавно появившийся (1968) молекулярный графический дисплей Brookhaven RAster Display (BRAD) для визуализации этих структур белков в 3D. В 1969 году при спонсорской поддержке Уолтера Гамильтона из Брукхейвенской национальной лаборатории Эдгар Мейер ( Техасский университет A&M ) начал писать программное обеспечение для хранения файлов атомных координат в общем формате, чтобы сделать их доступными для геометрической и графической оценки. К 1971 году одна из программ Мейера, SEARCH, позволила исследователям удаленно получать доступ к информации из базы данных для изучения структур белков в автономном режиме. [9] SEARCH сыграл важную роль в обеспечении сетевого взаимодействия, тем самым ознаменовав функциональное начало PDB.

Банк данных белков был анонсирован в октябре 1971 года в журнале Nature New Biology [10] как совместное предприятие Кембриджского центра кристаллографических данных (Великобритания) и Брукхейвенской национальной лаборатории (США).

После смерти Гамильтона в 1973 году Том Кетцле взял на себя руководство PDB на последующие 20 лет. В январе 1994 года Джоэл Сассман из Израильского института науки Вейцмана был назначен главой PDB. В октябре 1998 года [11] PDB была переведена в Исследовательский центр структурной биоинформатики (RCSB); [12] перевод был завершен в июне 1999 года. Новым директором стала Хелен М. Берман из Ратгерского университета (один из управляющих институтов RCSB, другой — Суперкомпьютерный центр Сан-Диего при Калифорнийском университете в Сан-Диего ). [13] В 2003 году с образованием wwPDB PDB стала международной организацией. Членами-основателями являются PDBe (Европа), [3] RCSB (США) и PDBj (Япония). [4] BMRB [6] присоединился в 2006 году. Каждый из четырех членов wwPDB может выступать в качестве центров депонирования, обработки данных и распространения данных PDB. Обработка данных подразумевает, что сотрудники wwPDB просматривают и аннотируют каждую представленную запись. [14] Затем данные автоматически проверяются на достоверность (исходный код [15] для этого программного обеспечения для проверки был предоставлен общественности бесплатно).

Содержание

Примеры структур белков из PDB (созданных с помощью UCSF Chimera)
Скорость определения структуры белка по методу и году. MX = макромолекулярная кристаллография , 3DEM = трехмерная электронная микроскопия . [16]

База данных PDB обновляется еженедельно ( среда , UTC +0) вместе со списком активов. [17] По состоянию на 10 января 2023 года в PDB входили:

162 041 структура в PDB имеет файл структурного фактора .
11 242 конструкции имеют файл ограничений ЯМР.
5774 структуры в PDB имеют файл химических сдвигов .
13 388 структур в PDB имеют файл карты 3DEM, размещенный в банке данных EM.

Большинство структур определяются методом рентгеновской дифракции, но около 7% структур определяются методом ЯМР белков . При использовании рентгеновской дифракции получаются приближения координат атомов белка, тогда как при использовании ЯМР оценивается расстояние между парами атомов белка. Окончательная конформация белка получается из ЯМР путем решения задачи геометрии расстояний . После 2013 года все большее число белков определяется методом криоэлектронной микроскопии .

Для структур PDB, определенных методом рентгеновской дифракции, имеющих файл структурного фактора, можно просмотреть карту их электронной плотности. Данные таких структур можно просмотреть на трех веб-сайтах PDB.

Исторически число структур в PDB росло примерно экспоненциально: в 1982 году было зарегистрировано 100 структур, в 1993 году — 1000 структур, в 1999 году — 10 000, в 2014 году — 100 000 и в январе 2023 года — 200 000. [18] [19]

Формат файла

Формат файла, изначально используемый PDB, назывался форматом файла PDB. Первоначальный формат был ограничен шириной компьютерных перфокарт до 80 символов на строку. Около 1996 года был поэтапно введен формат «файла макромолекулярной кристаллографической информации», mmCIF, который является расширением формата CIF . mmCIF стал стандартным форматом для архива PDB в 2014 году . [20] В 2019 году wwPDB объявила, что отложения для кристаллографических методов будут приниматься только в формате mmCIF. [21]

XML- версия PDB, называемая PDBML, была описана в 2005 году. [22] Файлы структур можно загрузить в любом из этих трех форматов, хотя все большее число структур не соответствуют устаревшему формату PDB. Отдельные файлы легко загружаются в графические пакеты с интернет- адресов :

" 4hhb" — это идентификатор PDB. Каждая структура, опубликованная в PDB, получает четырехзначный буквенно-цифровой идентификатор, свой PDB ID. (Это не уникальный идентификатор для биомолекул, поскольку несколько структур для одной и той же молекулы — в разных средах или конформациях — могут содержаться в PDB с разными PDB ID.)

Просмотр данных

Файлы структур можно просматривать с помощью одной из нескольких бесплатных и открытых программ , включая Jmol , Pymol , VMD , Molstar и Rasmol . Другие несвободные, условно-бесплатные программы включают ICM-Browser, [23] MDL Chime , UCSF Chimera , Swiss-PDB Viewer, [24] StarBiochem [25] (интерактивный молекулярный просмотрщик на основе Java с интегрированным поиском в банке данных белков), Sirius и VisProt3DS [26] (инструмент для визуализации белков в 3D-стереоскопическом виде в анаглифическом и других режимах), а также Discovery Studio . Веб-сайт RCSB PDB содержит обширный список как бесплатных, так и коммерческих программ визуализации молекул и плагинов для веб-браузеров.

Смотрите также

Ссылки

  1. ^ wwPDB, Консорциум (2019). «Банк данных белков: единый глобальный архив данных о трехмерной макромолекулярной структуре». Nucleic Acids Res . 47 (D1): 520–528. doi : 10.1093/nar/gky949. PMC 6324056. PMID  30357364. 
  2. ^ wwPDB.org. "wwPDB: Политики использования". www.wwpdb.org . Получено 2024-04-16 .
  3. ^ ab "PDBe home < Node < EMBL-EBI". pdbe.org .
  4. ^ ab "Банк данных белков Японии – PDB Япония – PDBj". pdbj.org .
  5. ^ Банк, RCSB Protein Data. "RCSB PDB: Домашняя страница". rcsb.org .
  6. ^ ab "Биологический магнитно-резонансный банк". bmrb.wisc.edu .
  7. ^ Берман, Х. М. (январь 2008 г.). «Банк данных белков: историческая перспектива» (PDF) . Acta Crystallographica Section A. A64 ( 1): 88–95. doi : 10.1107/S0108767307035623 . PMID  18156675.
  8. ^ Laskowski RA, Hutchinson EG, Michie AD, Wallace AC, Jones ML, Thornton JM (декабрь 1997 г.). "PDBsum: веб-база данных резюме и анализов всех структур PDB". Trends Biochem. Sci . 22 (12): 488–90. doi :10.1016/S0968-0004(97)01140-7. PMID  9433130.
  9. ^ Мейер ЭФ (1997). «Первые годы банка данных по белкам». Protein Science . 6 (7). Cambridge University Press: 1591–1597. doi :10.1002/pro.5560060724. PMC 2143743. PMID  9232661 . 
  10. ^ "Банк данных белков". Nature New Biology . 233. 1971. doi : 10.1038/newbio233223b0 .
  11. ^ Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, Shindyalov IN, Bourne PE (январь 2000 г.). "Банк данных белков". Nucleic Acids Res . 28 (1): 235–242. doi :10.1093/nar/28.1.235. PMC 102472. PMID  10592235 . 
  12. ^ "Research Collaboratory for Structural Bioinformatics". RCSB.org . Research Collaboratory for Structural Bioinformatics. Архивировано из оригинала 2007-02-05.
  13. ^ "Архив информационного бюллетеня RCSB PDB". Банк данных белков RCSB.
  14. ^ Карри Э., Фрейтас А., О'Райн С. (2010). «Роль курирования данных, управляемого сообществом, для предприятий». В Д. Вуде (ред.). Связывание корпоративных данных . Бостон: Springer US. С. 25–47. ISBN 978-1-441-97664-2.
  15. ^ "PDB Validation Suite". sw-tools.pdb.org .
  16. ^ Burley SK, Berman HM, Bhikadiya C, Bi C, Chen L, Costanzo LD и др. (консорциум wwPDB) (январь 2019 г.). «Банк данных белков: единый глобальный архив данных о трехмерной макромолекулярной структуре». Nucleic Acids Research . 47 (D1): D520–D528. doi :10.1093/nar/gky949. PMC 6324056 . PMID  30357364. 
  17. ^ "PDB Current Holdings Breakdown". RCSB. Архивировано из оригинала 2007-07-04 . Получено 2007-07-02 .
  18. ^ Anon (2014). «Жесткие данные: для Protein Data Bank было немалым подвигом оставаться актуальным для 100 000 структур». Nature . 509 (7500): 260. doi : 10.1038/509260a . PMID  24834514.
  19. ^ Protein Data Bank. «PDB Statistics: Overall Growth of Released Structures Per Year» (Банк данных белков). www.rcsb.org . Получено 12 января 2023 г.
  20. ^ "wwPDB: Форматы файлов и PDB". wwpdb.org . Получено 1 апреля 2020 г. .
  21. ^ wwPDB.org. "wwPDB: Новости 2019". wwpdb.org .
  22. ^ Westbrook J, Ito N, Nakamura H, Henrick K, Berman HM (апрель 2005 г.). «PDBML: представление архивных данных о макромолекулярной структуре в XML». Биоинформатика . 21 (7): 988–992. doi : 10.1093/bioinformatics/bti082 . PMID  15509603.
  23. ^ "ICM-Browser". Molsoft LLC . Получено 2013-04-06 .
  24. ^ "Swiss PDB Viewer". Швейцарский институт биоинформатики . Получено 2013-04-06 .
  25. ^ "STAR: Биохимия - Главная". web.mit.edu .
  26. ^ "VisProt3DS". Molecular Systems Ltd. Получено 2013-04-06 .

Внешние ссылки