stringtranslate.com

Банк данных белков (формат файла)

Формат файла Protein Data Bank (PDB) — это текстовый формат файла, описывающий трехмерные структуры молекул, хранящихся в Protein Data Bank , теперь замененный форматом mmCIF . Формат PDB соответственно обеспечивает описание и аннотацию структур белков и нуклеиновых кислот, включая атомные координаты, вторичные структурные назначения, а также атомную связность. Кроме того, хранятся экспериментальные метаданные. Формат PDB — это устаревший формат файла для Protein Data Bank , который хранил данные о биологических макромолекулах в новом формате файла PDBx/mmCIF с 2014 года. [1]

История

Формат файла PDB был изобретен в 1972 году [2] [3] как файл, читаемый человеком, который позволил бы исследователям обмениваться атомными координатами в данном белке через систему базы данных. Его формат с фиксированной шириной столбцов ограничен 80 или 140 [4] столбцами, что было основано на ширине компьютерных перфокарт, которые ранее использовались для обмена координатами. [5] За эти годы формат файла претерпел множество изменений и доработок. Последнее обновление формата файла PDB было в ноябре 2012 года с версией 3.30. [6]

Пример

Типичный файл PDB, описывающий белок, состоит из сотен или тысяч строк, подобных следующим (взятым из файла, описывающего структуру синтетического коллагеноподобного пептида):

ЗАГОЛОВОК ВНЕКЛЕТОЧНЫЙ МАТРИКС 22-ЯНВ-98 1A3IНАЗВАНИЕ РЕНТГЕНОКРИСТАЛЛОГРАФИЧЕСКОЕ ОПРЕДЕЛЕНИЕ КОЛЛАГЕНОПОДОБНОГОНАЗВАНИЕ 2 ПЕПТИД С ПОВТОРЯЮЩЕЙСЯ ПОСЛЕДОВАТЕЛЬНОСТЬЮ (PRO-PRO-GLY)...РЕНТГЕНОВСКАЯ ДИФРАКЦИЯ EXPDTAАВТОР РЗКРАМЕР,Л.ВИТАЛЬЯНО,Х.БЕЛЛА,Р.БЕРИЗИО,Л.МАЦАРЕЛЛА,АВТОР 2 Б.БРОДСКИЙ,А.ЗАГАРИ,ХМБЕРМАН...ЗАМЕЧАНИЕ 350 БИОМОЛЕКУЛА: 1ЗАМЕЧАНИЕ 350 ПРИМЕНЯЙТЕ СЛЕДУЮЩЕЕ К ЦЕПЯМ: A, B, CЗАМЕЧАНИЕ 350 БИОМТ1 1 1,000000 0,000000 0,000000 0,00000ЗАМЕЧАНИЕ 350 БИОМТ2 1 0,000000 1,000000 0,000000 0,00000...SEQRES 1 A 9 PRO PRO GLY PRO PRO GLY PRO PRO GLYSEQRES 1 B 6 PRO PRO GLY PRO PRO GLYSEQRES 1 C 6 PRO PRO GLY PRO PRO GLY...АТОМ 1 N PRO A 1 8,316 21,206 21,530 1,00 17,44 НАТОМ 2 CA ПРО А 1 7,608 20,729 20,336 1,00 17,44 САТОМ 3 С ПРО А 1 8,487 20,707 19,092 1,00 17,44 САТОМ 4 О ПРО А 1 9,466 21,457 19,005 1,00 17,44 ОАТОМ 5 КБ ПРО А 1 6,460 21,723 20,211 1,00 22,26 С...HETATM 130 C ACY 401 3,682 22,541 11,236 1,00 21,19 CHETATM 131 O ACY 401 2,807 23,097 10,553 1,00 21,19 OHETATM 132 OXT ACY 401 4,306 23,101 12,291 1,00 21,19 O...
Записи HEADER, TITLE и AUTHOR
предоставляют информацию об исследователях, которые определили структуру; доступны многочисленные другие типы записей, предоставляющие другие типы информации.
РЕМАРК записи
могут содержать аннотации в свободной форме, но они также содержат стандартизированную информацию; например, REMARK 350 BIOMTзаписи описывают, как вычислить координаты экспериментально наблюдаемого мультимера из координат явно указанных мультимеров одной повторяющейся единицы.
записи SEQRES
приведите последовательности трех пептидных цепей (названных A, B и C), которые в этом примере очень короткие, но обычно охватывают несколько строк.
АТОМ записи
описывают координаты атомов, входящих в состав белка. Например, первая строка ATOM выше описывает атом альфа-N первого остатка пептидной цепи A, который является остатком пролина; первые три числа с плавающей точкой являются его координатами x, y и z и выражены в единицах ангстремов . [7] Следующие три столбца — это занятость, температурный фактор и название элемента соответственно.
записи HETATM
описывают координаты гетероатомов, то есть тех атомов, которые не входят в состав молекулы белка.

Программное обеспечение для молекулярной визуализации, способное отображать файлы PDB

Программное обеспечение для 3D-анимации, способное отображать файлы PDB

Смотрите также

Ссылки

  1. ^ Берман, Хелен М.; Клейвегт, Джерард Дж.; Накамура, Харуки; Маркли, Джон Л. (2014-10-01). «Архив банка данных белков как открытый ресурс данных». Журнал компьютерного молекулярного дизайна . 28 (10): 1009–1014. doi :10.1007/s10822-014-9770-y. ISSN  1573-4951. PMC 4196035.  PMID 25062767  .
  2. ^ "wwPDB: Формат файла". www.wwpdb.org .
  3. ^ "ФОРМАТЫ ЗАПИСИ ФАЙЛОВ БАЗЫ ДАННЫХ БЕЛКОВ" (PDF) . Получено 9 июня 2024 г. .
  4. ^ "ФОРМАТЫ ЗАПИСИ ФАЙЛОВ БАЗЫ ДАННЫХ БЕЛКОВ" (PDF) . Получено 9 июня 2024 г. .
  5. ^ Берман, Хелен М (2008). «Банк данных белков: историческая перспектива». Acta Crystallographica . 64 (Pt 1): 88–95. doi : 10.1107/S0108767307035623 . ISSN  2053-2733. PMID  18156675.
  6. ^ "wwPDB: Форматы файлов и PDB". Protein Data Bank . Получено 2024-01-15 .
  7. ^ "Формат wwPDB версии 3.3: Раздел координат". Архивировано из оригинала 2012-02-28 . Получено 2012-03-23 ​​.

Внешние ссылки