stringtranslate.com

база данных CATH

Схематическое изображение трех верхних уровней схемы классификации CATH. [2]

База данных классификации структур белков CATH — это бесплатный, общедоступный онлайн-ресурс, предоставляющий информацию об эволюционных связях доменов белков . Она была создана в середине 1990-х годов профессором Кристин Оренго и коллегами, включая Джанет Торнтон и Дэвида Джонса , [2] и продолжает разрабатываться группой Оренго в Университетском колледже Лондона . CATH разделяет многие общие черты с ресурсом SCOP , однако есть также много областей, в которых подробная классификация сильно отличается. [3] [4] [5] [6]

Иерархическая организация

Экспериментально определенные трехмерные структуры белков получаются из Protein Data Bank и разделяются на их последовательные полипептидные цепи , где это применимо. Домены белков идентифицируются в этих цепях с использованием смеси автоматических методов и ручного курирования. [7]

Затем домены классифицируются в рамках структурной иерархии CATH: на уровне класса (C) домены назначаются в соответствии с содержанием их вторичной структуры , то есть все альфа , все бета , смесь альфа и бета или небольшая вторичная структура; на уровне архитектуры (A) для назначения используется информация о расположении вторичной структуры в трехмерном пространстве; на уровне топологии/складки (T) используется информация о том, как соединены и организованы элементы вторичной структуры; назначения на уровень гомологичного суперсемейства (H) производятся, если есть веские доказательства того, что домены связаны эволюцией [2], то есть они гомологичны.

Дополнительные данные о последовательностях для доменов без экспериментально определенных структур предоставляются родственным ресурсом CATH, Gene3D, которые используются для заполнения гомологичных суперсемейств. Последовательности белков из UniProtKB и Ensembl сканируются с помощью CATH HMMs для прогнозирования границ последовательностей доменов и выполнения назначений гомологичных суперсемейств.

Релизы

Команда CATH выпускает новые данные как в виде ежедневных снимков, так и официальных релизов примерно ежегодно. Последний релиз CATH-Gene3D (v4.3) был выпущен в декабре 2020 года и состоит из: [8]

Программное обеспечение с открытым исходным кодом

CATH — это проект программного обеспечения с открытым исходным кодом , в рамках которого разработчики разрабатывают и поддерживают ряд инструментов с открытым исходным кодом, [9] которые доступны публично на GitHub . [10]

Ссылки

  1. ^ Dawson NL, Lewis TE, Das S, Lees JG, Lee D, Ashford P, et al. (Январь 2017). «CATH: расширенный ресурс для прогнозирования функции белка через структуру и последовательность». Nucleic Acids Research . 45 (D1): D289–D295. doi :10.1093/nar/gkw1098. PMC  5210570. PMID  27899584 .
  2. ^ abc Orengo CA, Michie AD, Jones S, Jones DT, Swindells MB, Thornton JM (август 1997 г.). "CATH — иерархическая классификация структур доменов белков". Structure . 5 (8). London, England: 1093–108. doi : 10.1016/s0969-2126(97)00260-8 . PMID  9309224.
  3. ^ "CATH: База данных классификации структур белков в UCL". Cathdb.info . Получено 9 марта 2017 г. .
  4. ^ "CATH". Cathdb.info . Получено 9 марта 2017 г. .
  5. ^ "CATH Database (@CATHDatabase)". Twitter . Получено 9 марта 2017 г. .
  6. ^ Pearl FM, Bennett CF, Bray JE, Harrison AP, Martin N, Shepherd A и др. (январь 2003 г.). «База данных CATH: расширенный ресурс семейства белков для структурной и функциональной геномики». Nucleic Acids Research . 31 (1): 452–455. doi : 10.1093/nar/gkg062. PMC 165509. PMID  12520050. 
  7. ^ "CATH". cathdb.info . Получено 14 сентября 2024 г. .
  8. ^ "CATH". cathdb.info . Получено 14 сентября 2024 г. .
  9. ^ "Инструменты". cathdb.info . Получено 18 декабря 2016 г. .
  10. ^ UCLOrengoGroup/cath-tools, UCLOrengoGroup, 9 сентября 2024 г. , получено 14 сентября 2024 г.