DisProt — это вручную курируемая биологическая база данных внутренне неупорядоченных белков (IDP) и регионов (IDR). [1] [2] [3] Аннотации DisProt охватывают информацию о состоянии белка, а также, когда это доступно, о его переходах состояний, взаимодействиях и функциональных аспектах беспорядка, обнаруженных с помощью определенных экспериментальных методов. DisProt размещается и поддерживается в лаборатории BioComputing UP (Кафедра биомедицинских наук, Университет Падуи ).
Веб-сайт
Последняя версия DisProt, DisProt 9, [3] включает в себя более 2300 записей о белках и более 4500 доказательств структурного состояния, переходов состояний, взаимодействий и функций, а также более 2500 аннотированных научных публикаций.
Биокурация в DisProt
Записи DisProt аннотируются профессиональными и общественными биокураторами на основе экспериментальных данных, опубликованных в научной литературе. На домашней странице DisProt представлены примеры записей DisProt, то есть p53 и Catenin beta-1 , а также записи белков, принадлежащих вирусу SARS-CoV-2 , например Nucleoprotein .
Тематические наборы данных
Начиная с 2020 года DisProt выпускает « тематические наборы данных », описывающие биологические области, в которых ВПЛ участвуют и играют решающую роль. [3] Все записи, относящиеся к этим наборам данных, помечены названием темы .
Одноклеточные токсины и антитоксины (DisProt release 2020_12)
На домашней странице DisProt модельные организмы представлены значком, названием вида и количеством записей DisProt, принадлежащих каждому конкретному организму. Записи следующих организмов доступны на домашней странице DisProt в разделе « Организмы » и могут быть загружены как отдельные файлы: Homo sapiens, Mus musculus, Rattus norvegicus, Saccharomices cerevisiae, Escherichia coli, Arabidopsis thaliana, Drosophila melanogaster, Caenorhabditis elegans .
Версии и релизы DisProt
Версии и выпуски DisProt включают изменения на веб-сайте и в вручную отобранном контенте базы данных.
DisProt 7 [4] (2016): более 800 записей белков и 1000 аннотированных публикаций. Каждая запись белка в DisProt характеризуется идентификатором DisProt, который принимает форму префикса DP, за которым следует 5-значный идентификатор белка, например, DP00016 соответствует белку Cyclin-dependent kinase inhibitor 1. Он включал новый веб-интерфейс на основе Angular.JS .
DisProt 8 [5] (2019): более 1400 записей белков и более 3000 неупорядоченных областей белков. DisProt 8 также представил концепцию стабильного идентификатора области DisProt. DisProt широко использовался для обучения методов машинного обучения (ML) для прогнозирования неупорядоченных областей в белках. Кроме того, DisProt использовался для понимания свойств внутренне неструктурированных белков. [6] DisProt 8 отличался новым веб-интерфейсом и расширенным API, а также новым интерфейсом аннотаций, интегрирующим технологии интеллектуального анализа текста.
DisProt 9 [3] (2021): более 2300 записей о белках и более 4500 доказательств, аннотированных из более чем 2500 научных статей. DisProt 9 имеет обновленный веб-интерфейс и реорганизованную онтологию внутренне неупорядоченных белков (IDPO). Лучшая совместимость обеспечивается за счет принятия онтологии генов (аннотации взаимодействий и функций IDP и IDR) и онтологии доказательств и заключений (аннотации экспериментальных методов).
Онтологии DisProt
DisProt использует три различные онтологии для аннотирования неупорядоченных областей: Intrinsically Disordered Proteins Ontology (IDPO), Evidence and Conclusion Ontology (ECO) и Gene Ontology (GO) . DisProt имеет специальную страницу для каждого термина IDPO, которая включает идентификатор, имя и определение термина и перекрестные ссылки на внешние онтологии, например Gene Ontology. Каждая страница термина IDPO содержит список всех записей DisProt, аннотированных этим конкретным термином.
Онтология внутренне неупорядоченных белков: используется для аннотирования следующих типов доказательств: 1. структурное состояние (т. е. беспорядок, предрасплавленная глобула, расплавленная глобула, порядок ), 2. структурный переход (переходы между структурными состояниями) и 3. самофункции (например, самоингибирование ) и функции, связанные с неструктурированным состоянием белка (например, гибкий линкер/спейсер ).
Онтология доказательств и заключений: используется для аннотирования экспериментальных методов, используемых для оценки наличия внутреннего беспорядка или одного из его аспектов, например, доказательство кругового дихроизма .
Онтология генов: используется для аннотирования партнеров по связыванию, например, связывания белков , и других функций, например, шаперона фолдинга РНК .
Внешние ссылки
Домашняя страница DisProt
Блог DisProt
Ссылки
^ Вучетич, Слободан; Обрадович, Зоран; Вачич, Владимир; Радивояц, Предраг; Пэн, Канг; Якучева, Лилия М.; Кортезе, Марк С.; Лоусон, Дж. Дэвид; Браун, Селеста Дж. (2005-01-01). "DisProt: база данных нарушений белков". Биоинформатика . 21 (1): 137–140. doi : 10.1093/bioinformatics/bth476 . ISSN 1367-4803. PMID 15310560.
^ Sickmeier, Megan; Hamilton, Justin A.; LeGall, Tanguy; Vacic, Vladimir; Cortese, Marc S.; Tantos, Agnes; Szabo, Beata; Tompa, Peter; Chen, Jake (2007-01-01). "DisProt: база данных неупорядоченных белков". Nucleic Acids Research . 35 (выпуск базы данных): D786–793. doi :10.1093/nar/gkl893. ISSN 1362-4962. PMC 1751543. PMID 17145717 .
^ abcd Квалья, Федерика; Месарош, Балинт; Салладини, Эдоардо; Хатос, Андраш; Панча, Рита; Чемес, Люсия Б.; Пайкос, Матьяш; Лазарь, Тамас; Пенья-Диас, Самуэль; Сантос, Хайме; Акс, Вероника (25 ноября 2021 г.). «DisProt в 2022 году: улучшенное качество и доступность аннотации о внутренних нарушениях белка». Исследования нуклеиновых кислот . 50 (Д1): Д480–Д487. дои : 10.1093/nar/gkab1082. ISSN 1362-4962. ПМЦ 8728214 . ПМИД 34850135.
^ Piovesan, Damiano; Tabaro, Francesco; Mičetić, Ivan; Necci, Marco; Quaglia, Federica; Oldfield, Christopher J.; Aspromonte, Maria Cristina; Davey, Norman E.; Davidović, Radoslav (2016-11-28). "DisProt 7.0: крупное обновление базы данных неупорядоченных белков". Nucleic Acids Research . 45 (D1): D219–D227. doi :10.1093/nar/gkw1056. ISSN 1362-4962. PMC 5210544. PMID 27899601 .
^ Kovačević JJ (июнь 2012 г.). «Вычислительный анализ содержимого позиционно-зависимого беспорядка в базе данных DisProt». Геномика Протеомика Биоинформатика . 10 (3): 158–65. doi :10.1016/j.gpb.2012.01.002. PMC 5056116 . PMID 22917189.