Критическая оценка предсказания структуры ( CASP ), иногда называемая критической оценкой предсказания структуры белка , является всемирным экспериментом по предсказанию структуры белка , проводимым сообществом каждые два года с 1994 года. [1] [2] CASP предоставляет исследовательским группам возможность объективно протестировать свои методы предсказания структуры и предоставляет независимую оценку современного состояния моделирования структуры белка исследовательскому сообществу и пользователям программного обеспечения. Несмотря на то, что основной целью CASP является содействие развитию методов определения трехмерной структуры белка по его аминокислотной последовательности, многие рассматривают эксперимент скорее как «чемпионат мира» в этой области науки. Более 100 исследовательских групп со всего мира регулярно участвуют в CASP, и нередко целые группы приостанавливают свои другие исследования на месяцы, пока они сосредотачиваются на подготовке своих серверов к эксперименту и выполнении подробных прогнозов.
Чтобы гарантировать, что ни один предсказатель не будет иметь предварительной информации о структуре белка, которая даст им преимущество, важно, чтобы эксперимент проводился двойным слепым методом: ни предикторы, ни организаторы и оценщики не знают структуры целевых белков на момент составления прогнозов. Целями для прогнозирования структуры являются либо структуры, которые вскоре будут решены с помощью рентгеновской кристаллографии или ЯМР-спектроскопии, либо структуры, которые только что были решены (в основном одним из центров структурной геномики ) и хранятся в Protein Data Bank . Если будет обнаружено, что данная последовательность связана общим происхождением с белковой последовательностью известной структуры (называемой шаблоном), для прогнозирования третичной структуры можно использовать сравнительное моделирование белка . Шаблоны можно найти с помощью методов выравнивания последовательностей (например, BLAST или HHsearch ) или методов белковой нити , которые лучше подходят для поиска отдаленно связанных шаблонов. В противном случае необходимо применять прогнозирование структуры белка de novo (например, Rosetta), что гораздо менее надежно, но иногда может давать модели с правильной складкой (обычно для белков менее 100-150 аминокислот). Действительно новые складочки становятся довольно редкими среди целей, [3] [4] делая эту категорию меньше, чем хотелось бы.
Основной метод оценки [5] — это сравнение предсказанных модельных позиций α-углерода с позициями в целевой структуре. Сравнение наглядно показано с помощью кумулятивных графиков расстояний между парами эквивалентных α-углеродов в выравнивании модели и структуры, как показано на рисунке (идеальная модель будет оставаться на нуле на всем протяжении), и ей присваивается числовая оценка GDT-TS (Global Distance Test — Total Score), описывающая процент хорошо смоделированных остатков в модели по отношению к цели. [6] Свободное моделирование (без шаблонов или de novo ) также оценивается визуально экспертами, поскольку числовые оценки не работают так хорошо для поиска слабых сходств в самых сложных случаях. [7] Высокоточные прогнозы на основе шаблонов оценивались в CASP7 по тому, работали ли они для молекулярно-замещающей фазировки целевой кристаллической структуры [8] с последующими успехами [9] и по качеству модели полной модели (не только α-углерода ) и ее соответствию цели в CASP8. [10]
Оценка результатов проводится по следующим категориям прогнозов:
Категория прогнозирования третичной структуры была далее подразделена на:
Начиная с CASP7, категории были переопределены, чтобы отразить разработки в методах. Категория «Моделирование на основе шаблонов» включает все бывшие сравнительные модели, модели на основе гомологичных складок и некоторые модели на основе аналогичных складок. Категория «Моделирование без шаблонов (FM)» включает модели белков с ранее невиданными складками и модели на основе жестких аналогичных складок. Из-за ограниченного количества целей без шаблонов (они довольно редки), в 2011 году был введен так называемый CASP ROLL. Этот непрерывный (переходящий) эксперимент CASP направлен на более строгую оценку методов прогнозирования без шаблонов посредством оценки большего количества целей за пределами обычного сезона прогнозирования CASP. В отличие от LiveBench и EVA , этот эксперимент соответствует духу слепого прогнозирования CASP, т. е. все прогнозы делаются на основе еще неизвестных структур. [11]
Результаты CASP опубликованы в специальных дополнительных выпусках научного журнала Proteins , все из которых доступны на веб-сайте CASP. [12] В главной статье каждого из этих приложений описываются особенности эксперимента [13] [14] , а в заключительной статье оценивается прогресс в этой области. [15] [16]
В декабре 2018 года CASP13 попал в заголовки новостей, когда его выиграла AlphaFold , программа искусственного интеллекта, созданная DeepMind . [17] В ноябре 2020 года улучшенная версия 2 AlphaFold победила в CASP14. [18] По словам одного из соучредителей CASP Джона Молта, AlphaFold набрал около 90 баллов по 100-балльной шкале точности прогнозирования для умеренно сложных белковых целей. [19] AlphaFold стал открытым исходным кодом в 2021 году, а в CASP15 в 2022 году, хотя DeepMind не участвовал, практически все высокопоставленные команды использовали AlphaFold или модификации AlphaFold. [20]
Автоматизированные оценки для CASP15 (2022)
Автоматизированные оценки для CASP14 (2020)
Автоматизированные оценки для CASP13 (2018)
Автоматизированные оценки для CASP12 (2016)
Автоматизированные оценки для CASP11 (2014)
Автоматизированные оценки для CASP10 (2012)
Автоматизированные оценки для CASP9 (2010)
Автоматизированные оценки для CASP8 (2008)
Автоматизированные оценки для CASP7 (2006)