КАСП

Критическая оценка предсказания структуры ( CASP ), иногда называемая критической оценкой предсказания структуры белка , является всемирным экспериментом по предсказанию структуры белка , проводимым сообществом каждые два года с 1994 года. ^[1]^[2] CASP предоставляет исследовательским группам возможность объективно протестировать свои методы предсказания структуры и предоставляет независимую оценку современного состояния моделирования структуры белка исследовательскому сообществу и пользователям программного обеспечения. Несмотря на то, что основной целью CASP является содействие развитию методов определения трехмерной структуры белка по его аминокислотной последовательности, многие рассматривают эксперимент скорее как «чемпионат мира» в этой области науки. Более 100 исследовательских групп со всего мира регулярно участвуют в CASP, и нередко целые группы приостанавливают свои другие исследования на месяцы, пока они сосредотачиваются на подготовке своих серверов к эксперименту и выполнении подробных прогнозов.

Выбор целевых белков

Чтобы гарантировать, что ни один предсказатель не будет иметь предварительной информации о структуре белка, которая даст им преимущество, важно, чтобы эксперимент проводился двойным слепым методом: ни предикторы, ни организаторы и оценщики не знают структуры целевых белков на момент составления прогнозов. Целями для прогнозирования структуры являются либо структуры, которые вскоре будут решены с помощью рентгеновской кристаллографии или ЯМР-спектроскопии, либо структуры, которые только что были решены (в основном одним из центров структурной геномики ) и хранятся в Protein Data Bank . Если будет обнаружено, что данная последовательность связана общим происхождением с белковой последовательностью известной структуры (называемой шаблоном), для прогнозирования третичной структуры можно использовать сравнительное моделирование белка . Шаблоны можно найти с помощью методов выравнивания последовательностей (например, BLAST или HHsearch ) или методов белковой нити , которые лучше подходят для поиска отдаленно связанных шаблонов. В противном случае необходимо применять прогнозирование структуры белка de novo^{(например, Rosetta), что гораздо менее надежно, но иногда может давать модели с правильной складкой (обычно для белков менее 100-150 аминокислот). Действительно новые складочки становятся довольно редкими среди целей, [3]}^[4] делая эту категорию меньше, чем хотелось бы.

Оценка

Основной метод оценки ^[5] — это сравнение предсказанных модельных позиций α-углерода с позициями в целевой структуре. Сравнение наглядно показано с помощью кумулятивных графиков расстояний между парами эквивалентных α-углеродов в выравнивании модели и структуры, как показано на рисунке (идеальная модель будет оставаться на нуле на всем протяжении), и ей присваивается числовая оценка GDT-TS (Global Distance Test — Total Score), описывающая процент хорошо смоделированных остатков в модели по отношению к цели. ^[6] Свободное моделирование (без шаблонов или de novo ) также оценивается визуально экспертами, поскольку числовые оценки не работают так хорошо для поиска слабых сходств в самых сложных случаях. ^[7] Высокоточные прогнозы на основе шаблонов оценивались в CASP7 по тому, работали ли они для молекулярно-замещающей фазировки целевой кристаллической структуры ^[8] с последующими успехами ^[9] и по качеству модели полной модели (не только α-углерода ) и ее соответствию цели в CASP8. ^[10]

Оценка результатов проводится по следующим категориям прогнозов:

Прогнозирование третичной структуры (все CASP)
Прогнозирование вторичной структуры (исключено после CASP5)
прогнозирование структурных комплексов (только CASP2; отдельный эксперимент — CAPRI — продолжает эту тему)
Прогнозирование контакта остатков с остатками (начало CASP4)
Прогнозирование неупорядоченных областей (начиная с CASP5)
Прогнозирование границ домена (CASP6–CASP8)
прогнозирование функции (начиная с CASP6)
оценка качества модели (начиная с CASP7)
Уточнение модели (начиная с CASP7)
высокоточное прогнозирование на основе шаблонов (начиная с CASP7)

Категория прогнозирования третичной структуры была далее подразделена на:

моделирование гомологии
Распознавание складки (также называется нитеобразованием белка ; обратите внимание, что это название неверно, поскольку нитеобразование — это метод)
Прогнозирование структуры de novo , теперь называемое «New Fold», поскольку многие методы применяют оценочные или балльные функции, которые зависят от знания нативных структур белка, например, искусственная нейронная сеть .

Начиная с CASP7, категории были переопределены, чтобы отразить разработки в методах. Категория «Моделирование на основе шаблонов» включает все бывшие сравнительные модели, модели на основе гомологичных складок и некоторые модели на основе аналогичных складок. Категория «Моделирование без шаблонов (FM)» включает модели белков с ранее невиданными складками и модели на основе жестких аналогичных складок. Из-за ограниченного количества целей без шаблонов (они довольно редки), в 2011 году был введен так называемый CASP ROLL. Этот непрерывный (переходящий) эксперимент CASP направлен на более строгую оценку методов прогнозирования без шаблонов посредством оценки большего количества целей за пределами обычного сезона прогнозирования CASP. В отличие от LiveBench и EVA , этот эксперимент соответствует духу слепого прогнозирования CASP, т. е. все прогнозы делаются на основе еще неизвестных структур. ^[11]

Результаты CASP опубликованы в специальных дополнительных выпусках научного журнала Proteins , все из которых доступны на веб-сайте CASP. ^[12] В главной статье каждого из этих приложений описываются особенности эксперимента ^[13]^[14] , а в заключительной статье оценивается прогресс в этой области. ^[15]^[16]

AlphaFold

В декабре 2018 года CASP13 попал в заголовки новостей, когда его выиграла AlphaFold , программа искусственного интеллекта, созданная DeepMind . ^[17] В ноябре 2020 года улучшенная версия 2 AlphaFold победила в CASP14. ^[18] По словам одного из соучредителей CASP Джона Молта, AlphaFold набрал около 90 баллов по 100-балльной шкале точности прогнозирования для умеренно сложных белковых целей. ^[19] AlphaFold стал открытым исходным кодом в 2021 году, а в CASP15 в 2022 году, хотя DeepMind не участвовал, практически все высокопоставленные команды использовали AlphaFold или модификации AlphaFold. ^[20]

Смотрите также

Ссылки

^ "Главная - CASP15". predictcenter.org . Получено 2022-12-14 .
^ Moult J, Pedersen JT, Judson R, Fidelis K (ноябрь 1995 г.). «Крупномасштабный эксперимент по оценке методов прогнозирования структуры белка». Proteins . 23 (3): ii–v. doi :10.1002/prot.340230303. PMID 8710822. S2CID 11216440.
^ Tress ML, Ezkurdia I, Richardson JS (2009). «Определение и классификация целевого домена в CASP8». Белки . 77 Suppl 9 (Suppl 9): 10–7. doi :10.1002/prot.22497. PMC 2805415 . PMID 19603487.
^ Zhang Y, Skolnick J (январь 2005 г.). «Проблема предсказания структуры белка может быть решена с использованием текущей библиотеки PDB». Труды Национальной академии наук Соединенных Штатов Америки . 102 (4): 1029–34. Bibcode :2005PNAS..102.1029Z. doi : 10.1073/pnas.0407152101 . PMC 545829 . PMID 15653774.
^ Cozzetto D, Kryshtafovych A, Fidelis K, Moult J, Rost B, Tramontano A (2009). «Оценка моделей на основе шаблонов в CASP8 со стандартными мерами». Белки . 77 Suppl 9 (Suppl 9): 18–28. doi :10.1002/prot.22561. PMC 4589151 . PMID 19731382.
^ Zemla A (июль 2003 г.). «LGA: метод поиска трехмерных сходств в белковых структурах». Nucleic Acids Research . 31 (13): 3370–4. doi :10.1093/nar/gkg571. PMC 168977. PMID 12824330 .
^ Ben-David M, Noivirt-Brik O, Paz A, Prilusky J, Sussman JL, Levy Y (2009). «Оценка предсказаний структуры CASP8 для целевых объектов без шаблонов». Proteins . 77 Suppl 9 (Suppl 9): 50–65. doi :10.1002/prot.22591. PMID 19774550. S2CID 16517118.
^ Читайте RJ, Chavali G (2007). «Оценка предсказаний CASP7 в категории моделирования на основе шаблонов высокой точности». Белки . 69 Suppl 8 (Suppl 8): 27–37. doi : 10.1002/prot.21662 . PMID 17894351. S2CID 33172629.
^ Qian B, Raman S, Das R, Bradley P, McCoy AJ, Read RJ, Baker D (ноябрь 2007 г.). «Высокоразрешающее предсказание структуры и проблема кристаллографической фазы». Nature . 450 (7167): 259–64. Bibcode :2007Natur.450..259Q. doi :10.1038/nature06249. PMC 2504711 . PMID 17934447.
^ Keedy DA, Williams CJ, Headd JJ, Arendall WB, Chen VB, Kapral GJ и др. (2009). «Остальные 90% белка: оценка за пределами Calphas для моделей CASP8 на основе шаблонов и высокой точности». Белки . 77 Suppl 9 (Suppl 9): 29–49. doi :10.1002/prot.22551. PMC 2877634 . PMID 19731372.
^ Криштафович А, Монастырский Б, Фиделис К (февраль 2014 г.). "Инфраструктура центра прогнозирования CASP и меры оценки в CASP10 и CASP ROLL". Белки . 82 Suppl 2 (2): 7–13. doi :10.1002/prot.24399. PMC 4396618 . PMID 24038551.
^ «Труды CASP».
^ Moult J, Fidelis K, Kryshtafovych A, Rost B, Hubbard T, Tramontano A (2007). "Критическая оценка методов предсказания структуры белка-раунд VII". Белки . 69 Suppl 8 (Suppl 8): 3–9. doi :10.1002/prot.21767. PMC 2653632 . PMID 17918729.
^ Moult J, Fidelis K, Kryshtafovych A, Rost B, Tramontano A (2009). "Критическая оценка методов предсказания структуры белка - Раунд VIII". Белки . 77 Suppl 9 (Suppl 9): 1–4. doi : 10.1002/prot.22589 . PMID 19774620. S2CID 9704851.
^ Kryshtafovych A, Fidelis K, Moult J (2007). «Прогресс от CASP6 до CASP7». Белки . 69 Suppl 8 (Suppl 8): 194–207. doi : 10.1002/prot.21769 . PMID 17918728. S2CID 40200832.
^ Kryshtafovych A, Fidelis K, Moult J (2009). «Результаты CASP8 в контексте предыдущих экспериментов». Белки . 77 Suppl 9 (Suppl 9): 217–28. doi :10.1002/prot.22562. PMC 5479686 . PMID 19722266.
^ Сэмпл, Ян (2 декабря 2018 г.). «Google DeepMind предсказывает трехмерные формы белков». The Guardian . Получено 19 июля 2019 г. .
^ «Искусственный интеллект DeepMind, сворачивающий белки, решил 50-летнюю грандиозную задачу биологии». MIT Technology Review . Получено 30 ноября 2020 г.
^ Callaway, Ewen (2020). «'Это изменит всё': ИИ DeepMind совершает гигантский скачок в решении структур белков». Nature . 588 (7837): 203–204. doi :10.1038/d41586-020-03348-4. PMID 33257889. S2CID 227243204.
^ Шрайнер, Максимилиан (14.12.2022). «CASP15: Успех AlphaFold подстегивает новые вызовы в прогнозировании структуры белков». The Decoder . Получено 13.02.2023 .

Внешние ссылки

Официальный сайт
КАСП РОЛЛ
Форум FORCASP

Результат рейтинга

Автоматизированные оценки для CASP15 (2022)

Официальный рейтинг только для серверов
Официальный рейтинг для людей и серверов

Автоматизированные оценки для CASP14 (2020)

Официальный рейтинг только для серверов
Официальный рейтинг для людей и серверов
Рейтинг Zhang Lab

Автоматизированные оценки для CASP13 (2018)

Официальный рейтинг только для серверов
Официальный рейтинг для людей и серверов
Рейтинг Zhang Lab

Автоматизированные оценки для CASP12 (2016)

Официальный рейтинг только для серверов
Официальный рейтинг для людей и серверов
Рейтинг Zhang Lab

Автоматизированные оценки для CASP11 (2014)

Официальный рейтинг только для серверов (126 целей)
Официальный рейтинг для людей и серверов (78 целей)
Рейтинг Zhang Lab

Автоматизированные оценки для CASP10 (2012)

Официальный рейтинг только для серверов (127 целей)
Официальный рейтинг для людей и серверов (71 цель)
Рейтинг Zhang Lab

Автоматизированные оценки для CASP9 (2010)

Официальный рейтинг только для серверов (147 целей)
Официальный рейтинг для людей и серверов (78 целей)
Рейтинг Grishin Lab (только для сервера)
Рейтинг Grishin Lab (для людей и серверов)
Рейтинг Zhang Lab
Рейтинг Cheng Lab

Автоматизированные оценки для CASP8 (2008)

Официальный рейтинг только для серверов
Официальный рейтинг для людей и серверов
Рейтинг Zhang Lab
Рейтинг Grishin Lab
Рейтинг McGuffin Lab
Рейтинг Cheng Lab

Автоматизированные оценки для CASP7 (2006)

Рейтинг Livebench
Рейтинг Zhang Lab