stringtranslate.com

КАСП

Целевая структура (ленты) и 354 предсказания на основе шаблонов, наложенные друг на друга (серые магистральные линии Calpha); из CASP8

Критическая оценка предсказания структуры ( CASP ), иногда называемая критической оценкой предсказания структуры белка , является всемирным экспериментом по предсказанию структуры белка , проводимым сообществом каждые два года с 1994 года. [1] [2] CASP предоставляет исследовательским группам возможность объективно протестировать свои методы предсказания структуры и предоставляет независимую оценку современного состояния моделирования структуры белка исследовательскому сообществу и пользователям программного обеспечения. Несмотря на то, что основной целью CASP является содействие развитию методов определения трехмерной структуры белка по его аминокислотной последовательности, многие рассматривают эксперимент скорее как «чемпионат мира» в этой области науки. Более 100 исследовательских групп со всего мира регулярно участвуют в CASP, и нередко целые группы приостанавливают свои другие исследования на месяцы, пока они сосредотачиваются на подготовке своих серверов к эксперименту и выполнении подробных прогнозов.

Выбор целевых белков

Чтобы гарантировать, что ни один предсказатель не будет иметь предварительной информации о структуре белка, которая даст им преимущество, важно, чтобы эксперимент проводился двойным слепым методом: ни предикторы, ни организаторы и оценщики не знают структуры целевых белков на момент составления прогнозов. Целями для прогнозирования структуры являются либо структуры, которые вскоре будут решены с помощью рентгеновской кристаллографии или ЯМР-спектроскопии, либо структуры, которые только что были решены (в основном одним из центров структурной геномики ) и хранятся в Protein Data Bank . Если будет обнаружено, что данная последовательность связана общим происхождением с белковой последовательностью известной структуры (называемой шаблоном), для прогнозирования третичной структуры можно использовать сравнительное моделирование белка . Шаблоны можно найти с помощью методов выравнивания последовательностей (например, BLAST или HHsearch ) или методов белковой нити , которые лучше подходят для поиска отдаленно связанных шаблонов. В противном случае необходимо применять прогнозирование структуры белка de novo (например, Rosetta), что гораздо менее надежно, но иногда может давать модели с правильной складкой (обычно для белков менее 100-150 аминокислот). Действительно новые складочки становятся довольно редкими среди целей, [3] [4] делая эту категорию меньше, чем хотелось бы.

Оценка

Основной метод оценки [5] — это сравнение предсказанных модельных позиций α-углерода с позициями в целевой структуре. Сравнение наглядно показано с помощью кумулятивных графиков расстояний между парами эквивалентных α-углеродов в выравнивании модели и структуры, как показано на рисунке (идеальная модель будет оставаться на нуле на всем протяжении), и ей присваивается числовая оценка GDT-TS (Global Distance Test — Total Score), описывающая процент хорошо смоделированных остатков в модели по отношению к цели. [6] Свободное моделирование (без шаблонов или de novo ) также оценивается визуально экспертами, поскольку числовые оценки не работают так хорошо для поиска слабых сходств в самых сложных случаях. [7] Высокоточные прогнозы на основе шаблонов оценивались в CASP7 по тому, работали ли они для молекулярно-замещающей фазировки целевой кристаллической структуры [8] с последующими успехами [9] и по качеству модели полной модели (не только α-углерода ) и ее соответствию цели в CASP8. [10]

Оценка результатов проводится по следующим категориям прогнозов:

Категория прогнозирования третичной структуры была далее подразделена на:

Начиная с CASP7, категории были переопределены, чтобы отразить разработки в методах. Категория «Моделирование на основе шаблонов» включает все бывшие сравнительные модели, модели на основе гомологичных складок и некоторые модели на основе аналогичных складок. Категория «Моделирование без шаблонов (FM)» включает модели белков с ранее невиданными складками и модели на основе жестких аналогичных складок. Из-за ограниченного количества целей без шаблонов (они довольно редки), в 2011 году был введен так называемый CASP ROLL. Этот непрерывный (переходящий) эксперимент CASP направлен на более строгую оценку методов прогнозирования без шаблонов посредством оценки большего количества целей за пределами обычного сезона прогнозирования CASP. В отличие от LiveBench и EVA , этот эксперимент соответствует духу слепого прогнозирования CASP, т. е. все прогнозы делаются на основе еще неизвестных структур. [11]

Результаты CASP опубликованы в специальных дополнительных выпусках научного журнала Proteins , все из которых доступны на веб-сайте CASP. [12] В главной статье каждого из этих приложений описываются особенности эксперимента [13] [14] , а в заключительной статье оценивается прогресс в этой области. [15] [16]

AlphaFold

В декабре 2018 года CASP13 попал в заголовки новостей, когда его выиграла AlphaFold , программа искусственного интеллекта, созданная DeepMind . [17] В ноябре 2020 года улучшенная версия 2 AlphaFold победила в CASP14. [18] По словам одного из соучредителей CASP Джона Молта, AlphaFold набрал около 90 баллов по 100-балльной шкале точности прогнозирования для умеренно сложных белковых целей. [19] AlphaFold стал открытым исходным кодом в 2021 году, а в CASP15 в 2022 году, хотя DeepMind не участвовал, практически все высокопоставленные команды использовали AlphaFold или модификации AlphaFold. [20]

Смотрите также

Ссылки

  1. ^ "Главная - CASP15". predictcenter.org . Получено 2022-12-14 .
  2. ^ Moult J, Pedersen JT, Judson R, Fidelis K (ноябрь 1995 г.). «Крупномасштабный эксперимент по оценке методов прогнозирования структуры белка». Proteins . 23 (3): ii–v. doi :10.1002/prot.340230303. PMID  8710822. S2CID  11216440.
  3. ^ Tress ML, Ezkurdia I, Richardson JS (2009). «Определение и классификация целевого домена в CASP8». Белки . 77 Suppl 9 (Suppl 9): 10–7. doi :10.1002/prot.22497. PMC 2805415 . PMID  19603487. 
  4. ^ Zhang Y, Skolnick J (январь 2005 г.). «Проблема предсказания структуры белка может быть решена с использованием текущей библиотеки PDB». Труды Национальной академии наук Соединенных Штатов Америки . 102 (4): 1029–34. Bibcode :2005PNAS..102.1029Z. doi : 10.1073/pnas.0407152101 . PMC 545829 . PMID  15653774. 
  5. ^ Cozzetto D, Kryshtafovych A, Fidelis K, Moult J, Rost B, Tramontano A (2009). «Оценка моделей на основе шаблонов в CASP8 со стандартными мерами». Белки . 77 Suppl 9 (Suppl 9): 18–28. doi :10.1002/prot.22561. PMC 4589151 . PMID  19731382. 
  6. ^ Zemla A (июль 2003 г.). «LGA: метод поиска трехмерных сходств в белковых структурах». Nucleic Acids Research . 31 (13): 3370–4. doi :10.1093/nar/gkg571. PMC 168977. PMID 12824330  . 
  7. ^ Ben-David M, Noivirt-Brik O, Paz A, Prilusky J, Sussman JL, Levy Y (2009). «Оценка предсказаний структуры CASP8 для целевых объектов без шаблонов». Proteins . 77 Suppl 9 (Suppl 9): 50–65. doi :10.1002/prot.22591. PMID  19774550. S2CID  16517118.
  8. ^ Читайте RJ, Chavali G (2007). «Оценка предсказаний CASP7 в категории моделирования на основе шаблонов высокой точности». Белки . 69 Suppl 8 (Suppl 8): 27–37. doi : 10.1002/prot.21662 . PMID  17894351. S2CID  33172629.
  9. ^ Qian B, Raman S, Das R, Bradley P, McCoy AJ, Read RJ, Baker D (ноябрь 2007 г.). «Высокоразрешающее предсказание структуры и проблема кристаллографической фазы». Nature . 450 (7167): 259–64. Bibcode :2007Natur.450..259Q. doi :10.1038/nature06249. PMC 2504711 . PMID  17934447. 
  10. ^ Keedy DA, Williams CJ, Headd JJ, Arendall WB, Chen VB, Kapral GJ и др. (2009). «Остальные 90% белка: оценка за пределами Calphas для моделей CASP8 на основе шаблонов и высокой точности». Белки . 77 Suppl 9 (Suppl 9): 29–49. doi :10.1002/prot.22551. PMC 2877634 . PMID  19731372. 
  11. ^ Криштафович А, Монастырский Б, Фиделис К (февраль 2014 г.). "Инфраструктура центра прогнозирования CASP и меры оценки в CASP10 и CASP ROLL". Белки . 82 Suppl 2 (2): 7–13. doi :10.1002/prot.24399. PMC 4396618 . PMID  24038551. 
  12. ^ «Труды CASP».
  13. ^ Moult J, Fidelis K, Kryshtafovych A, Rost B, Hubbard T, Tramontano A (2007). "Критическая оценка методов предсказания структуры белка-раунд VII". Белки . 69 Suppl 8 (Suppl 8): 3–9. doi :10.1002/prot.21767. PMC 2653632 . PMID  17918729. 
  14. ^ Moult J, Fidelis K, Kryshtafovych A, Rost B, Tramontano A (2009). "Критическая оценка методов предсказания структуры белка - Раунд VIII". Белки . 77 Suppl 9 (Suppl 9): 1–4. doi : 10.1002/prot.22589 . PMID  19774620. S2CID  9704851.
  15. ^ Kryshtafovych A, Fidelis K, Moult J (2007). «Прогресс от CASP6 до CASP7». Белки . 69 Suppl 8 (Suppl 8): 194–207. doi : 10.1002/prot.21769 . PMID  17918728. S2CID  40200832.
  16. ^ Kryshtafovych A, Fidelis K, Moult J (2009). «Результаты CASP8 в контексте предыдущих экспериментов». Белки . 77 Suppl 9 (Suppl 9): 217–28. doi :10.1002/prot.22562. PMC 5479686 . PMID  19722266. 
  17. ^ Сэмпл, Ян (2 декабря 2018 г.). «Google DeepMind предсказывает трехмерные формы белков». The Guardian . Получено 19 июля 2019 г. .
  18. ^ «Искусственный интеллект DeepMind, сворачивающий белки, решил 50-летнюю грандиозную задачу биологии». MIT Technology Review . Получено 30 ноября 2020 г.
  19. ^ Callaway, Ewen (2020). «'Это изменит всё': ИИ DeepMind совершает гигантский скачок в решении структур белков». Nature . 588 (7837): 203–204. doi :10.1038/d41586-020-03348-4. PMID  33257889. S2CID  227243204.
  20. ^ Шрайнер, Максимилиан (14.12.2022). «CASP15: Успех AlphaFold подстегивает новые вызовы в прогнозировании структуры белков». The Decoder . Получено 13.02.2023 .

Внешние ссылки

Результат рейтинга

Автоматизированные оценки для CASP15 (2022)

Автоматизированные оценки для CASP14 (2020)

Автоматизированные оценки для CASP13 (2018)

Автоматизированные оценки для CASP12 (2016)

Автоматизированные оценки для CASP11 (2014)

Автоматизированные оценки для CASP10 (2012)

Автоматизированные оценки для CASP9 (2010)

Автоматизированные оценки для CASP8 (2008)

Автоматизированные оценки для CASP7 (2006)