Программное обеспечение AlphaFold имело три основные версии. Группа исследователей, использовавшая AlphaFold 1 (2018), заняла первое место в общем рейтинге 13-й критической оценки прогнозирования структур (CASP) в декабре 2018 года. Программа была особенно успешной в прогнозировании наиболее точной структуры для целей, оцененных организаторами конкурса как самые сложные, где не было существующих шаблонных структур из белков с частично похожей последовательностью. Группа, использовавшая AlphaFold 2 (2020), повторила это место в конкурсе CASP14 в ноябре 2020 года. [3] Группа достигла уровня точности, намного превышающего уровень любой другой группы. [2] [4] Она набрала более 90 баллов примерно для двух третей белков в глобальном тесте расстояния CASP (GDT), тесте, который измеряет степень, в которой предсказанная вычислительной программой структура похожа на структуру, определенную лабораторным экспериментом, при этом 100 является полным совпадением в пределах расстояния, используемого для расчета GDT. [2] [5]
Результаты AlphaFold 2 на CASP14 были описаны как «поразительные» [6] и «трансформационные». [7] Некоторые исследователи отметили, что точность недостаточно высока для трети его предсказаний, и что он не раскрывает механизм или правила сворачивания белка , чтобы проблема сворачивания белка могла считаться решенной. [8] [9] Тем не менее, это техническое достижение получило широкое признание. 15 июля 2021 года статья AlphaFold 2 была опубликована в Nature в качестве публикации с предварительным доступом вместе с программным обеспечением с открытым исходным кодом и поисковой базой данных протеомов видов . [10] [11] [12] С тех пор статья была процитирована более 27 тысяч раз.
AlphaFold 3 был анонсирован 8 мая 2024 года. Он может предсказывать структуру комплексов , созданных белками с ДНК , РНК , различными лигандами и ионами . [13]
Структуры белков можно определить экспериментально с помощью таких методов, как рентгеновская кристаллография , криоэлектронная микроскопия и ядерный магнитный резонанс , которые все являются дорогостоящими и трудоемкими. [16] Такие усилия, использующие экспериментальные методы, позволили определить структуры около 170 000 белков за последние 60 лет, в то время как во всех формах жизни известно более 200 миллионов белков. [5]
На протяжении многих лет исследователи применяли многочисленные вычислительные методы для прогнозирования трехмерных структур белков по их аминокислотным последовательностям, но точность таких методов не приближалась к экспериментальным методам. CASP , запущенный в 1994 году, чтобы бросить вызов научному сообществу и предложить им наилучшие предсказания структуры белка, обнаружил, что к 2016 году для самых сложных белков можно достичь оценок GDT всего около 40 из 100. [5] AlphaFold начал соревноваться в CASP 2018 года, используя технику глубокого обучения искусственного интеллекта (ИИ) . [16]
Алгоритм
Известно, что DeepMind обучил программу на более чем 170 000 белков из публичного репозитория последовательностей и структур белков. Программа использует форму сети внимания , технику глубокого обучения , которая фокусируется на том, чтобы ИИ идентифицировал части более крупной проблемы, а затем объединял их для получения общего решения. [2] Общее обучение проводилось на вычислительной мощности от 100 до 200 графических процессоров . [2]
АльфаФолд 1 (2018)
AlphaFold 1 (2018) был создан на основе работы, проделанной различными группами в 2010-х годах, работы, которая рассматривала большие банки данных связанных последовательностей ДНК, которые теперь доступны из многих различных организмов (большинство из которых не имеют известных трехмерных структур), чтобы попытаться найти изменения в различных остатках , которые, по-видимому, коррелируют, даже если остатки не были последовательными в основной цепи. Такие корреляции предполагают, что остатки могут быть близки друг к другу физически, даже если не близки в последовательности, что позволяет оценить карту контактов . Основываясь на недавней работе до 2018 года, AlphaFold 1 расширил это, чтобы оценить распределение вероятностей того, насколько близко могут быть остатки, — превратив карту контактов в карту вероятных расстояний. Он также использовал более продвинутые методы обучения, чем ранее, для разработки вывода. [17] [18]
АльфаФолд 2 (2020)
По словам команды DeepMind, версия программы 2020 года ( AlphaFold 2 , 2020) существенно отличается от оригинальной версии, которая выиграла CASP 13 в 2018 году. [20] [21]
Программное обеспечение, используемое в AlphaFold 1, содержало ряд модулей, каждый из которых обучался отдельно, которые использовались для создания направляющего потенциала, который затем объединялся с энергетическим потенциалом, основанным на физике. AlphaFold 2 заменил это системой подсетей, соединенных вместе в единую дифференцируемую сквозную модель, основанную полностью на распознавании образов, которая обучалась интегрированным образом как единая интегрированная структура. [21] [22] Локальная физика в форме энергетического уточнения на основе модели AMBER применяется только в качестве последнего шага уточнения после того, как прогноз нейронной сети сошлся, и лишь немного корректирует предсказанную структуру. [23]
Ключевой частью системы 2020 года являются два модуля, которые, как полагают, основаны на конструкции трансформатора , которые используются для постепенного уточнения вектора информации для каждой связи (или « ребра » в терминологии теории графов) между аминокислотным остатком белка и другим аминокислотным остатком (эти связи представлены массивом, показанным зеленым); и между каждой позицией аминокислоты и каждой различной последовательностью в выравнивании входной последовательности (эти связи представлены массивом, показанным красным). [22] Внутренне эти преобразования уточнения содержат слои, которые имеют эффект объединения соответствующих данных и отфильтровывания нерелевантных данных («механизм внимания») для этих связей контекстно-зависимым образом, изученным из обучающих данных. Эти преобразования повторяются, обновленная информация, выводимая на одном шаге, становится входом для следующего, при этом уточненная информация об остатке/остатке подается на обновление информации об остатке/последовательности, а затем улучшенная информация об остатке/последовательности подается на обновление информации об остатке/остатке. [22] По мере развития итерации, согласно одному отчету, «алгоритм внимания... имитирует способ, которым человек собирает пазл: сначала соединяя части в небольшие группы — в данном случае кластеры аминокислот — а затем ищем способы объединить группы в более крупное целое». [5] [ требуется обновление ]
Выходные данные этих итераций затем информируют модуль окончательного предсказания структуры, [22] который также использует трансформаторы, [24] и затем сам итерируется. В примере, представленном DeepMind, модуль предсказания структуры достиг правильной топологии для целевого белка на своей первой итерации, оцененной как имеющая GDT_TS 78, но с большим количеством (90%) стереохимических нарушений – т. е. нефизических углов связи или длин. С последующими итерациями количество стереохимических нарушений уменьшалось. К третьей итерации GDT_TS предсказания приближалось к 90, а к восьмой итерации количество стереохимических нарушений приближалось к нулю. [25]
Первоначально данные обучения были ограничены отдельными пептидными цепями. Однако обновление от октября 2021 года под названием AlphaFold-Multimer включило в свои данные обучения белковые комплексы. DeepMind заявила, что это обновление успешно предсказывало белок-белковые взаимодействия примерно в 70% случаев. [26]
AlphaFold 3 представляет «Pairformer», архитектуру глубокого обучения, вдохновленную трансформатором, считающуюся похожей, но более простой, чем Evoformer, представленный в AlphaFold 2. [28] [29] Необработанные прогнозы из модуля Pairformer передаются в диффузионную модель , которая начинается с облака атомов и использует эти прогнозы для итеративного продвижения к трехмерному изображению молекулярной структуры. [13]
Сервер AlphaFold был создан для предоставления бесплатного доступа к AlphaFold 3 для некоммерческих исследований. [30]
Программа особенно успешно предсказывала наиболее точную структуру для целей, оцененных организаторами конкурса как самые сложные, где не было существующих шаблонных структур из белков с частично похожей последовательностью. AlphaFold дал наилучший прогноз для 25 из 43 белковых целей в этом классе, [32] [33] [34] достигнув медианного балла 58,9 по баллу теста на глобальное расстояние (GDT) CASP, опередив 52,5 и 52,4 двух следующих лучших команд, [35] которые также использовали глубокое обучение для оценки контактных расстояний. [36] [37] В целом, по всем целям программа достигла балла GDT 68,5. [38]
В январе 2020 года реализации и иллюстративный код AlphaFold 1 были опубликованы с открытым исходным кодом на GitHub . [39] [16] но, как указано в файле «Read Me» на этом сайте: «Этот код не может быть использован для прогнозирования структуры произвольной последовательности белка. Он может быть использован для прогнозирования структуры только на наборе данных CASP13 (ссылки ниже). Код генерации признаков тесно связан с нашей внутренней инфраструктурой, а также с внешними инструментами, поэтому мы не можем открыть его исходный код». Поэтому, по сути, размещенный код не подходит для общего использования, а подходит только для белков CASP13. Компания не объявляла о планах сделать свой код общедоступным по состоянию на 5 марта 2021 года.
КАСП14
В ноябре 2020 года новая версия DeepMind, AlphaFold 2, победила в CASP14. [40] [41] В целом, AlphaFold 2 сделал лучший прогноз для 88 из 97 целей. [6]
По предпочтительному для конкурса глобальному дистанционному тесту (GDT) показателю точности программа достигла медианного балла 92,4 (из 100), что означает, что более половины ее предсказаний были оценены выше 92,4% для атомов в более или менее правильном месте, [42] [43] уровень точности, как сообщается, сопоставим с экспериментальными методами, такими как рентгеновская кристаллография . [20] [7] [38] В 2018 году AlphaFold 1 достигла этого уровня точности только в двух из всех своих предсказаний. [6] 88% предсказаний в конкурсе 2020 года имели балл GDT_TS более 80. В группе целей, классифицированных как самые сложные, AlphaFold 2 достигла медианного балла 87.
Измеренное по среднеквадратичному отклонению (RMS-D) размещения альфа-углеродных атомов основной цепи белка, которое, как правило, определяется производительностью наихудших выбросов, 88% предсказаний AlphaFold 2 имели среднеквадратичное отклонение менее 4 Å для набора перекрывающихся атомов C-альфа. [6] 76% предсказаний достигли точности лучше, чем 3 Å, и 46% имели точность RMS атома C-альфа лучше, чем 2 Å, [6] со средним среднеквадратическим отклонением в его предсказаниях 2,1 Å для набора перекрывающихся атомов CA. [6] AlphaFold 2 также достиг точности в моделировании поверхностных боковых цепей, описанной как «действительно очень необычайная».
Для дополнительной проверки AlphaFold-2 организаторы конференции обратились к четырем ведущим экспериментальным группам для структур, которые они считали особенно сложными и не смогли определить. Во всех четырех случаях трехмерные модели, созданные AlphaFold 2, были достаточно точными для определения структур этих белков путем молекулярной замены . Они включали целевой T1100 (Af1503), небольшой мембранный белок, изучаемый экспериментаторами в течение десяти лет. [5]
Из трех структур, в предсказании которых AlphaFold 2 имел наименьший успех, две были получены методами ЯМР белка , которые определяют структуру белка непосредственно в водном растворе, тогда как AlphaFold в основном обучался на структурах белка в кристаллах . Третья существует в природе как многодоменный комплекс, состоящий из 52 идентичных копий одного и того же домена , ситуация, на рассмотрение которой AlphaFold не был запрограммирован. Для всех целей с одним доменом, за исключением только одного очень большого белка и двух структур, определенных с помощью ЯМР, AlphaFold 2 достиг оценки GDT_TS более 80.
КАСП15
В 2022 году DeepMind не участвовал в CASP15, но большинство участников использовали AlphaFold или инструменты, включающие AlphaFold. [44]
Прием
AlphaFold 2, набравший более 90 баллов в глобальном дистанционном тесте CASP (GDT), считается значительным достижением в вычислительной биологии [5] и большим прогрессом в решении грандиозной задачи биологии, стоящей перед десятилетиями. [7] Лауреат Нобелевской премии и структурный биолог Венки Рамакришнан назвал результат «потрясающим достижением в решении проблемы сворачивания белка» [5], добавив, что «это произошло на десятилетия раньше, чем многие специалисты в этой области могли бы это предсказать. Будет интересно увидеть множество способов, которыми это фундаментально изменит биологические исследования». [40]
Подстегиваемый пресс-релизами CASP и DeepMind, [45] [40] успех AlphaFold 2 получил широкое освещение в СМИ. [46] Помимо новостных статей в специализированной научной прессе, такой как Nature , [7] Science , [5] MIT Technology Review , [2] и New Scientist , [47] [48] история широко освещалась крупными национальными газетами. [49] [50] [51] [52] Частой темой было то, что способность точно предсказывать структуры белков на основе последовательности составляющих аминокислот, как ожидается, будет иметь широкий спектр преимуществ в области наук о жизни, включая ускорение разработки передовых лекарств и обеспечение лучшего понимания заболеваний. [7] [53] Некоторые отметили, что даже идеальный ответ на проблему предсказания белка все еще оставит вопросы о проблеме сворачивания белка — детальное понимание того, как процесс сворачивания на самом деле происходит в природе (и как иногда они также могут неправильно сворачиваться ). [54]
Открытый доступ к исходному коду нескольких версий AlphaFold (за исключением AlphaFold 3) был предоставлен DeepMind по просьбе научного сообщества. [57] [58] [59] Ожидается, что полный исходный код AlphaFold-3 будет предоставлен в открытый доступ к концу 2024 года. [60] [61]
База данных моделей белков, созданная AlphaFold
База данных структур белков AlphaFold была запущена 22 июля 2021 года в результате совместных усилий AlphaFold и EMBL-EBI . На момент запуска база данных содержит предсказанные AlphaFold модели структур белков почти полного протеома UniProt человека и 20 модельных организмов , что составляет более 365 000 белков. База данных не включает белки с менее чем 16 или более чем 2700 аминокислотными остатками , [62] но для людей они доступны во всем пакетном файле. [63] AlphaFold планировала добавить больше последовательностей в коллекцию, первоначальная цель (на начало 2022 года) состояла в том, чтобы охватить большую часть набора UniRef90 из более чем 100 миллионов белков. По состоянию на 15 мая 2022 года было доступно 992 316 прогнозов. [64]
В июле 2021 года UniProt-KB и InterPro [65] были обновлены для отображения прогнозов AlphaFold, когда они доступны. [66]
28 июля 2022 года команда загрузила в базу данных структуры около 200 миллионов белков из 1 миллиона видов, охватывающих почти все известные белки на планете. [67]
Ограничения
AlphaFold имеет ряд ограничений:
AlphaFold DB предоставляет мономерные модели белков, а не их биологически значимые комплексы . [68]
Alphafold-2 был проверен на предмет прогнозирования структурных эффектов мутаций с ограниченным успехом. [70]
Модель в некоторой степени опирается на коэволюционную информацию о схожих белках и, таким образом, может не работать хорошо с синтетическими белками или белками с очень низкой гомологией с чем-либо в базе данных. [71]
Способность модели воспроизводить множественные нативные конформации белков ограничена.
Версия AlphaFold 3 может предсказывать структуры белковых комплексов с очень ограниченным набором выбранных кофакторов и ко- и посттрансляционных модификаций . [72] От 50% до 70% структур человеческого протеома являются неполными без ковалентно связанных гликанов. [73] [68] AlphaFill, производная база данных, добавляет кофакторы в модели AlphaFold, где это необходимо. [74]
В алгоритме остатки перемещаются свободно, без каких-либо ограничений. Поэтому при моделировании целостность цепи не сохраняется. В результате AlphaFold может выдавать топологически неверные результаты, например, структуры с произвольным числом узлов. [75]
Приложения
AlphaFold использовался для прогнозирования структур белков SARS-CoV-2 , возбудителя COVID-19 . Структуры этих белков ожидали экспериментального обнаружения в начале 2020 года. [76] [7] Результаты были изучены учеными Института Фрэнсиса Крика в Соединенном Королевстве перед публикацией в более широком исследовательском сообществе. Группа также подтвердила точное предсказание в отношении экспериментально определенного белка-шипа SARS-CoV-2 , который был опубликован в Protein Data Bank , международной базе данных с открытым доступом, прежде чем опубликовать вычислительно определенные структуры недостаточно изученных молекул белков. [77] Группа признала, что, хотя эти структуры белков, возможно, не являются предметом текущих терапевтических исследовательских усилий, они пополнят понимание сообществом вируса SARS-CoV-2. [77] В частности, предсказание AlphaFold 2 структуры белка ORF3a было очень похоже на структуру, определенную исследователями из Калифорнийского университета в Беркли с помощью криоэлектронной микроскопии . Этот специфический белок, как полагают, помогает вирусу вырваться из клетки-хозяина после его репликации. Также считается, что этот белок играет роль в запуске воспалительного ответа на инфекцию. [78]
Опубликованные работы
Эндрю В. Сениор и др. (декабрь 2019 г.), «Прогнозирование структуры белка с использованием нескольких глубоких нейронных сетей в 13-й критической оценке прогнозирования структуры белка (CASP13)», Белки: структура, функция, биоинформатика 87 (12) 1141–1148 doi :10.1002/prot.25834
Эндрю В. Сениор и др. (15 января 2020 г.), «Улучшенное предсказание структуры белка с использованием потенциалов глубокого обучения», Nature 577 706–710 doi :10.1038/s41586-019-1923-7
Джон Джампер и др. (декабрь 2020 г.), «Высокоточное прогнозирование структуры белка с использованием глубокого обучения», в Четырнадцатой критической оценке методов прогнозирования структуры белка (реферат) , стр. 22–24
Джон Джампер и др. (декабрь 2020 г.), «АльфаФолд 2». Презентация на CASP 14.
^ "AlphaFold". Deepmind . Архивировано из оригинала 19 января 2021 . Получено 30 ноября 2020 .
^ abcdef "ИИ DeepMind, сворачивающий белки, решил 50-летнюю грандиозную задачу биологии". MIT Technology Review . Архивировано из оригинала 28-08-2021 . Получено 30-11-2020 .
^ Шеад, Сэм (2020-11-30). "DeepMind решает 50-летнюю "грандиозную задачу" с помощью ИИ для сворачивания белков" CNBC . Архивировано из оригинала 2021-01-28 . Получено 2020-11-30 .
^ Стоддарт, Шарлотта (1 марта 2022 г.). «Структурная биология: как белки получили свой крупный план». Knowable Magazine . doi : 10.1146/knowable-022822-1 . S2CID 247206999. Архивировано из оригинала 7 апреля 2022 г. . Получено 25 марта 2022 г. .
^ abcdefgh Роберт Ф. Сервис, «Игра изменилась». ИИ торжествует в решении структур белков Архивировано 24.06.2023 в Wayback Machine , Science , 30 ноября 2020 г.
^ abcdef Мохаммед Аль-Кураиши, Результаты CASP14 только что вышли, и они поразительны. Архивировано 04.08.2022 в Wayback Machine , Twitter, 30 ноября 2020 г.
^ Стивен Карри, Нет, DeepMind не решил проблему сворачивания белка Архивировано 29 июля 2022 г. в Wayback Machine , Reciprocal Space (блог), 2 декабря 2020 г.
^ Болл, Филлип (9 декабря 2020 г.). «За экранами AlphaFold». Chemistry World . Архивировано из оригинала 15 августа 2021 г. Получено 10 декабря 2020 г.
^ "GitHub - deepmind/alphafold: Открытый исходный код для AlphaFold". GitHub . Архивировано из оригинала 2021-07-23 . Получено 2021-07-24 .
^ "База данных структур белков AlphaFold". alphafold.ebi.ac.uk . Архивировано из оригинала 2021-07-24 . Получено 2021-07-24 .
^ abc "AlphaFold 3 предсказывает структуру и взаимодействие всех молекул жизни". Google . 2024-05-08. Архивировано из оригинала 2024-05-09 . Получено 2024-05-09 .
^ ab Hunt, Christian Edwards, Katie (9 октября 2024 г.). «Ученые, которые использовали ИИ для «взлома кода» почти всех белков, получили Нобелевскую премию по химии». CNN . Архивировано из оригинала 10 октября 2024 г. . Получено 9 октября 2024 г. .{{cite news}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ ab Knapp, Alex. "Объявлены награды за прорыв 2023 года: Protein Folders от Deepmind получили награду в размере 3 миллионов долларов". Forbes . Архивировано из оригинала 2024-05-09 . Получено 2024-05-09 .
^ abc "AlphaFold: использование ИИ для научных открытий". Deepmind . 15 января 2020 г. Архивировано из оригинала 2022-03-07 . Получено 2020-11-30 .
^ Mohammed AlQuraishi (май 2019 г.), AlphaFold на CASP13 Архивировано 22 ноября 2021 г. на Wayback Machine , Bioinformatics , 35 (22), 4862–4865 doi :10.1093/bioinformatics/btz422. См. также Mohammed AlQuraishi (9 декабря 2018 г.), AlphaFold на CASP13: "Что только что произошло?" Архивировано 29 июля 2022 г. на Wayback Machine (запись в блоге). Мохаммед Аль-Кураиши (15 января 2020 г.), Переломный момент в предсказании структуры белка. Архивировано 23 июня 2022 г. в Wayback Machine , Nature 577 , 627–628 doi :10.1038/d41586-019-03951-0
^ AlphaFold: Машинное обучение для прогнозирования структуры белка. Архивировано 12.05.2022 в Wayback Machine , Foldit , 31 января 2020 г.
^ ab Jumper, John; et al. (август 2021 г.). «Высокоточное предсказание структуры белка с помощью AlphaFold». Nature . 596 (7873): 583–589. Bibcode :2021Natur.596..583J. doi :10.1038/s41586-021-03819-2. ISSN 1476-4687. PMC 8371605 . PMID 34265844.
^ ab "DeepMind отвечает на один из крупнейших вызовов биологии". The Economist . 2020-11-30. ISSN 0013-0613. Архивировано из оригинала 2020-12-03 . Получено 2020-11-30 .
^ ab Джереми Кан, Уроки прорыва DeepMind в области искусственного интеллекта, связывающего белки Архивировано 08.04.2022 в Wayback Machine , Fortune , 1 декабря 2020 г.
^ abcd См. блок-схему. Также Джон Джампер и др. (1 декабря 2020 г.), презентация AlphaFold 2 Архивировано 03.07.2022 на Wayback Machine , слайд 10
^ Джон Джампер и др., тезисы конференции (декабрь 2020 г.)
^ Утверждается, что структурный модуль использует «3-мерную эквивариантную архитектуру трансформатора» (Джон Джампер и др. (1 декабря 2020 г.), презентация AlphaFold 2, архивировано 03.07.2022 на Wayback Machine , слайд 12). Одна конструкция сети трансформатора с SE(3) -эквивариантностью была предложена в работе Фабиана Фукса и др. SE(3)-Transformers: 3D Roto-Translation Equivariant Attention Networks, архивировано 07.10.2021 на Wayback Machine , NeurIPS 2020; также веб-сайт, архивировано 03.07.2022 на Wayback Machine . Неизвестно, насколько это может быть похоже или нет на то, что использовалось в AlphaFold. См. также запись в блоге AlQuaraishi, архивированная 08.12.2020 на Wayback Machine , или более подробную запись Фабиана Фукса, архивированная 03.07.2022 на Wayback Machine.
^ Джон Джампер и др. (1 декабря 2020 г.), презентация AlphaFold 2, архивированная 03.07.2022 на Wayback Machine , слайды с 12 по 20.
^ Callaway, Ewen (13 апреля 2022 г.). «Что ждет AlphaFold и революцию в области фолдинга белков ИИ». Nature . 604 (7905): 234–238. Bibcode :2022Natur.604..234C. doi : 10.1038/d41586-022-00997-5 . PMID 35418629. S2CID 248156195.
^ Метц, Кейд (2024-05-08). «Google представляет ИИ для прогнозирования поведения человеческих молекул». The New York Times . ISSN 0362-4331. Архивировано из оригинала 2024-10-10 . Получено 2024-05-09 .
^ Точное предсказание структуры биомолекулярных взаимодействий с AlphaFold 3 Архивировано 12 мая 2024 г. на Wayback Machine , pdf-файл препринта статьи в Nature.
^ Групповая эффективность на основе объединенных z-оценок. Архивировано 08.03.2022 на Wayback Machine , CASP 13, декабрь 2018 г. (AlphaFold = Team 043: A7D)
^ ab Sample, Ian (2 декабря 2018 г.). «Google DeepMind предсказывает трехмерные формы белков». The Guardian . Архивировано из оригинала 18 июля 2019 г. Получено 30 ноября 2020 г.
^ "AlphaFold: использование ИИ для научных открытий". Deepmind . Архивировано из оригинала 10 октября 2024 г. Получено 30 ноября 2020 г.
^ См. таблицы данных CASP 13, заархивированные 14.03.2022 на Wayback Machine для 043 A7D, 322 Zhang и 089 MULTICOM.
^ Вэй Чжэн и др. , Прогнозирование структуры белка с помощью глубокого обучения на основе контактной карты в CASP13. Архивировано 22 января 2022 г. в Wayback Machine , Белки: структура, функция и биоинформатика , 87 (12) 1149–1164 doi :10.1002/prot.25792; и слайды. Архивировано 26 июля 2022 г. в Wayback Machine.
^ Хоу, Цзе; У, Тяньци; Цао, Жэньчжи; Чэн, Цзяньлинь (2019-04-25). «Моделирование третичной структуры белка, основанное на глубоком обучении и прогнозировании расстояния контакта в CASP13». Белки: структура, функция и биоинформатика . 87 (12). Wiley: 1165–1178. bioRxiv 10.1101/552422 . doi :10.1002/prot.25697. ISSN 0887-3585. PMC 6800999. PMID 30985027 .
^ ab "Прорыв DeepMind помогает решить, как болезни проникают в клетки". Bloomberg.com . 2020-11-30. Архивировано из оригинала 2022-04-05 . Получено 2020-11-30 .
^ abc "AlphaFold: решение грандиозной проблемы биологии 50-летней давности". Deepmind . 30 ноября 2020 г. Архивировано из оригинала 30 ноября 2020 г. Получено 30 ноября 2020 г.
^ "Искусственный интеллект DeepMind, сворачивающий белки, решил 50-летнюю грандиозную задачу биологии". MIT Technology Review . Архивировано из оригинала 28 августа 2021 г. Получено 30 ноября 2020 г.
^ Для используемой меры GDT_TS каждый атом в прогнозе получает четверть балла, если он находится в пределах 8 Å (0,80 нм) от экспериментального положения; половину балла, если он находится в пределах 4 Å, три четверти балла, если он находится в пределах 2 Å, и целый балл, если он находится в пределах 1 Å.
^ Чтобы получить оценку GDT_TS 92,5, математически не менее 70% структуры должны быть точными в пределах 1 Å, и не менее 85% должны быть точными в пределах 2 Å,
^ Callaway, Ewen (2022-12-13). «После AlphaFold: конкурс по сворачиванию белков ищет следующий большой прорыв». Nature . 613 (7942): 13–14. doi : 10.1038/d41586-022-04438-1 . PMID 36513827. S2CID 254660427.
^ Решение 50-летней научной проблемы с помощью искусственного интеллекта может «произвести революцию» в медицинских исследованиях Архивировано 24.04.2022 в Wayback Machine (пресс-релиз), оргкомитет CASP , 30 ноября 2020 г.
^ Майкл Ле Пейдж, биолог ИИ DeepMind может расшифровать секреты механизмов жизни Архивировано 2022-08-02 в Wayback Machine , New Scientist , 30 ноября 2020 г.
^ Предсказания новейшего искусственного интеллекта DeepMind могут произвести революцию в медицине Архивировано 2021-11-07 в Wayback Machine , New Scientist , 2 декабря 2020 г.
^ Том Уиппл, Deepmind находит «святой Грааль» биологии, решая проблему белка. Архивировано 19 января 2021 г. в Wayback Machine , The Times (онлайн), 30 ноября 2020 г. В день, когда появилась эта новость , редактор отдела науки Том Уиппл написал шесть статей на эту тему для The Times . (тема Архивировано 08 ноября 2021 г. в Wayback Machine ).
^ Кейд Метц, Лондонская лаборатория искусственного интеллекта заявляет о прорыве, который может ускорить открытие лекарств. Архивировано 04.08.2022 в Wayback Machine , New York Times , 30 ноября 2020 г.
^ Ян Сэмпл, DeepMind AI решает 50-летнюю проблему сворачивания белка Архивировано 2020-11-30 в Wayback Machine , The Guardian , 30 ноября 2020 г.
^ Лиззи Робертс, «Раз в поколение прогресс», как исследователи Google AI решают 50-летнюю биологическую задачу Архивировано 2022-08-04 в Wayback Machine . Daily Telegraph , 30 ноября 2020 г.
^ Тим Хаббард , Секрет жизни, часть 2: решение проблемы сворачивания белка. Архивировано 2022-05-14 в Wayback Machine , medium.com , 30 ноября 2020 г.
^ например, Грег Боуман, Сворачивание белка и связанные с этим проблемы остаются нерешенными, несмотря на прогресс AlphaFold Архивировано 13 июля 2022 г. в Wayback Machine , блог Folding@home , 8 декабря 2020 г.
^ Сэмпл, Ян (21.09.2023). «Команда, стоящая за программой искусственного интеллекта AlphaFold, получила научную премию Ласкера». The Guardian . ISSN 0261-3077. Архивировано из оригинала 10.10.2024 . Получено 09.05.2024 .
^ "Нобелевская премия по химии 2024 года". NobelPrize.org . Архивировано из оригинала 2024-10-09 . Получено 2024-10-10 .
^ Домингес, Нуньо (2 декабря 2020 г.). «Интеллектуальное искусственное образование в одной из важнейших проблем биологии». Эль Паис (на испанском языке). Архивировано из оригинала 26 июля 2022 г. Проверено 12 мая 2024 г.
^ Бриггс, Дэвид (2020-12-04). «Если Alphafold2 от Google действительно решил проблему сворачивания белка, им нужно показать свою работу». The Skeptic . Архивировано из оригинала 2024-05-12 . Получено 2024-05-12 .
^ Демис Хассабис , «Краткий обзор захватывающего прогресса в #AlphaFold!» Архивировано 22 июля 2022 г. на Wayback Machine (твит), через Twitter , 18 июня 2021 г.
^ «AlphaFold3 — почему Nature опубликовала его без кода?». Архивировано из оригинала 28.06.2024 . Получено 27.05.2024 .
^ "AlphaFold 3: Шаг в будущее предсказания структур". Архивировано из оригинала 2024-05-27 . Получено 2024-05-27 .
^ "База данных структур белков AlphaFold". alphafold.ebi.ac.uk . Архивировано из оригинала 2022-07-29 . Получено 2021-07-29 .
^ "База данных структур белков AlphaFold". alphafold.ebi.ac.uk . Архивировано из оригинала 29 июля 2022 г. . Получено 27 июля 2021 г. .
^ "База данных структур белков AlphaFold". www.alphafold.ebi.ac.uk . Архивировано из оригинала 2022-08-02 . Получено 2021-07-24 .
^ InterPro (22 июля 2021 г.). «Предсказания структуры Alphafold, доступные в Interpro». proteinswebteam.github.io . Архивировано из оригинала 2021-11-05 . Получено 2021-07-29 .
^ «Передаем силу AlphaFold в руки мира». Deepmind . 22 июля 2022 г. Архивировано из оригинала 24 июля 2021 г. Получено 24 июля 2021 г.
^ Callaway, Ewen (28.07.2022). «Вся белковая вселенная»: ИИ предсказывает форму почти каждого известного белка». Nature . 608 (7921): 15–16. Bibcode :2022Natur.608...15C. doi : 10.1038/d41586-022-02083-2 . PMID 35902752. S2CID 251159714.
^ ab "Какие варианты использования AlphaFold не поддерживает?". База данных структур белков AlphaFold . Архивировано из оригинала 29-07-2022 . Получено 15-05-2022 .
^ AlphaFold возвещает о революции в биологии и медицине, основанной на данных. Архивировано 10 октября 2024 г. в Wayback Machine , Джанет М. Торнтон , Роман А. Ласковски и Нира Боркакоти, Nature Medicine , том 12, страницы 1666–1669, 12 октября 2021 г.
^ McBride, John M.; Polev, Konstantin; Abdirasulov, Amirbek; Reinharz, Vladimir; Grzybowski, Bartosz A.; Tlusty, Tsvi (2023-11-20). "AlphaFold2 Can Predict Single-Mutation Effects". Physical Review Letters . 131 (21): 218401. arXiv : 2204.06860 . Bibcode :2023PhRvL.131u8401M. doi :10.1103/PhysRevLett.131.218401. ISSN 0031-9007. PMID 38072605. Архивировано из оригинала 2024-06-09 . Получено 2023-11-26 .
^ "Последний прорыв DeepMind в области искусственного интеллекта может ускорить разработку лекарств". Fast Company . ISSN 1085-9241. Архивировано из оригинала 24.01.2023 . Получено 24.01.2023 .
^ Багдонас, Гарольдас; Фогарти, Карл А.; Фадда, Элиза; Агирре, Джон (29.10.2021). «Дело в пользу постпредсказательных модификаций в базе данных структур белков AlphaFold» (PDF) . Nature Structural & Molecular Biology . 28 (11): 869–870. doi : 10.1038/s41594-021-00680-9 . ISSN 1545-9985. PMID 34716446. S2CID 240228913. Архивировано (PDF) из оригинала 13.01.2024 . Получено 13.01.2024 .
^ An, Hyun Joo; Froehlich, John W; Lebrilla, Carlito B (2009-10-01). «Определение сайтов гликозилирования и сайт-специфической гетерогенности в гликопротеинах». Current Opinion in Chemical Biology . Analytical Techniques/Mechanisms. 13 (4): 421–426. doi :10.1016/j.cbpa.2009.07.022. ISSN 1367-5931. PMC 2749913. PMID 19700364 .
^ Хеккельман, Маартен Л.; де Врис, Ида; Йостен, Робби П.; Перракис, Анастасис (февраль 2023 г.). «AlphaFill: обогащение моделей AlphaFold лигандами и кофакторами». Природные методы . 20 (2): 205–213. дои : 10.1038/s41592-022-01685-y . ПМЦ 9911346 . ПМИД 36424442.
^ Домбровски-Туманский, Павел; Стасяк, Анджей (7 ноября 2023 г.). «Слепота AlphaFold к топологическим барьерам влияет на его способность правильно предсказывать топологию белков». Molecules . 28 (22): 7462. doi : 10.3390/molecules28227462 . PMC 10672856 . PMID 38005184.
^ "ИИ может помочь ученым найти вакцину от Covid-19". Wired . ISSN 1059-1028. Архивировано из оригинала 2022-04-23 . Получено 2020-12-01 .
^ ab "Вычислительные предсказания структур белков, связанных с COVID-19". Deepmind . 4 августа 2020 г. Архивировано из оригинала 2022-03-25 . Получено 2020-12-01 .
^ "Как новый ИИ DeepMind по сворачиванию белков уже помогает бороться с пандемией коронавируса". Fortune . Архивировано из оригинала 2020-11-30 . Получено 2020-12-01 .
Дальнейшее чтение
Карлос Оутейрал, CASP14: чего на самом деле достиг AlphaFold 2 от Google DeepMind и что это значит для сворачивания белков, биологии и биоинформатики, Oxford Protein Informatics Group. (3 декабря)
Мохаммед Аль-Кураиши, AlphaFold2 @ CASP14: «Такое ощущение, будто твой ребенок ушел из дома» (блог), 8 декабря 2020 г.
Мохаммед Аль-Кураиши, Метод AlphaFold2: Источник хороших идей (блог), 25 июля 2021 г.
Открытый доступ к прогнозам структуры белка для человеческого протеома и 20 других ключевых организмов в Европейском институте биоинформатики (база данных структуры белка AlphaFold)
Сайт CASP 14
AlphaFold: Создание научного прорыва, DeepMind, на YouTube.
ColabFold ( Мирдита, Милот; Шютце, Константин; Мориваки, Ёситака; Хео, Лим; Овчинников, Сергей; Штайнеггер, Мартин (30.05.2022). «ColabFold: делаем сворачивание белка доступным для всех». Nature Methods . 19 (6): 679–682. doi : 10.1038/s41592-022-01488-1 . PMC 9184281. PMID 35637307 . ), версия для гомоолигомерного предсказания и комплексов