stringtranslate.com

AlphaFold

AlphaFold — это программа искусственного интеллекта (ИИ), разработанная DeepMind , дочерней компанией Alphabet , которая выполняет прогнозирование структуры белка . [1] Программа разработана как система глубокого обучения . [2]

Программное обеспечение AlphaFold имело три основные версии. Группа исследователей, использовавшая AlphaFold 1 (2018), заняла первое место в общем рейтинге 13-й критической оценки прогнозирования структур (CASP) в декабре 2018 года. Программа была особенно успешной в прогнозировании наиболее точной структуры для целей, оцененных организаторами конкурса как самые сложные, где не было существующих шаблонных структур из белков с частично похожей последовательностью. Группа, использовавшая AlphaFold 2 (2020), повторила это место в конкурсе CASP14 в ноябре 2020 года. [3] Группа достигла уровня точности, намного превышающего уровень любой другой группы. [2] [4] Она набрала более 90 баллов примерно для двух третей белков в глобальном тесте расстояния CASP (GDT), тесте, который измеряет степень, в которой предсказанная вычислительной программой структура похожа на структуру, определенную лабораторным экспериментом, при этом 100 является полным совпадением в пределах расстояния, используемого для расчета GDT. [2] [5]

Результаты AlphaFold 2 на CASP14 были описаны как «поразительные» [6] и «трансформационные». [7] Некоторые исследователи отметили, что точность недостаточно высока для трети его предсказаний, и что он не раскрывает механизм или правила сворачивания белка , чтобы проблема сворачивания белка могла считаться решенной. [8] [9] Тем не менее, это техническое достижение получило широкое признание. 15 июля 2021 года статья AlphaFold 2 была опубликована в Nature в качестве публикации с предварительным доступом вместе с программным обеспечением с открытым исходным кодом и поисковой базой данных протеомов видов . [10] [11] [12] С тех пор статья была процитирована более 27 тысяч раз.

AlphaFold 3 был анонсирован 8 мая 2024 года. Он может предсказывать структуру комплексов , созданных белками с ДНК , РНК , различными лигандами и ионами . [13]

Демис Хассабис и Джон Джампер из команды, которая разработала AlphaFold, получили Нобелевскую премию по химии в 2024 году за свою работу по «предсказанию структуры белка». Ранее в 2023 году они получили Премию за прорыв в области наук о жизни и Премию Альберта Ласкера за фундаментальные медицинские исследования. [14] [15]

Фон

три отдельные полипептидные цепи на разных уровнях сворачивания и кластер цепей
Аминокислотные цепи, известные как полипептиды , сворачиваются, образуя белок.

Белки состоят из цепочек аминокислот , которые спонтанно складываются , образуя трехмерные (3-D) структуры белков. Трехмерная структура имеет решающее значение для понимания биологической функции белка.

Структуры белков можно определить экспериментально с помощью таких методов, как рентгеновская кристаллография , криоэлектронная микроскопия и ядерный магнитный резонанс , которые все являются дорогостоящими и трудоемкими. [16] Такие усилия, использующие экспериментальные методы, позволили определить структуры около 170 000 белков за последние 60 лет, в то время как во всех формах жизни известно более 200 миллионов белков. [5]

На протяжении многих лет исследователи применяли многочисленные вычислительные методы для прогнозирования трехмерных структур белков по их аминокислотным последовательностям, но точность таких методов не приближалась к экспериментальным методам. CASP , запущенный в 1994 году, чтобы бросить вызов научному сообществу и предложить им наилучшие предсказания структуры белка, обнаружил, что к 2016 году для самых сложных белков можно достичь оценок GDT всего около 40 из 100. [5] AlphaFold начал соревноваться в CASP 2018 года, используя технику глубокого обучения искусственного интеллекта (ИИ) . [16]

Алгоритм

Известно, что DeepMind обучил программу на более чем 170 000 белков из публичного репозитория последовательностей и структур белков. Программа использует форму сети внимания , технику глубокого обучения , которая фокусируется на том, чтобы ИИ идентифицировал части более крупной проблемы, а затем объединял их для получения общего решения. [2] Общее обучение проводилось на вычислительной мощности от 100 до 200 графических процессоров . [2]

АльфаФолд 1 (2018)

AlphaFold 1 (2018) был создан на основе работы, проделанной различными группами в 2010-х годах, работы, которая рассматривала большие банки данных связанных последовательностей ДНК, которые теперь доступны из многих различных организмов (большинство из которых не имеют известных трехмерных структур), чтобы попытаться найти изменения в различных остатках , которые, по-видимому, коррелируют, даже если остатки не были последовательными в основной цепи. Такие корреляции предполагают, что остатки могут быть близки друг к другу физически, даже если не близки в последовательности, что позволяет оценить карту контактов . Основываясь на недавней работе до 2018 года, AlphaFold 1 расширил это, чтобы оценить распределение вероятностей того, насколько близко могут быть остатки, — превратив карту контактов в карту вероятных расстояний. Он также использовал более продвинутые методы обучения, чем ранее, для разработки вывода. [17] [18]

АльфаФолд 2 (2020)

Производительность, эксперименты и архитектура AlphaFold 2 [19]
Архитектурные детали AlphaFold 2 [19]

По словам команды DeepMind, версия программы 2020 года ( AlphaFold 2 , 2020) существенно отличается от оригинальной версии, которая выиграла CASP 13 в 2018 году. [20] [21]

Программное обеспечение, используемое в AlphaFold 1, содержало ряд модулей, каждый из которых обучался отдельно, которые использовались для создания направляющего потенциала, который затем объединялся с энергетическим потенциалом, основанным на физике. AlphaFold 2 заменил это системой подсетей, соединенных вместе в единую дифференцируемую сквозную модель, основанную полностью на распознавании образов, которая обучалась интегрированным образом как единая интегрированная структура. [21] [22] Локальная физика в форме энергетического уточнения на основе модели AMBER применяется только в качестве последнего шага уточнения после того, как прогноз нейронной сети сошлся, и лишь немного корректирует предсказанную структуру. [23]

Ключевой частью системы 2020 года являются два модуля, которые, как полагают, основаны на конструкции трансформатора , которые используются для постепенного уточнения вектора информации для каждой связи (или « ребра » в терминологии теории графов) между аминокислотным остатком белка и другим аминокислотным остатком (эти связи представлены массивом, показанным зеленым); и между каждой позицией аминокислоты и каждой различной последовательностью в выравнивании входной последовательности (эти связи представлены массивом, показанным красным). [22] Внутренне эти преобразования уточнения содержат слои, которые имеют эффект объединения соответствующих данных и отфильтровывания нерелевантных данных («механизм внимания») для этих связей контекстно-зависимым образом, изученным из обучающих данных. Эти преобразования повторяются, обновленная информация, выводимая на одном шаге, становится входом для следующего, при этом уточненная информация об остатке/остатке подается на обновление информации об остатке/последовательности, а затем улучшенная информация об остатке/последовательности подается на обновление информации об остатке/остатке. [22] По мере развития итерации, согласно одному отчету, «алгоритм внимания... имитирует способ, которым человек собирает пазл: сначала соединяя части в небольшие группы — в данном случае кластеры аминокислот — а затем ищем способы объединить группы в более крупное целое». [5] [ требуется обновление ]

Выходные данные этих итераций затем информируют модуль окончательного предсказания структуры, [22] который также использует трансформаторы, [24] и затем сам итерируется. В примере, представленном DeepMind, модуль предсказания структуры достиг правильной топологии для целевого белка на своей первой итерации, оцененной как имеющая GDT_TS 78, но с большим количеством (90%) стереохимических нарушений – т. е. нефизических углов связи или длин. С последующими итерациями количество стереохимических нарушений уменьшалось. К третьей итерации GDT_TS предсказания приближалось к 90, а к восьмой итерации количество стереохимических нарушений приближалось к нулю. [25]

Первоначально данные обучения были ограничены отдельными пептидными цепями. Однако обновление от октября 2021 года под названием AlphaFold-Multimer включило в свои данные обучения белковые комплексы. DeepMind заявила, что это обновление успешно предсказывало белок-белковые взаимодействия примерно в 70% случаев. [26]

АльфаФолд 3 (2024)

Анонсированный 8 мая 2024 года, AlphaFold 3 был совместно разработан Google DeepMind и Isomorphic Labs , обеими дочерними компаниями Alphabet . AlphaFold 3 не ограничивается одноцепочечными белками, поскольку он также может предсказывать структуры белковых комплексов с ДНК , РНК , посттрансляционными модификациями и выбранными лигандами и ионами . [27] [13]

AlphaFold 3 представляет «Pairformer», архитектуру глубокого обучения, вдохновленную трансформатором, считающуюся похожей, но более простой, чем Evoformer, представленный в AlphaFold 2. [28] [29] Необработанные прогнозы из модуля Pairformer передаются в диффузионную модель , которая начинается с облака атомов и использует эти прогнозы для итеративного продвижения к трехмерному изображению молекулярной структуры. [13]

Сервер AlphaFold был создан для предоставления бесплатного доступа к AlphaFold 3 для некоммерческих исследований. [30]

Соревнования

Результаты, достигнутые для предсказания белков лучшими реконструкциями в конкурсе CASP 2018 (маленькие кружки) и конкурсе CASP 2020 (большие кружки), по сравнению с результатами, достигнутыми в предыдущие годы.
Красная линия тренда показывает, как несколько моделей, включая AlphaFold 1, достигли значительного скачка в 2018 году по сравнению со скоростью прогресса, достигнутого ранее, особенно в отношении последовательностей белков, которые считаются наиболее сложными для прогнозирования.
(Качественное улучшение было достигнуто в предыдущие годы, но только когда изменения приводят структуры в пределах 8 Å от их экспериментальных положений, они начинают влиять на показатель CASP GDS-TS).
Оранжевая линия тренда показывает, что к 2020 году серверы онлайн-прогнозирования смогли извлечь уроки и соответствовать этой производительности, в то время как лучшие другие группы (зеленая кривая) в среднем смогли внести некоторые улучшения в нее. Однако черная кривая тренда показывает степень, в которой AlphaFold 2 снова превзошел это в 2020 году по всем направлениям.
Подробный разброс точек данных указывает на степень согласованности или вариации, достигнутую AlphaFold. Выбросы представляют собой горстку последовательностей, для которых не удалось сделать столь успешного прогноза.

КАСП13

В декабре 2018 года AlphaFold от DeepMind занял первое место в общем рейтинге 13-й критической оценки методов прогнозирования структуры белка (CASP). [31] [32]

Программа особенно успешно предсказывала наиболее точную структуру для целей, оцененных организаторами конкурса как самые сложные, где не было существующих шаблонных структур из белков с частично похожей последовательностью. AlphaFold дал наилучший прогноз для 25 из 43 белковых целей в этом классе, [32] [33] [34] достигнув медианного балла 58,9 по баллу теста на глобальное расстояние (GDT) CASP, опередив 52,5 и 52,4 двух следующих лучших команд, [35] которые также использовали глубокое обучение для оценки контактных расстояний. [36] [37] В целом, по всем целям программа достигла балла GDT 68,5. [38]

В январе 2020 года реализации и иллюстративный код AlphaFold 1 были опубликованы с открытым исходным кодом на GitHub . [39] [16] но, как указано в файле «Read Me» на этом сайте: «Этот код не может быть использован для прогнозирования структуры произвольной последовательности белка. Он может быть использован для прогнозирования структуры только на наборе данных CASP13 (ссылки ниже). Код генерации признаков тесно связан с нашей внутренней инфраструктурой, а также с внешними инструментами, поэтому мы не можем открыть его исходный код». Поэтому, по сути, размещенный код не подходит для общего использования, а подходит только для белков CASP13. Компания не объявляла о планах сделать свой код общедоступным по состоянию на 5 марта 2021 года.

КАСП14

В ноябре 2020 года новая версия DeepMind, AlphaFold 2, победила в CASP14. [40] [41] В целом, AlphaFold 2 сделал лучший прогноз для 88 из 97 целей. [6]

По предпочтительному для конкурса глобальному дистанционному тесту (GDT) показателю точности программа достигла медианного балла 92,4 (из 100), что означает, что более половины ее предсказаний были оценены выше 92,4% для атомов в более или менее правильном месте, [42] [43] уровень точности, как сообщается, сопоставим с экспериментальными методами, такими как рентгеновская кристаллография . [20] [7] [38] В 2018 году AlphaFold 1 достигла этого уровня точности только в двух из всех своих предсказаний. [6] 88% предсказаний в конкурсе 2020 года имели балл GDT_TS более 80. В группе целей, классифицированных как самые сложные, AlphaFold 2 достигла медианного балла 87.

Измеренное по среднеквадратичному отклонению (RMS-D) размещения альфа-углеродных атомов основной цепи белка, которое, как правило, определяется производительностью наихудших выбросов, 88% предсказаний AlphaFold 2 имели среднеквадратичное отклонение менее 4 Å для набора перекрывающихся атомов C-альфа. [6] 76% предсказаний достигли точности лучше, чем 3 Å, и 46% имели точность RMS атома C-альфа лучше, чем 2 Å, [6] со средним среднеквадратическим отклонением в его предсказаниях 2,1 Å для набора перекрывающихся атомов CA. [6] AlphaFold 2 также достиг точности в моделировании поверхностных боковых цепей, описанной как «действительно очень необычайная».

Для дополнительной проверки AlphaFold-2 организаторы конференции обратились к четырем ведущим экспериментальным группам для структур, которые они считали особенно сложными и не смогли определить. Во всех четырех случаях трехмерные модели, созданные AlphaFold 2, были достаточно точными для определения структур этих белков путем молекулярной замены . Они включали целевой T1100 (Af1503), небольшой мембранный белок, изучаемый экспериментаторами в течение десяти лет. [5]

Из трех структур, в предсказании которых AlphaFold 2 имел наименьший успех, две были получены методами ЯМР белка , которые определяют структуру белка непосредственно в водном растворе, тогда как AlphaFold в основном обучался на структурах белка в кристаллах . Третья существует в природе как многодоменный комплекс, состоящий из 52 идентичных копий одного и того же домена , ситуация, на рассмотрение которой AlphaFold не был запрограммирован. Для всех целей с одним доменом, за исключением только одного очень большого белка и двух структур, определенных с помощью ЯМР, AlphaFold 2 достиг оценки GDT_TS более 80.

КАСП15

В 2022 году DeepMind не участвовал в CASP15, но большинство участников использовали AlphaFold или инструменты, включающие AlphaFold. [44]

Прием

AlphaFold 2, набравший более 90 баллов в глобальном дистанционном тесте CASP (GDT), считается значительным достижением в вычислительной биологии [5] и большим прогрессом в решении грандиозной задачи биологии, стоящей перед десятилетиями. [7] Лауреат Нобелевской премии и структурный биолог Венки Рамакришнан назвал результат «потрясающим достижением в решении проблемы сворачивания белка» [5], добавив, что «это произошло на десятилетия раньше, чем многие специалисты в этой области могли бы это предсказать. Будет интересно увидеть множество способов, которыми это фундаментально изменит биологические исследования». [40]

Подстегиваемый пресс-релизами CASP и DeepMind, [45] [40] успех AlphaFold 2 получил широкое освещение в СМИ. [46] Помимо новостных статей в специализированной научной прессе, такой как Nature , [7] Science , [5] MIT Technology Review , [2] и New Scientist , [47] [48] история широко освещалась крупными национальными газетами. [49] [50] [51] [52] Частой темой было то, что способность точно предсказывать структуры белков на основе последовательности составляющих аминокислот, как ожидается, будет иметь широкий спектр преимуществ в области наук о жизни, включая ускорение разработки передовых лекарств и обеспечение лучшего понимания заболеваний. [7] [53] Некоторые отметили, что даже идеальный ответ на проблему предсказания белка все еще оставит вопросы о проблеме сворачивания белка — детальное понимание того, как процесс сворачивания на самом деле происходит в природе (и как иногда они также могут неправильно сворачиваться ). [54]

В 2023 году Демис Хассабис и Джон Джампер выиграли премию «За прорыв» в области естественных наук [15], а также премию Альберта Ласкера за фундаментальные медицинские исследования за руководство проектом AlphaFold. [55] Хассабис и Джампер в 2024 году получили Нобелевскую премию по химии за свою работу по «предсказанию структуры белка» совместно с Дэвидом Бейкером из Вашингтонского университета. [14] [56]

Исходный код

Открытый доступ к исходному коду нескольких версий AlphaFold (за исключением AlphaFold 3) был предоставлен DeepMind по просьбе научного сообщества. [57] [58] [59] Ожидается, что полный исходный код AlphaFold-3 будет предоставлен в открытый доступ к концу 2024 года. [60] [61]

База данных моделей белков, созданная AlphaFold

База данных структур белков AlphaFold была запущена 22 июля 2021 года в результате совместных усилий AlphaFold и EMBL-EBI . На момент запуска база данных содержит предсказанные AlphaFold модели структур белков почти полного протеома UniProt человека и 20 модельных организмов , что составляет более 365 000 белков. База данных не включает белки с менее чем 16 или более чем 2700 аминокислотными остатками , [62] но для людей они доступны во всем пакетном файле. [63] AlphaFold планировала добавить больше последовательностей в коллекцию, первоначальная цель (на начало 2022 года) состояла в том, чтобы охватить большую часть набора UniRef90 из более чем 100 миллионов белков. По состоянию на 15 мая 2022 года было доступно 992 316 прогнозов. [64]

В июле 2021 года UniProt-KB и InterPro [65] были обновлены для отображения прогнозов AlphaFold, когда они доступны. [66]

28 июля 2022 года команда загрузила в базу данных структуры около 200 миллионов белков из 1 миллиона видов, охватывающих почти все известные белки на планете. [67]

Ограничения

AlphaFold имеет ряд ограничений:

Приложения

AlphaFold использовался для прогнозирования структур белков SARS-CoV-2 , возбудителя COVID-19 . Структуры этих белков ожидали экспериментального обнаружения в начале 2020 года. [76] [7] Результаты были изучены учеными Института Фрэнсиса Крика в Соединенном Королевстве перед публикацией в более широком исследовательском сообществе. Группа также подтвердила точное предсказание в отношении экспериментально определенного белка-шипа SARS-CoV-2 , который был опубликован в Protein Data Bank , международной базе данных с открытым доступом, прежде чем опубликовать вычислительно определенные структуры недостаточно изученных молекул белков. [77] Группа признала, что, хотя эти структуры белков, возможно, не являются предметом текущих терапевтических исследовательских усилий, они пополнят понимание сообществом вируса SARS-CoV-2. [77] В частности, предсказание AlphaFold 2 структуры белка ORF3a было очень похоже на структуру, определенную исследователями из Калифорнийского университета в Беркли с помощью криоэлектронной микроскопии . Этот специфический белок, как полагают, помогает вирусу вырваться из клетки-хозяина после его репликации. Также считается, что этот белок играет роль в запуске воспалительного ответа на инфекцию. [78]

Опубликованные работы

Смотрите также

Ссылки

  1. ^ "AlphaFold". Deepmind . Архивировано из оригинала 19 января 2021 . Получено 30 ноября 2020 .
  2. ^ abcdef "ИИ DeepMind, сворачивающий белки, решил 50-летнюю грандиозную задачу биологии". MIT Technology Review . Архивировано из оригинала 28-08-2021 . Получено 30-11-2020 .
  3. ^ Шеад, Сэм (2020-11-30). "DeepMind решает 50-летнюю "грандиозную задачу" с помощью ИИ для сворачивания белков" CNBC . Архивировано из оригинала 2021-01-28 . Получено 2020-11-30 .
  4. ^ Стоддарт, Шарлотта (1 марта 2022 г.). «Структурная биология: как белки получили свой крупный план». Knowable Magazine . doi : 10.1146/knowable-022822-1 . S2CID  247206999. Архивировано из оригинала 7 апреля 2022 г. . Получено 25 марта 2022 г. .
  5. ^ abcdefgh Роберт Ф. Сервис, «Игра изменилась». ИИ торжествует в решении структур белков Архивировано 24.06.2023 в Wayback Machine , Science , 30 ноября 2020 г.
  6. ^ abcdef Мохаммед Аль-Кураиши, Результаты CASP14 только что вышли, и они поразительны. Архивировано 04.08.2022 в Wayback Machine , Twitter, 30 ноября 2020 г.
  7. ^ abcdef Каллауэй, Юэн (2020-11-30). "«Это изменит всё»: ИИ DeepMind совершает гигантский скачок в решении структур белков». Nature . 588 (7837): 203–204. Bibcode :2020Natur.588..203C. doi :10.1038/d41586-020-03348-4. PMID  33257889. S2CID  227243204.
  8. ^ Стивен Карри, Нет, DeepMind не решил проблему сворачивания белка Архивировано 29 июля 2022 г. в Wayback Machine , Reciprocal Space (блог), 2 декабря 2020 г.
  9. ^ Болл, Филлип (9 декабря 2020 г.). «За экранами AlphaFold». Chemistry World . Архивировано из оригинала 15 августа 2021 г. Получено 10 декабря 2020 г.
  10. ^ аб Джампер, Джон; Эванс, Ричард; Притцель, Александр; Грин, Тим; Фигурнов Михаил; Роннебергер, Олаф; Туньясувунакул, Кэтрин; Бейтс, Расс; Жидек, Августин; Потапенко, Анна; Бриджланд, Алекс; Мейер, Клеменс; Коль, Саймон А.А.; Баллард, Эндрю Дж; Коуи, Эндрю; Ромера-Паредес, Бернардино; Николов Станислав; Джайн, Ришуб; Адлер, Йонас; Назад, Тревор; Петерсен, Стиг; Рейман, Дэвид; Клэнси, Эллен; Зелински, Михал; Штайнеггер, Мартин; Пачольска, Михалина; Бергаммер, Тамас; Боденштейн, Себастьян; Сильвер, Дэвид; Виньялс, Ориол; Старший, Эндрю В.; Кавукчуоглу, Корай; Кохли, Пушмит; Хассабис, Демис (2021-07-15). "Высокоточное предсказание структуры белка с AlphaFold". Nature . 596 (7873): 583–589. Bibcode :2021Natur.596..583J. doi : 10.1038/s41586-021-03819 -2 . PMC 8371605 . PMID  34265844. 
  11. ^ "GitHub - deepmind/alphafold: Открытый исходный код для AlphaFold". GitHub . Архивировано из оригинала 2021-07-23 . Получено 2021-07-24 .
  12. ^ "База данных структур белков AlphaFold". alphafold.ebi.ac.uk . Архивировано из оригинала 2021-07-24 . Получено 2021-07-24 .
  13. ^ abc "AlphaFold 3 предсказывает структуру и взаимодействие всех молекул жизни". Google . 2024-05-08. Архивировано из оригинала 2024-05-09 . Получено 2024-05-09 .
  14. ^ ab Hunt, Christian Edwards, Katie (9 октября 2024 г.). «Ученые, которые использовали ИИ для «взлома кода» почти всех белков, получили Нобелевскую премию по химии». CNN . Архивировано из оригинала 10 октября 2024 г. . Получено 9 октября 2024 г. .{{cite news}}: CS1 maint: несколько имен: список авторов ( ссылка )
  15. ^ ab Knapp, Alex. "Объявлены награды за прорыв 2023 года: Protein Folders от Deepmind получили награду в размере 3 миллионов долларов". Forbes . Архивировано из оригинала 2024-05-09 . Получено 2024-05-09 .
  16. ^ abc "AlphaFold: использование ИИ для научных открытий". Deepmind . 15 января 2020 г. Архивировано из оригинала 2022-03-07 . Получено 2020-11-30 .
  17. ^ Mohammed AlQuraishi (май 2019 г.), AlphaFold на CASP13 Архивировано 22 ноября 2021 г. на Wayback Machine , Bioinformatics , 35 (22), 4862–4865 doi :10.1093/bioinformatics/btz422. См. также Mohammed AlQuraishi (9 декабря 2018 г.), AlphaFold на CASP13: "Что только что произошло?" Архивировано 29 июля 2022 г. на Wayback Machine (запись в блоге). Мохаммед Аль-Кураиши (15 января 2020 г.), Переломный момент в предсказании структуры белка. Архивировано 23 июня 2022 г. в Wayback Machine , Nature 577 , 627–628 doi :10.1038/d41586-019-03951-0
  18. ^ AlphaFold: Машинное обучение для прогнозирования структуры белка. Архивировано 12.05.2022 в Wayback Machine , Foldit , 31 января 2020 г.
  19. ^ ab Jumper, John; et al. (август 2021 г.). «Высокоточное предсказание структуры белка с помощью AlphaFold». Nature . 596 (7873): 583–589. Bibcode :2021Natur.596..583J. doi :10.1038/s41586-021-03819-2. ISSN  1476-4687. PMC 8371605 . PMID  34265844. 
  20. ^ ab "DeepMind отвечает на один из крупнейших вызовов биологии". The Economist . 2020-11-30. ISSN  0013-0613. Архивировано из оригинала 2020-12-03 . Получено 2020-11-30 .
  21. ^ ab Джереми Кан, Уроки прорыва DeepMind в области искусственного интеллекта, связывающего белки Архивировано 08.04.2022 в Wayback Machine , Fortune , 1 декабря 2020 г.
  22. ^ abcd См. блок-схему. Также Джон Джампер и др. (1 декабря 2020 г.), презентация AlphaFold 2 Архивировано 03.07.2022 на Wayback Machine , слайд 10
  23. ^ Джон Джампер и др., тезисы конференции (декабрь 2020 г.)
  24. ^ Утверждается, что структурный модуль использует «3-мерную эквивариантную архитектуру трансформатора» (Джон Джампер и др. (1 декабря 2020 г.), презентация AlphaFold 2, архивировано 03.07.2022 на Wayback Machine , слайд 12).
    Одна конструкция сети трансформатора с SE(3) -эквивариантностью была предложена в работе Фабиана Фукса и др. SE(3)-Transformers: 3D Roto-Translation Equivariant Attention Networks, архивировано 07.10.2021 на Wayback Machine , NeurIPS 2020; также веб-сайт, архивировано 03.07.2022 на Wayback Machine . Неизвестно, насколько это может быть похоже или нет на то, что использовалось в AlphaFold. См. также запись в блоге AlQuaraishi, архивированная 08.12.2020 на Wayback Machine , или более подробную запись Фабиана Фукса, архивированная 03.07.2022 на Wayback Machine.
  25. ^ Джон Джампер и др. (1 декабря 2020 г.), презентация AlphaFold 2, архивированная 03.07.2022 на Wayback Machine , слайды с 12 по 20.
  26. ^ Callaway, Ewen (13 апреля 2022 г.). «Что ждет AlphaFold и революцию в области фолдинга белков ИИ». Nature . 604 (7905): 234–238. Bibcode :2022Natur.604..234C. doi : 10.1038/d41586-022-00997-5 . PMID  35418629. S2CID  248156195.
  27. ^ Метц, Кейд (2024-05-08). «Google представляет ИИ для прогнозирования поведения человеческих молекул». The New York Times . ISSN  0362-4331. Архивировано из оригинала 2024-10-10 . Получено 2024-05-09 .
  28. ^ Абрамсон, Джош; Адлер, Джонас; Дангер, Джек; Эванс, Ричард; Грин, Тим; Притцель, Александр; Роннебергер, Олаф; Уиллмор, Линдси; Баллард, Эндрю Дж.; Бэмбрик, Джошуа; Боденштейн, Себастьян В.; Эванс, Дэвид А.; Хунг, Чиа-Чун; О'Нил, Майкл; Рейман, Дэвид (2024-05-08). "Точное предсказание структуры биомолекулярных взаимодействий с AlphaFold 3". Nature . 630 (8016): 493–500. Bibcode :2024Natur.630..493A. doi : 10.1038/s41586-024-07487-w . ISSN  1476-4687. PMC 11168924 . PMID  38718835. 
  29. ^ Точное предсказание структуры биомолекулярных взаимодействий с AlphaFold 3 Архивировано 12 мая 2024 г. на Wayback Machine , pdf-файл препринта статьи в Nature.
  30. ^ "Некоммерческий сервер AlphaFold-3". Архивировано из оригинала 2024-10-10 . Получено 2024-05-12 .
  31. ^ Групповая эффективность на основе объединенных z-оценок. Архивировано 08.03.2022 на Wayback Machine , CASP 13, декабрь 2018 г. (AlphaFold = Team 043: A7D)
  32. ^ ab Sample, Ian (2 декабря 2018 г.). «Google DeepMind предсказывает трехмерные формы белков». The Guardian . Архивировано из оригинала 18 июля 2019 г. Получено 30 ноября 2020 г.
  33. ^ "AlphaFold: использование ИИ для научных открытий". Deepmind . Архивировано из оригинала 10 октября 2024 г. Получено 30 ноября 2020 г.
  34. ^ Сингх, Арунима (2020). «Глубокое обучение 3D-структур». Nature Methods . 17 (3): 249. doi : 10.1038/s41592-020-0779-y . ISSN  1548-7105. PMID  32132733. S2CID  212403708.
  35. ^ См. таблицы данных CASP 13, заархивированные 14.03.2022 на Wayback Machine для 043 A7D, 322 Zhang и 089 MULTICOM.
  36. ^ Вэй Чжэн и др. , Прогнозирование структуры белка с помощью глубокого обучения на основе контактной карты в CASP13. Архивировано 22 января 2022 г. в Wayback Machine , Белки: структура, функция и биоинформатика , 87 (12) 1149–1164 doi :10.1002/prot.25792; и слайды. Архивировано 26 июля 2022 г. в Wayback Machine.
  37. ^ Хоу, Цзе; У, Тяньци; Цао, Жэньчжи; Чэн, Цзяньлинь (2019-04-25). «Моделирование третичной структуры белка, основанное на глубоком обучении и прогнозировании расстояния контакта в CASP13». Белки: структура, функция и биоинформатика . 87 (12). Wiley: 1165–1178. bioRxiv 10.1101/552422 . doi :10.1002/prot.25697. ISSN  0887-3585. PMC 6800999. PMID 30985027  .  
  38. ^ ab "Прорыв DeepMind помогает решить, как болезни проникают в клетки". Bloomberg.com . 2020-11-30. Архивировано из оригинала 2022-04-05 . Получено 2020-11-30 .
  39. ^ "deepmind/deepmind-research". GitHub . Архивировано из оригинала 2022-02-01 . Получено 2020-11-30 .
  40. ^ abc "AlphaFold: решение грандиозной проблемы биологии 50-летней давности". Deepmind . 30 ноября 2020 г. Архивировано из оригинала 30 ноября 2020 г. Получено 30 ноября 2020 г.
  41. ^ "Искусственный интеллект DeepMind, сворачивающий белки, решил 50-летнюю грандиозную задачу биологии". MIT Technology Review . Архивировано из оригинала 28 августа 2021 г. Получено 30 ноября 2020 г.
  42. ^ Для используемой меры GDT_TS каждый атом в прогнозе получает четверть балла, если он находится в пределах 8 Å (0,80 нм) от экспериментального положения; половину балла, если он находится в пределах 4 Å, три четверти балла, если он находится в пределах 2 Å, и целый балл, если он находится в пределах 1 Å.
  43. ^ Чтобы получить оценку GDT_TS 92,5, математически не менее 70% структуры должны быть точными в пределах 1 Å, и не менее 85% должны быть точными в пределах 2 Å,
  44. ^ Callaway, Ewen (2022-12-13). «После AlphaFold: конкурс по сворачиванию белков ищет следующий большой прорыв». Nature . 613 (7942): 13–14. doi : 10.1038/d41586-022-04438-1 . PMID  36513827. S2CID  254660427.
  45. ^ Решение 50-летней научной проблемы с помощью искусственного интеллекта может «произвести революцию» в медицинских исследованиях Архивировано 24.04.2022 в Wayback Machine (пресс-релиз), оргкомитет CASP , 30 ноября 2020 г.
  46. ^ Бригитта Нерлих, Сворачивание белка и научная коммуникация: между шумихой и смирением Архивировано 15 февраля 2022 г. в Wayback Machine , блог Ноттингемского университета , 4 декабря 2020 г.
  47. ^ Майкл Ле Пейдж, биолог ИИ DeepMind может расшифровать секреты механизмов жизни Архивировано 2022-08-02 в Wayback Machine , New Scientist , 30 ноября 2020 г.
  48. ^ Предсказания новейшего искусственного интеллекта DeepMind могут произвести революцию в медицине Архивировано 2021-11-07 в Wayback Machine , New Scientist , 2 декабря 2020 г.
  49. ^ Том Уиппл, Deepmind находит «святой Грааль» биологии, решая проблему белка. Архивировано 19 января 2021 г. в Wayback Machine , The Times (онлайн), 30 ноября 2020 г. В день, когда появилась эта новость
    , редактор отдела науки Том Уиппл написал шесть статей на эту тему для The Times . (тема Архивировано 08 ноября 2021 г. в Wayback Machine ).
  50. ^ Кейд Метц, Лондонская лаборатория искусственного интеллекта заявляет о прорыве, который может ускорить открытие лекарств. Архивировано 04.08.2022 в Wayback Machine , New York Times , 30 ноября 2020 г.
  51. ^ Ян Сэмпл, DeepMind AI решает 50-летнюю проблему сворачивания белка Архивировано 2020-11-30 в Wayback Machine , The Guardian , 30 ноября 2020 г.
  52. ^ Лиззи Робертс, «Раз в поколение прогресс», как исследователи Google AI решают 50-летнюю биологическую задачу Архивировано 2022-08-04 в Wayback Machine . Daily Telegraph , 30 ноября 2020 г.
  53. ^ Тим Хаббард , Секрет жизни, часть 2: решение проблемы сворачивания белка. Архивировано 2022-05-14 в Wayback Machine , medium.com , 30 ноября 2020 г.
  54. ^ например, Грег Боуман, Сворачивание белка и связанные с этим проблемы остаются нерешенными, несмотря на прогресс AlphaFold Архивировано 13 июля 2022 г. в Wayback Machine , блог Folding@home , 8 декабря 2020 г.
  55. ^ Сэмпл, Ян (21.09.2023). «Команда, стоящая за программой искусственного интеллекта AlphaFold, получила научную премию Ласкера». The Guardian . ISSN  0261-3077. Архивировано из оригинала 10.10.2024 . Получено 09.05.2024 .
  56. ^ "Нобелевская премия по химии 2024 года". NobelPrize.org . Архивировано из оригинала 2024-10-09 . Получено 2024-10-10 .
  57. ^ Домингес, Нуньо (2 декабря 2020 г.). «Интеллектуальное искусственное образование в одной из важнейших проблем биологии». Эль Паис (на испанском языке). Архивировано из оригинала 26 июля 2022 г. Проверено 12 мая 2024 г.
  58. ^ Бриггс, Дэвид (2020-12-04). «Если Alphafold2 от Google действительно решил проблему сворачивания белка, им нужно показать свою работу». The Skeptic . Архивировано из оригинала 2024-05-12 . Получено 2024-05-12 .
  59. ^ Демис Хассабис , «Краткий обзор захватывающего прогресса в #AlphaFold!» Архивировано 22 июля 2022 г. на Wayback Machine (твит), через Twitter , 18 июня 2021 г.
  60. ^ «AlphaFold3 — почему Nature опубликовала его без кода?». Архивировано из оригинала 28.06.2024 . Получено 27.05.2024 .
  61. ^ "AlphaFold 3: Шаг в будущее предсказания структур". Архивировано из оригинала 2024-05-27 . Получено 2024-05-27 .
  62. ^ "База данных структур белков AlphaFold". alphafold.ebi.ac.uk . Архивировано из оригинала 2022-07-29 . Получено 2021-07-29 .
  63. ^ "База данных структур белков AlphaFold". alphafold.ebi.ac.uk . Архивировано из оригинала 29 июля 2022 г. . Получено 27 июля 2021 г. .
  64. ^ "База данных структур белков AlphaFold". www.alphafold.ebi.ac.uk . Архивировано из оригинала 2022-08-02 . Получено 2021-07-24 .
  65. ^ InterPro (22 июля 2021 г.). «Предсказания структуры Alphafold, доступные в Interpro». proteinswebteam.github.io . Архивировано из оригинала 2021-11-05 . Получено 2021-07-29 .
  66. ^ «Передаем силу AlphaFold в руки мира». Deepmind . 22 июля 2022 г. Архивировано из оригинала 24 июля 2021 г. Получено 24 июля 2021 г.
  67. ^ Callaway, Ewen (28.07.2022). «Вся белковая вселенная»: ИИ предсказывает форму почти каждого известного белка». Nature . 608 (7921): 15–16. Bibcode :2022Natur.608...15C. doi : 10.1038/d41586-022-02083-2 . ​​PMID  35902752. S2CID  251159714.
  68. ^ ab "Какие варианты использования AlphaFold не поддерживает?". База данных структур белков AlphaFold . Архивировано из оригинала 29-07-2022 . Получено 15-05-2022 .
  69. ^ AlphaFold возвещает о революции в биологии и медицине, основанной на данных. Архивировано 10 октября 2024 г. в Wayback Machine , Джанет М. Торнтон , Роман А. Ласковски и Нира Боркакоти, Nature Medicine , том 12, страницы 1666–1669, 12 октября 2021 г.
  70. ^ McBride, John M.; Polev, Konstantin; Abdirasulov, Amirbek; Reinharz, Vladimir; Grzybowski, Bartosz A.; Tlusty, Tsvi (2023-11-20). "AlphaFold2 Can Predict Single-Mutation Effects". Physical Review Letters . 131 (21): 218401. arXiv : 2204.06860 . Bibcode :2023PhRvL.131u8401M. doi :10.1103/PhysRevLett.131.218401. ISSN  0031-9007. PMID  38072605. Архивировано из оригинала 2024-06-09 . Получено 2023-11-26 .
  71. ^ "Последний прорыв DeepMind в области искусственного интеллекта может ускорить разработку лекарств". Fast Company . ISSN  1085-9241. Архивировано из оригинала 24.01.2023 . Получено 24.01.2023 .
  72. ^ Багдонас, Гарольдас; Фогарти, Карл А.; Фадда, Элиза; Агирре, Джон (29.10.2021). «Дело в пользу постпредсказательных модификаций в базе данных структур белков AlphaFold» (PDF) . Nature Structural & Molecular Biology . 28 (11): 869–870. doi : 10.1038/s41594-021-00680-9 . ISSN  1545-9985. PMID  34716446. S2CID  240228913. Архивировано (PDF) из оригинала 13.01.2024 . Получено 13.01.2024 .
  73. ^ An, Hyun Joo; Froehlich, John W; Lebrilla, Carlito B (2009-10-01). «Определение сайтов гликозилирования и сайт-специфической гетерогенности в гликопротеинах». Current Opinion in Chemical Biology . Analytical Techniques/Mechanisms. 13 (4): 421–426. doi :10.1016/j.cbpa.2009.07.022. ISSN  1367-5931. PMC 2749913. PMID 19700364  . 
  74. ^ Хеккельман, Маартен Л.; де Врис, Ида; Йостен, Робби П.; Перракис, Анастасис (февраль 2023 г.). «AlphaFill: обогащение моделей AlphaFold лигандами и кофакторами». Природные методы . 20 (2): 205–213. дои : 10.1038/s41592-022-01685-y . ПМЦ 9911346 . ПМИД  36424442. 
  75. ^ Домбровски-Туманский, Павел; Стасяк, Анджей (7 ноября 2023 г.). «Слепота AlphaFold к топологическим барьерам влияет на его способность правильно предсказывать топологию белков». Molecules . 28 (22): 7462. doi : 10.3390/molecules28227462 . PMC 10672856 . PMID  38005184. 
  76. ^ "ИИ может помочь ученым найти вакцину от Covid-19". Wired . ISSN  1059-1028. Архивировано из оригинала 2022-04-23 . Получено 2020-12-01 .
  77. ^ ab "Вычислительные предсказания структур белков, связанных с COVID-19". Deepmind . 4 августа 2020 г. Архивировано из оригинала 2022-03-25 . Получено 2020-12-01 .
  78. ^ "Как новый ИИ DeepMind по сворачиванию белков уже помогает бороться с пандемией коронавируса". Fortune . Архивировано из оригинала 2020-11-30 . Получено 2020-12-01 .

Дальнейшее чтение

Внешние ссылки