В области молекулярного моделирования стыковка представляет собой метод, который предсказывает предпочтительную ориентацию одной молекулы по отношению ко второй, когда лиганд и мишень связаны друг с другом, образуя стабильный комплекс . [1] Знание предпочтительной ориентации, в свою очередь, может быть использовано для прогнозирования прочности ассоциации или сродства связывания между двумя молекулами с использованием, например, функций оценки .
Ассоциации между биологически значимыми молекулами, такими как белки , пептиды , нуклеиновые кислоты , углеводы и липиды , играют центральную роль в передаче сигнала . Кроме того, относительная ориентация двух взаимодействующих партнеров может влиять на тип производимого сигнала (например, агонизм против антагонизма ). Поэтому стыковка полезна для прогнозирования как силы, так и типа производимого сигнала.
Молекулярный стыковочный метод является одним из наиболее часто используемых методов в структурно-ориентированном дизайне лекарств , благодаря его способности предсказывать связывающую конформацию лигандов малых молекул с соответствующим целевым сайтом связывания . Характеристика поведения связывания играет важную роль в рациональном дизайне лекарств , а также в выяснении фундаментальных биохимических процессов. [2] [3]
Можно представить себе молекулярную стыковку как проблему «замка и ключа» , в которой требуется найти правильную относительную ориентацию «ключа» , который откроет «замок» (где на поверхности замка находится замочная скважина, в каком направлении поворачивать ключ после того, как он вставлен и т. д.). Здесь белок можно рассматривать как «замок», а лиганд можно рассматривать как «ключ». Молекулярную стыковку можно определить как задачу оптимизации, которая описывала бы «наилучшую» ориентацию лиганда, связывающегося с конкретным интересующим белком. Однако, поскольку и лиганд, и белок являются гибкими, аналогия «рука в перчатке» более уместна, чем «замок и ключ» . [4] В ходе процесса стыковки лиганд и белок корректируют свою конформацию для достижения общей «наилучшей подгонки», и этот вид конформационной корректировки, приводящий к общему связыванию, называется «индуцированной подгонкой» . [5]
Исследования молекулярного стыковки фокусируются на вычислительном моделировании процесса молекулярного распознавания . Целью является достижение оптимизированной конформации как для белка, так и для лиганда, а также относительной ориентации между белком и лигандом, чтобы минимизировать свободную энергию всей системы.
В сообществе специалистов по молекулярной стыковке особенно популярны два подхода.
Оба подхода имеют как существенные преимущества, так и некоторые ограничения. Они изложены ниже.
Методы геометрического соответствия/комплементарности формы описывают белок и лиганд как набор характеристик, которые делают их стыкуемыми. [10] Эти характеристики могут включать молекулярные поверхностные /комплементарные поверхностные дескрипторы. В этом случае молекулярная поверхность рецептора описывается в терминах его доступной для растворителя площади поверхности , а молекулярная поверхность лиганда описывается в терминах описания его совпадающей поверхности. Комплементарность между двумя поверхностями сводится к описанию соответствия формы, которое может помочь найти комплементарную позу стыковки мишени и молекул лиганда. Другой подход заключается в описании гидрофобных характеристик белка с использованием поворотов в атомах основной цепи. Еще один подход заключается в использовании метода дескриптора формы Фурье. [11] [12] [13] В то время как подходы, основанные на комплементарности формы, обычно являются быстрыми и надежными, они обычно не могут точно моделировать движения или динамические изменения в конформациях лиганда/белка, хотя недавние разработки позволяют этим методам исследовать гибкость лиганда. Методы комплементарности формы могут быстро сканировать несколько тысяч лигандов за считанные секунды и фактически выяснить, могут ли они связываться с активным сайтом белка, и обычно масштабируются даже до белок-белковых взаимодействий. Они также гораздо более поддаются подходам на основе фармакофоров , поскольку они используют геометрические описания лигандов для поиска оптимального связывания.
Моделирование процесса стыковки гораздо сложнее. В этом подходе белок и лиганд разделены некоторым физическим расстоянием, и лиганд находит свое положение в активном центре белка после определенного количества «ходов» в его конформационном пространстве. Ходы включают в себя преобразования жесткого тела, такие как трансляции и вращения, а также внутренние изменения в структуре лиганда, включая вращения торсионного угла. Каждое из этих движений в конформационном пространстве лиганда вызывает общую энергетическую стоимость системы. Следовательно, общая энергия системы рассчитывается после каждого хода.
Очевидное преимущество моделирования стыковки заключается в том, что гибкость лиганда легко включается, тогда как методы комплементарности формы должны использовать изобретательные методы для включения гибкости в лиганды. Кроме того, он более точно моделирует реальность, тогда как методы комплементарности формы являются скорее абстракцией.
Очевидно, что моделирование является вычислительно затратным, поскольку необходимо исследовать большой энергетический ландшафт. Методы на основе сетки, методы оптимизации и возросшая скорость компьютера сделали моделирование стыковки более реалистичным.
Для выполнения стыковочного экрана первым требованием является структура интересующего белка. Обычно структура определяется с помощью биофизического метода, такого как
но также может быть получена из построения моделирования гомологии . Эта структура белка и база данных потенциальных лигандов служат входными данными для программы стыковки. Успех программы стыковки зависит от двух компонентов: алгоритма поиска и функции подсчета очков .
Пространство поиска в теории состоит из всех возможных ориентаций и конформаций белка, сопряженного с лигандом. Однако на практике с текущими вычислительными ресурсами невозможно исчерпывающе исследовать пространство поиска — это включало бы перечисление всех возможных искажений каждой молекулы (молекулы динамичны и существуют в ансамбле конформационных состояний) и всех возможных вращательных и трансляционных ориентаций лиганда относительно белка на заданном уровне детализации . Большинство используемых программ стыковки учитывают все конформационное пространство лиганда (гибкий лиганд), а несколько пытаются смоделировать гибкий белковый рецептор. Каждый «снимок» пары называется позой . [ 14]
К лиганду и рецептору были применены различные стратегии конформационного поиска. Они включают:
Конформации лиганда могут быть получены в отсутствие рецептора и впоследствии стыкованы [15] или конформации могут быть получены «на лету» в присутствии полости связывания рецептора [16] или с полной вращательной гибкостью каждого двугранного угла с использованием стыковки на основе фрагментов [17] Оценка энергии силового поля чаще всего используется для выбора энергетически обоснованных конформаций [18] , но также использовались методы, основанные на знаниях [19] .
Пептиды являются одновременно очень гибкими и относительно большими молекулами, что делает моделирование их гибкости сложной задачей. Было разработано несколько методов, позволяющих эффективно моделировать гибкость пептидов во время стыковки белок-пептид. [20]
Вычислительная мощность значительно возросла за последнее десятилетие, что сделало возможным использование более сложных и ресурсоемких методов в компьютерном дизайне лекарств. Однако работа с гибкостью рецепторов в методологиях стыковки по-прежнему остается сложной проблемой. [21] Основной причиной этой трудности является большое количество степеней свободы, которые необходимо учитывать в такого рода расчетах. Однако пренебрежение этим в некоторых случаях может привести к плохим результатам стыковки с точки зрения прогнозирования позы связывания. [22]
Множественные статические структуры, экспериментально определенные для одного и того же белка в различных конформациях, часто используются для имитации гибкости рецептора. [23] В качестве альтернативы можно искать библиотеки ротамеров боковых цепей аминокислот, которые окружают полость связывания, для создания альтернативных, но энергетически обоснованных конформаций белка. [24] [25]
Программы стыковки генерируют большое количество потенциальных поз лиганда, некоторые из которых могут быть немедленно отклонены из-за столкновений с белком. Остальные оцениваются с использованием некоторой функции оценки, которая принимает позу в качестве входных данных и возвращает число, указывающее вероятность того, что поза представляет благоприятное связывающее взаимодействие, и ранжирует один лиганд относительно другого.
Большинство функций оценки — это основанные на физике поля молекулярной механики , которые оценивают энергию позы в месте связывания. Различные вклады в связывание можно записать в виде аддитивного уравнения:
Компоненты состоят из эффектов растворителя, конформационных изменений в белке и лиганде, свободной энергии из-за взаимодействий белок-лиганд, внутренних вращений, энергии ассоциации лиганда и рецептора для образования единого комплекса и свободной энергии из-за изменений в колебательных модах. [26] Низкая (отрицательная) энергия указывает на стабильную систему и, следовательно, на вероятное связывающее взаимодействие.
Альтернативные подходы используют модифицированные функции оценки для включения ограничений, основанных на известных ключевых взаимодействиях белок-лиганд [27] или потенциалов, основанных на знаниях, полученных из взаимодействий, наблюдаемых в больших базах данных структур белок-лиганд (например, Protein Data Bank ). [28]
Существует большое количество структур из рентгеновской кристаллографии для комплексов между белками и лигандами с высоким сродством, но сравнительно меньше для лигандов с низким сродством, поскольку последние комплексы, как правило, менее стабильны и, следовательно, их сложнее кристаллизовать. Функции подсчета, обученные с этими данными, могут правильно стыковать лиганды с высоким сродством, но они также дадут правдоподобные стыковочные конформации для лигандов, которые не связываются. Это дает большое количество ложноположительных попаданий, т. е. лигандов, которые, как предсказывают, связываются с белком, но на самом деле не связываются, когда помещаются вместе в пробирку.
Одним из способов уменьшения количества ложных срабатываний является пересчет энергии поз с наивысшими показателями с использованием (потенциально) более точных, но и более ресурсоемких методов, таких как обобщенный метод Борна или метод Пуассона-Больцмана . [9]
Взаимозависимость между функцией выборки и подсчета влияет на способность стыковки предсказывать правдоподобные позы или сродства связывания для новых соединений. Таким образом, оценка протокола стыковки обычно требуется (при наличии экспериментальных данных) для определения его предсказательной способности. Оценка стыковки может быть выполнена с использованием различных стратегий, таких как:
Точность стыковки [30] [31] представляет собой одну из мер количественной оценки пригодности программы стыковки путем обоснования способности предсказывать правильное положение лиганда относительно экспериментально наблюдаемого. [32]
Экраны стыковки также можно оценить путем обогащения аннотированных лигандов известных связующих из большой базы данных предполагаемых несвязывающихся молекул- « приманок ». [29] Таким образом, успех экрана стыковки оценивается по его способности обогащать небольшое количество известных активных соединений в верхних рядах экрана из гораздо большего количества молекул-«приманок» в базе данных. Площадь под кривой рабочей характеристики приемника (ROC) широко используется для оценки его производительности.
Полученные в результате стыковочных экранов результаты подвергаются фармакологической проверке (например, IC 50 , измерения сродства или активности ). Только перспективные исследования представляют собой окончательное доказательство пригодности метода для определенной цели. [33] В случае рецепторов, сопряженных с G-белком (GPCR), которые являются целями более 30% продаваемых лекарств, молекулярная стыковка привела к открытию более 500 лигандов GPCR. [34]
Потенциал программ стыковки по воспроизведению режимов связывания, определенных с помощью рентгеновской кристаллографии, можно оценить с помощью ряда наборов контрольных тестов стыковки.
Для малых молекул существует несколько наборов контрольных данных для стыковки и виртуального скрининга, например, Astex Diverse Set, состоящий из высококачественных рентгеновских кристаллических структур белок-лиганд [35], Directory of Useful Decoys (DUD) для оценки эффективности виртуального скрининга [29] или набор данных LEADS-FRAG для фрагментов [36].
Оценку программ стыковки на предмет их потенциала воспроизводить режимы связывания пептидов можно провести с помощью уроков по оценке эффективности стыковки и подсчета очков (LEADS-PEP). [37]
Связывающее взаимодействие между лигандом малой молекулы и белком фермента может привести к активации или ингибированию фермента. Если белок является рецептором, связывание лиганда может привести к агонизму или антагонизму . Стыковка чаще всего используется в области разработки лекарств — большинство лекарств представляют собой небольшие органические молекулы, и стыковка может применяться к:
Интернет-сервис, который вычисляет местоположение, геометрию и энергию малых молекул, взаимодействующих с белками.