Химическое сходство (или молекулярное сходство ) относится к сходству химических элементов , молекул или химических соединений в отношении структурных или функциональных качеств, т. е. эффекта, который химическое соединение оказывает на партнеров реакции в неорганических или биологических условиях. Биологические эффекты и, следовательно, также сходство эффектов обычно количественно определяются с использованием биологической активности соединения. В общих чертах, функция может быть связана с химической активностью соединений (среди прочего).
Понятие химического сходства (или молекулярного сходства ) является одним из важнейших понятий в хеминформатике . [1] [2] Оно играет важную роль в современных подходах к прогнозированию свойств химических соединений, проектированию химических веществ с предопределенным набором свойств и, особенно, в проведении исследований по разработке лекарственных средств путем скрининга больших баз данных, содержащих структуры доступных (или потенциально доступных) химических веществ. Эти исследования основаны на принципе сходных свойств Джонсона и Маджиоры, который гласит: сходные соединения имеют сходные свойства . [1]
Химическое сходство часто описывается как обратная величина меры расстояния в пространстве дескрипторов. Примерами мер обратного расстояния являются ядра молекул , которые измеряют структурное сходство химических соединений. [3]
Виртуальный скрининг на основе сходства [4] (разновидность виртуального скрининга на основе лигандов) предполагает, что все соединения в базе данных, которые похожи на запрашиваемое соединение, имеют схожую биологическую активность. Хотя эта гипотеза не всегда верна, [5] довольно часто набор извлеченных соединений значительно обогащается активными веществами. [6] Для достижения высокой эффективности скрининга на основе сходства баз данных, содержащих миллионы соединений, молекулярные структуры обычно представляются молекулярными экранами (структурными ключами) или молекулярными отпечатками фиксированного или переменного размера . Молекулярные экраны и отпечатки могут содержать как 2D-, так и 3D-информацию. Однако в этой области доминируют 2D-отпечатки, которые являются своего рода двоичными дескрипторами фрагментов. Структурные ключи на основе фрагментов, такие как ключи MDL [7] , достаточно хороши для обработки небольших и средних химических баз данных, тогда как обработка больших баз данных выполняется с отпечатками, имеющими гораздо более высокую плотность информации. Наиболее известными примерами являются фрагментные отпечатки пальцев Daylight, [8] BCI, [9] и UNITY 2D (Tripos [10] ). Наиболее популярной мерой сходства для сравнения химических структур, представленных с помощью отпечатков пальцев, является коэффициент Танимото (или Жаккара) T. Обычно две структуры считаются похожими, если T > 0,85 (для отпечатков пальцев Daylight). Однако распространено заблуждение, что сходство T > 0,85 отражает схожую биоактивность в целом («миф о 0,85»). [11]
Концепция химического сходства может быть расширена для рассмотрения теории сетей химического сходства , где описательные свойства сетей и теория графов могут применяться для анализа большого химического пространства , оценки химического разнообразия и прогнозирования мишени для лекарств . Недавно также были разработаны трехмерные сети химического сходства, основанные на трехмерной конформации лигандов, которые можно использовать для идентификации лигандов, прыгающих по каркасу.