Хеминформатика (также известная как хемоинформатика ) относится к использованию теории физической химии с компьютерными и информационными методами — так называемыми методами « in silico » — в применении к ряду описательных и предписывающих задач в области химии , в том числе в ее приложениях. к биологии и связанным с ней молекулярным областям . Такие методы in silico используются, например, фармацевтическими компаниями и в академических кругах, чтобы помочь и информировать процесс открытия лекарств , например, при разработке четко определенных комбинаторных библиотек синтетических соединений или для помощи в разработке лекарств на основе структуры. дизайн . Эти методы также могут использоваться в химической и смежных отраслях, а также в таких областях, как наука об окружающей среде и фармакология , где задействованы или изучаются химические процессы. [1]
Хеминформатика была активной областью в различных формах с 1970-х годов и ранее, с деятельностью в академических отделах и коммерческих фармацевтических отделах исследований и разработок. [2] [ нужна страница ] [ нужна ссылка ] Термин «хемоинформатика» был определен в его применении к открытию лекарств Ф. К. Брауном в 1998 году: [3]
Хемоинформатика – это объединение этих информационных ресурсов для преобразования данных в информацию, а информации в знания с целью более быстрого принятия более эффективных решений в области идентификации и оптимизации лекарственных средств.
С тех пор использовались оба термина, хемоинформатика и хемоинформатика, хотя с лексикографической точки зрения хемоинформатика, по - видимому , используется чаще, [ когда? ] [4] [5] несмотря на то, что ученые в Европе заявили о выборе варианта хемоинформатики в 2006 году. [6] В 2009 году трансатлантические исполнительные редакторы основали известный журнал Springer в этой области под названием « Журнал хеминформатики» . [7]
Хеминформатика объединяет научные области химии, информатики и информатики, например, в области топологии , теории химических графов , поиска информации и интеллектуального анализа данных в химическом пространстве . [8] [ необходима страница ] [9] [ необходима страница ] [10] [11] [ необходима страница ] Хеминформатика также может применяться для анализа данных в различных отраслях промышленности, таких как бумажная и целлюлозно-бумажная , красильная и других смежных отраслях. [12]
Основным применением хемоинформатики является хранение, индексирование и поиск информации, касающейся химических соединений. [ по мнению кого? ] [ нужна цитация ] Эффективный поиск такой хранимой информации включает в себя темы, которые рассматриваются в области информатики, такие как интеллектуальный анализ данных, поиск информации, извлечение информации и машинное обучение . [ нужна ссылка ] Связанные темы исследований включают: [ нужна ссылка ]
Для представления химических структур in silico используются специализированные форматы, такие как упрощенные спецификации ввода строки молекулярного ввода (SMILES) [13] или язык химической разметки на основе XML . [14] Эти представления часто используются для хранения в больших химических базах данных . [ нужна цитата ] В то время как некоторые форматы подходят для визуальных представлений в двух или трех измерениях, другие больше подходят для изучения физических взаимодействий, моделирования и исследований стыковки. [ нужна цитата ]
Химические данные могут относиться к реальным или виртуальным молекулам. Виртуальные библиотеки соединений могут быть созданы различными способами для исследования химического пространства и выдвижения гипотез о новых соединениях с желаемыми свойствами. Виртуальные библиотеки классов соединений (лекарства, натуральные продукты, синтетические продукты, ориентированные на разнообразие) были недавно созданы с использованием алгоритма FOG (оптимизированный по фрагментам рост). [15] Это было сделано с помощью хеминформатических инструментов для обучения вероятностей перехода цепи Маркова на аутентичных классах соединений, а затем с использованием цепи Маркова для создания новых соединений, которые были похожи на обучающую базу данных.
В отличие от высокопроизводительного скрининга , виртуальный скрининг включает в себя компьютерный скрининг в библиотеках соединений silico с помощью различных методов, таких как стыковка , для идентификации членов, которые могут обладать желаемыми свойствами, такими как биологическая активность в отношении заданной мишени. В некоторых случаях при разработке библиотеки используется комбинаторная химия для повышения эффективности освоения химического пространства. Чаще всего проверяют разнообразную библиотеку малых молекул или натуральных продуктов .
Это расчет значений количественной зависимости структура-активность и количественной зависимости структура-свойство , используемый для прогнозирования активности соединений на основе их структур. В этом контексте существует также сильная связь с хемометрикой . Химические экспертные системы также актуальны, поскольку они представляют часть химических знаний в виде представления in silico . Существует относительно новая концепция анализа согласованных молекулярных пар или MMPA на основе прогнозирования, которая сочетается с моделью QSAR для выявления скачка активности. [16]