stringtranslate.com

Количественная связь структура-активность

Количественные модели взаимосвязи структура-активность ( модели QSAR ) представляют собой модели регрессии или классификации, используемые в химических и биологических науках и технике. Как и другие модели регрессии, модели регрессии QSAR связывают набор переменных-предсказателей (X) с эффективностью переменной ответа (Y), тогда как модели классификации QSAR связывают переменные-предикторы с категориальным значением переменной ответа.

При моделировании QSAR предикторы состоят из физико-химических свойств или теоретических молекулярных дескрипторов [1] [2] химических веществ; Переменная ответа QSAR может быть биологической активностью химических веществ. Модели QSAR сначала суммируют предполагаемую взаимосвязь между химическими структурами и биологической активностью в наборе данных о химических веществах. Во-вторых, модели QSAR предсказывают активность новых химических веществ. [3] [4]

Связанные термины включают количественные отношения структура-свойство ( QSPR ), когда химическое свойство моделируется как переменная отклика. [5] [6] «Различные свойства или поведение химических молекул были исследованы в области QSPR. Некоторыми примерами являются количественные отношения структура-реактивность (QSRR), количественные отношения структура-хроматография (QSCR) и количественные отношения структура-токсичность. (QSTR), количественные отношения структура-электрохимия (QSER) и количественные отношения структура- биоразлагаемость (QSBR)». [7]

Например, биологическая активность может быть выражена количественно как концентрация вещества, необходимая для возникновения определенного биологического ответа. Кроме того, когда физико-химические свойства или структуры выражаются числами, между ними можно обнаружить математическую связь или количественную связь структура-активность. Математическое выражение, если оно тщательно проверено, [8] [9] [10] [11] затем может быть использовано для прогнозирования смоделированного ответа других химических структур. [12]

QSAR имеет форму математической модели :

Ошибка включает в себя ошибку модели ( смещение ) и изменчивость наблюдений, то есть изменчивость наблюдений даже на правильной модели.

Основные шаги в исследованиях QSAR

Основные этапы QSAR/QSPR включают в себя:

  1. Выбор набора данных и извлечение структурных/эмпирических дескрипторов,
  2. выбор переменных,
  3. построение модели и
  4. валидационная оценка. [7]

SAR и парадокс SAR

Основное предположение для всех гипотез , основанных на молекулах , заключается в том, что аналогичные молекулы обладают одинаковой активностью. Этот принцип также называется взаимосвязью структура-деятельность ( SAR ). Поэтому основная проблема заключается в том, как определить небольшое различие на молекулярном уровне, поскольку каждый вид активности, например реакционная способность, способность к биотрансформации , растворимость , целевая активность и т. д., может зависеть от другого различия. Примеры были приведены в обзорах по биоизостеризму Патани/ЛаВуа [13] и Брауна. [14]

В общем, человека больше интересует обнаружение сильных тенденций . Создаваемые гипотезы обычно основаны на ограниченном числе химических веществ, поэтому необходимо проявлять осторожность, чтобы избежать переобучения : генерации гипотез, которые очень точно соответствуют обучающим данным, но плохо работают при применении к новым данным.

Парадокс SAR относится к тому факту, что не все подобные молекулы обладают одинаковой активностью.

Типы

На основе фрагментов (вклад группы)

Аналогично, « коэффициент распределения » — показатель дифференциальной растворимости, который сам по себе является компонентом предсказания QSAR — может быть предсказан либо атомарными методами (известными как «XLogP» или «ALogP»), либо методами химических фрагментов (известными как «CLogP»). и другие варианты). Показано, что logP соединения можно определить по сумме его фрагментов; Методы на основе фрагментов обычно считаются лучшими предикторами, чем методы на основе атомов. [15] Фрагментарные значения были определены статистически на основе эмпирических данных для известных значений logP. Этот метод дает неоднозначные результаты, и, как правило, его точность не превышает ±0,1 единицы. [16]

QSAR на основе группы или фрагмента также известен как GQSAR. [17] GQSAR позволяет гибко изучать различные представляющие интерес молекулярные фрагменты в зависимости от вариаций биологического ответа. Молекулярные фрагменты могут быть заместителями в различных сайтах замещения в родственном наборе молекул или могут действовать на основе заранее определенных химических правил в случае неродственных наборов. GQSAR также учитывает перекрестные дескрипторы фрагментов, которые могут быть полезны при идентификации ключевых взаимодействий фрагментов при определении вариаций активности. [17] Открытие свинца с использованием фрагномики является новой парадигмой. В этом контексте FB-QSAR оказывается многообещающей стратегией для проектирования библиотек фрагментов и идентификации фрагментов. [18]

Разработан усовершенствованный подход к QSAR на основе фрагментов или групп, основанный на концепции фармакофорного сходства. [19] Этот метод QSAR на основе фармакофорного сходства (PS-QSAR) использует топологические фармакофорные дескрипторы для разработки моделей QSAR. Такое предсказание активности может способствовать вкладу определенных характеристик фармакофора, кодируемых соответствующими фрагментами, в улучшение активности и/или вредные эффекты. [19]

3D-QSAR

Аббревиатура 3D-QSAR или 3-D QSAR относится к применению расчетов силового поля , требующих трехмерных структур заданного набора небольших молекул с известной активностью (обучающий набор). На обучающий набор необходимо наложить (выровнять) либо экспериментальные данные (например, на основе кристаллографии лиганд-белок), либо программное обеспечение для наложения молекул . Он использует вычисленные потенциалы, например, потенциал Леннарда-Джонса , а не экспериментальные константы, и касается всей молекулы, а не отдельного заместителя. Первый 3-D QSAR был назван Cramer et al. Сравнительным молекулярно-полевым анализом (CoMFA). Он исследовал стерические поля (форму молекулы) и электростатические поля [20] , которые были коррелированы с помощью частичной регрессии наименьших квадратов (PLS).

Созданное пространство данных затем обычно уменьшается путем последующего извлечения признаков (см. также уменьшение размерности ). Следующий метод обучения может быть любым из уже упомянутых методов машинного обучения , например, машины опорных векторов . [21] Альтернативный подход использует множественное обучение путем кодирования молекул как наборов экземпляров данных, каждый из которых представляет возможную молекулярную конформацию. Метка или ответ присваивается каждому набору, соответствующему активности молекулы, которая, как предполагается, определяется по меньшей мере одним экземпляром в наборе (т.е. некоторой конформацией молекулы). [22]

18 июня 2011 года патент на сравнительный молекулярно-полевой анализ (CoMFA) снял все ограничения на использование технологий GRID и частичного метода наименьших квадратов (PLS). [ нужна цитата ]

На основе химического дескриптора

В этом подходе дескрипторы, количественно определяющие различные электронные, геометрические или стерические свойства молекулы, вычисляются и используются для разработки QSAR. [23] Этот подход отличается от подхода фрагмента (или группового вклада) тем, что дескрипторы вычисляются для системы в целом, а не на основе свойств отдельных фрагментов. Этот подход отличается от подхода 3D-QSAR тем, что дескрипторы вычисляются на основе скалярных величин (например, энергии, геометрических параметров), а не на основе трехмерных полей.

Примером такого подхода являются QSAR, разработанные для полимеризации олефинов полусэндвичевыми соединениями . [24] [25]

Строковая основа

Было показано, что прогнозирование активности возможно даже на основе строки SMILES . [26] [27] [28]

Основанный на графе

Подобно методам на основе строк, молекулярный граф может напрямую использоваться в качестве входных данных для моделей QSAR, [29] [30] , но обычно дает меньшую производительность по сравнению с моделями QSAR на основе дескрипторов. [31] [32]

Моделирование

В литературе часто можно обнаружить, что химики отдают предпочтение методам частичных наименьших квадратов (PLS), поскольку они применяют извлечение признаков и индукцию за один этап.

Подход к интеллектуальному анализу данных

Компьютерные модели SAR обычно рассчитывают относительно большое количество функций. Поскольку им не хватает возможности структурной интерпретации, этапы предварительной обработки сталкиваются с проблемой выбора признаков (т. е. какие структурные признаки следует интерпретировать для определения взаимосвязи структура-активность). Выбор признаков может осуществляться визуальным осмотром (качественный выбор человеком); путем интеллектуального анализа данных; или путем добычи молекул.

Типичное прогнозирование на основе интеллектуального анализа данных использует, например, машины опорных векторов , деревья решений , искусственные нейронные сети для создания модели прогнозного обучения.

Подходы молекулярного анализа , частный случай подходов структурированного анализа данных , применяют прогнозирование на основе матрицы сходства или схему автоматической фрагментации на молекулярные субструктуры. Кроме того, существуют также подходы, использующие поиск максимального общего подграфа или ядра графа . [33] [34]

QSAR-протокол

Анализ подобранных молекулярных пар

Обычно модели QSAR, полученные с помощью нелинейного машинного обучения, рассматриваются как «черный ящик», которым не могут руководствоваться химики-медики. Недавно появилась относительно новая концепция анализа согласованных молекулярных пар [35] или MMPA, основанная на прогнозировании, которая сочетается с моделью QSAR для выявления скачков активности. [36]

Оценка качества QSAR-моделей

Моделирование QSAR создает прогностические модели , полученные с помощью статистических инструментов, сопоставляющих биологическую активность (включая желаемый терапевтический эффект и нежелательные побочные эффекты) или физико-химические свойства в моделях QSPR химических веществ (лекарственных средств/токсикантов/загрязнителей окружающей среды) с дескрипторами, репрезентативными для молекулярной структуры или свойств. . QSAR применяются во многих дисциплинах, например: оценка рисков , прогнозирование токсичности и принятие нормативных решений [37], а также при разработке новых лекарств и оптимизации потенциальных клиентов . [38] Получение QSAR-модели хорошего качества зависит от многих факторов, таких как качество входных данных, выбор дескрипторов и статистических методов для моделирования и проверки. Любое моделирование QSAR должно в конечном итоге привести к созданию статистически надежных и прогнозирующих моделей, способных делать точные и надежные прогнозы смоделированного ответа новых соединений.

Для проверки моделей QSAR обычно применяются различные стратегии: [39]

  1. внутренняя проверка или перекрестная проверка (на самом деле, при извлечении данных перекрестная проверка является мерой надежности модели: чем более надежна модель (выше q2), тем меньше извлечение данных влияет на исходную модель);
  2. внешняя проверка путем разделения доступного набора данных на обучающий набор для разработки модели и набор прогнозов для проверки прогнозируемости модели;
  3. слепая внешняя проверка путем применения модели к новым внешним данным и
  4. рандомизация данных или Y-скремблирование для проверки отсутствия случайной корреляции между ответом и дескрипторами моделирования.

Успех любой модели QSAR зависит от точности входных данных, выбора подходящих дескрипторов и статистических инструментов и, что наиболее важно, проверки разработанной модели. Валидация — это процесс, посредством которого устанавливается надежность и актуальность процедуры для конкретной цели; для моделей QSAR проверка должна касаться главным образом надежности, прогнозируемых характеристик и области применимости (AD) моделей. [8] [9] [11] [40] [41]

Некоторые методологии проверки могут быть проблематичными. Например, перекрестная проверка с исключением одного исключения обычно приводит к переоценке прогностической способности. Даже при внешней проверке трудно определить, манипулировали ли выбором обучающих и тестовых наборов для максимизации прогностической способности публикуемой модели.

Различные аспекты проверки моделей QSAR, требующие внимания, включают методы выбора соединений обучающего набора, [42] установку размера обучающего набора [43] и влияние выбора переменных [44] на модели обучающего набора для определения качества прогнозирования. Также важна разработка новых параметров проверки для оценки качества моделей QSAR. [11] [45] [46]

Приложение

Химическая

Одним из первых исторических применений QSAR было предсказание точек кипения . [47]

Хорошо известно, например, что внутри определенного семейства химических соединений , особенно органической химии , существуют сильные корреляции между структурой и наблюдаемыми свойствами. Простой пример — зависимость между количеством атомов углерода в алканах и температурой их кипения . Существует четкая тенденция повышения температуры кипения с увеличением числа атомов углерода, и это служит средством прогнозирования температур кипения высших алканов .

Еще очень интересное применение — уравнение Гаммета , уравнение Тафта и методы прогнозирования pKa . [48]

Биологический

Биологическую активность молекул обычно измеряют с помощью анализов , позволяющих установить уровень ингибирования определенных путей передачи сигнала или метаболических путей . Открытие лекарств часто включает использование QSAR для идентификации химических структур, которые могут оказывать хорошее ингибирующее действие на определенные мишени и иметь низкую токсичность (неспецифическую активность). Особый интерес представляет прогноз коэффициента распределения log P , который является важной мерой, используемой при определении « лекарственного сходства » в соответствии с « Правилом пяти» Липински .

Хотя многие количественные анализы взаимосвязей структура-активность включают взаимодействие семейства молекул с сайтом связывания фермента или рецептора , QSAR также можно использовать для изучения взаимодействий между структурными доменами белков. Белко-белковые взаимодействия можно количественно проанализировать на предмет структурных изменений, возникающих в результате сайт-направленного мутагенеза . [49]

Это часть метода машинного обучения , позволяющая снизить риск парадокса SAR, особенно с учетом того, что доступен только конечный объем данных (см. также MVUE ). В целом все задачи QSAR можно разделить на кодирование [50] и обучение . [51]

Приложения

(Q)Модели SAR использовались для управления рисками . QSARS рекомендуются регулирующими органами; в Европейском Союзе QSAR предложены регламентом REACH , где «REACH» сокращенно означает «Регистрация, оценка, авторизация и ограничение химических веществ». Нормативное применение методов QSAR включает токсикологическую оценку генотоксичных примесей in silico . [52] Обычно используемое программное обеспечение для оценки QSAR, такое как DEREK или CASE Ultra (MultiCASE), используется для определения генотоксичности примесей в соответствии с ICH M7. [53]

Пространство химических дескрипторов, выпуклая оболочка которого создается конкретным обучающим набором химических веществ, называется областью применимости обучающего набора . Прогнозирование свойств новых химических веществ, находящихся за пределами области применимости, использует экстраполяцию и поэтому менее надежно (в среднем), чем прогнозирование внутри области применимости. Оценка надежности прогнозов QSAR остается темой исследования.

Уравнения QSAR можно использовать для прогнозирования биологической активности новых молекул перед их синтезом.

Примеры инструментов машинного обучения для моделирования QSAR включают: [54]

Смотрите также

Рекомендации

  1. ^ Тодескини, Роберто; Консонни, Вивиана (2009). Молекулярные дескрипторы для хемоинформатики. Методы и принципы медицинской химии. Том. 41. Уайли. дои : 10.1002/9783527628766. ISBN 978-3-527-31852-0.
  2. ^ Маури, Андреа; Консонни, Вивиана; Тодескини, Роберто (2017). «Молекулярные дескрипторы». Справочник по вычислительной химии. Международное издательство Спрингер. стр. 2065–2093. дои : 10.1007/978-3-319-27282-5_51. ISBN 978-3-319-27282-5.
  3. ^ Рой К., Кар С., Дас Р.Н. (2015). «Глава 1.2: Что такое QSAR? Определения и формулизм». Учебное пособие по моделированию QSAR/QSPR: фундаментальные концепции . Нью-Йорк: Springer-Verlag Inc., стр. 2–6. ISBN 978-3-319-17281-1.
  4. ^ Гасеми, Перес-Санчес; Мехри, Перес-Гарридо (2018). «Нейронные сети и алгоритмы глубокого обучения, используемые в исследованиях QSAR: достоинства и недостатки». Открытие наркотиков сегодня . 23 (10): 1784–1790. doi :10.1016/j.drudis.2018.06.016. PMID  29936244. S2CID  49418479.
  5. ^ Нантасенамат С, Исаранкура-На-Аюдхья С, Наэнна Т, Прачаяситтикул V (2009). «Практический обзор количественной связи структура-активность». Эксклюзивный журнал . 8 : 74–88. дои : 10.17877/DE290R-690.
  6. ^ Нантасенамат С, Исаранкура-На-Аюдхья С, Прачаяситтикул V (июль 2010 г.). «Достижения в области вычислительных методов прогнозирования биологической активности соединений». Мнение экспертов об открытии лекарств . 5 (7): 633–54. дои : 10.1517/17460441.2010.492827. PMID  22823204. S2CID  17622541.
  7. ^ аб Юсефинеджад С, Хемматинеджад Б (2015). «Инструменты хемометрики в исследованиях QSAR/QSPR: историческая перспектива». Хемометрика и интеллектуальные лабораторные системы . 149, Часть Б: 177–204. doi :10.1016/j.chemolab.2015.06.016.
  8. ^ аб Тропша А , Граматика П, Гомбар В.Дж. (2003). «Как важно быть серьезным: проверка является абсолютно необходимой для успешного применения и интерпретации моделей QSPR». QSAR Гребень. Наука . 22 : 69–77. дои : 10.1002/qsar.200390007.
  9. ^ ab Gramatica P (2007). «Принципы валидации моделей QSAR: внутренняя и внешняя». QSAR Гребень. Наука . 26 (5): 694–701. дои : 10.1002/qsar.200610151. hdl : 11383/1668881 .
  10. ^ Руусманн, В.; Силд, С.; Маран, У. (2015). «Репозиторий QSAR DataBank: открытые и связанные качественные и количественные модели взаимосвязи структура-активность». Журнал хеминформатики . 7:32 . дои : 10.1186/s13321-015-0082-6 . ПМЦ 4479250 . ПМИД  26110025. 
  11. ^ abc Кирико Н, Gramatica P (август 2012 г.). «Реальная внешняя прогнозируемость моделей QSAR. Часть 2. Новые сопоставимые пороговые значения для различных критериев проверки и необходимость проверки диаграммы рассеяния». Журнал химической информации и моделирования . 52 (8): 2044–58. дои : 10.1021/ci300084j. ПМИД  22721530.
  12. ^ Тропша, Александр (2010). «Лучшие практики разработки, проверки и использования моделей QSAR». Молекулярная информатика . 29 (6–7): 476–488. дои : 10.1002/минф.201000061. ISSN  1868-1743. PMID  27463326. S2CID  23564249.
  13. ^ Патани Г.А., ЛаВуа Э.Дж. (декабрь 1996 г.). «Биоизостеризм: рациональный подход к разработке лекарств». Химические обзоры . 96 (8): 3147–3176. дои : 10.1021/cr950066q. ПМИД  11848856.
  14. ^ Браун Н. (2012). Биоизостеры в медицинской химии . Вайнхайм: Wiley-VCH. ISBN 978-3-527-33015-7.
  15. ^ Томпсон С.Дж., Хаттотувагама К.К., Холлидей Дж.Д., Флауэр Д.Р. (2006). «О гидрофобности пептидов: сравнение эмпирических предсказаний значений log P пептидов». Биоинформация . 1 (7): 237–41. дои : 10.6026/97320630001237. ЧВК 1891704 . ПМИД  17597897. 
  16. ^ Wildman SA, Crippen GM (1999). «Прогнозирование физико-химических параметров по атомным вкладам». Дж. Хим. Инф. Вычислить. Наука . 39 (5): 868–873. дои : 10.1021/ci990307l.
  17. ^ аб Аджмани С., Джадхав К., Кулкарни С.А., QSAR на групповой основе (G-QSAR)
  18. ^ Манохаран П., Виджаян Р.С., Гошал Н. (октябрь 2010 г.). «Рационализация открытия лекарств на основе фрагментов для BACE1: результаты исследований FB-QSAR, FB-QSSR, многоцелевых (MO-QSPR) и MIF». Журнал компьютерного молекулярного дизайна . 24 (10): 843–64. Бибкод : 2010JCAMD..24..843M. дои : 10.1007/s10822-010-9378-9. PMID  20740315. S2CID  1171860.
  19. ^ аб Прасант Кумар С., Джасрай Ю.Т., Пандья Х.А., Равал Р.М. (ноябрь 2013 г.). «QSAR на основе сходства фармакофоров (PS-QSAR) для прогнозирования биологической активности для конкретных групп». Журнал биомолекулярной структуры и динамики . 33 (1): 56–69. дои : 10.1080/07391102.2013.849618. PMID  24266725. S2CID  45364247.
  20. ^ Лич А.Р. (2001). Молекулярное моделирование: принципы и приложения . Энглвуд Клиффс, Нью-Джерси: Прентис Холл. ISBN 978-0-582-38210-7.
  21. ^ Верт Дж. П., Шёлкопф Б., Цуда К. (2004). Ядерные методы в вычислительной биологии . Кембридж, Массачусетс: MIT Press. ISBN 978-0-262-19509-6.
  22. ^ Дитерих Т.Г., Латроп Р.Х., Лозано-Перес Т. (1997). «Решение задачи множественных экземпляров с прямоугольниками, параллельными осям». Искусственный интеллект . 89 (1–2): 31–71. дои : 10.1016/S0004-3702(96)00034-3.
  23. ^ Карутерс Дж.М., Лаутербах Дж.А., Томсон К.Т., Венкатасубраманиан В., Снайвли СМ, ​​Бхан А., Катаре С., Оскарсдоттир Г. (2003). «Разработка катализатора: извлечение знаний из высокопроизводительных экспериментов». Дж. Катал . 216 (1–2): 3776–3777. дои : 10.1016/S0021-9517(02)00036-2.
  24. ^ Манц Т.А., Фомфрай К., Медведев Г., Кришнамурти Б.Б., Шарма С., Хак Дж., Новструп К.А., Томсон К.Т., Делгасс В.Н., Карутерс Дж.М., Абу-Омар М.М. (апрель 2007 г.). «Корреляция структура-активность в титановых катализаторах полимеризации олефинов с одним центром, содержащих смешанное лигирование циклопентадиенил / арилоксид». Журнал Американского химического общества . 129 (13): 3776–7. дои : 10.1021/ja0640849. ПМИД  17348648.
  25. ^ Манц Т.А., Карутерс Дж.М., Шарма С., Фомфрай К., Томсон К.Т., Делгасс В.Н., Абу-Омар М.М. (2012). «Корреляция структура-активность относительно скорости инициирования цепи и скорости ее распространения в катализе одноцентровой полимеризации олефинов». Металлоорганические соединения . 31 (2): 602–618. дои : 10.1021/om200884x.
  26. ^ Ястржебский, Станислав; Лесняк, Дамиан; Чарнецкий, Войцех Мариан (8 марта 2018 г.). «Учимся УЛЫБАТЬСЯ(И)». arXiv : 1602.06289 [cs.CL].
  27. Бьеррум, Эсбен Янник (17 мая 2017 г.). «Перечисление SMILES как увеличение данных для нейросетевого моделирования молекул». arXiv : 1703.07076 [cs.LG].
  28. ^ Майр, Андреас; Кламбауэр, Гюнтер; Унтертинер, Томас; Стейярт, Марвин; Вегнер, Йорг К.; Сеулеманс, Хьюго; Клеверт, Джорк-Арне; Хохрайтер, Зепп (20 июня 2018 г.). «Крупномасштабное сравнение методов машинного обучения для прогнозирования мишени лекарств с помощью ChEMBL». Химическая наука . 9 (24): 5441–5451. дои : 10.1039/c8sc00148k. ПМК 6011237 . ПМИД  30155234. 
  29. ^ Мерквирт, Кристиан; Ленгауэр, Томас (1 сентября 2005 г.). «Автоматическая генерация дополнительных дескрипторов с сетями молекулярных графов». Журнал химической информации и моделирования . 45 (5): 1159–1168. дои : 10.1021/ci049613b. ПМИД  16180893.
  30. ^ Кирнс, Стивен; Макклоски, Кевин; Берндл, Марк; Панде, Виджай; Райли, Патрик (1 августа 2016 г.). «Свертки молекулярных графов: выход за рамки отпечатков пальцев». Журнал компьютерного молекулярного дизайна . 30 (8): 595–608. arXiv : 1603.00856 . Бибкод : 2016JCAMD..30..595K. дои : 10.1007/s10822-016-9938-8. ПМК 5028207 . ПМИД  27558503. 
  31. ^ Цзян, Дэджун; Ву, Чжэньсин; Се, Чан-Ю; Чен, Гуанъюн; Ляо, Бен; Ван, Чжэ; Шен, Чао; Цао, Дуншэн; Ву, Цзянь; Хоу, Тинцзюнь (17 февраля 2021 г.). «Могут ли графические нейронные сети лучше изучить молекулярное представление для открытия лекарств? Сравнительное исследование моделей на основе дескрипторов и моделей на основе графов». Журнал хеминформатики . 13 (1): 12. дои : 10.1186/s13321-020-00479-8 . ПМЦ 7888189 . ПМИД  33597034. 
  32. ^ ван Тилборг, Дерек; Аленичева, Алиса; Гризони, Франческа (12 декабря 2022 г.). «Выявление ограничений молекулярного машинного обучения с помощью скачков активности». Журнал химической информации и моделирования . 62 (23): 5938–5951. doi : 10.1021/acs.jcim.2c01073. ПМЦ 9749029 . ПМИД  36456532. 
  33. ^ Гасфилд Д. (1997). Алгоритмы на строках, деревьях и последовательностях: информатика и вычислительная биология . Кембридж, Великобритания: Издательство Кембриджского университета. ISBN 978-0-521-58519-4.
  34. ^ Хельма С (2005). Предиктивная токсикология . Вашингтон, округ Колумбия: Тейлор и Фрэнсис. ISBN 978-0-8247-2397-2.
  35. ^ Доссеттер АГ, Гриффен Э.Дж., Лич АГ (2013). «Анализ согласованных молекулярных пар при открытии лекарств». Открытие наркотиков сегодня . 18 (15–16): 724–31. doi :10.1016/j.drudis.2013.03.003. ПМИД  23557664.
  36. ^ Сушко Ю, Новотарский С, Кернер Р, Фогт Дж, Абдельазиз А, Тетко IV (2014). «Соответствующие молекулярные пары на основе прогнозов для интерпретации QSAR и помощи в процессе молекулярной оптимизации». Журнал хеминформатики . 6 (1): 48. дои : 10.1186/s13321-014-0048-0 . ПМЦ 4272757 . ПМИД  25544551. 
  37. ^ Тонг В., Хун Х., Се К., Ши Л., Фанг Х., Перкинс Р. (апрель 2005 г.). «Оценка ограничений QSAR – нормативно-правовая перспектива». Современный компьютерный дизайн лекарств . 1 (2): 195–205. дои : 10.2174/1573409053585663.
  38. ^ Дирден Дж.К. (2003). «In silico прогнозирование токсичности лекарств». Журнал компьютерного молекулярного дизайна . 17 (2–4): 119–27. Бибкод : 2003JCAMD..17..119D. дои : 10.1023/А: 1025361621494. PMID  13677480. S2CID  21518449.
  39. ^ Уолд С., Эрикссон Л. (1995). «Статистическая проверка результатов QSAR». В Waterbeemd, Хан ван де (ред.). Хемометрические методы в молекулярном дизайне . Вайнхайм: ВЧ. стр. 309–318. ISBN 978-3-527-30044-0.
  40. ^ Рой К. (декабрь 2007 г.). «О некоторых аспектах валидации прогнозных количественных моделей взаимосвязи структура-активность». Мнение экспертов об открытии лекарств . 2 (12): 1567–77. дои : 10.1517/17460441.2.12.1567. PMID  23488901. S2CID  21305783.
  41. ^ Сахигара, Файзан; Мансури, Камель; Баллабио, Давиде; Маури, Андреа; Консонни, Вивиана; Тодескини, Роберто (2012). «Сравнение различных подходов к определению области применимости моделей QSAR». Молекулы . 17 (5): 4791–4810. дои : 10.3390/molecules17054791 . ПМК 6268288 . ПМИД  22534664. 
  42. ^ Леонард Дж.Т., Рой К. (2006). «О выборе обучающих и тестовых наборов для разработки прогнозирующих QSAR-моделей». QSAR и комбинаторная наука . 25 (3): 235–251. дои : 10.1002/qsar.200510161.
  43. ^ Рой П.П., Леонард Дж.Т., Рой К. (2008). «Изучение влияния размера обучающих наборов на разработку прогнозирующих моделей QSAR». Хемометрика и интеллектуальные лабораторные системы . 90 (1): 31–42. doi : 10.1016/j.chemolab.2007.07.004.
  44. ^ Put R, Вандер Хейден Y (октябрь 2007 г.). «Обзор аспектов моделирования количественных зависимостей сохранения структуры в обращенно-фазовой жидкостной хроматографии». Аналитика Химика Акта . 602 (2): 164–72. дои : 10.1016/j.aca.2007.09.014. ПМИД  17933600.
  45. ^ Пратим Рой П., Пол С., Митра И., Рой К. (2009). «О двух новых параметрах проверки прогнозных моделей QSAR». Молекулы . 14 (5): 1660–701. дои : 10.3390/molecules14051660 . ПМК 6254296 . ПМИД  19471190. 
  46. ^ Кирико Н., Gramatica P (сентябрь 2011 г.). «Реальная внешняя прогнозируемость моделей QSAR: как ее оценить? Сравнение различных критериев проверки и предложение использования коэффициента согласованности корреляции». Журнал химической информации и моделирования . 51 (9): 2320–35. дои : 10.1021/ci200211n. ПМИД  21800825.
  47. ^ Рувре Д.Х., Бончев Д. (1991). Химическая теория графов: введение и основы . Танбридж Уэллс, Кент, Англия: Abacus Press. ISBN 978-0-85626-454-2.
  48. ^ Фрачкевич, Р. (2013). «In Silico предсказание ионизации». В Ридейке, Дж. (ред.). Справочный модуль по химии, молекулярным наукам и химической инженерии . Справочный модуль по химии, молекулярным наукам и химической инженерии [онлайн] . Том. 5. Амстердам, Нидерланды: Эльзевир. doi : 10.1016/B978-0-12-409547-2.02610-X. ISBN 9780124095472.
  49. ^ Фрейхульт ЕК, Андерссон К, Густафссон М.Г. (апрель 2003 г.). «Структурное моделирование расширяет QSAR-анализ взаимодействий антитело-лизоцим до 3D-QSAR». Биофизический журнал . 84 (4): 2264–72. Бибкод : 2003BpJ....84.2264F. дои : 10.1016/S0006-3495(03)75032-2. ПМК 1302793 . ПМИД  12668435. 
  50. ^ Тиммерман Х., Тодескини Р., Консонни В., Маннхольд Р., Кубиньи Х. (2002). Справочник молекулярных дескрипторов . Вайнхайм: Wiley-VCH. ISBN 978-3-527-29913-3.
  51. ^ Дуда Р.О., Харт П.В., Сторк Д.Г. (2001). Классификация узоров . Чичестер: Джон Уайли и сыновья. ISBN 978-0-471-05669-0.
  52. ^ Фиораванзо, Э.; Бассан, А.; Паван, М.; Мостраг-Шлихтынг, А.; Стоит, AP (01 апреля 2012 г.). «Роль инструментов генотоксичности in silico в нормативной оценке фармацевтических примесей». SAR и QSAR в экологических исследованиях . 23 (3–4): 257–277. дои : 10.1080/1062936X.2012.657236. ISSN  1062-936Х. PMID  22369620. S2CID  2714861.
  53. ^ ICH M7 Оценка и контроль примесей, реагирующих с ДНК (мутагенных) в фармацевтических препаратах, для ограничения потенциального канцерогенного риска - Научное руководство [1]
  54. ^ Лавечкья А (март 2015 г.). «Подходы машинного обучения к открытию лекарств: методы и приложения». Открытие наркотиков сегодня . 20 (3): 318–31. doi :10.1016/j.drudis.2014.10.012. ПМИД  25448759.
  55. ^ Столринг Дж.К., Карлссон Л.А., Алмейда П., Бойер С. (2011). «AZOrange — Высокопроизводительное машинное обучение с открытым исходным кодом для моделирования QSAR в среде графического программирования». Журнал хеминформатики . 3:28 . дои : 10.1186/1758-2946-3-28 . ПМК 3158423 . ПМИД  21798025. 
  56. ^ Маури, Андреа; Бертола, Маттео (2022). «Alvascience: новый пакет программного обеспечения для рабочего процесса QSAR, применяемого к проницаемости гематоэнцефалического барьера». Международный журнал молекулярных наук . 23 (12882): 12882. дои : 10.3390/ijms232112882 . ПМЦ 9655980 . ПМИД  36361669. 
  57. ^ Фабиан Педрегоса; Гаэль Варокво; Александр Грамфор; Винсент Мишель; Бертран Тирион; Оливье Гризель; Матье Блондель; Питер Преттенхофер; Рон Вайс; Винсент Дюбур; Джейк Вандерплас; Александр Пассос; Дэвид Курнапо; Матье Перро; Эдуард Дюшенэ (2011). «scikit-learn: машинное обучение на Python». Журнал исследований машинного обучения . 12 : 28 :25–28:30.

дальнейшее чтение

Внешние ссылки