КОМПЬЮТЕРНОЕ ПРОГНОЗИРОВАНИЕ СПЕКТРОВ БИОЛОГИЧЕСКОЙ АКТИВНОСТИ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ Д.А. Филимонов Институт биомедицинской химии им. В.Н. Ореховича РАМН, Москва Методы биоинформатики Фундаментальная теория Универсальный закон природы Ab initio принципы Molecular Modelling Machine Learning Обучение на примерах Единичная оценка Сходство Пример лекарственной субстанции http://www.drugs.com/plavix.html Brand Names : Plavix Generic Name: Clopidogrel Plavix (clopidogrel) keeps the platelets in your blood from coagulating (clotting) to prevent unwanted blood clots that can occur with certain heart or blood vessel conditions. http://en.wikipedia.org/wiki/Clopidogrel Clopidogrel is an oral, thienopyridine class antiplatelet agent used to inhibit blood clots in coronary artery disease, peripheral vascular disease, and cerebrovascular disease. It is marketed by Bristol-Myers Squibb and SanofiAventis under the trade name Plavix. The drug works by irreversibly inhibiting a receptor called P2Y12, an adenosine diphosphate ADP chemoreceptor. Adverse effects include hemorrhage, severe neutropenia, and thrombotic thrombocytopenic purpura (TTP). Клопидогрел (Clopidogrelum) — лекарственный препарат, снижающий склонность тромбоцитов к агрегации. Обучающая выборка PASS Число соединенй в выборке 250000 4000 200000 3000 150000 2000 100000 1000 50000 0 0 1995 1995 1998 1998 2001 2001 2003 2003 2005 2005 2007 2007 2009 2009 2010 2010 Число прогнозируемых активностей 5000 300000 Спектр биологической активности: Весь комплекс üфармакологических эффектов üбиохимических механизмов действия üэффектов специфической токсичности и побочного действия üэффектов взаимодействия с системой метаболизма üэффектов влияния на генную экспрессию üэффектов влияния на белки-транспортеры которые вещество способно вызывать при некоторых условиях взаимодействия с биологическими объектами, без учета особенностей конкретных экспериментов. Активности представлены качественно. Принцип «презумпции невиновности»: вещество не обладает теми видами биологической активности, которые не указаны в его спектре. Представление структуры молекулы Взаиморасположение в пространстве атомов Поэтому структурная формула однозначно определяет свободной молекулы в основном состоянии в вакууме – свойства молекулы. необходимая и достаточная характеристика ее структуры. Представление структуры молекулы Дескрипторы многоуровневых атомных окрестностей (MNA) основаны на идее описания отдельных атомов молекулы с учетом их окружения. Дескрипторы многоуровневых атомных окрестностей – MNA O O C N S Cl MNA/0: -С Филимонов Д.А., Поройков В.В. (2006) РХЖ, L, (2), 66-75. Filimonov D.A., Poroikov V.V. (2008) In: Chemoinformatics Approaches to Virtual Screening. Eds. Alexandre Varnek and Alexander Tropsha. Cambridge (UK): RSC Publishing, 182-216. Дескрипторы многоуровневых атомных окрестностей – MNA O C C C O N S Cl MNA/1: -С(CN-H-C) Филимонов Д.А., Поройков В.В. (2006) РХЖ, L, (2), 66-75. Filimonov D.A., Poroikov V.V. (2008) In: Chemoinformatics Approaches to Virtual Screening. Eds. Alexandre Varnek and Alexander Tropsha. Cambridge (UK): RSC Publishing, 182-216. Дескрипторы многоуровневых атомных окрестностей – MNA O C C C MNA/2: C C Cl O N C C S -С(C(CC-С)N(CC-С)-H(-С)-C(-С-O-O)) Филимонов Д.А., Поройков В.В. (2006) РХЖ, L, (2), 66-75. Filimonov D.A., Poroikov V.V. (2008) In: Chemoinformatics Approaches to Virtual Screening. Eds. Alexandre Varnek and Alexander Tropsha. Cambridge (UK): RSC Publishing, 182-216. Дескрипторы многоуровневых атомных окрестностей – MNA CH3 O C C C C C C C Cl O N C C C C S MNA/3: -С(C(C(СС-H)C(CC-Cl)-С(CN-H-C)) N(C(CN-H-H)C(CN-H-H)-С(CN-H-C)) -H(-С(CN-H-C)) -C(-С(CN-H-C)-O(-C)-O(-C-C))) Филимонов Д.А., Поройков В.В. (2006) РХЖ, L, (2), 66-75. Filimonov D.A., Poroikov V.V. (2008) In: Chemoinformatics Approaches to Virtual Screening. Eds. Alexandre Varnek and Alexander Tropsha. Cambridge (UK): RSC Publishing, 182-216. Дескрипторы многоуровневых атомных окрестностей – MNA O HC CHHHO CHHCC CHHCN CHCC CHCCN CHCS CCCC CCCS CCCCl CCOO NCCC OC OCC SCC ClC O C Cl N S Филимонов Д.А., Поройков В.В. (2006) РХЖ, L, (2), 66-75. C(C(CCC)C(CC-H-H)S(CC)) C(C(CCC)C(CS-H)-H(C)) C(C(CCC)N(CC-C)-H(C)-H(C)) C(C(CCS)C(CC-H)C(CN-H-H)) C(C(CCS)C(CN-H-H)-H(C)-H(C)) C(C(CC-H-H)N(CC-C)-H(C)-H(C)) C(C(CC-H)C(CC-H)-H(C)) C(C(CC-H)C(CC-C)-H(C)) C(C(CC-H)C(CC-C)-Cl(C)) C(C(CC-H)C(CC-Cl)-H(C)) C(C(CC-H)C(CC-Cl)-C(CN-H-C)) C(C(CC-H)S(CC)-H(C)) N(C(CN-H-H)C(CN-H-H)-C(CN-H-C)) S(C(CCS)C(CS-H)) -H(C(CC-H)) -H(C(CC-H-H)) -H(C(CN-H-H)) -H(C(CS-H)) -H(-C(CN-H-C)) -H(-C(-H-H-H-O)) -C(C(CC-C)N(CC-C)-H(-C)-C(-C-O-O)) -C(-H(-C)-H(-C)-H(-C)-O(-C-C)) -C(-C(CN-H-C)-O(-C)-O(-C-C)) -O(-C(-H-H-H-O)-C(-C-O-O)) -O(-C(-C-O-O)) -Cl(C(CC-Cl)) Filimonov D.A., Poroikov V.V. (2008) In: Chemoinformatics Approaches to Virtual Screening. Eds. Alexandre Varnek and Alexander Tropsha. Cambridge (UK): RSC Publishing, 182-216. Дескрипторы многоуровневых атомных окрестностей – MNA 9000 8000 Количество структур 7000 6000 5000 4000 3000 2000 1000 0 0 20 40 60 80 100 120 Количество MNA дескрипторов 140 160 180 Пример органического соединения в PASS O Структурные дескрипторы O N Cl S Спектр активности Acute neurologic disorders treatment Antianginal Antiarthritic Anticoagulant Antipsoriatic Antithrombotic Atherosclerosis treatment CYP2C19 inhibitor CYP2C9 inhibitor CYP3A4 substrate Hyperthermic Neuroprotector Platelet aggregation inhibitor Purinergic P2T antagonist Purinergic P2Y12 antagonist HC CHHHO CHHCC CHHCN CHCC CHCCN CHCS CCCC CCCS CCCCl CCOO NCCC OC OCC SCC ClC C(C(CCC)C(CC-H-H)S(CC)) C(C(CCC)C(CS-H)-H(C)) C(C(CCC)N(CC-C)-H(C)-H(C)) C(C(CCS)C(CC-H)C(CN-H-H)) C(C(CCS)C(CN-H-H)-H(C)-H(C)) C(C(CC-H-H)N(CC-C)-H(C)-H(C)) C(C(CC-H)C(CC-H)-H(C)) C(C(CC-H)C(CC-C)-H(C)) C(C(CC-H)C(CC-C)-Cl(C)) C(C(CC-H)C(CC-Cl)-H(C)) C(C(CC-H)C(CC-Cl)-C(CN-H-C)) C(C(CC-H)S(CC)-H(C)) N(C(CN-H-H)C(CN-H-H)-C(CN-H-C)) S(C(CCS)C(CS-H)) -H(C(CC-H)) -H(C(CC-H-H)) -H(C(CN-H-H)) -H(C(CS-H)) -H(-C(CN-H-C)) -H(-C(-H-H-H-O)) -C(C(CC-C)N(CC-C)-H(-C)-C(-C-O-O)) -C(-H(-C)-H(-C)-H(-C)-O(-C-C)) -C(-C(CN-H-C)-O(-C)-O(-C-C)) -O(-C(-H-H-H-O)-C(-C-O-O)) -O(-C(-C-O-O)) -Cl(C(CC-Cl)) Термины биологической активности в PASS 501 3295 57 199 29 49 фармакологический эффект биохимических механизмов действия эффектов специфической токсичности и побочного действия терминов метаболизма эффектов влияния на генную экспрессию эффектов влияния на белки-транспортеры Алгоритм прогноза спектра биологической активности органических соединений PASS По структуре молекулы в виде множества из m дескрипторов {D1, …, Dm} для каждой активности Ak подсчитываются значения Bk: Bk = (Sk – S0k)/(1 – Sk*S0k) Sk = Sin[åi ArcSin(2P(Ak|Di) – 1)/m] S0k = 2P(Ak) – 1 P(Ak) P(Ak|Di) - априорная вероятность найти вещество с активностью Ak - условная вероятность активности Ak у молекулы, имеющей дескриптор Di Алгоритм прогноза спектра биологической активности органических соединений PASS Частотные оценки вероятностей P(Ak) и P(Ak|Di): P(Ak) = Nk /N, P(Ak|Di) = Nik /Ni N - общее количество веществ в выборке; Ni - количество веществ, содержащих дескриптор Di в описании структуры; Nk - количество веществ, содержащих активность Ak в спектре активности; Nik - количество веществ, содержащих и дескриптор Di в описании структуры, и активность Ak в спектре активности. Филимонов Д.А., Поройков В.В. (2006) РХЖ, L, (2), 66-75. Результат прогноза PASS Спектр активности Acute neurologic disorders treatment Antianginal Antiarthritic Anticoagulant Antipsoriatic Antithrombotic Atherosclerosis treatment CYP2C19 inhibitor CYP2C9 inhibitor CYP3A4 substrate Hyperthermic Neuroprotector Platelet aggregation inhibitor Purinergic P2T antagonist Purinergic P2Y12 antagonist Задача классификации Неактивные TP Calculated value FP Активные Порог TN FN Observed value Критерий точности классификации Anthony Nicholls. What do we know and when do we know it? J. Comput. Aided. Mol. Des. 2008 Задача классификации в PASS 1.0 0.9 0.8 0.7 Pa 0.6 Pi 0.5 0.4 0.3 0.2 0.1 0.0 -1 -0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Pa(B) и Pi(B) – функции B-статистики, вычисляемые по обучающей выборке с исключением по одному. Фармакологический эффект «Противоопухолевое». Критерий точности прогноза PASS 1 Вероятнсть распознавания 0.9 0.8 0.7 0.6 Чувствителность 0.5 Специфичность 0.4 Точность 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Вероятность ошибки 2-го рода Фармакологический эффект «Противоопухолевое». Инвариантная точность прогноза 0.87. Задача классификации в PASS 1.0 0.9 0.8 0.7 Pa 0.6 Pi 0.5 0.4 0.3 0.2 0.1 0.0 -1 -0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Pa(B) и Pi(B) – функции B-статистики, вычисляемые по обучающей выборке с исключением по одному. Биохимический механизм действия «Carbonic anhydrase inhibitor». Критерий точности прогноза PASS 1 Вероятнсть распознавания 0.9 0.8 0.7 0.6 Чувствителность 0.5 Специфичность 0.4 Точность 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Вероятность ошибки 2-го рода Биохимический механизм действия «Carbonic anhydrase inhibitor». Инвариантная точность прогноза 0.9986. Валидация точности прогноза PASS Валидация точности прогноза PASS IAP для тестовой выборки, % 100 95 100 90 80 85 60 80 40 75 20 70 65 60 0 10 20 30 40 50 60 70 80 90 100 110 120 124 активности отобранных из MDDR соединений Влияние Влияниенеполноты неполнотыданных данныхоб о структурах активности Результат прогноза PASS Пример применения прогноза PASS Пример применения прогноза PASS Из 573 виртуальных соединений по прогнозу PASS было отобрано 9 потенциальных ингибиторов циклооксигеназы и липоксигеназы одновременно В эксперименте: 8 проявили противовоспалительную активность по 7 – ингибиторы одного из ферментов 6 – ингибиторы обоих ферментов Использование прогнозов PASS Inet Navarrete-Vazquez G., Hidalgo-Figueroa S., Torres-Piedra M., et al. (2010). Synthesis, vasorelaxant activity and antihypertensive effect of benzo[d]imidazole derivatives. Bioorganic & Medicinal Chemistry, 18 (11): 3985–3991. Mustafayeva K., Di Giorgio C., Elias R., et al. (2010). DNA-Damaging, mutagenic, and clastogenic activities of gentiopicroside isolated from Cephalaria kotschyi roots. Journal of Natural Products, 73 (2): 99– 103. Raja A.K., Vimalanathan A.B., Raj S.V., et al. (2010). Indispensable chemical genomic approaches in novel systemic targeted drug discovery. Biology and Medicine, 2 (3): 26-37. Torres-Piedra M., Ortiz-Andrade R., Villalobos-Molina R., et al. (2010). A comparative study of flavonoid analogues on streptozotocinenicotinamide induced diabetic rats: Quercetin as a potential antidiabetic agent acting via 11b–Hydroxysteroid dehydrogenase type 1 inhibition. European Journal of Medicinal Chemistry, 45: 2606-2612. Benchabane Y., Di Giorgio C., Boyer G., et al. (2009). Photo-inducible cytotoxic and clastogenic activities of 3,6-di-substituted acridines obtained by acylation of proflavine. European Journal of Medicinal Chemistry, 44: 2459–2467. Hernandez-Nunez E., Tlahuext H., Moo-Puc R., et al. (2009). Synthesis and in vitro trichomonicidal, giardicidal and amebicidal activity of N-acetamide(sulfonamide)-2-methyl-4-nitro-1H-imidazoles. European Journal of Medicinal Chemistry, 44 (7), 2975-2984. Babaev E.V. (2009). Combinatorial chemistry at the university: ten years experience of research, educational and organizational projects. Russsian Chemical Journal, 53 (5), 140-152. Ghadimi S., Ebrahimi-Valmoozi A.A. (2009). Lipophilicity, electronic, steric and topological effects of some phosphoramidates on acethylcholinesterase inhibitory property. J. Iran. Chem. Soc., 6 (4): 838-848. Gregirchak N.M., Kosyanchuk Ya.S. (2009). Studies of biological activity of newly synthesized compounds. Proceedings of the National University of Food Technologies, No.28, 27-30. Благодарности ИБМХ РАМН, Москва, Россия Александр Дмитриев Дмитрий Дружиловский Алексей Захаров Олег Гомазков Алексей Лагунин Ольга Коборова Алла Степанчикова Ольга Фильц Анастасия Рудик Сергей Иванов Борис Соболев Татьяна Брюшинина Владимир Поройков Татьяна Глориозова ВИНИТИ РАН, Россия Валентина Блинова Lab. Med. Chem., NCI, NIH, Frederik, M.D., U.S. Marc Nicklaus Marcus Sitzmann Igor Filippov Aristotelian University of Thessaloniki, Greece Athina Geronikaki Norwegian UniVersity of Science and Technology, Trondheim Sergey Zotchev