Виртуальная биология: от виртуальной клетки в виртуальному пациенту и персонализированной медицине Федор Колпаков ООО Институт системной биологии; Конструкторско-технологический институт вычислительной техники СО РАН Новосибирск План доклада • • • • • • • Концепция виртуальной биологии Современное состояние Компьютерная платформа BioUML Концепция виртуальной клетки Виртуальный физиологический человек ТП «Медицина будущего» Новый электронный журнал “Virtual biology” - геном NGS - транскриптом - эпигенетика масс - протеом спек. - метаболом данные лабораторных исследований - GWA - биомаркеры механизмы действия лекарств, фармакодинамика/фармокинетика персонализированная медицина • оценки риска возникновения • прогнозирования динамики • оптимизации диагностики • поиска новых мишеней, • предсказания эффективности и побочных действий новых лекарств • выбор оптимальной терапии • предсказание ее эффективности учитывая генетические, молекулярные и физиологические особенности конкретного пациента - геном NGS - транскриптом - эпигенетика Модели Виртуальная клетка масс - протеом спек. - метаболом - GWA - биомаркеры данные лабораторных исследований механизмы действия лекарств, фармакодинамика, фармокинетика Виртуальный человек - физиология - биохимия Виртуальный пациент персонализированная медицина Реальный мир - геном NGS - транскриптом - эпигенетика Виртуальный мир (мир моделей) Виртуальная биология Виртуальная клетка масс - протеом спек. - метаболом - GWA - биомаркеры данные лабораторных исследований механизмы действия лекарств, фармакодинамика, фармокинетика персонализированная медицина Виртуальный человек - физиология - биохимия Виртуальный пациент This figure demonstrates the skeletal metabolism responses before and during the exercise period PS15.7 Using a Systems Biology Approach to Explore Clinical Diversity and Explain Results from Clinical Trials: Example of the RAAS System in Hyptertension Schmidt, Henning Novartis, Switzerland Платформа BioUML •Визуальное моделирование биологических систем • алгебро-дифференциальные уравнения, • уравнения в частых производных • стохастическое моделирование • модульные модели • мультиагентные модели (agent based modeling) • Поддержка основных форматов системной биологии: SBML, SBGN, BioPax, SED-ML, Miriam, OBO, и др. • Подгонка параметров моделей на основе нескольких экспериментов • Интеграция с многими биологическими базами (30+), полнотекстовый поиск и визуализация результатов • Анализ данных • собственные методы • интеграция с R/Bioconductor • интеграция с Galaxy (и другими программами) • Геномный браузер • Воспроизводимые исследования (reproducible research) • Совместные исследования (Collaborative researc) • портал Biosotore – создание проектов, управление правами доступа к совместным данным; • совместное редактирование диаграмм (подобно Google docs) Modular design Modules: clear specification of interfaces input/output contacts Modular model of apoptosis • 13 modules • 286 species • 684 reactions • 719 parameters Mitochondron module (BMOND ID: Int_Mitoch_module) Bagci EZ, et al, Biophysical J 2006 Albeck JG, et al, PLoS Biol 2008 Additions: Activation of CREB and deactivation of BAD by AktPP and ERK-PP Upregulation of Bcl-2 by CREB Bcl-2 suppression by p53 EGF module (BMOND ID: Int_EGF_module) Schoeberl B, et al: Nature Biotechnology 2002 Borisov N, et al: Molecular Systems Biology 2009 Additions: Reactions of protein syntheses and degradations Modular model allows us to combine both up-down and bottom-up approaches top-down bottom-up ChIP-seq processing pipeline CDK – Chemical development kit PASS: Computerized Prediction of Biological Activity Spectra for Chemical Substances developed by group of Prof. Vladimir Poroikov, IBMC, Moscow Совместная работа и редактирование диаграмм Bob Alice Разработчики - модули: методы анализа и визуализации данных - базы данных обеспечивают средства и базы данных Пользователи - подписки - совместные и воспроизводимые исследования Эксперты - сервисы по анализу данных - консультации on-line используют Торговая площадка Информационная платформа обеспечивают сервисы BioUML Biodatomics Виртуальная клетка Global quantification of mammalian gene expression control. Schwanhäusser B, Busse D, Li N, Dittmar G, Schuchhardt J, Wolf J, Chen W, Selbach M. Nature. 2011; 473(7347):337-342. -mouse fibroblasts -simultaneously measured absolute mRNA and protein abundance and turnover for 5000+ genes -first genome-scale quantitative model for prediction of synthesis rates of mRNAs and proteins Corrigendum – 13.02.2013 Fig. 6: Comparison of synthesis rates of mRNA and proteins assuming the measured levels reflect averages over one cell cycle or steady-state values. For the mRNA synthesis rates (molecules/h,light gray) both assumptions give comparable results, whereas the translation rate constant (h -1, dark gray) differ partly more than one order of magnitude. For the synthesis rates of mRNA, the deviation is small, because mRNA half lives are mostly smaller than the cell cycle time. Note, that calculating synthesis rates from measured mean mRNA and protein levels as described above is still a simplification and gives mean synthesis rates over time and cell population. They do not take into account that gene expression in mammalian cells is non-continuous. In addition, the non-uniform age distribution of cells in culture is neglected, since this effect is expected to be small compared to the deviation obtained by neglecting the cell cycle. Зависимость ожидаемого для стационарного состояния количества белка к соответствующим экспериментальным значениям в зависимости от времени его полураспада 1 0,9 0,8 obs/exp 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0 10 20 30 40 50 half-life 60 70 80 90 100 Агентная модель (популяция клеток) с учетом клеточного цикла 9 000+ уравнений, сгенерированных по базе данных на основе статьи Schwanhäusser et al., 2011 Fig.4. The ratio of experimental data and numerical calculations by agent-based model taking into account cage division Fig. 5. Dependence of protein copy number and relation of experimental and numerical data. vcell DB cell type filter - protein atlas - microarray, NGS data -… generate (cellType1, influence) generate (cellType2, influence) explain(diff) model 1 simulate diff model 2 simulate mRNA experiment proteins metabolites compare Reconstruction of genome-scale active metabolic networks for 69 human cell types and 16 cancer types using INIT. Agren R, Bordel S, Mardinoglu A, Pornputtapong N, Nookaew I, Nielsen J. PLoS Comput Biol. 2012; 8(5):e1002518. doi: 10.1371/journal.pcbi.1002518. Bordbar A, Feist AM, Usaite-Black R, Woodcock J, Palsson BO, Famili I A multi-tissue type genome-scale metabolic network for analysis of whole-body systems physiology. BMC Syst Biol. 2011 Oct 31;5:180. doi: 10.1186/1752-0509-5-180. транскриптом dri krs krd ri dt протеом dpi k ps ri k pd pi dt метаболом dmi s mj pj dt синтез sm p i использование k k md mi deduce_krs – скорость синтеза РНК - гистоновые модификации - TFBS deduce_krd – скорость распада РНК - особенности 3’UTR - miRNA deduce_kps – скорость синтеза белка - особенности 5’UTR - IRES, … deduce_kpd – скорость распада белка - особенности белка - убиквитинирование generate_ – набор реакций реакции - RECON1 - KEGG реакции/константы: - BRENDA - SABIO-RK Computational inference of mRNA stability from histone modification and transcriptome profiles Wang C, Tian R, Zhao Q, Xu H, Meyer CA, Li C, Zhang Y, Liu XS Nucleic Acids Res. 2012 Aug;40(14):6414-23. doi: 10.1093/nar/gks304. Epub 2012 Apr 10. GTRD – gene transcription regulation database Statistics: ChIP-seq experiments - 2417 Transcription factors - 470 Reads - 81 млрд Peaks - 60 мл) R=0.75 Proteome The quantitative proteome of a human cell line. Beck M, Schmidt A, Malmstroem J, Claassen M, Ori A, Szymborska A, Herzog F, Rinner O, Ellenberg J, Aebersold R. Mol Syst Biol. 2011 Nov 8;7:549. doi: 10.1038/msb.2011.82. – человек, остеосаркома – U20S клеточная линия – количество молекул для 10 000+ белков – диапазон измерений – 7 порядков, от десятков до 20 000 000 молекул белка – измерения приведены в интерфазе и митозе MaxQB database – 28 mouse tissues – 11 different human cell lines, 10,361 ± 120 proteins in each cell line ? как скачать Рибосомное профилирование (ribo-seq) Ingolia NT, Lareau LF, Weissman JS. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell, 2011,147(4):789-802 Виртуальный человек Virtual (Physiological) Human – база данных моделей различных физиологических функций человека. На данный момент содержит более 40 модулей связанных с работой сердечнососудистой системы и почки: • проанализированы существующие модели сердечнососудистой системы человека; • разработан подход к объединению моделей с различным математическим формализмом на основе агентного моделирования; • выбранные модели объединены в комплексную модель сердечно-сосудистой системы человека; • комплексную модель валидирована с использованием экспериментальных данных. Модульная модель сердечно-сосудистой системы и регуляции артериального давления Элементы блочной модели Modular model in BioUML Пример работы модели мл/сек мм рт. ст. сек Поток крови из желудочка в артерии Поток крови через капилляры сек Среднее артериальное давление Experiment with sodium load Sodium intake, mEq/l Renal symp. Nerve activity, ratio to normal Renin concentration, ratio to normal Mean arterial pressure, mmHg Time, min Time, min Experiment with sodium load Mean arterial pressure Oscillating arterial pressure 2 seconds 2 seconds 18.200 minutes Time, seconds Time, minutes The take of diuretic drug with 25% reduction of areas of renal arteries. Long-time dependences Renal blood flow (l/min) blood volume (l) The diuretic drug intake Glomerular blood pressure (mmHg) The filtration rate of blood in nephron was increased by 43% Afferent arteriole resistance (min*mmHg/l) Time(min) www.biouml.org/vc Технологическая платформа «Медицина будущего» Научно-технический совет «Медицинская биоинформатика» Круглый стол «ТП «Медицина будущего» – основа для формирования приоритетных направлений развития биомедицины в России» Комплексный проект полного цикла Разработка компьютерных моделей от "виртуальной клетки" до "виртуального пациента" для поиска новых биомишеней, биомаркеров и персонализированной медицины ТП «Медицина будущего» в рамках мероприятий VI Международной биотехнологической выставки-ярмарки «РосБиоТех-2012» (7-9 ноября 2012 г., ЦВК «Экспоцентр», г. Москва) Стратегические цели проекта Создать информационную инфраструктуру для эффективного использования новых и существующих данных высокопроизводительных технологий: – NGS – геном, транскриптом, эпигенетические данные – масс-спектрометрия – протеом, метаболом, липидом, гликом – микрочиповые технологии – GWA и другие. их интеграция в медицинские информационные системы для: - настройки параметров и валидации моделей - персонализированной медицины в целях медицины: – поиск новых мишеней и биомаркеров – разработка и виртуальный скрининг новых лекарств – персонализированная медицина Ожидаемые результаты Ближнесрочные: - интегрированная информационная платформа - организация сообщества разраотчикова, пользователей и экспертов на основе платформы - доказательство концепции – работающие модели: - виртуальная клетка, ткань, орган - виртуальный человек - виртуальный пациент - модули – фармакокинетика/фармакодинамика - интеграция с медицинскими информационными системами Среднесрочные: - пилотное использование для персонализированной медицины - новые мишени, биомаркеры, потенциальные лекарства, полученные на основе анализа данных Долгосрочные: - персонализированная медицина - экспериментальная проверка предсказанных новых мишеней, биомаркеров и потенциальные лекарств. Планируемые научно-исследовательские работы Вид работ разработка платформы разработка методов моделирования разработка моделей и их экспериментальная валидация - клетка - ткань - физиологические подсистемы - виртуальный человек - виртуальный пациент Фармакодинамика, фармокинетика Поиск новых мишеней, биомаркеров, лекарств Персонализированная медицина Образовательные программы Итого 1-3 бюджет вне 2 x 10 5 4-6 7-8 Всего бюджет вне бюджет вне бюджет вне 1 x 10 2.5 1 x 10 2.5 40 10 2 x 10 5 1 x 10 2.5 1 x 10 2.5 40 10 8 x 10 4 x 10 4 x 10 2 x 10 4 x 10 20 10 10 5 10 8 x 10 4 x 10 4 x 10 2 x 10 4 x 10 20 10 10 5 10 8 x 10 4 x 10 4 x 10 2 x 10 4 x 10 20 10 10 5 10 240 120 120 60 120 60 30 30 15 30 4 x 10 10 4 x 10 10 4 x 10 10 120 30 4 x 10 10 4 x 10 10 4 x 10 10 120 30 4 x 10 10 4 x 10 10 4 x 10 10 120 30 5x2 5x2 5x2 30 1130 275 ПО ЛОТУ 2 Лот сформирован по предложению технологической платформы «Медицина будущего» Разделы 1, 2, 3, 4, 5, 7, 8 и 9 Технического задания могут быть дополнены по усмотрению участника размещения заказа ТЕХНИЧЕСКОЕ ЗАДАНИЕ на выполнение поисковых научно-исследовательских работ по лоту: «Разработка математических моделей и прикладных программ для оценки риска возникновения, прогнозирования динамики, оптимизации диагностики и лечения социально значимых болезней» 1 Цель выполнения НИР 1.1 Разработка [математических моделей биологических систем, прикладных программ и сценариев анализа экспериментальных данных] для [оценки риска возникновения, прогнозирования динамики, оптимизации диагностики и лечения социально значимых болезней, поиска новых мишеней, предсказания эффективности и побочных действий новых лекарств, и/или персонализированной медицины - выбор оптимальной терапии и предсказание ее эффективности учитывая генетические, молекулярные и физиологические особенности конкретного пациента] 1.2 […] (перечень целей, планируемых к достижению в рамках НИР, может быть дополнен участником размещения заказа применительно к заявляемой области исследований). Схема проектов Экспериментальные данные Сценарий анализа данных (BioUML workflow) Математическая модель Прикладные программы Методы и программы BioUML Результаты анализа: • оценки риска возникновения • прогнозирования динамики • оптимизации диагностики • поиска новых мишеней, • предсказания эффективности и побочных действий новых лекарств • выбор оптимальной терапии • предсказание ее эффективности учитывая генетические, молекулярные и физиологические особенности конкретного пациента для социально-значимые болезней Virtual biology New open access, peer-reviewed electronic journal that considers articles on all theoretical aspects of the function of biological systems at the molecular, cellular or organismal level and their practical application to personalized medicine, finding new biomarkers, drug targets, PK/PD. Quick peer-review process, no fee for readers and authors. Publisher: Institute of Systems Biology, Ltd., Novosibirsk, Russia Editor-in-chief: Dr. Fedor Kolpakov ISSN: 2306-8140 DOI: 10.12704/vb http://http://virtual-biology.org First issue - May 1st, 2013, issues are published quarterly. www.biouml.org wiki.biouml.org forum.biouml.org bio-store.org virtual-biology.org Acknowledgements Part of this work was partially supported by the grant: European Committee grant №037590 “Net2Drug” European Committee grant №202272 “LipidomicNet” Integration and interdisciplinary grants №16, 91 of SB RAS. BioUML team Software developers Nikita Tolstyh Ilya Kiselev Tagir Valeev Elena Kutumova Anna Ryabova Alexey Shadrin Biologists Ruslan Sharipov Ivan Yevshin Реальный мир риментальные ые ройка параметров, онализация елей Виртуальная биология Базы данных автоматическая генерация моделей Модели (клеточные линии и типы клеток) Персонализированные модели Виртуальные пациенты