BioUML - интегрированная платформа для построения моделей виртуальной клетки и физиологических функций человека Колпаков Ф.А.1,2, Толстых Н.И.1, Валеев Т.Ф.1, Киселев И.Н. 1,2, Кутумова Е.О. 1,2, Евшин И.С.1,3, Семисалов Б.В. 1,2, Шарипов Р.Н.1,4, Кондрахин Ю.В.1,2, Кель А.Э.1,5 1ООО «Институт системной биологии», г. Новосибирск, 2КТИ ВТ СО РАН, г. Новосибирск, 3НГУ, г. Новосибирск 4ИЦиГ СО РАН, г. Новосибирск 5geneXplain GmbH, г. Вольфенбютель, Германия www.biouml.org План доклада • Технология BioUML • Методология • разработка компьютерной техники: • визуальное моделирование ( графическая нотация) •модульный подход • определение интерфейсов • переключатели • разработка программного обеспечения • итерационный подход • функциональные тесты • социальные технологии • совместные исследования (collaborative research) • crowdsourcing • Новые экспериментальные данные • Модель виртуальной клетки (концепция) • Текущие результаты • Virtual cell • GTRD – Gene Transcription Regulation Database модели регуляции генной экспрессии генов • Proteome – база данных о количестве белков в клетке • Apoptosis - модель апоптоза из 13 модулей. • Virtual Human – база данных моделей различных физиологических функций человека. Содержит более 40 модулей связанных с работой сердечнососудистой системы и почки. Технология BioUML platform • BioUML is an open source integrated platform for systems biology that spans the comprehensive range of capabilities including access to databases with experimental data, tools for formalized description, visual modeling and analyses of complex biological systems. • Due to scripts (R, JavaScript) and workflow support it provides powerful possibilities for analyses of high-throughput data. • Plug-in based architecture (Eclipse run time from IBM is used) allows to add new functionality using plug-ins. BioUML platform consists from 3 parts: • BioUML server – provides access to biological databases; • BioUML workbench – standalone application. • BioUML web edition – web interface based on AJAX technology; Main features • supported standards: SBML, SBGN, BioPAX, SED-ML, SBO, MIRIAM, CellML – some examples, CellDesigner extension support – state concept – SED-ML as workflow • Modular modelling: composite models, agent based models • systems biology – reproducible highthroughput data analyses: • analyses: algorithms, scripts, workflows • integration with R/Bioconductor, Galaxy • data: microarrays, NGS, ChIP-SEQ • visualization: genome browser • BioUML – as platform for collaborative research – Amazon EC2 servers – data repository - groups, projects, import/export, FTP upload – chat, history www.biouml.org JavaScript host objects allows to merge R/Bioconductor and Java/BioUML worlds R world Java/BioUML world Main platforms for bioinformatics and BioUML Taverna R/Bioconductor standalone application powerful workflows standalone application powerful workflows scripts, statistics, plots scripts, statistics, plots BioUML platform web interface, collaborative research genome browser workflows, web interface, collaborative research, genome browser Galaxy Eclipse plug-in based architecture, chemoinformatics Eclipse plug-in based architecture, chemoinformatics BioClipse Main platforms for bioinformatics and BioUML Taverna R/Bioconductor standalone application powerful workflows standalone application powerful workflows scripts, statistics, plots scripts, statistics, plots BioUML platform web interface, collaborative research genome browser workflows, web interface, collaborative research, genome browser Galaxy Eclipse plug-in based architecture, chemoinformatics Eclipse plug-in based architecture, chemoinformatics BioClipse + systems biology • visual modelling • simulation • parameters fitting •… + chat for on-line consultations Методология • разработка компьютерной техники: • визуальное моделирование (графическая нотация) •модульный подход • четкое определение интерфейсов • переключатели (состояние) • разработка программного обеспечения • итерационный подход • функциональные тесты • социальные технологии • совместные исследования (collaborative research) • crowdsourcing Yuri Lazebnik “Can a biologist fix a radio?—Or, what I learned while studying apoptosis“. Cancer Cell, 2002, 2(3): 179-182 Biologist view Engineer’s view 2002 However, I hope that it is only a question of time before a user-friendly and flexible formal language will be taught to biology students, as it is taught to engineers, as a basic requirement for their future studies. My advice to experimental biologists is to be prepared. Y. Lazebnik, 2002 2010 Standards in systems biology SBML – Systems Biology Markup Language SBGN – Systems Biology Graphics Notation TNF-α module (SBGN) Biologist view Engineer’s view Biologist view Engineer’s view Last centaury: 50-70-th Modular design Modules: clear specification of interfaces input/output contacts Функциональные тесты Функциональные тесты Новые экспериментальные данные Global quantification of mammalian gene expression control. Schwanhäusser B, Busse D, Li N, Dittmar G, Schuchhardt J, Wolf J, Chen W, Selbach M. Nature. 2011 May 19; 473(7347):337-342. - фибробласты мыши - одновременное измерение транскриптома и протеома для 5000+ генов - измерено время полураспада для всех мРНК и соответствующих белков - построена полногеномная модель для предсказания скорости синтеза мРНК и белков Deep proteome and transcriptome mapping of a human cancer cell line. Nagaraj N, Wisniewski JR, Geiger T, Cox J, Kircher M, Kelso J, Pääbo S, Mann M. Mol Syst Biol. 2011 Nov 8;7:548. doi: 10.1038/msb.2011.81. - HeLa cells - число молекул для 10 255 белков и 9207 соответствующих РНК - проведенный анализ показывает, что покрыто большинство белков и РНК кодирующих генов The quantitative proteome of a human cell line. Beck M, Schmidt A, Malmstroem J, Claassen M, Ori A, Szymborska A, Herzog F, Rinner O, Ellenberg J, Aebersold R. Mol Syst Biol. 2011 Nov 8;7:549. doi: 10.1038/msb.2011.82. - человек, остеосаркома – U20S клеточная линия - количество молекул для 10 000+ белков - диапазон измерений – 7 порядков, от десятков до 20 000 000 молекул белка на клетку. Схема эксперимента Виртуальная клетка концепция модели Базовая модель на основе данных Schwanhäusser et al, 2011 - транскриптом - протеом - параметры - для мРНК – ksynth-RNA, kdegr-RNA - для белков - ktransl-p, kdegr-p воздействие предсказание Базовая модель на основе данных Schwanhäusser et al, 2011 - транскриптом - протеом - параметры - для мРНК – ksynth-RNA, kdegr-RNA - для белков - ktransl-P, kdegr-P транскриптом (виртуальный микрочиповый эксперимент) протеом сравнение эксперимент микрочип NGS мас-спекрометрия воздействие Базовая модель на основе данных Schwanhäusser et al, 2011 - транскриптом - протеом - параметры - для мРНК – ksynth-RNA, kdegr-RNA - для белков - ktransl-P, kdegr-P моделирование воздействия: - путь передачи сигнала - задействованные гены - модели регуляции транскрипции соответствующих генов - базовая модель - транскрипция мРНК - трансляция белок геном набор регуляторных сайтов, полученных GTRD в результате мета-анализа данных: • ChIP-SEQ • предсказанных сайтов • эволюционно-консервативных районов • микрочиповых экспериментов математические модели на основе геномных и транскриптомных данных транскриптом GTRD протеом Proteome регуляторные пути Apoptosis Ubiquitomix метаболом dri F (rg1 , rg 2 ,...) * k synth RNA kdeg r RNA * ri dt dpi k synth P * ri kdeg r P * pi dt Экспериментальные данные: - Schwanhausser et al., 2011 - Beck et al., 2011 - Nagaraj N., 2011 система АДУ + дискретные события • модификации белков • образование комплексов • функции F для регуляции: транскрипции, трансляции, распада белков (например, через убиквитинирование) система ОДУ Текущие результаты GTRD Gene Transcription Regulation Database Целью которой является: - построение моделей регуляции генной экспрессии для всех генов человека, мыши и крысы - ежеквартальное обновление моделей на основе вновь появляющихся данных в полуавтоматическом режиме на основе сценариев (workflow) Модели строятся на 2 уровнях: 1) набор сайтов связывания транскрипционных факторов, полученных в ходе мета-анализа на основе данных: - ChIP-SEQ - предсказанных сайтов - эволюционно-консервативных районов - микрочиповых экспериментов. 2) математические модели регуляции отдельных генов, представленные в виде дифференциальных уравнений; Фрагмент сценария для автоматической обработки ChIP-Seq данных Моделирование генной экспрессии Фиксируем ген-мишень G. - экспрессия гена-мишени в момент времени t. - гены прямо или косвенно влияющие на его экспрессию (регуляторы). - уровень экспрессии i-того гена-регулятора в момент времени t. Модель регуляции гена-мишени: Задачи: 1. Составление списка генов-регуляторов – на основе GTRD. 2. Выбор регуляторной функции (т.е. выбор модели). Исходные данные: Варианты моделей 1. Линейная модель со сдвигом: 2. Простая нелинейная модель: 3. Стохастическая нелинейная модель: где - сигма-функция. Proteome Apoptosis На данный момент содержит наиболее полную модель апоптоза, включающую • 13 модулей • 286 белков и их комплексов • 684 реакции • 719 параметров Прототип базы данных модулей (математический моделей) для регуляторных и метаболических путей. Modular model of apoptosis Mitochondron module (BMOND ID: Int_Mitoch_module) Bagci EZ, et al, Biophysical J 2006 Albeck JG, et al, PLoS Biol 2008 Additions: Activation of CREB and deactivation of BAD by AktPP and ERK-PP Upregulation of Bcl-2 by CREB Bcl-2 suppression by p53 EGF module (BMOND ID: Int_EGF_module) Schoeberl B, et al: Nature Biotechnology 2002 Borisov N, et al: Molecular Systems Biology 2009 Additions: Reactions of protein syntheses and degradations CD95L module and results of fitting its dynamics to experimental data Bentele M, 2004 Neumann L, 2010 Modular model allows us to combine both up-down and bottom-up approaches top-down bottom-up Virtual human Virtual (Physiological) Human – база данных моделей различных физиологических функций человека. На данный момент содержит более 40 модулей связанных с работой сердечнососудистой системы и почки: • проанализированы существующие модели сердечнососудистой системы человека; • разработан подход к объединению моделей с различным математическим формализмом на основе агентного моделирования; • выбранные модели объединены в комплексную модель сердечно-сосудистой системы человека; • комплексную модель валидирована с использованием экспериментальных данных. Агентное моделирование Агентное моделирование Элементы блочной модели BioUML BioUML Модель сердечных сокращений Q – поток P – давление R – сопротивление V – объем DO2 – кислородный долг H – нейрогуморальный фактор Солодянников Ю. В. “Элементы математического моделирования и идентификация системы кровообращения”. Самара. Изд-во Самар. ун-та, 1994. 315 с. Пример работы модели мл/сек мм рт. ст. сек Поток крови из желудочка в артерии Поток крови через капилляры сек Среднее артериальное давление Модель почечной регуляции Karaaslan F. et al. “Long-term mathematical model involving renal sympathetic nerve activity, arterial pressure, and sodium excretion.” Ann Biomed Eng. 2005. 33(11): 1607-1630. Модель почечной регуляции Обозначение eaum Cadh Canp Cal Cat Cr Сsod Fico Fiu Pma Pmf Pra R rsna vas Vecf Описание Эффект автономной нервной системы. Концентрация антидиуретического гормона. Концентрация натриуретического пептида. Концентрация альдостерона. Концентрация ангиотензина. Концентрация ренина. Концентрация натрия. Сердечный выброс (минутный объем). Скорость тока мочи. Среднее артериальное давление. Среднее наполняющее давление. Давление в правом предсердии. Артериальное сопротивление. Почеченая симпатическая нервная активность. Васкуляризация. Объем внеклеточной жидкости. Пример работы модели мм рт. ст. Среднее артериальное давление Общее время эксперимента – 7 дней. Потребоение соли увеличено с 0.126 до 0.26 мЭкв/л через 50 часов после начала эксперимента и уменьшено до 0.02 мЭкв/л через 133 часа. Модель артериального дерева Возможные граничных условий на выходе из сердца и на концах последних артериях: 1. Зависимость давления от времени p(t) 2. Зависимость площади от времени A(t) 3. Зависимость потока от времени Q(t) 4. Условие фильтрации: Q = KD(p-pv) Пример работы модели Профиль давления на входе в аорту На выходе – постоянное давление 70 мм. рт. ст. Объединение моделей, шаг 1 Объединение моделей, шаг 1 Объединение моделей, шаг 1 Среднее давление Среднее сопротивление Поток на выходе Объем крови Сопротивление на выходе Поток на входе Давление на входе Комплексная модель ССС человека Trash Trash Trash Trash Trash Acknowledgements Part of this work was partially supported by the grant: European Committee grant №037590 “Net2Drug” European Committee grant №202272 “LipidomicNet” Integration and interdisciplinary grants №16, 91 of SB RAS. BioUML team Software developers Nikita Tolstyh Ilya Kiselev Tagir Valeev Elena Kutumova Anna Ryabova Alexey Shadrin Biologists Ruslan Sharipov Ivan Yevshin