Революция в современной биологии Биология как наука насчитывает сотни лет своего развития. Однако, за относительно короткий срок (1980-2000 гг.) в молекулярной биологии и генетике произошли революционные изменения, повлиявшие весь "ландшафт" биологии и связанных с нею областей знаний.Исходным событием явилась осуществленная в 1953 году Уотсоном и Криком расшифровки структуры двойной спирали ДНК. За этим последовало создание методов расшифровки пространственной структуры белков с помощью рентгено-структурного анализа; методов расшифровки (чтения) аминокислотных и нуклеотидных последовательностей; создание методов генетической инженерии; трансгенез, клонирование. Началась эпоха массовой расшифровки геномов, увенчавшаяся таким выдающимся достижением как расшифровка генома человека. Были разработаны эффективные методические подходы, гарантирующие получение фундаментальных знаний о молекулярно-генетическом, клеточном, организменном, экосистемном уровнях организации жизни и трансформацию этих знаний для нужд прикладных отраслей и общества в целом. РЕВОЛЮЦИЯ В СОВРЕМЕННОЙ БИОЛОГИИ Расшифровка структуры двойной спирали ДНК Рентгено-структурные методы расшифровка пространственной структуры белков Методы расшифровки аминокислотных последовательностей Методы расшифровки нуклеотидных последовательностей Генетическая инженерия Генодиагностика Трансгенез Клонирования Молекулярные биотехнологии ДНК-микрочипы Массовое секвенирование геномов Расшифровка генома человека Протеомика Транскриптомика Молекулярная медицина, генотерапия Конструирование молекулярно-генетических систем с заданными свойствами 2. Глобальные проблемы, стоящие перед человечеством и Россией в 21 веке числу глобальных проблем, стоящих перед человечеством и Россией в 21 веке, решение которых связано с революционными достижениями биологии, относятся следующие: обеспечение стремительно растущего населения Земли продуктами питания на основе современных генетических технологий - клонирования организмов и трансгенеза; создание индустриальных технологий нового поколения на основе методов промышленной микробиологии, ориентированных на стратегию энергосбережения и энергозамещения; разработка стратегий сохранения и восстановления биосферы, разрушенной в результате техногенной деятельностью человечества; создание медицины нового поколения, способной решить проблему раковых заболеваний, обуздать глобальные пандемии, приобретающие все более зловещие для судеб человечества очертания (вирус СПИДА, новые высокоагрессивные формы туберкулеза и т.д.), выработать стратегии лечения наследственных и мультифакториальных заболеваний за счет направленного воздействия на молекулярно-генетические механизмы организма человека; cохранение естественного генетического разнообразия человечества в условиях разрушения естественной среды его обитания; сохранение и восстановление естественного биоразнообразия природы (микробного, растительного и животного мира) в условиях стремительно растущего населения планеты и постоянно увеличивающегося техногенного давления на естественные ареалы обитания видов и экосистемы; создание эффективной системы биологической безопасности для распознавания и противодействия различным видам биологического (генетического) оружия (индивидуального, популяционного, этнического, экологического), нейтрализующей распознанное биологическое оружие. 3. Информационный взрыв в молекулярной биологии и генетике Суммарные объемы первичных экспериментальных данных только по молекулярно-генетическому уровню организации жизни превышают сотни терробайт.В результате автоматической расшифровки нуклеотидных последовательностей в молекулярной биологии и генетике за последние 20 лет произошел информационный взрыв. Объемы получаемых данных поражают воображение. ИНФОРМАЦИОННЫЙ ВЗРЫВ В МОЛЕКУЛЯРНОЙ БИОЛОГИИ И ГЕНЕТИКЕ: автоматическая расшифровка нуклеотидных последовательностей 4. Характеристики генома человека Например, длина генома человека составляет более 6 миллиардов пар оснований и он содержит более 30 тысяч генов. При его расшифровке получены данные объемом десятки терробайт о физических и цитогенетических картах хромосом, их нуклеотидных последовательностях, локализации генов, мутациях: выявлено не менее 1.5 миллиона мутаций, по которым геномы людей отличаются друг от друга. ИНФОРМАЦИОННЫЙ ВЗРЫВ В МОЛЕКУЛЯРНОЙ БИОЛОГИИ И ГЕНЕТИКЕ Характеристики генома человека 5. Экспериментальные данные Расшифрованы структуры геномной ДНК тысяч вирусов, десятков бактерий, геномы дрожжей, дрозофилы, ряда животных и растений. Расшифрованы аминокислотные последовательности миллионов белков и более 15 тысяч пространственных структур белков. Технология ДНК-чипов позволяет количественно измерять экспрессию десятков тысяч генов одновременно в отдельной клетке. Разворачиваются исследования по протеомике, направленные на расшифровку первичной и пространственной структур всех белков человека и бактерий (миллионы молекул). Огромные экспериментальные данные накапливаются при изучении разнообразия геномов человека и животных. Не менее мощные массивы экспериментальных данных накапливается в таких классических направлениях биологии, как зоология, ботаника, систематика, экология. Расшифрованы аминокислотные последовательности миллионов белков Расшифрованы пространственные структуры десятков тысяч белков 6. Информатика - становой хребет современной науки и цивилизации Информатика, в отличие от биологии, существует лишь около 50 лет. Однако с момента своего возникновения она оказывала радикальное и все более возрастающее влияние на все области знаний, включая биологию. Анализируя историю развития науки, можно сделать вывод, что подавляющее большинство революционных достижений биологии последних десятилетий было бы невозможно без использования информационных технологий. Особенно стремительный прогресс информационных технологий наблюдается в последние десятилетия 20-го века, хронологически совпадая с революцией в биологии. К числу наиболее впечатляющих достижений информатики относятся: -персональные компьютеры высокой производительности, обеспечившие массовое распространение информационных технологий во всех областях знаний, в том числе в биологии; -сверхмощные вычислительные системы (суперкомпьютеры и сверхбольшие вычислительные кластеры); -сверхбольшие носители информации, обеспечивающие накопление и сохранение огромных объемов данных; -мировая сеть Интернет, обеспечившая доступ к глобальным распределенным информационным и программным ресурсам; -огромное разнообразие универсальных и специализированных языков программирования; -методы анализа данных, основанные на достижениях теории искусственного интеллекта; -технологии моделирования динамики сверхсложных систем, состоящих из огромного разнообразия взаимодействующих элементов. Информационные технологии становятся становым хребтом современной науки и цивилизации в целом, и их роль в 21 веке будет стремительно возрастать. 7. Возникновение информационной биологии Современная биология стала производителем беспрецедентно огромных объемов экспериментальных данных, осмысливание которых невозможно без привлечения современных информационных технологий и эффективных математических методов анализа данных и моделирования биологических систем и процессов. Прогресс человечества в 21 веке будет неразрывно связан с биологией и информатикой. Ответы на многие глобальные вызовы, стоящие перед современной цивилизацией, критическим образом зависят от развития этих наук, их взаимодействия и использования их достижений. В ответ на эту острую потребность возникает новая наука информационная биология. Объектами исследований информационной биологии являются генетические макромолекулы - ДНК, РНК, белки, фундаментальные генетические процессы - репликация, транскрипция, трансляция, генетические сети, функционирование которых обеспечивает выполнение всех функций организмов. 8. Актуальные задачи информационной биологии Информационная биология относится к числу высоких технологий современной биологии и обеспечивает информационно-компьютерные и теоретические основы генетики и селекции, молекулярной генетики и биологии, генетической и белковой инженерии, биотехнологии, медицинской генетики, генодиагностики, генотерапии, экологии, словом, тех наук, благодаря выдающимся достижениям которых биология превратилась в одну из лидирующих наук грядущего столетия. Информационная биология занимает в современной биологии ключевую и исключительно важную позицию. Предметом информационной биологии является исследование биологических систем на трех уровнях их организации: (i) молекулярно-генетическом; (ii) организменном и (iii) популяционном и экосистемном. К числу наиболее актуальных задач информационной биологии относятся: создание компьютерных баз данных для хранения экспериментальной информации о структуре и функции биологических объектов на всех уровнях их иерархии начиная с молекулярно-генетического, включая организменный и заканчивая популяционным; разработка алгоритмов и пакетов программ для анализа информации, накапливаемой в перечисленных выше базах данных; разработка теоретических и компьютерных методов анализа геномов и изучение их информационного содержания; изучение механизмов хранения, реализации и передачи наследственной информации, закодированной в геномах; создание компьютерных технологий моделирования молекулярногенетических систем и процессов, в том числе фундаментальных: репликации, транскрипции и т.д.; моделирование структурной организации и функции генетических макромолекул, молекулярных взаимодействий между ними; изучение закономерностей эволюции генетических макромолекул и молекулярно-генетических систем; разработка теоретических и информационно-компьютерных основ моделирования молекулярно-генетических систем-продуцентов с заданными свойствами; создание математических моделей функционирования клеток и целых организмов на основе информации, записанной в их геномах; создание математических моделей воспроизведения, функционирования и эволюции популяций и экосистем; разработка теоретических основ фармакологии, биотехнологии и агробиологии нового поколения. 9. Компьютерная система ГЕНЭКСПРЕСС Для решения этих задач в Институте цитологии и генетики в течение 20 лет проводятся крупномасштабные исследования в области информационной биологии. Их результаты интегрированы в рамках сверхбольшой компьютерной системы ГЕНЭКСПРЕСС, содержащей десятки оригинальных, созданных нами баз данных, баз знаний и комплексов программ для анализа и моделирования генетических макромолекул и фундаментальных генетических систем и процессов. ГЕНЭКСПРЕСС не имеет аналогов и является первой в мировой науке компьютерной системой, интегрирующей информационные и программные ресурсы по регуляции функции генов. Качественная схема процессов 10. БАЗА ДАННЫХ GENENET: генная сеть Генная сеть - группа координированно функционирующих генов, контролирующих физиологические, биохимические и молекулярные функции организмов. В настоящее время в научной литературе опубликованы десятки тысяч статей, содержащих информацию о структурно-функциональной организации генных сетей. Однако до настоящего времени она не описывалась и не систематизировалась в компьютерных базах данных. Для решения этой задачи нами разработана компьютерная система GeneNet. База данных GeneNet содержит описание десятков генных сетей человека, животных, растений и микроорганизмов и не имеет аналогов в мировой науке. Зарубежные фармакологические и биотехнологические фирмы проявляют к ней большой интерес. БАЗА ДАННЫХ GENENET: ГЕННАЯ СЕТЬ – ГРУППА ГЕНОВ, КООРДИНИРОВАННО ФУНКЦИОНИРУЮЩИХ ПРИ ВЫПОЛНЕНИИ МОЛЕКУЛЯРНЫХ, БИОХИМИЧЕСКИХ, ФИЗИОЛОГИЧЕСКИХ И ДРУГИХ ФУНКЦИЙ ОРГАНИЗМА Обязательные компоненты любой генной сети: Группа координированно функционирующих генов Белки и мРНК, кодируемые этими генами (структурные белки, ферменты, транскрипционные факторы и т.д.) Пути передачи сигналов Регуляторные контуры: отрицательные и положительные обратные связи Внешние сигналы, гормоны, метаболиты и т.д. 11. БАЗА ДАННЫХ GENENET: классы элементарных структур и событий В рамках этого подхода все компоненты генной сети подразделяются на два класса: элементарные структуры - гены, РНК, белки и различные метаболиты) и элементарные события или взаимодействия между структурами - реакции и регуляторные события БАЗА ДАННЫХ GENENET: КЛАССЫ ЭЛЕМЕНТАРНЫХ СТРУКТУР И СОБЫТИЯ, ЗНАЧИМЫХ ДЛЯ ФУНКЦИОНИРОВАНИЯ ГЕННЫХ СЕТЕЙ 12. БАЗА ДАННЫХ GENENET: примеры графического представления На рисунке приведены примеры графического представления в базе данных GeneNet реакций и регуляторных событий: транскрипции, трансляции, формирования и распада мультимерного комплекса, ферментного синтеза, активации и подавления транскрипции. В основе организации генных сетей лежит ограниченный набор элементарных структур, событий и процессов. Комбинируясь, они порождают огромное разнообразие генных сетей и режимов их функционирования. БАЗА ДАННЫХ GENENET: ПРИМЕРЫ ЭЛЕМЕНТАРНЫХ СТРУКТУР И СОБЫТИЙ, ЗНАЧИМЫХ ДЛЯ ФУНКЦИОНИРОВАНИЯ ГЕННЫХ СЕТЕЙ 13. БАЗА ДАННЫХ GENENET: формализованное описание элементарных событий Разработан специальный язык для описания элементарных событий в генных сетях. На этом рисунке дан пример описания элементарной реакции в генной сети дифференцировки эритроцитов - синтеза гема из предшественников - двухвалентного железа (Fe++) и протопорфирина IX (Proto IX) под действием фермента феррохелатазы. БАЗА ДАННЫХ GENENET: ФОРМАЛИЗОВАННОЕ ОПИСАНИЕ ЭЛЕМЕНТАРНЫХ СОБЫТИЙ Синтез гема (Heme) из протопорфирина IX (ProtoIX) и двухвалентного железа (Fe++) под действием фермента феррохелатазы (FCH). 14. БАЗА ДАННЫХ GENENET: программа для ввода информации На рисунке показан пример программы для ввода информации в базу данных GeneNet через Интернет БАЗА ДАННЫХ GENENET: ПРОГРАММА ДЛЯ ВВОДА ИНФОРМАЦИИ В БАЗУ ДАННЫХ GENENET ЧЕРЕЗ СЕТЬ ИНТЕРНЕТ 15. БАЗА ДАННЫХ GENENET: основные типы генных сетей Проведенный нами анализ выявил 5 типов генных сетей с качественно различающимися функциями: среды организмов (гомеостаз) морфогенеза тканей и органов, роста и развития организмов. изменение состояния внешней среды. ые сети, обеспечивающие циклическое выполнение процессов (типичный пример – генная сеть, контролирующая клеточный цикл). воспроизведение организма. 16. БАЗА ДАННЫХ GENENET: центральный фрагмент генной сети Ключевую роль в функционировании генных сетей, обеспечивающих гомеостаз, играют регуляторные контуры с отрицательными обратными связями, поддерживающие контролируемый параметр X вблизи определенного уровня X0 (рис. 8 г) На рисунке показан центральный фрагмент генной сети, обеспечивающей биосинтез холестерина и постоянство его концентрации в клетках. Обозначения таковы. Центральный круг - ядро, периферия - цитоплазма, внешняя полоса мембрана клетки; гены - прямоугольники, белки - круги, метаболиты синие квадраты; реакции и регуляторные события - стрелки. Путь биосинтеза холестерина из ацетил-коэнзима А контролируется по механизму отрицательной обратной связи. Центральный регулятор генов, кодирующих ферменты этого пути, транскрипционный фактор SREBP, активирующий транскрипцию кассеты этих генов и тем самым усиливающий продукцию холестерола. Фактор SREBP образуется из предшественника preSREBP под действием стерол-зависимой протеазы. При повышении уровня холестерола активность протеазы подавляется, что снижает скорость образования фактора SREBP и его концентрацию. Тем самым снижается активность генов, кодирующих ферменты этого пути, и уровень холестерола нормализуется. Так работает отрицательная обратная связь, контролирующая концентрацию холестерина. Всего эта генная сеть включает несколько сотен генов. БАЗА ДАННЫХ GENENET: ЦЕНТРАЛЬНЫЙ ФРАГМЕНТ ГЕННОЙ СЕТИ БИОСИНТЕЗА ХОЛЕСТЕРИНА В КЛЕТКЕ (РЕГУЛЯЦИЯ ПО МЕХАНИЗМУ ОТРИЦАТЕЛЬНОЙ ОБРАТНОЙ СВЯЗИ 17. БАЗА ДАННЫХ GENENET: химико-кинетическое описание элементарных событий в генной сети Для количественной характеристики динамики генных сетей строятся их математические модели. Каждый из элементарных процессов в генной сети описывается уравнением химической кинетики. На рисунке представлено химико-кинетическое описание трех событий в сети липидного метаболизма: (1) превращение мевалоновой кислоты в 5'фосфат мевалоновую кислоту (мономолекулярная реакция); (2) формирование димерного белка из двух субъединиц транскрипционного фактора SREBP1 (бимолекулярная реакция); (3) ферментативная реакция превращения пресквален-дифосфата в сквален. БАЗА ДАННЫХ GENENET: ПРИМЕРЫ ХИМИКО-КИНЕТИЧЕСКОГО ОПИСАНИЯ ЭЛЕМЕНТАРНЫХ СОБЫТИЙ В ГЕННОЙ СЕТИ ЛИПИДНОГО МЕТАБОЛИЗМА 18. БАЗА ДАННЫХ GENENET: фрагмент системы дифференциальных уравнений Модель генной сети описывается системой обыкновенных дифференциальных уравнений. Фрагмент модели биосинтеза холестерина представлен на рисунке. Она описывает 65 элементарных процессов, характеризующихся 93 константами. Примеры ряда констант приведены в нижней части рисунка. БАЗА ДАННЫХ GENENET: ФРАГМЕНТ СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ МАТЕМАТИЧЕСКОЙ МОДЕЛИ РЕГУЛЯЦИИ БИОСИНТЕЗА ХОЛЕСТЕРИНА В КЛЕТКЕ KISBfree = 1*10-02, Ksrpcdeg = 2.5*10-05, Kfre____ Константы = 1*10-02, KLDLRdeg = 1.93*10-6, KsynLDL = мономолекулярных -1 3.32*10-02, KutiLDL = 3.21*10-06, KdegLRin = реакций, с 1.93*10-06 Константы л*ммоль-1*с-1 с-1 бимолекулярных Kclaw1 = 3.3*10-01 Kclaw2 =1*10-03 реакций Константы Константы оборота Константы Михаэлиса, -1 ферментативных фермента, с ммоль/л реакций +02 KISBestr = 1*10 , KMSBestr = 6.67*10-03, KISBhydr = KMSBhydr = 7.6*10-01, +03 1.9*10 ,KISBldlr = 1*10 KMSBldlr = 3.3*10-05 1 19. БАЗА ДАННЫХ GENENET: примеры соответствия между рассчитанными и экспериментально наблюдаемыми характеристиками системы липидного метаболизма Здесь представлены примеры соответствия между рассчитанными и экспериментально наблюдаемыми характеристиками системы липидного метаболизма: (i) равновесная кривая связывания липопротеина низкой плотности LDL с клеточной мембраной и (ii) динамика связывания рецептора LDL с клеточной мембраной после подавления его биосинтеза в организме. Видно хорошее совпадение экспериментальных и рассчитанных величин. БАЗА ДАННЫХ GENENET: ПРИМЕРЫ СООТВЕТСТВИЯ МЕЖДУ РАССЧИТАННЫМИ И ЭКСПЕРИМЕНТАЛЬНО НАБЛЮДАЕМЫМИ ХАРАКТЕРИСТИКАМИ СИСТЕМЫ ЛИПИДНОГО МЕТАБОЛИЗМА Равновесная кривая связывания липопротеина низкой плотности (LDL) с клеточной мембраной Динамика связывания LDL с клеточной мембраной после подавления его биосинтеза в организме 20. БАЗА ДАННЫХ GENENET: модель генной сети липидного метаболизма помощью модели можно исследовать динамику генной сети липидного метаболизма в норме и при мутациях. Кривыми красного цвета на рисунке изображена рассчитанная с помощью модели динамика концентрации холестерина в плазме и клетке в ответ на пиковое увеличении в крови концентрации липидов. Нормализация уровня липидов происходит через 30-40 минут после пиковой нагрузки. Кривыми синего цвета представлены расчеты динамики при мутации по гену LDL-рецептора, двукратно снижающей число этих рецепторов на клеточной мембране, и тем самым транспорт холестерина в клетку. Концентрация холестерина в плазме в этом случае существенно выше, чем в норме, как в стационарном состоянии, так и при пиковом поступлении липидов в организм. Полученные эффекты совпадают с экспериментальными наблюдениями, которые характерны для мутации по этому гену Исследование генной сети липидного метаболизма в норме и при мутациях представляет большой интерес с медицинской и фармакологической точек зрения, так как нарушения именно в этой генной сети ответственны за большое число тяжелых и патологий, таких, как атеросклероз, ишемическая болезнь сердца, инсульты и т.д. БАЗА ДАННЫХ GENENET: МОДЕЛЬ ГЕННОЙ СЕТИ ЛИПИДНОГО МЕТАБОЛИЗМА (СТАЦИОНАРНЫЕ СОСТОЯНИЯ И ОТВЕТНАЯ РЕАКЦИЯ НОРМАЛЬНЫХ И МУТАНТНЫХ КЛЕТОК НА ПОВЫШЕНИИ СОДЕРЖАНИЯ ЛНП В КРОВИ) 21. БАЗА ДАННЫХ GENENET: фрагмент генной сети активации макрофага этом рисунке представлен фрагмент генной сети активации макрофага типичной генной сети стрессового ответа. Макрофаги - важнейшая компонента защиты организма от бактериальных инфекций. Активированный макрофаг, согласно представленной здесь схеме, синтезирует NO - окись азота, убивающую бактерии. БАЗА ДАННЫХ GENENET: ФРАГМЕНТ ГЕННОЙ СЕТИ, КОНТРОЛИРУЮЩЕЙ СИНТЕЗ NO ПРИ АКТИВАЦИИ МАКРОФАГА 22. БАЗА ДАННЫХ GENENET: моделирование влияния мутации на динамику синтеза NO Математическая модель генной сети активации макрофага дает возможность рассчитывать кинетику синтеза окиси азота при инфекциях. Синяя кривая - активация синтеза окиси азота в норме, а красная - при мутации, увеличивающей в 10 раз содержание рецептора CD14. Видно, что при мутации уровень окиси азота существенно выше, чем в норме. Такая мутация опасна для организма из за высокого токсического эффекта окиси азота. Возникает вопрос: можно ли оказать воздействие на мутантную генную сеть, добившись нормализации ее функции? Моделирование показывает, что этого можно достигнуть введением фармакологической субстанции, связывающей избыток рецептора CD14. Видно (зеленая кривая), что в этом случае динамика синтеза окиси азота при активации совпадает с нормой. Фактически в данном случае речь идет о решении задачи управления динамической системой, описываемой обыкновенными дифференциальными уравнениями. БАЗА ДАННЫХ GENENET: МОДЕЛИРОВАНИЕ ВЛИЯНИЯ МУТАЦИИ НА ДИНАМИКУ СИНТЕЗА NO ПРИ АКТИВАЦИИ МАКРОФАГА 23. БАЗА ДАННЫХ GENENET: обязательные компоненты Эта задача относится к числу важнейших для фармакологии третьего поколения, создаваемой в ведущих фармакологических фирмах мира. Основная стратегия новых подходов в фармакологии - индивидуальный генотип-специфический подбор фармацевтических препаратов для коррекции заболеваний человека. При этом выбор оптимальных стратегий коррекции основан на моделировании функции генных сетей. БАЗА ДАННЫХ GENENET: Обязательные компоненты: дуального генотип-специфического подбор фармацевтических препаратов для коррекции заболеваний человека. дефектов на основе компьютерного анализа и моделирования функции нарушенных генетически контролируемых систем и процессов организма. 24. БАЗА ДАННЫХ GENENET: фрагмент генной сети дифференцировки и созревания эритроцитов Положительные обратные связи обеспечивают эффективное отклонение контролируемого параметра Х от его текущего значения. Они играют ключевую роль в генных сетях роста и дифференцировки клеток, морфогенеза органов, роста и развития организмов, при которых система непрерывно уходит от своего текущего состояния. Например, генная сеть дифференцировки и созревания эритроцитов контролируется по механизму положительной обратной связи. Исследование и моделирование генных сетей, контролирующих функции кроветворения, имеют фундаментальное значение для понимания процессов клеточной дифференцировки, а в прикладном плане - для поиска путей фармакологической коррекции патологий системы кроветворения. БАЗА ДАННЫХ GENENET: ФРАГМЕНТ ГЕННОЙ СЕТИ ДИФФЕРЕНЦИРОВКИ И СОЗРЕВАНИЯ ЭРИТРОЦИТОВ 25. БАЗА ДАННЫХ GENENET: фрагмент генной сети развития цветка По механизму положительной обратной связи функционирует также система генных сетей, контролирующих развитие цветка. При этом за формирование каждого органа цветка - тычинки, пестика, лепестка и чашелистика отвечает отдельная сеть. Взаимодействуя и конкурируя друг с другом, эти генные сети контролируют сложный, многоэтапный процесс развития цветка. Изучение этих генных сетей важно для понимания механизмов морфогенеза растений и решения задач растительной биотехнологии, в том числе создания растений с качественно новыми морфологическими характеристиками. БАЗА ДАННЫХ GENENET: ФРАГМЕНТ ГЕННОЙ СЕТИ ФОРМИРОВАНИЕ ЦВЕТКА 26. БАЗА ДАННЫХ GENENET: фрагмент генной сети контролирующей процесс апоптоза Здесь показана замечательная генная сеть, контролирующая процесс клеточной смерти - апоптоз. Эта генная сеть играет ключевую роль в убийстве раковых клеток на ранних стадиях канцерогенеза. С другой стороны, дефекты в генной сети апоптоза являются одним из факторов возникновения раковых трансформаций клеток. Этим и объясняется значимость изучения генной сети апоптоза как с фундаментальной, так и прикладной точек зрения. БАЗА ДАННЫХ GENENET: ФРАГМЕНТ ГЕННОЙ СЕТИ, КОНТРОЛИРУЮЩЕЙ ПРОЦЕСС КЛЕТОЧНОЙ СМЕРТИ – АПОПТОЗА 27. БАЗА ДАННЫХ GENENET: теория генных сетей Локальные генные сети иерархически объединяются в глобальную генную сеть организма. В геноме человека имеется до 35 тысяч генов. Можно представить насколько огромно количество взаимодействий между генами глобальной генной сети, а также уровень ее сложности, который принципиально не может быть понят без применения методов математического анализа и моделирования. Парадигма генетики начала века основывалась на том, что один ген кодирует один признак. Она сыграла свою роль, позволив доказать, что существуют очень просто, с генетической точки зрения, контролируемые признаки. В настоящее время идет становление новой парадигмы, утверждающей, что фенотипический признак организма - это продукт функционирования определенной генной сети. Теория генных сетей позволяет изучать функциональные взаимосвязи между генами в норме и при мутациях, оценивать действие фармакологических препаратов, выбирать стратегии коррекции нарушений генной сети при заболеваниях. Это направление является одной из горячих точек информационной биологии. Согласно оценкам экспертов, в ближайшие годы объем ивестиций фармацевтических и биотехнологических фирм мира в теорию генных сетей составят около 3 миллиардов долларов. БАЗА ДАННЫХ GENENET: ИЕРАРХИЧЕСКАЯ ИНТЕГРАЦИЯ ЛОКАЛЬНЫХ ГЕННЫХ СЕТЕЙ, КОНТРОЛИРУЮЩИХ ОТДЕЛЬНЫЕ ФУНКЦИИ ГЛОБАЛЬНУЮ ГЕННУЮ СЕТЬ ОРГАНИЗМА 28. База данных TRRD (Transcription Regulatory Regions Database) этом рисунке можно видеть графическое представление строения регуляторного района на основе информации из базы данных ТРРД. База данных ТРРД - признанный и наиболее полный источник информации по строению регуляторных районов генов, не имеющий аналогов в мировой науке. Информация, накапливаемая в этой базе данных, важна для создания искусственных генно-инженерных конструкций, обеспечивающих заданный уровень экспрессии определенного гена в заданной ткани, она представляет первостепенный интерес для конструирования искусственных генетических систем с принципиально новыми свойствами. Эта конструкция, в частности, содержит мышинный ген, контролирующий начальные стадии развития глаза, а также дрозофилиный ген-энхансер, активный только в определенных органах. Ее использование вызывает формирование глаз в тех клетках, в которых энхансер активен, т.е. на ногах, на крыльях и в различных участках головы у дрозофилы. В настоящее время все больший размах приобретают исследования такого рода, особенно на растениях. Громадные биотехнологические фирмы, например МОНСАНТА, с годовым оборотом в десятки миллиардов долларов осуществляют на основе методов трансгенеза радикальные изменения регуляторных систем растений, добиваясь при этом возникновения качественно новых морфологических и биохимических свойств у трансгенных растений База данных TRRD (Transcription Regulatory Regions Database) РЕГУЛЯТОРНЫЕ РАЙОНЫ ГЕНОВ ЭУКАРИОТ И ФОРМИРОВАНИЕ ТРАНСКРИПЦИОННОГО КОМПЛЕКСА 29. МОДЕЛИРОВАНИЕ ВЛИЯНИЯ МУТАЦИЙ Рассмотрим теперь вторую проблему – исследование и моделирование влияния мутаций на регуляторные механизмы функции. Взаимодействие регуляторных белков с ДНК требует тонкого стереохимического соответствия между ними и сайтами их связывания. Пример ДНКбелкового комплекса между транскрипционным фактором USF человека и сайтом его связывания показан на этом рисунке. Мутационные нарушения конформации ДНК, нарушающие тонкое соответствие между сайтами и регуляторными белками – одна из причин возникновения молекулярных патологий. МОДЕЛИРОВАНИЕ ВЛИЯНИЯ МУТАЦИЙ: ТРЕХМЕРНАЯ СТРУКТУРА ДНК-БЕЛКОВОГО КОМПЛЕКСА 30. МОДЕЛИРОВАНИЕ ВЛИЯНИЯ МУТАЦИЙ: конформационные особенности настоящее время доказано наличие специального конформационного кода двойной спирали ДНК, записываемого в ее нуклеотидной последовательности. Например, конформационный параметр, описывающий взаимную ориентацию соседних комплементарных пар в спирали ДНК (угол спирального вращения TWIST), зависит от динуклеотидного контекста МОДЕЛИРОВАНИЕ ВЛИЯНИЯ МУТАЦИЙ: Динуклеотидный код угла спирального вращения ДНК (Helical Twist) AA 35,6 AT 29,3 AG 31,9 AC 31,1 TA 39,5 TT 35,6 TG 36,0 TC 35,9 GA 35,9 GT 31,1 GG 33,3 GC 34,6 CA 35,9 CT 31,9 CG 34,9 CC 33,3 Угол спирального вращения TWIST (градусы) 31. МОДЕЛИРОВАНИЕ ВЛИЯНИЯ МУТАЦИЙ: конформационные коды двойной спирали Экспериментально установлены зависимости от динуклеотидного контекста всех параметров, определяющих конформационные особенности спирали ДНК. Основываясь на свойствах конформационного кода, мы разработали компьютерные методы, позволяющие выявлять конформационные особенности ДНК-сайтов, значимые для взаимодействия с транскрипционными факторами, и исследовать влияние мутаций на активность сайтов. МОДЕЛИРОВАНИЕ ВЛИЯНИЯ МУТАЦИЙ КОНФОРМАЦИОННЫЕ КОДЫ ДВОЙНОЙ СПИРАЛИ Параметры, определяющие взаимную ориентацию оснований в пределах комплементарной пары и взаимное расположение соседних пар в спирали ДНК, кодируются в динуклеотидном коде 32. МОДЕЛИРОВАНИЕ ВЛИЯНИЯ МУТАЦИЙ: полиморфизм по регуляторному району гена DUFFY В настоящее время у человека выявлено огромное число мутаций в регуляторных районах генов, сопровождающихся выраженными патологическими проявлениями. Например, ген Duffy кодирует поверхностный рецептор, взаимодействие с которым необходимо для проникновения малярийного плазмодия в клетку. Белые европейцы восприимчивы к малярии, потому что у них нормально работает этот ген. В то же время в черных популяциях Африки в регуляторном районе этого гена фиксировалась мутация, повреждающая сайт связывания фактора GATA, необходимый для транскрипции гена Duffy. В результате этого африканцы не имеют антигена Duffy, что обеспечивает устойчивость аборигенов Африки к малярийному плазмодию. Влияние мутаций на регуляторные районы генов ПОЛИМОРФИЗМ ПО РЕГУЛЯТОРНОМУ РАЙОНУ ГЕНА DUFFY 33. МОДЕЛИРОВАНИЕ ВЛИЯНИЯ МУТАЦИЙ: сродство регуляторных белков к сайтам определяется конформационными свойствами ДНК Проведенные исследования показали, что эффективность связывания транскрипционных факторов с ДНК-сайтами определяется их конформационными особенностями, которые могут сильно меняться при мутациях. Например, сродство СRO-репрессора к своему оператору определяется шириной большой бороздки ДНК, сродство транскрипционного фактора USF к ДНК зависит от угла twist закрученности спирали ДНК. Сродство ТВР белка с сайтом его связывания определяется шириной малой бороздки и т.д. МОДЕЛИРОВАНИЕ ВЛИЯНИЯ МУТАЦИЙ: СРОДСТВО РЕГУЛЯТОРНЫХ БЕЛКОВ К САЙТАМ ИХ СВЯЗЫВАНИЯ ОПРЕДЕЛЯЕТСЯ КОНФОРМАЦИОННЫМИ СВОЙСТВАМИ ДНК 34. МОДЕЛИРОВАНИЕ ВЛИЯНИЯ МУТАЦИЙ: мутации в гене триптофандиоксигеназы человека Рассмотрим применение разработанных нами подходов к изучению мутации в гене триптофан-диоксигеназы человека, кодирующем фермент, участвующий в биосинтезе серотонина. Она сопровождается тяжелыми психическими патологиями: рассеяние внимания, наркотическая зависимость и др. МОДЕЛИРОВАНИЕ ВЛИЯНИЯ МУТАЦИЙ: МОДЕЛИРОВАНИЕ ВЛИЯНИЯ МУТАЦИЙ: 35. МОДЕЛИРОВАНИЕ ВЛИЯНИЯ МУТАЦИЙ: компьютерное и экспериментальное исследование влияния мутации G--->A на связывание транскрипционного фактора УУ1 Проведенный нами компьютерный анализ показал, что в нормальном гене в этом месте находится сайт связывания транскрипционного фактора УУ1 (положительный индекс сходства, обозначенный красным столбиком на данном рисунке). Однако при мутации этот сайт теряет способность связывать транскрипционный фактор YY1 (отрицательный индекс сходства, светлый столбик) Это означает, что в результате мутации происходит полное разрушение нормальной структуры УУ1 сайта. Полученные результаты послужили основой для планирования эксперимента, в котором изучалось связывание фактора УУ1 с этим сайтом в норме и при мутации. Результаты экспериментов, проведенных в нашем институте, подтвердили это предсказание, показав, что нормальный сайт действительно связывается с фактором, в то время как при мутации способность к связыванию теряется. Итак, одиночная нуклеотидная замена, мутация, возникщая в одной из трех миллиардов позиций генома человека, может оказать разрушающее влияние на фенотипические характеристики организма. Вот на каких тончайших весах взвешивается жизнь и здоровье человека. МОДЕЛИРОВАНИЕ ВЛИЯНИЯ МУТАЦИЙ: КОМПЬЮТЕРНОЕ И ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ВЛИЯНИЯ МУТАЦИИ G--->A НА СВЯЗЫВАНИЕ ТРАНСКРИПЦИОННОГО ФАКТОРА YY1 36. Описание экспериментальных данных в базе данных ТРРД Регуляторные районы генов имеют, как правило, большую длину - от тысяч до десятков тысяч пар оснований и содержат большое количество сайтов, повреждение каждого из которых может приводить к возникновению тяжелых патологий. При инициации транскрипции фермент РНК полимераза II, белки базального транскрипционного комплекса, а также различные транскрипционные факторы взаимодействуют с ДНК-сайтами, расположенными в регуляторном районе, и между собой. В результате формируется сложный ДНКбелковый комплекс, после чего начинается транскрипция гена. Несмотря на разнообразие строения регуляторных районов, большинство их особенностей можно описать в рамках предложенной нами блочноиерархической информационной модели. В ее рамках нижний уровень организации регуляторного района соответствует сайту связывания транскрипционного фактора. Одновременно работающие группы сайтов образуют регуляторные единицы иерархически более высоких уровней: композиционные элементы, энхансеры, сайленсеры и т.д. Они могут находиться на больших расстояниях от стартов транскрипции на 5'- и 3'концах генов, а также в интронах. Высший уровень иерархии соответствует системе интегральной регуляции транскрипции. БАЗА ДАННЫХ TRRD: ОРГАНИЗАЦИЯ РЕГУЛЯТОРНЫХ РАЙОНОВ ГЕНА ЧЕЛОВЕКА, КОДИРУЮЩЕГО БЕЛОК АПОЛИПОПРОТЕИН В 37. БАЗА ДАННЫХ TRRD: описание сайта связывания транскрипционного фактора Эта модель взята за основу при создании базы данных TRRD (Transcription Regulatory Regions Database). Формат описания экспериментальных данных в этой базе основан на 88 информационных полях. На этом рисунке представлено описание в базе данных ТРРД одного из сайтов в гене аполипопротеина B на основе экспериментальных данных. БАЗА ДАННЫХ TRRD: ОПИСАНИЕ САЙТА СВЯЗЫВАНИЯ ТРАНСКРИПЦИОННОГО ФАКТОРА 38. Международное сотрудничество ИЦиГ СО РАН в области информационной биологии Как говорилось в самом начале доклада, разработанные нами методы анализа и базы данных интегрированы в рамках сверхбольшой компьютерной системы GeneNetWorks - уникального информационнопрограммного ресурса, не имеющего аналогов в мировой науке. К ней проявляют большой интерес (в том числе - на коммерческой основе) зарубежные исследовательские организации и фармакологические и биотехнологические фирмы. В ряде случаев уже подписаны контракты о продаже лицензий на эту систему для проведения исследовательских и конструкторских работ. На этом рисунке приведен неполный перечень международных контактов ИЦиГ СО РАН в области информационной биологии. МЕЖДУНАРОДНОЕ СОТРУДНИЧЕСТВО ИЦиГ СО РАН В ОБЛАСТИ ИНФОРМАЦИОННОЙ БИОЛОГИИ University of Pennsylvania, Philadelphia, USA Glaxo SmithKline (GSK), England, USA Ludwig Institute for Cancer Research, Zurich, Switzerland 39. Международный интеграционный проект Крупномасштабные исследования по биоинформатике осуществляются институтами СО РАН МЕЖДИСЦИПЛИНАРНЫЙ ИНТЕГРАЦИОННЫЙ ПРОЕКТ СО РАН N65 “МОДЕЛИРОВАНИЕ ФУНДАМЕНТАЛЬНЫХ ГЕНЕТИЧЕСКИХ ПРОЦЕССОВ И СИСТЕМ” Институт цитологии и генетики СО РАН Институт вычислительной математики и математической геофизики СО РАН Институт математики СО РАН Институт вычислительных технологий СО РАН Институт теплофизики СО РАН Международный томографический центр СО РАН Руководители проекта: Проф. Н.А. Колчанов Член-корр. РАН С.С. Гончаров 40. Информационная биология Новосибирского научного центра Информационная биология Новосибирского научного центра занимает в мировой науке прочные позиции. Новосибирский научный центр является одним из центров притяжения международной активности в этой области. Информационная биология возникла в СО РАН гораздо раньше, чем на Западе. У его истоков в 60-е годы стоял выдающийся Советский ученый член-корр. АН СССР А.А.Ляпунов, 90-летний юбилей которого отмечается в этом году, а также его коллеги профессора И.А.Полетаев, М.Г.Колпаков и В.А.Ратнер. Одновременно с этим на кафедре цитологии и генетики ФЕН НГУ была начата и продолжается уже в течение 30 лет подготовка специалистов в этой области. Член-корреспондент АН СССР Алексей Андреевич Ляпунов 41. Заключение Индустриально развитые страны расходуют десятки миллиардов долларов на фундаментальные и прикладные исследования в области высоких технологий современной биологии и значительно большие средства на их практическое использование в промышленности, здравоохранении, социальной и демографической сферах, охране окружающей среды, производстве продуктов питания и т.д. О значимости и масштабах исследований в области информационной биологии свидетельствует тот факт, что только в ближайшие 4 года в индустриально развитых странах мира (США, АНГЛИЯ, ЯПОНИЯ, ГЕРМАНИЯ, ФРАНЦИЯ) в информационные технологии, ориентированные на молекулярную биологию, генетику, биотехнологию, медицину, агробиологию будет инвестировано более 30 миллиардов долларов. Расходы на биологические исследования в США составляют в настоящее время до 50% всех инвестиций в науку. Это определяется тем, что национальная безопасность любой страны зависит от владения высокими технологиями современной биологии и их практического использования в промышленности, здравоохранении, социальной и демографической сферах, охране окружающей среды, производстве продуктов питания и т.д. При этом критически важную роль в современной биологии играют инфомационная биология о некоторых задачах которой я рассказал в своем докладе. Проф. Н.А. Колчанов