На правах рукописи ПИНТУС СЕРГЕЙ СЕРГЕЕВИЧ КОМПЬЮТЕРНЫЙ АНАЛИЗ СТРУКТУРЫ И ЭВОЛЮЦИИ ФУНКЦИОНАЛЬНЫХ САЙТОВ БЕЛКА P53 03.01.09 – математическая биология, биоинформатика АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук Новосибирск — 2010 Работа выполнена в секторе компьютерной протеомики Учреждения Российской академии наук Института цитологии и генетики СО РАН, г. Новосибирск. Научный руководитель: кандидат биологических наук, доцент Иванисенко В.А. Институт цитологии и генетики СО РАН, г. Новосибирск Официальные оппоненты: доктор биологических наук Бажан С.И. Государственный научный центр вирусологии и биотехнологии «Вектор», Новосибирская обл., пгт. Кольцово кандидат биологических наук Кочетов В.А. Институт цитологии и генетики СО РАН, г. Новосибирск Ведущее учреждение: Институт молекулярной биологии имени В.А. Энгельгардта, г. Москва Защита состоится «____»_______________2010 г. на утреннем заседании Диссертационного совета по защите диссертаций на соискание ученой степени доктора наук (Д 003.011.01) при Институте цитологии и генетики Сибирского отделения РАН по адресу: 630090, г. Новосибирск, пр. академика Лаврентьева, 10. Факс: (383) 333-12-78; e-mail: dissov@bionet.nsc.ru. С диссертацией можно ознакомиться в библиотеке Института цитологии и генетики Сибирского отделения РАН. Автореферат разослан «____»_______________2010 г. Ученый секретарь Диссертационного совета, доктор биологических наук Т.М. Хлебодарова ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность работы. Основной функцией белка P53, являются предотвращение деления клеток, имеющих повреждения в своей ДНК, и участие в формировании органов у эмбрионов большинства позвоночных животных. В случае повреждения клеточной ДНК, белок P53 вызывает либо задержку клеточного цикла в одной из контрольных точек, либо вызывает апоптоз данной клетки. При этом белок может выступать как в качестве фактора транскрипции, так и активировать продукты других генов напрямую. Как правило, для задержки клеточного цикла необходима транскрипционная активность гена p53, тогда как апоптоз может проходить и посредством белок-белковых взаимодействий (Levine, 1997). Противоопухолевые функции P53 включают также его прямое участие в эксцизионной репарации ДНК (Donehower, 1997). Белок P53 также играет важную роль в эмбриональном развитии у позвоночных, регулируя пролиферацию и апоптоз клеток (Prochazkova et al, 2004). Таким образом, исследование структуры, функции и эволюции P53 является актуальным и представляет как чисто теоретический, так и прикладной интерес. Белку P53 родственны белки P63 и P73. Белки P63 и P73 способны вызывать остановку клеточного цикла и апоптоз, но имеют большее значение в эмбриогенезе, чем P53. Оба гена имеют множество функциональных продуктов альтернативного сплайсинга. Организация функциональных доменов белков P53, P63, P73 эволюционно консервативна, за исключением того, что P63 и P73 отличаются наличием C-концевого домена, обозначаемого как SAM (sterile alpha motif). На основании филогенетического анализа белков P53, P63 и P73 (Aguinaldo et al, 1997; Gerhard and Kirschner, 1997) ранее было предположено, что белок P53 произошел от предка, общего с предком белков P63 и P73, и, впоследствии, потерял SAM-домен (Saccone et al, 2002; Yang et al, 2002). При этом его функции претерпели значительную специализацию, что в работе (Yang et al, 2002) было предположительно связано с естественным отбором, направленным на уменьшение риска образования опухолей, который повышен у позвоночных, в связи с тем, что у них повышена скорость регенерации тканей. Итак, для полного понимания всех аспектов функционирования белка P53 в клетке необходимо детальное изучение структурно-функциональной организации и эволюции родственных ему белков P63 и P73. В настоящее время накоплено довольно много экспериментальных данных, представленных в электронных базах, по первичной последовательности, структуре и функции белка P53, как для человека, так и для других видов. Функциональные характеристики сайта в белке непосредственно зависят от типа входящих него аминокислот и от их пространственного расположения в третичной структуре белка. С другой стороны, на функциональные свойства сайтов белка также могут оказывать влияние аминокислоты, удаленные от этих сайтов в пространственной структуре белка. Изучение связи структуры и 1 функции белков требует рассмотрения различных аспектов их структурной организации, включающих как физико-химические, так и геометрические и конформационные свойства функциональных сайтов, а также окружающих их участков белка и всей белковой молекулы в целом. Цель и задачи исследования. Целью настоящего исследования было выявление закономерностей структурно-функциональной организации белка P53 на основе анализа пространственных структур мутантных форм белка и определения режимов его эволюции. Для достижения данной цели были поставлены следующие задачи: 1. Разработка метода предсказания функциональных сайтов белков на основе структурного выравнивания шаблонов сайтов из базы данных пространственных структур функциональных сайтов белков PDBSite с пространственными структурами анализируемых белков. 2. Разработка метода выявления участков белка, подверженных конформационным изменениям в результате мутаций, на основе статистического анализа траекторий молекулярной динамики. 3. Анализ влияния мутаций на структурно-функциональную организацию белка P53 с помощью моделирования пространственных структур его мутантных форм и разработанных методов предсказания функциональных сайтов, а также определения участков белка, подверженных статистически значимым конформационным изменениям в результате мутаций. 4. Изучение влияния естественного отбора на эволюционную историю и структуру белка P53: поиск этапов движущего отбора в эволюционной истории белков P53, P63, P73, определение в кодирующих последовательностях соответствующих генов позиций, замены в которых давали кодируемым белкам селективное преимущество. 5. Сравнительный анализ частот аминокислотных замен, приходящихся на позиции белка P53, подверженные различным режимам естественного отбора. Научная новизна. Разработан метод оценки влияния мутаций на конформационные свойства белков на основе анализа траекторий молекулярной динамики с помощью метода Z-статистики. Предложенный подход является новым и ранее не применялся другими авторами. Впервые предположено возникновение нового функционального сайта связывания катиона цинка в мутантной форме белка P53 человека, возникающей в результате аминокислотной замены G245С. Предположен новый механизм влияния данной замены на функцию соответствующей мутантной формы белка. Механизм основан на предположении, что катион цинка может смещаться из нормального положения во вновь образованный сайт, нарушая конформационные свойства белка. Впервые обнаружено выраженное действие стабилизирующего отбора против мутантных форм белка P53 с фенотипическим эффектом приобретения функции. Положения, выносимые на защиту. 1. Разработан метод анализа конформационных различий между мутантными и нормальной формой белка, основанный на методе молекулярной динамики и статистическом анализе траекторий молекулярной динамики с 2 помощью Z-статистики. Метод позволяет оценивать влияние мутаций на конформацию отдаленных участков белков. 2. Возникновение новых потенциальных сайтов связывания катиона цинка в мутантных формах белка P53 человека обусловлено аминокислотными заменами G245С и G245D. Связывание иона цинка новыми сайтами, обеспечивает изменение конформационных различий ДНК-связывающего мотива между мутантными формами и нормальной формой белка P53. 3. Получены свидетельства движущего отбора в эволюционной истории семейства P53. Установлено выраженное действие стабилизирующего отбора против мутантных форм белка P53 с фенотипическим эффектом приобретения функции. Практическая значимость. Полученные результаты по анализу молекулярных механизмов нарушения функции мутантных форм белка P53 могут быть использованы при создании противоопухолевых лекарственных препаратов, направленных на коррекцию возникшего сайта связывания катиона цинка. Такой подход к фармакологической коррекции генетических нарушений может быть применен и к другим заболеваниям, вызванных возникновением новых сайтов в мутантных белках. База данных функциональных сайтов белков может использоваться при решении широкого круга задач функциональной аннотации белков, планировании генно-инженерных экспериментов и конструировании лекарственных препаратов. Широкое применение также может найти предложенный в работе метод оценки влияния мутаций на конформационные свойства белков. В частности с помощью таких оценок могут планироваться эксперименты по получению белков с повышенной стабильностью, а также заранее заданной функцией. Апробация работы. Результаты работы были представлены автором на следующих российских и международных конференциях: «BGRS’III-VI – International Conference on Bioinformatics of Genome Regulation and Structure» (Новосибирск, 2002, 2004, 2006, 2008), «MCCMB’2005 - International Moscow Conference On Computational Molecular Biology» (Москва, 2005), «МНСК’20032006 – Международная научная студенческая конференция» (Новосибирск, 2003-2006). Публикации. По теме диссертации опубликованы две работы в рецензируемых зарубежных журналах и две работы в рецензируемых отечественных журналах, рекомендованных ВАК, а также две статьи в рецензируемых коллективных монографиях и девять сообщений в трудах научных конференций. Вклад автора. Основные результаты получены автором самостоятельно. Автором непосредственно был проведен компьютерный анализ молекулярной эволюции семейств P53, P63, P73, проанализировано влияние естественного отбора на мутантные формы белка с различным фенотипическим проявлением. Автором было предсказано возникновение новых функциональных сайтов связывания катиона цинка в мутантных структурах белка P53 человека, соответствующих аминокислотным заменам G245С и G245D. Механизм влияния замены G245С на структуру белка был предложен автором совместно с В.А. 3 Иванисенко. Автором непосредственно было проведено исследование влияния замен G245C и G245D белка P53 на конформацию мутантных форм методом молекулярной динамики. Методы пространственного выравнивания функциональных сайтов с пространственными структурами белков на основе генетического алгоритма, совмещения фрагментов белковых структур на основе алгоритма поиска наилучшего вращения, автоматической классификации функциональных сайтов белков разработаны автором совместно с В.А. Иванисенко. Структура и объем работы. Диссертационная работа состоит из введения, обзора литературы, описания материалов и методов исследований, раздела “Результаты и обсуждение”, заключения, выводов, библиографического списка (164 источника). Работа изложена на 154 страницах машинописного текста, включает 48 формул, 13 таблиц и 11 рисунков. МАТЕРИАЛЫ И МЕТОДЫ Филогенетический анализ. Проводился филогенетический анализ для каждого из белковых семейств P53, P63, P73 по отдельности, а также для всей группы P53/P63/P73. Кодирующие нуклеотидные последовательности генов и аминокислотные последовательности белков были взяты из базы данных EMBL/Genbank, версия 81. Выравнивания аминокислотных последовательностей были проведены с помощью программы ClustalW, версия 1.7 (Thompson et al, 1994). Были построены филогенетические деревья с помощью программы PhyML, версия 2.4.4 (Guindon and Gascuel, 2003), реализующей метод максимального правдоподобия. Был проведен поиск аминокислот, подверженных движущему отбору, с помощью программы codeml из пакета PAML, версия 3.14 (Yang, 1997). Поиск новых функциональных сайтов в мутантных формах белка P53. Проводился поиск функциональных сайтов в мутантных формах белка P53 с помощью веб-сервера PDBSiteScan (Ivanisenko et al, 2004), на основе сходства пространственных структур исследуемого белка и шаблона функционального сайта из базы PDBSite. Структуры мутантных форм белка P53 были получены в результате предсказания по гомологии с помощью сервера SWISS-MODEL (Schwede et al, 2003). Молекулярная динамика. Моделирование молекулярной динамики комплексов мутантных форм ДНК-связывающего домена белка P53 с ионом цинка, а также тех же мутантных форм, свободных от иона, проводилось с помощью пакета Gromacs 3.3.2 с использованием явной модели воды TIP4P. Начальное положение иона цинка в структурах комплексов белок-цинк задавалось таким, каким оно было получено в результате предсказания сайта связывания цинка в данной мутантной форме. Взаимодействие иона цинка с атомами сайта моделировалось посредством задания химических связей (т.н. bonded approach), по аналогии с работой (Hwangseo and Kenneth, 2004). Кулоновский заряд иона цинка был положен равным +0,67 Кл, согласно квантово-химическим расчетам (Hoops et al, 1991). 4 С использованием критерия Z-статистики был проведен статистический анализ полученных траекторий молекулярной динамики мутантных форм G245C и G245D белка P53, по сравнению с нормальной формой белка. Анализ был проведен отдельно для комплексов мутантных форм, в которых цинк был связан аминокислотами нормального сайта и для комплексов этих же форм, в которых цинк был связан аминокислотами сайтов, возникающих в результате мутаций, а также для этих же форм белка, не связанных с ионом цинка. Для каждого из двух комплексов обеих мутантных форм (всего 4 структуры) и для каждой мутантной формы, свободной от иона (2 структуры) а также для нормальной формы, как свободной, так и связанной с Zn2+, проводился расчет по 12 траекторий молекулярной динамики, различающихся между собой распределениями начальных скоростей атомов (итого 8 расчетов по 12 траекторий). Для каждой из 6-ти структур мутантных форм каждая из 12 траекторий сравнивалась со статистикой из 12 траекторий, вычисленных для нормальной формы. При этом, комплексы мутантных форм сравнивались с комплексом нормальной формы, а мутантные формы, свободные от цинка, сравнивались с нормальной формой, свободной от цинка. Для каждого Сα-атома ДНКсвязывающего домена каждой структуры мутантной формы белка P53 и для каждой из 30 последних пикосекунд молекулярной динамики вычислялось значение Z-статистики координат этого атома. Далее, полученные для каждого Сα-атома значения усреднялись по 30-ти пикосекундам динамики. Поскольку такой анализ проводился для каждой из 12 траекторий структуры мутантной формы, каждое из полученных в результате усреднения значений усреднялось еще раз, по 12 траекториям. Таким образом, строился профиль значений критерия Z-статистики по аминокислотным позициям ДНК-связывающего домена белка P53 для каждого из комплексов мутантных форм и для каждой мутантной формы, свободной от иона. Анализ частот мутаций. Данные литературных источников по влиянию различных аминокислотных замен, соответствующих наследуемым в поколениях и возникающим de novo мутациям, на функцию белка в клетке, т.е на фенотипическое проявление мутантных аллелей гена p53, взяли из 9-й версии базы данных IARC TP53 Database (Olivier et al, 2002). В настоящей работе рассматривались следующие фенотипические проявления мутаций: эффект сохранения, потери, приобретения функции, а также доминатно-негативный эффект. Для каждого их этих четырех эффектов, с помощью статистического метода многопольных таблиц и критерия χ2 Пирсона, определялось, подвержены ли мутации с данным фенотипическим проявлением элиминированию под действием стабилизирующего отбора. Для этого подсчитывалось количество мутаций, отдельно для каждого из четырех типов, затрагивающих аминокислотные сайты белка P53, которые в результате исследования эволюции P53 были определены как подверженные стабилизирующему отбору. Реконструкция предковых последовательностей и анализ адаптивных замен. Реконструкция предковых последовательностей белка P53 проводилась с помощью программы ANCESCON (Cai et al, 2004). Проводилась реконструкция предковых аминокислот белка P53, которые в результате исследования 5 эволюции P53 были определены как подверженные движущему отбору, а также предковых аминокислот белка P53 и ингибирующей его убиквитин-лигазы MDM2, участвующих в связывании этих белков. Для аминокислотных сайтов белков P53 и MDM2, в которых на некотором этапе истории видообразования позвоночных фиксировались замены аминокислот, было проведено сравнение между изменениями физикохимических свойств этих аминокислот белка P53 и изменениями тех же физикохимических свойств аминокислот белка MDM2 на данном этапе истории видообразования. Для каждого этапа видообразования был проведен поиск таких пар замен, что одна замена в белке P53 изменяла физико-химические свойства аминокислоты некоторым образом, а другая замена в белке MDM2 изменяла те же физико-химические свойства аминокислоты в противоположную сторону. Такие замены рассматривались как потенциально компенсаторные. Особое внимание уделялось аминокислотным заменам в области контакта белков P53 и MDM2 в комплексе P53-MDM2. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ Методы, разработанные для исследования структуры функциональных сайтов белков. Разработан метод поиска функциональных сайтов в пространственных структурах белков, основанный на сравнении фрагментов пространственной структуры белка с пространственными структурами шаблонов функциональных сайтов из базы PDBSite (Ivanisenko et al, 2005). Для оптимизации поиска метод использует генетический алгоритм. Для нахождения наилучшего совмещения пространственных структур сайта и шаблона метод использует алгоритм поиска наилучшего совмещения векторов (Kabsch, 1976) и критерий среднеквадратичного отклонения координат RMSD (McLachlan, 1979). Разработан метод автоматической классификации функциональных сайтов базы PDBSite по химической природе лиганда. Активные центры ферментов классифицировались согласно четырехзначному номеру классификации фермента, а также типу сайта (каталитический, структурный), представленному в поле описания сайта — «SITE_DESCR». Для распознавания функциональных сайтов остальных типов использовались ключевые слова из поля описания сайта. Тип функционального сайта, полученный в результате классификации, заносился в поле «SITE_TYPE» базы PDBSite. Значения этого поля используются программой PDBSiteScan (Ivanisenko et al, 2004) для поиска сайтов заданного типа. Поиск функциональных сайтов в пространственной структуре белка P53. В предсказанных структурах мутантных форм P53, соответствующих заменам G245C и G245D, ассоциированных с наследственным синдромом ЛиФраумени, в результате поиска функциональных сайтов были найдены потенциальные сайты связывания иона Zn2+, включающие в себя аминокислоты, не характерные для нормального сайта связывания цинка в белке P53, а также было предсказано положение иона Zn2+ в найденных потенциальных сайтах (табл. 1). 6 Таблица 1. Мутации в белке P53, приводящие к появлению потенциальных сайтов. Замена PDBSITE ID Последовательность сайта RMSD, Å G245D 1W5MBC4 242C 245D 176C 0.97 G245C 1E51ZN 242C 245C 176C 0.83 норма 1GZHZN1 176C 179H 238C 242С 0.05 Согласно проведенному предсказанию, в мутантных формах G245C и G245D потенциальный сайт связывания Zn2+ располагается в кармане нормального сайта связывания Zn2+. Также было предсказано смещение положения связанного иона цинка в потенциальных сайтах мутантных форм относительно нормальной формы белка (рис. 1). На основании результатов предсказания был предположен механизм влияния функционирования найденных потенциальных сайтов на функцию белка P53, основанный на конкуренции найденных потенциальных сайтов с нормальным сайтом за ион цинка. А Б Рисунок 1. Относительное расположение потенциального сайта связывания Zn2+, найденного для замен G245D (А), G245C (Б) и сайта связывания Zn2+, характерного для нормальной формы белка P53. Зеленым показаны аминокислоты потенциальных сайтов мутантных форм. Синим показаны аминокислоты сайта связывания цинка нормальной формы P53. Шарики показывают положение Zn2+ в нормальном (синий) и потенциальных (зеленый) сайтах. Анализ конформационных различий мутантных и нормальной форм белка P53. Сравнение сходства и различий между профилями Z-статистики мутантных форм белка, не связанных с ионом цинка, со сходством и различиями между профилями комплексов мутантных форм, находящихся комплексе с ионом, позволяет сделать вывод, что замены G245C и G245D, встречающиеся при синдроме Ли-Фраумени, в белке P53 оказывают существенное влияние на конформацию сайта связывания ДНК. Связывание иона цинка частично компенсирует влияние замен на конформацию некоторых структурных фрагментов мотива связывания ДНК, тогда как влияние замен на конформацию сайта связывания ДНК у мутантных форм, не связанных с ионом, достаточно выражено. Особенно стоит отметить C- 7 концевую α-спираль мотива «петля-лист-спираль», также называемого LSH (loop-sheet-helix), которая находится в сходной конформации у всех четырех исследованных комплексов, но имеет различную конформацию у мутантных форм, свободных от иона. Конформации мутантных форм G245C и G245D, свободных от иона цинка, в наибольшей степени различаются в области мотива «петля-листспираль» или LSH, участвующего в связывании большой бороздки ДНК, и структурной петли L3, связывающей малую бороздку ДНК (рис. 2). Петля и β-лист мотива LSH α-спираль мотива LSH Петля L3 Рисунок 2. Домен связывания ДНК белка P53. Синим выделены структурные элементы сайта связывания ДНК, конформация которых затронута мутациями. Сравнение профилей Z-статистики отклонения от нормы атомов основной цепи двух мутантных форм показывает, что обе замены влияют на конформацию сайта связывания ДНК. Тем не менее, замена G245C, в отличие от замены G245D, не проявляет значимого влияния на конформацию α-спирали, связывающей ДНК. В противоположность этому, петля L3, связывающая большую бороздку ДНК, подвержена влиянию именно замены G245C (рис. 3). Z-критерий 4 петля L3 G245D G245C 2 Z-критерий 0 238 239 240 241 242 243 244 245 246 247 номер аминокислоты 2 β-лист мотива LSH 1 -1 133 Z-критерий G245D G245C 0 4 134 135 137 номер аминокислоты 136 α-спираль мотива LSH 2 0 275 G245D G245C 277 279 281 283 285 287 289 291 номер аминокислоты Рисунок 3. Профили Z-статистики для аминокислот структурных элементов белка P53, свободного от иона цинка, конформация которых изменяется в результате аминокислотных замен G245C и G245D. 8 Таким образом, профили Z-статистики позволяют предположить, что в белке P53 конформационная подвижность кармана связывания цинка оказывает аллостерическое влияние на сайт связывания ДНК. Конформации мутантных форм G245C и G245D, связывающих ион цинка в нормальном и потенциальном сайтах, в наибольшей степени различаются в области структурной петли L2, непосредственно участвующей в связывании иона цинка. Это согласуется с общим представлением, что связывание иона цинка влияет на конформацию петли L2 (рис. 4). Z-критерий 6 петля L2 G245C нормальный сайт G245C потенциальный сайт G245D нормальный сайт G245D потенциальный сайт 4 2 0 -2 160 Z-критерий 2,5 165 170 175 180 185 190 195 петля L3 1,5 0,5 -0,5 Z-критерий -1,5 238 239 240 241 242 243 244 245 246 247 1 β-лист мотива LSH 0 -1 133 Z-критерий 7 134 135 136 137 номер аминокислоты G245C нормальный сайт G245C потенциальный сайт G245D нормальный сайт G245D потенциальный сайт номер аминокислоты G245C нормальный сайт G245C потенциальный сайт G245D нормальный сайт G245D потенциальный сайт номер аминокислоты α-спираль мотива LSH 5 G245C нормальный сайт G245C потенциальный сайт G245D нормальный сайт G245D потенциальный сайт 3 1 -1 275 277 279 281 283 285 287 289 291 номер аминокислоты Рисунок 4. Профили Z-статистики для аминокислот структурных элементов белка P53, связанного с ионом цинка, конформация которых изменяется в результате аминокислотных замен G245C и G245D. Из профиля Z-статистики видно, что, в случае связывания иона цинка нормальным сайтом, конформация петли L2 подвержена влиянию обеих замен в гораздо меньшей степени, нежели в случае связывания иона потенциальными сайтами. Это позволяет сделать вывод, что связывание иона цинка потенциальными сайтами приводит к отклонению конформации домена связывания ДНК от нормы. Согласно профилям Z-статистики (рис. 4), влияние мутаций G245C и G245D на конформацию сайта связывания ДНК в белке, связанном с ионом 9 цинка, заметно отличаются от влияния этих же мутаций на конформацию сайта связывания ДНК в белке, свободном от иона цинка. Интересно, что конформация петли L3 не подвержена значимому влиянию замены G245D, независимо от того, связан ион цинка нормальным или потенциальным сайтом. Напротив, замена G245C, в случае связывания иона цинка потенциальным сайтом, значимо изменяет конформацию петли L3, связывающей ДНК (по сравнению с нормальной формой белка, связанной с ионом цинка), в то время как, в случае связывания цинка нормальным сайтом, конформация петли L3 мутантной формы G245C сходна с конформацией, характерной для нормальной формы белка P53, связанного с ионом цинка. Также, в случае связывания иона цинка мутантными формами, α-спираль, связывающая большую бороздку ДНК, подвержена сильному влиянию обоих замен, вне зависимости от положения иона цинка (рис. 4). Тем не менее, замена G245C, в случае связывания иона цинка в нормальном сайте, оказывает наименьшее влияние на конформацию α-спирали мотива «петля-лист-спираль» белка, связанного с ионом. Полученные результаты свидетельствуют в пользу того, что влияние замен в кармане связывания иона цинка G245C и G245D проявляется, в основном, в изменении конформации сайта связывания ДНК, необходимого для выполнения белком функции задержки пролиферации клетки. Кроме того, из полученных результатов следует, что влияние замен на сайт связывания ДНК, в случае связывания иона цинка нормальным сайтом, ниже, чем в случае связывания его потенциальными сайтами, возникающими в результате замен. Тем не менее, связывание иона цинка, как нормальным сайтом, так и потенциальными сайтами, частично компенсирует влияние замен на конформацию сайта связывания ДНК, то есть стабилизирует его. Молекулярная эволюция белка P53 и родственных ему белков P63 и P73. Адаптивная эволюция семейства белков P53. В результате применения модели движущего отбора в кодирующей последовательности гена p53 были обнаружены позиции, в которых происходили преимущественно несинонимичные замены. В белке P53 человека этим позициям соответствуют аминокислотные остатки 6S, 35L, 38Q, 47P, 51E, 52Q, 59G, 65R, 73V, 106S, 129A. Всего в результате применения этой модели было обнаружено 85 консервативных аминокислот, 297 аминокислот, подверженных нейтральному режиму эволюции и 11 аминокислот, подверженных движущему отбору, что составило для человеческого белка P53 21,63%, 25,57% и 2,8%, соответственно. Было обнаружено, что аминокислота 245G, для замен которой в белке P53 человека было обнаружено возникновение потенциальных сайтов связывания Zn2+, высоко консервативна, также как и аминокислоты, входящие в сайт связывания иона Zn2+ у человека: 176C, 179H, 238C, 242C. Аминокислотные остатки 106S и 129A участвуют в образовании структурных петель в белке P53. Петля, содержащая 106S, связывает неструктурный участок 105S – 104Q с β-листом 110R – 112G, а петля L1, содержащая 129A, соединяет β-листы 124C – 127S и 132K – 135C, которые входят в число 9-ти β-листов, образующих структурный «бочонок» (β-barrel), 10 который несет на себе основные структурные компоненты ДНК-связывающего домена – сайт связывания с ДНК и регулирующий его работу сайт связывания цинка. Аминокислотные замены в позициях 106 и 129, таким образом, могли влиять на пространственную структуру «бочонка» и, как следствие, на особенности работы ДНК-связывающего домена в ходе эволюции. Полученные результаты также свидетельствуют о мощном стабилизирующем отборе по аминокислоте 245G в белке P53. Это согласуется с ассоцированностью генеративных замен по этой позиции с развитием опухолей, в частности семейным синдромом Ли-Фраумени, а также с полученным результатом по возникновению в мутантных формах G245C и G245D потенциальных сайтов связывания цинка. Физико-химические свойства адаптивных замен. Проводился анализ физико-химических свойств аминокислотных замен, происходивших во время образования различных видов, в том числе замен, затрагивающих аминокислотные сайты, вообще подверженные движущему отбору в эволюционной истории белка P53. Для нескольких аминокислотных сайтов трансактивационного домена, в которых происходили мутации на стадии происхождения амниот, характерна коадаптация с аминокислотными сайтами белка MDM2, с которым физически взаимодействует трансактивационный домен белка P53. Эти аминокислотные сайты относятся к участкам взаимодействия белков P53 и MDM2, что позволяет предположить, что часть эволюционных изменений в белке P53 может быть объяснена коадаптацией функциональных сайтов белок-белковых взаимодействий. Адаптивная эволюция семейства белков P63. Были получены свидетельства того, что в эволюционной истории белка P63 происходил движущий отбор на стадии дивергенции амниот. Были найдены позиции кодирующих последовательностей, подверженные движущему отбору на данном этапе эволюционной истории белка P63. На основании предсказания вторичной структуры белка P63 было обнаружено, что большинство аминокислот (13 из 17ти), подверженных движущему отбору, входят в состав неструктурных элементов белка P63. Это может быть объяснено большей подвижностью неструктурных элементов (петель, поворотов), по сравнению со структурными элементами (спиралями, листами). Изменение конформационной подвижности этих элементов, в результате мутаций, в свою очередь, может влиять на относительное положение в пространстве соединяемых ими структурных элементов белка, не разрушая его. Такое изменение структуры белка может оказаться выгодным, и соответствующая мутация может зафиксироваться в результате движущего отбора. Адаптивная эволюция семейства белков P73. Было обнаружено, что эволюция белка P73 сопровождалась движущим отбором на стадии дивергенции общего предка хищников и непарнокопытных. В последовательности белка P73 были найдены две аминокислоты, подверженные движущему отбору. На основании предсказания вторичной структуры белка P73 было обнаружено, что обе аминокислоты относятся к неструктурным элементам, что является дополнительным свидетельством в пользу движущего отбора по этим аминокислотам, аналогично белку P63. 11 Филогенетический анализ группы семейств P53, P63 и P73 в целом. Для всей группы семейств P53, P63 и P73 было построено общее филогенетическое древо (рис. 5). Из полученного филогенетического древа видно, что со времени радиации тетрапод P63 и P73 накапливали сравнительно немного мутаций, тогда в белке P53 за это же время фиксировалось заметно больше мутаций. Увеличение скорости фиксации замен в белке P53 на стадии радиации тетрапод, обусловленной выходом позвоночных на сушу, может быть связано с усилением роли P53 как супрессора опухолей, что было необходимо для выживания организмов в новой, богатой кислородом, а следовательно, более агрессивной, по сравнению с водной, средой обитания. Также из рис. 5 следует более высокая скорость фиксации замен в белке P73, по сравнению с белком P63, на ранних стадиях эволюционной истории, что может быть объяснено специализацией белка P73 на выполнении функций гомеостаза. Это позволяет предположить, что естественный отбор, направленный на усиление гомеостаза, был причиной обособления белка P73. замен на одну аминокислоту Рисунок 5. Филогенетическое древо белков P53, P63 и P73. 12 Частоты встречаемости наследуемых мутаций гена p53, имеющих различное фенотипическое проявление, в консервативных позициях его кодирующей последовательности. Оценивалось, против какого из фенотипических эффектов мутаций гена p53 направлен наиболее мощный стабилизирующий отбор, для чего сравнивались частоты наследуемых (генеративных) и возникающих de novo (соматических) мутаций, аннотированных в базе данных IARC (Olivier et al, 2002). Для наследуемых (генеративных) мутаций кодирующей последовательности гена p53, а также мутаций, возникающих de novo в кодирующей последовательности p53 (соматических), было подсчитано, с какой частотой те и другие мутации изменяют аминокислотные позиции белка P53, подверженные стабилизирующему отбору, в зависимости от фенотипического проявления этих мутаций. Для статистического анализа предрасположенности мутаций с различным фенотипическим проявлением к аминокислотным позициям, подверженным стабилизирующему отбору, использовался критерий χ2 Пирсона для многопольных таблиц. Значение критерия χ2, рассчитанное для различий между заменами потери, приобретения функции и заменами с доминантно-негативным эффектом, составило 4.47 (p < 0,11, df = 2), то есть различия недостоверны. Тем не менее, из рис. 6 видно, что различия между частотами соматическими и генеративными мутаций, приходящихся на аминокислотные позиции, подверженные стабилизирующему отбору, наиболее заметны для эффекта приобретения функции. 90 80 70 60 50 40 30 20 10 0 генеративные соматические потери приобр. дом.-нег. Рисунок 6. Гистограмма частот мутаций потери, приобретения функции, а также мутаций с доминантно-негативным эффектом, приходящихся на аминокислотные позиции, подверженные стабилизирующему отбору, в процентах от общего числа мутаций с данным фенотипическим эффектом. ВЫВОДЫ 1. Разработаны новые методы поиска и автоматической классификации функциональных сайтов в третичных структурах белков на основе генетического алгоритма и структурного выравнивания сайтов из базы данных PDBSite. Проведена классификация сайтов в базе данных PDBSite, 13 2. 3. 4. 5. 6. которая включает: активные центры ферментов, сайты связывания ионов металлов, низкомолекулярных соединений, белков, РНК, ДНК, сайты посттрансляционной модификации белков. Разработан новый метод анализа конформационных различий между нормальной и мутантными формами белка, основанный на методе молекулярной динамики и статистическом анализе траекторий молекулярной динамики с помощью Z-статистики. Метод позволяет оценивать влияние мутаций на конформацию отдаленных участков белков. С помощью разработанных методов предсказано возникновение нового сайта связывания иона цинка в результате мутаций, вызывающих замены G245C и G245D в белке P53, ассоциированные с синдромом Ли-Фраумени и рядом других опухолевых заболеваний. Новый сайт располагается в непосредственной близости от нормального цинк-связывающего сайта и, предположительно, может конкурировать с ним за связывание иона цинка — аллостерического регулятора связывания ДНК белком P53. Показано, что наибольшее влияние замены G245C и G245D оказывают на конформацию удаленных участков белка, расположенных в ядре домена связывания ДНК. Эти данные указывают на то, что механизм действия мутаций G245C и G245D реализуется через изменение конформационных свойств ДНК-связывающего домена белка P53. Показано, что связывание иона цинка с новым сайтом обеспечивает уменьшение конформационных различий ДНК-связывающего мотива в мутантной и нормальной форме белка P53, что служит дополнительным свидетельством функциональности нового сайта. Впервые обнаружено, что в белке P53 движущему отбору подвергались позиции, соответствующие аминокислотным остаткам S106 и A129, важным для функциональных перестроек конформации при взаимодействии белка P53 c ДНК. В результате сравнительного анализа частот различных аминокислотных замен, приходящихся на кодоны с различными режимами отбора, установлено, что наиболее жесткий стабилизирующий отбор направлен против мутаций с эффектом приобретения функции. СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ В РЕЦЕНЗИРУЕМЫХ ИЗДАНИЯХ: 1. Ivanisenko V.A., Pintus S.S., Grigorovich D.A., Kolchanov N.A. PDBSiteScan: a program for search of the active, binding and posttranslational modification sites in the 3D structures of proteins // Nucleic Acids Research. 2004. V.32. P.W549-W554. (Перечень ВАК) 2. Ivanisenko V.A., Pintus S.S., Grigorovich D.A., Kolchanov N.A. PDBSite: a database of the 3D structure of protein functional sites // Nucleic Acids Research. 2005. V.33. P.D1-D5. (Перечень ВАК) 14 3. Пинтус С.С., Фомин Э.С., Иванисенко В.А., Колчанов Н.А. Филогенетический анализ семейства p53 // Биофизика. 2006. Т.51. С.640649. (Перечень ВАК) 4. Pintus S.S., Fomin E.S., Oshurkov I., Ivanisenko V.A. Phylogenetic analysis of the p53 and p63/p73 gene families // In Silico Biology. 2007. V.7 P.319-332. 5. Пинтус С.С. Коэволюция доменов ключевых белков апоптоза p53 и mdm2 // Информационный вестник ВОГиС. 2009. Т.13. №1 C.128-136. (Перечень ВАК) 6. Ivanisenko V.A., Debelov V.A., Pintus S.S., Matsokin A.M., Nikolaev S.V., Grigorovich D.A., Kolchanov N.A. PDBSitescan: a tool for search for the bestmatching superposition in the database PDBSite. Proceedings of the third international conference on bioinformatics of genome regulation and structure. V.3. Novosibirsk: IC&G. 2002. p.150. 7. Pintus S.S., Ivanisenko V.A. A molecular mechanism for the structurefunctional alterations in mutant forms of human p53 protein. Proceedings of the fourth international conference on bioinformatics of genome regulation and structure. V.1.Novosibirsk: IC&G. 2004. p.338 8. Ivanisenko V.A., Pintus S.S., Krestyanova M.A., Demenkov P.S., Znobisheva E.K.,Ivanov E.E., Grigorovich D.A. PDBSite, PDBLigand and PDBSiteScan: a computational workbench for the recognition of the structural and functional determinants in protein tertiary structures combined with protein draft docking. Proceedings of the fourth international conference on bioinformatics of genome regulation and structure.V.1. Novosibirsk: IC&G. 2004. p.269. 9. Pintus S.S., Ivanisenko V.A. Phylogenetic analysis of the p53 and p63/p73 gene families. Proceedings of the fifth international conference on bioinformatics of genome regulation and structure.V.1. Novosibirsk: IC&G. 2006. p.207. 10. Pintus S.S., Ivanisenko V.A. Coevolution of protein domains of p53 and mdm2 – key proteins of apoptosis. Proceedings of the sixth international conference on bioinformatics of genome regulation and structure. Novosibirsk: IC&G. 2008. p.188. Благодарности: Автор выражает благодарность сотрудникам отдела системной биологии ИЦиГ СО РАН и лично научному руководителю В.А. Иванисенко, а также Н.А. Колчанову, Н.Л. Подколодному, К.В. Гунбину, В.В. Суслову, С.В. Николаеву, Э.С. Фомину и И.И. Титову за плодотворные дискуссии и сотрудничество; Н.Л. Подколодному за всестороннюю помощь в предоставлении доступа к вычислительным мощностям СО РАН и НГУ; Д.А. Афонникову, А.В. Катохину, А.В. Кочетову, С.И. Бажану и И.В. Макунину за ценные критические замечания; А.Н. Фадеевой за профессиональный перевод на английский язык текстов статей, опубликованных по теме диссертации; Л.П. Кондриной, Л.В. Шумной и Т.М. Хлебодаровой за помощь в подготовке документов. 15