КАК ПОСТРОИТЬ БЕЛОК: В ПОИСКАХ РЕШЕНИЯ МОЛЕКУЛЯРНОЙ ГОЛОВОЛОМКИ №1, 2006 год Доктор физико-математических наук А. ФИНКЕЛЬШТЕЙН, заведующий лабораторией физики белка Института белка РАН, профессор МГУ, лауреат Государственной премии 1. Охарактеризуйте, пожалуйста, состояние области науки, в которой вы работаете, каким оно было примерно 20 лет назад? Какие тогда проводились исследования, какие научные результаты явились самыми значительными? Какие из них не потеряли актуальности на сегодняшний день (что осталось в фундаменте здания современной науки)? 2. Охарактеризуйте сегодняшнее состояние той области науки и техники, в которой вы трудитесь. Какие работы последних лет вы считаете самыми главными, имеющими принципиальное значение? 3. На какие рубежи выйдет ваша область науки через 20 лет? Какие кардинальные проблемы, по-вашему, могут быть решены, какие задачи будут волновать исследователей в конце первой четверти XXI века? Авторитетные ученые - авторы "Науки и жизни" продолжают присылать в редакцию свои ответы. Это отрадно и, главное, позволяет надеяться на то, что есть все основания для пересмотра официальной оценки прошлых и настоящих достижений отечественной науки. В России есть и должна быть национальная наука. По-видимому, ограничивать перспективы участия России в мировом научно-техническом прогрессе все-таки нельзя. Моя специальность - физика белка и отчасти биоинформатика - в той мере, в которой она, как и физика белка, изучает строение белковых молекул, их взаимодействия и структурные превращения. Исследование структур белков, начало которого связано со славными именами Э. Фишера, Дж. Бернала, Д. Ходжкин, Л. Полинга, Ф. Сэнгера, Ф. Крика, М. Перутца, Дж. Кендрью, начало приносить свои плоды в середине ХХ века. Тогда впервые определили химическую структуру белка - инсулина, то есть прочли индивидуальную, диктуемую геном последовательность аминокислот в полимерной цепи, образующей этот белок. Потом расшифровали пространственные структуры других белков - гемоглобина и миоглобина - и увидели, как расположены в пространстве тысячи атомов их полимерных цепей, каждая из которых имеет компактную, "глобулярную" форму. Природная ("нативная") пространственная структура каждого белка уникальна, без нее белок "не работает". Конформации белковых глобул оказались чрезвычайно сложными, но при этом обладающими уникальной способностью к спонтанной самоорганизации "в пробирке" (К. Анфинсен, 1961). Если белковую цепь, не повреждая, "развернуть", то есть разрушить ее компактную укладку каким-либо растворителем, то после удаления растворителя цепь сама собой свернется и обретет прежнюю пространственную структуру. Это означает, что продиктованная геном аминокислотная последовательность белковой цепи самостоятельно определяет свою уникальную пространственную конфигурацию - а тем самым и свою биологическую функцию. Явление самоорганизации казалось столь же загадочным, как если бы клубок ниток при одной пестрой раскраске самостоятельно превращался бы в рубашку, а при другой - в брюки. Физика белка возникла на стыке физики, молекулярной биологии и химии и "осознала саму себя" в 1960-годы, когда опыты К. Анфинсена и потом Р. Меррифилда принципиально отделили физический процесс - спонтанную самоорганизацию, или "сворачивание" белка - от биохимического синтеза белковой цепи. Физика белка появилась в попытке сначала поставить, а потом ответить на следующие фундаментальные вопросы: - Как белковая цепь находит свою уникальную "рабочую" архитектуру? - Какие пространственные структуры присущи белкам? - Как предсказать пространственное строение белка, зная лишь химическую структуру его гена? - Как "работают" белки? За сорок лет своего существования физика белка не только наметила ответы на эти вопросы, но и поставила ряд новых, например: "В каких физических состояниях может находиться белковая цепь?", "Как повлиять на работу белка в нужном направлении?", "Какую аминокислотную последовательность надо сделать для того, чтобы обрести желаемую пространственную структуру и функцию белка?". Она также внесла весомый вклад в другие науки (биохимию, биофизику, материаловедение, вычислитель ную математику, молекулярную биологию, энзимологию и фармакологию), способствовала появлению новых научных направлений (белковой инженерии, биоинформатики, протеомики, нанотехнологии), новых методов конструирования лекарств и т.д. Российская школа физики белка основана моим учителем, Олегом Борисовичем Птицыным, одним из организаторов Института белка АН СССР. К середине 1960-х он успел - вместе со своим учителем М. В. Волькенштейном - заложить основы современной теоретической физики полимеров, послужившей фундаментом физики белка, этого сложнейшего "живого" полимера. Важнейший вклад в рождение физики белка внес и глава другой лаборатории Института белка, Петр Леонидович Привалов: он доказал, что плавление белков, несмотря на всю их сложность и неоднородность, сходно с плавлением простых кристаллов. 1. Итак, что происходило в физике белка и вокруг нее лет 20 назад? Число расшифрованных пространственных структур белков тогда было все еще невелико: за 25 лет, прошедших после расшифровки первой из них, оно едва перевалило за сотню, так как рентгеноструктурный анализ требует предварительной очень трудоемкой процедуры выращивания белковых кристаллов, а ядерная магнитная спектроскопия белков только появляется. Однако аминокислотные и кодирующие их нуклеотидные последовательности ДНК расшифровываются уже тысячами: появились автоматизированные методы их определения. Накопленная информация пополняет быстро растущие банки компьютерных данных по структурам биологических макромолекул; потребность в эффективном использовании этой огромной массы данных приводит к появлению новой области науки - биоинформатики. Выясняется, что белки, совсем разные и по биохимической функции, и по аминокислотной последовательности (то есть не родственные по химической, заданной геном структуре и происхождению), часто имеют сходные пространственные структуры, и наоборот: сходная работа совершается порой белками с совсем разной архитектурой. Из этого делаются два важных вывода. (1) Функция белка обычно определяется не всей его архитектурой, а устройством ее небольшого фрагмента - активного центра. Дело остальной части белка - быть для этого функционального участка надежным, твердым фундаментом. (2) Набор типичных белковых архитектур ограничен, причем ограничен физическими причинами, так как наиболее "обычными" для белков оказываются те конфигурации, которые не имеют "структурных дефектов", делающих их нестабильными для всех аминокислотных последовательностей, кроме ничтожного числа точно к ним "подогнанных" . В результате в физике белка возникает представление о физическом отборе белковых структур и строится современная, так называемая рациональная их классификация, напоминающая таблицу Менделеева тем, что она способна успешно предсказывать еще не обнаруженные в природе белковые архитектуры. Однако, несмотря на некоторые успехи, предсказать пространственное строение каждого конкретного белка, зная лишь его аминокислотную последовательность, пока не удается. Также остается все еще открытым и вопрос о том, как белковая цепь ухитряется найти свою уникальную пространственную структуру среди массы других возможных вариантов. В попытке проследить пути самоорганизации белков ведется интенсивный поиск промежуточных состояний ("интермедиатов"), возникающих по ходу самоорганизации белков. Их ищут - и наконец находят. Одним из центральных событий того времени становится открытие нового физического состояния белковой цепи, ныне известного как "расплавленная глобула". Выведенная О.Б. Птицыным "на кончике пера" еще в 1973 году, расплавленная глобула в начале 1980-х годов экспериментально обнаружена в нашей лаборатории в Институте белка РАН, а затем - и в других, рассеянных по всему миру лабораториях: она оказывается типичным промежуточным состоянием при самоорганизации большинства белков. Необычные физические свойства этого "флуктуирующего компактного состояния белковой цепи без уникальной пространственной структуры" были тут же объяснены физиками-теоретиками, работающими в тесном контакте с экспериментаторами. Затем появляются свидетельства об участии расплавленной глобулы в ряде важных биологических процессов, а потом и в некоторых генетических заболеваниях, при которых имеющий мутацию белок, пытаясь свернуться, "застревает" в состоянии расплавленной глобулы и никак не может обрести свою рабочую, "нативную" структуру (к этой теме я еще вернусь, рассказывая о современности). Не менее важным событием становится появление белковой инженерии, которое связанно, прежде всего, с именем английского ученого А. Фершта. Компьютеры (и базы данных по структурам белков) становятся "глазами", физика белка - "мозгом", а генная инженерия - "руками" этого нового научного направления, ставящего своей целью повлиять на структуру и работу белка в нужном исследователю направлении. Белковая инженерия открывает наиболее прямой экспериментальный подход к изучению функционирования белков. Она доказывает наконец гипотезу Полинга - Холдейна, согласно которой основой фантастической эффективности работы ферментов - белковых катализаторов большинства биохимических реакций в клетке - является избирательное взаимодействие их активных центров с нестабильным, "переходным" ("почти готовым" к химическому превращению) состоянием исходного вещества, субстрата реакции. Достижения белковой инженерии начинают применяться для направленного изменения степени сродства молекулы фермента к субстрату. 2. Сегодняшнее состояние физики белка и смежных областей науки. Фундамент наиболее значительных работ настоящего времени закладывался в 90-е годы, в ходе исследований сравнительно небольших белков, представляющих собой одну глобулу-"домен" из 50-200 аминокислот. Именно тогда формируется (пока чисто теоретическая) концепция "энергетической щели", отделяющей единственную "правильную" стабильную укладку белковой цепи от миллиардов "неправильных", что и придает структуре белковой молекулы характеристики, нужные для ее эффективной биохимической работы: уникальность, устойчивость и твердость одновременно. Тогда же из компьютерных экспериментов Е. И. Шахновича (нашего с О. Б. Птицыным ученика, ныне - профессора Гарварда) (см. "Наука и жизнь" № 2, 2001 г.) и из развитой мной общей теории сворачивания белков становится ясно, что повышенная стабильность структуры белка сама по себе, автоматически, обеспечивает его быструю и безошибочную самоорганизацию. Одновременно на стыке теории и основанного на белковой инженерии эксперимента формируется концепция "ядра сворачивания" белка. "Ядро" напоминает зародыш кристаллизации - это та часть нативной пространственной структуры белка, после флуктуационного образования которой дальнейшая самоорганизация белка уже идет быстро, практически без перебора вариантов. На прочной основе этих концепций ныне строятся теории, позволяющие предсказывать скорости сворачивания белков, очерчивать ядра сворачивания в их пространственных структурах и т.д. То, что найден принцип, по которому белковая цепь выбирает свою уникальную пространственную структуру, - хорошая новость. Плохая же новость заключается в том, что воспроизвести этот выбор на компьютере пока не может никто, потому что нынешние оценки стабильности структур недостаточно точны для такой деликатной работы, как выбор одной "правильной", стабильной структуры белка из миллиардов возможных. На практике предсказать пространственную структуру белка можно лишь тогда, когда архитектура его более или менее близкого (судя по аминокислотной последовательности) "родственника" уже известна: тогда можно ее просто срисовать и получить приблизительную структуру интересующего нас белка. Однако при этом все та же неточность энергетических оценок ограничивает возможность дальнейшего уточнения этой "срисованной с родственника" приблизительной структуры, а равно и возможность конструирования новых, не имеющих природных аналогов белков, а также взаимодействующих с белками лекарственных молекул. Но все же в области конструирования белков интересные результаты уже есть. Так, сконструированный нами в сотрудничестве с М. П. Кирпичниковым и Д. А. Долгих "искусственный" белок альбеферон активирует реакцию бласт-трансформации тимоцитов и обладает антивирусной активностью. Однако использовать его как лекарство, к сожалению, пока нельзя из-за обнаружившейся тенденции к образованию вредных для организма амилоидных фибрилл. Ряд успешных работ по конструированию белков выполнен в лабораториях С. Майо и Д. Бейкера в США. Однако дизайн "новых" белков сегодня - это больше искусство и везение, чем научное конструирование. Работа над повышением точности энергетических оценок стабильности структур идет и в фундаментальной науке, и в промышленности, но существенных результатов здесь все еще нет. Теперь - опять хорошая новость: число и разнообразие белковых "родственников" быстро растет благодаря определению полного химического строения целых геномов и автоматизации расшифровки пространственных структур белков, так что предсказание структуры по аналогии с родственником становится возможным все чаще и чаще. Классификация белковых структур тоже автоматизируется. Но все же научное сообщество пока больше доверяет не автоматической классификации, а той, что делает "великий белковый гуру" - А. Г. Мурзин (ученик О. Б. Птицына и мой, обосновавшийся ныне в эпицентре структурной биологии, в Кембридже). Он единственный в мире - держит в своей голове все (десятки тысяч!) расшифрованные белковые структуры; это позволило ему создать - и, постоянно обновляя, поддерживать - знаменитый классификатор белковых структур SCOP (Structural Classification of Proteins). Одновременно развивается исследование сворачивания белков в живой клетке. Оказывается, что здесь, в концентрированном "клеточном супе", сворачивающаяся белковая цепь нуждается в опеке. "Опекунами" служат специальные белкишапероны, которые слегка прилипают к сворачивающемуся белку, тем самым не давая ему возможности прочно связаться с чем-то неподобающим. Не "выковывая" структуру белка, шапероны помогают его самоорганизации тем, что мешают "недосвернутым" и потому липким еще белкам прилипнуть к другим макромолекулам, концентрация которых в клетке в тысячи раз больше, чем в пробирке, где белки сворачиваются и сами по себе, без помощи шаперонов. Параллельно развивается протеомика - наука о взаимодействии белков в клетке во время ее жизненного цикла. Объем полученной феноменологической информации огромен, но ее осмысление и особенно понимание физики происходящих в клетке процессов лишь начинаются. В частности, накапливаются данные об образовании "неправильных" белковых структур, приводящих к разным болезням. Среди них - прионные болезни, такие, как печально известное "бешенство коров" и еще более печально известный старческий маразм (болезнь Альцгеймера), убивающие медленно, но верно. Такие болезни связаны с появлением в клетке амилоидов - фибрилл из "неправильно свернутых" белковых молекул. Эти губительные для клетки белковые образования заразны - они втягивают в себя не только "неправильные", мутантные, но и "здоровые" белки, перехватывая их сворачивание на стадии расплавленной глобулы и перестраивая их по-своему. Хуже всего то, что эти злокачественные структуры размножаются: они ломаются на части, и из каждого обломка опять вырастает губительная фибрилла. Поскольку "здоровые" белки вовлекаются в амилоидные образования очень медленно, прионные болезни обладают многолетним инкубационным периодом, и это делает их особенно коварными. Физические основы всех этих устрашающих явлений уже просматриваются, но они еще до конца не поняты. 3. На какие рубежи выйдет физика белка через 20 лет? Сегодня физика небольших, "однодоменных" белков близится к завершению. Зарождается физика крупных белковых молекул, их комплексов и комплексов белков с другими макромолекулами (амилоидов, вирусов и т.д.). Видимо, она и будет более всего актуальна через 20 лет. Это - как переход от физики атомов к физической химии молекул или от термодинамики обратимых к термодинамике необратимых процессов... Предсказывать развитие науки трудно вообще, а в ее поворотный момент особенно. Поэтому я ограничусь тем, что мне ближе - исследованиями взаимодействий в белках и с белками, белковой инженерией и биоинформатикой. Скорость развития белковой инженерии, особенно дизайна новых белков и лекарств и бионанотехнологии вообще, прямо зависит от того, сможет ли исследование физики молекулярных взаимодействий обеспечить их надежными теоретическими оценками силовых полей и тем самым - стабильности разнообразных белковых структур и комплексов. Если сможет, то инженерия и дизайн геномов будут развиваться с открытыми глазами и, следовательно, большими шагами. Если не сможет, то они обречены двигаться мелкими шажками, методом проб и ошибок, путем широчайшего экспериментального скрининга и т. д. В любом случае, быстро или медленно, через двадцать лет или через сорок, но они будут производить высокоэффективные молекулы для самых разных прикладных целей; среди этих молекул окажутся прекрасные лекарства и - надо отдавать себе отчет - сильнейшие яды. Ясно также, что биоинформатика - хозяйка несметных и быстро растущих богатств, важнейшую часть которых составляют геномы человека и многих других организмов, - будет стремительно развиваться. Сегодня она в основном каталогизирует взаимодействия молекул в клетке и, главное, разбирается с важными, но локальными деталями геномов. Однако вскоре заработает программа "индивидуальный геном", и каждый - за умеренную, видимо, плату - сможет получить компьютерную запись именно своего (а не "человека вообще") генома. И тогда, зная геном и имея развитую биоинформатику и статистику, можно будет - по малым отклонениям индивидуального генома от "нормы" - предсказывать развитие организма (и его аномалии), угрожающие (и не угрожающие) ему болезни, вероятный срок его жизни и т.д. Это - лет через 20 или раньше - уведет часть биоинформатики в практическую медицину (и, как следствие, столкнет ее с массой юридических, этических, социальных и религиозных проблем). Однако меня больше интересует возможность развития фундаментальной биоинформати ки, которая не ограничится исследованием "малых различий" индивидуальных геномов, а также возможность дизайна геномов, опять-таки далеко выходящего за делающиеся сегодня модификации, вставки и удаления отдельных генов. Такая биоинформатика и такой дизайн станут, видимо, принципиально неподконтрольны человеческому разуму, и вот почему. Пытаясь предсказать развитие всего организма по его геному, фундаментальная биоинформатика столкнется с теми же проблемами, что и предсказание строения белка по его аминокислотной последовательности. Сам организм (как и сам природный белок) эту задачу легко решает, и у нас как будто тоже есть все для ее решения, - но как его найти, не зная всех взаимодействий в точности? То есть пытаясь сконструировать сильно измененный (и тем более новый) геном, как предвидеть все косвенные последствия введенных изменений? Например, хотелось бы устранить ограниченность продолжительности человеческой жизни. Это не совсем фантастика: уже выделен ряд генов, ограничивающих продолжительность жизни одного из червей, и, манипулируя ими, можно продлить его жизнь на порядок (не выходя за пределы "малых изменений" генома червя, так как это его природные гены, уже "притершиеся" к остальным). Предположим, однако, что вы введете аналогичные гены человеку, желая продлить его жизнь. Продлит ли это жизнь в действительности - или убьет человека? Не получите ли вы бессмертного дебила или паралитика (как в романе "Понедельник начинается в субботу" братьев Стругацких)? Для ответа на эти вопросы надо предвидеть, с какими - из сотни тысяч молекул человеческого организма - и как будут взаимодействовать белки, кодируемые введенными извне (и не "притертыми" еще к остальным) генами... Проблемы оценки множества потенциальных взаимодействий будут здесь те же, что при конструировании белков, но возведенными в колоссальную степень: ведь человек может охватить взглядом отдельный белок и его ген (они умещаются на одной книжной странице), но никак не геном в целом (100 000 страниц). Такая задача может быть по силам (если вообще может) только искусственному интеллекту, появление которого через 20 лет проблематично. Не говоря уже о том, что толком не поставлена еще и сама задача "впряжения" искусственного интеллекта в проблему, где ему самому придется и ставить и решать задачи (в том числе экспериментальные) без помощи человека (эта проблема обсуждалась в философских эссе Станислава Лема). Альтернативный подход - клонирование, желательно во множестве экземпляров, и экспериментальное наблюдение его последствий - подходит для вирусов (и даже для культур человеческих клеток и тканей), но для целого человеческого организма вряд ли. Во всяком случае - не в следующие 20 лет. Но думать об этом уже не в философском, а в рабочем порядке к тому времени, пожалуй, начнут… Рисунки из книги А. В. Финкельштейна, О. Б. Птицына. Физика белка. - М.: Книжный Дом Университет, 2005. Декабрь 2005 года, г. Пущино Московской области. Полимерная цепь малатдегидрогеназа образует компактную, плотную глобулу (которая кажется "пустой" лишь потому, что цепь нарисована очень тонкой; при этом радужная расцветка цепи помогает проследить ее ход). В этой глобуле есть вмятина, а в ней небольшой активный центр (на него и указывает стрелка), катализирующий реакцию дегидрогенизации яблочной кислоты (малата) до щавелевоуксусной кислоты. Глядя на картинку слева направо, мы увидим путь сворачивания этого белка; глядя справа налево - путь его разворачивания. Внизу - два возможных устойчивых состояния полимерной цепи белка. Слева изображено ее развернутое, неупорядоченное состояние. Справа - ее нативное, глобулярное состояние с четко определенной структурой. Глобула, очертания которой показаны в виде облака, кажется "пустой", но на самом деле белковая цепь много толще, чем нарисована, и глобула заполнена ею плотно, как кристалл молекулами. Вверху посередине - "переходное", нестабильное состояние белковой цепи, готовое перейти в любое из двух ее стабильных состояний либо в полностю свернутое (нативное), либо в полностью развернутое. В этом "переходном состоянии" выделяется "ядро сворачивания" - часть глобулярной структуры нативного Схема пути сворачивания-разворачивания небольшого белка - ингибитора химотрипсина CI2, исследованного группой Фершта. <...>