Почему созданные в эксперименте белки со сходными последовательностями имеют разную укладку?! Реферат по биоинформатике Караваевой Юлии 1. Введение Очень важной задачей современной биологии является изучение того, каким образом белки формируют их нативную трехмерную структуру, необходимую для выполнения их биологических функций. Остатки различных аминокислот в белке вносят разный вклад в формирование той или иной укладки. Поскольку количество конформаций, которые может принимать белок, огромно, сложно понять весь процесс сворачивания белка. Некоторые белки меняют свою конформацию в ответ на изменение параметров раствора или в результате мутации. Совокупность этих факторов приводит к тому, что белки с очень похожими последовательностями принимают различные трехмерные структуры. Способность полилизина формировать различные вторичные структуры зависит от состава раствора и метода приготовления пробы. Были получены пептиды, спонтанно обратимо меняющие свою конформацию с α-спиральной структуры на β-лист. Последнее время внимание было сосредоточенно на том, что конформационно чувствительные последовательности могут играть роль в болезни Альцгеймера и прионных заболеваниях. Анализ баз данных показал, что баланс между локальными контактами и взаимодействиями на больших расстояниях может изменить конформацию белка. Кроме того было показано, что пентапептидные последовательности могут быть обнаружены как в конформации α-спирали, так и β-листа. Хотя петли и повороты, соединяющие элементы вторичной структуры, часто не играют принципиальной роли в стабильности белка, упаковка аминокислотных остатков в гидрофобные ядра чрезвычайно важна. Разные аминокислоты имеют различные предрасположенности к формированию α-спиральной или β-структурной конформации. Эти предрасположенности изначально были идентифицированы с помощью статистического анализа белков с известной структурой, а также недавно были количественно охарактеризованы посредством экспериментально определенных энергетических шкал. Последовательность из 11 аминокислот может принимать конформацию α-спирали или β-листа в зависимости от ее расположения внутри небольшого белка. Структуры, которые приобретают сконструированные пептиды и белки зависят не только от первичной структуры, но и от внешних условий, таких как пробоподготовка и полярность растворителя. Удалось изменить пространственную структуру небольших, около 50 аминокислот, белков как ответ на изменение условий растворения или на наличие мутации. Сильные изменения вторичной структуры этих белков были определены с помощью циркулярного дихромизма и ЯМР. В группе Не были созданы два белка, GA88 и GB88, имеющие сходные на 88% последовательности, но при этом различные укладки и функции. Группа также показала, что различающиеся аминокислоты в последовательностях этих белков ответственные за кодирование различных топологий, и что не все аминокислоты имеют эквивалентное значение в формировании укладки. Совсем недавно эта группа опубликовала данные о том, что единичная мутация в правильной позиции может полностью изменить трехмерную структуру белка. Образование стабильной вторичной и уникальной третичной структуры белков обусловлено межмолекулярными взаимодействиями между остатками аминокислот в полипептидной цепи, а также их взаимодействиями с окружающей средой. Для поддержания нативной структуры белка незаменимую роль играют взаимодействия между фрагментами, большинство из которых является контактами дальнего действия. Контакты дальнего действия – это контакты между аминокислотными остатками, расположенными далеко друг от друга в последовательности, но находящиеся близко в трехмерной структуре белка. Знание того, часто разные типы остатков располагаются рядом друг с другом, широко применяется для моделирования укладки белков. Недавняя экспериментальная работа по укладке белков показала, что во время биосинтеза белка происходит образование специфических ядер аминокислотных остатков, и дальнейшее формирование структуры происходит очень быстро. В дальнейшем было показано, что место образования этих ядер сильно зависит от укладки, и остатки, формирующие ядра укладки обычно имеют гидрофобное окружение. Гидрофобные кластеры в основном найдены в середине цепей и предсказаны как гидрофобные ядра. Остатки собраны в гидрофобные кластеры в основном под воздействием контактов дальнего действия и обладают высокой термостабильностью. Это исследование сосредоточено на белках GA88 и GB88, состоящих из 56 аминокислотных остатков, отличающихся только семью позициями, имеющих последовательности, сходные на 88%, и образующих различные укладки. Получены прекрасные трехмерные структуры этих белков (рис.1). Рис.1 Трехмерные структуры белков GA88 (PDB ID: 2JWS) (А) и GB88 (PDB ID: 2JWU) (В). (С) – пространственное выравнивание двух белков. Задачей данной работы является исследовать последовательности и структуры этих двух белков с помощью различных вычислительных методов и определить те характерные особенности, которые могли бы влиять на структуры, принимаемые этими двумя последовательностями. Были обнаружены редкие комбинации пентапептидных паттернов, которые отсутствуют при поиске по базам данных последовательностей для возникновения участков перекрывания пентапептидов, имеющихся в двух белках. Поскольку наличие сайтов нуклеации в различных позициях настолько важно для определения трехмерной структуры, была определена разница между укладкой гидрофобных остатков в двух белках. Кроме того, были протестированы различные методы предсказания вторичных структур исследуемых белков. 2. Материалы и методы. Массив данных. Координаты атомов двух созданных белков GA88 и GB88 (PDB ID: 2JWS и 2JWU) с последовательностями, идентичными на 88% , но различными укладками, а также координаты атомов родительских белков PSD-1 и GB1 (PDB ID: 2FS1 и 1PGB), из которых они были получены, были загружены из PDB и составляют предмет этого исследования. Белок GA88 имеет структуру, состоящую из трех α-спиралей, тогда как GB88 имеет α/β структуру, и каждый из белков имеет высокое сходство структуры со своим родительским белком. Оба полученных белка состоят из 56 аминокислотных остатков, 7 остатков различаются между белками. Для проведения вычислительных анализов координаты Сα атомов были выделены из PDB-файлов исследуемых белков (PDB ID: 2JWS и 2JWU). Вычисление взаимодействий между остатками. Каждый аминокислотный остаток в белке был представлен его Сα атомом. Центр был зафиксирован на Сα атоме N-концевого аминокислотного остатка, и расстояния между этим атомом и остальными Сα атомами белка были посчитаны. Набор остатков, связанных с этим остатком вычислялся для сферы радиуса 8 Å, поскольку было показано, что это объем, внутри которого остатки в молекуле белка могут оказывать друг на друга заметное воздействие. Затем центр смещался на следующий α-углеродный атом вдоль полипептидной цепи и процедура повторялась, в результате чего были определены наборы остатков, взаимодействия взаимодействующих были разделены на с каждым близкие остатком (Сα атом белка. ±2 Затем остатка эти вдоль последовательности), средние (Сα атом ±3-4 остатка друг от друга) и дальние (Сα атом ±5 и более остатков) взаимодействия. Вычисление попарных предпочтительных контактов между остатками. Для вычисления предпочтительных попарных контактов между остатками дальние взаимодействия были определены по схеме, описанной выше. Были подсчитаны предпочтительные контакты для семи различающихся между белками аминокислотных остатков в форме двумерной матрицы. Вычисление гидрофобности окружения. Каждому остатку присвоен соответствующий гидрофобный индекс, сумма индексов гидрофобности, посчитанная для аминокислот, находящихся внутри сферы радиуса 8 Å для каждого остатка, считается «гидрофобностью окружениея» данного остатка. Аминокислоты, обладающие значением гидрофобного окружения, большим или равным удвоенному среднему значению для всех остатков белка, были приняты за формирующие гидрофобные домены, а остаток, обладающий наибольшим значением гидрофобности окружения внутри домена, отражает сайт нуклеации белка. Значения гидрофобного окружения посчитанные для обоих искусственно созданных белков и их родительских белков, коррелируют друг с другом. Для изучения упаковки остатков в гидрофобные ядра между созданными и родительскими белками, были определены остатки, обладающие большим значением гидрофобности окружения , и контакты между ними были нанесены на двумерный график. Вычисление значений φ и ψ углов и анализ конформационных изменений. Анализ φ и ψ углов в исследуемых белках основан на вычислениях, осуществленных сервером назначения вторичных структур DSSP. Различия между значениями φ и ψ углов для каждого из остатков в обоих белках были посчитаны и представлены как график зависимости этой разницы от номера остатка. Вычисление энергии до и после мутации Обе PDB структуры (2JWS и 2JWU), были подвергнуты минимизации энергии с помощью Swiss PDB Viewer. Α-спиральный белок 2JWS был мутировали по каждой из различающихся аминокислот, заменяя ее на соответствующую аминокислоту в α/β-белке. Значение общей энергии обоих белков для каждой несовпадающей позиции были посчитаны до и после мутации с использованием силового поля Gromacs в Swiss PDB Viewer. 3. Результаты. Предпочтительные попарные взаимодействия остатков. Различающиеся между белками 2JWS и 2JWU аминокислоты имеют абсолютно разные попарные предпочтительные контакты между остатками (Таблица 1). В αспиральном белке (2JWS) большинство контактов образовано с Ala, Ile, Leu и Lys, тогда как в случае α/β-белка (2JWU) основные контакты образованы с Ala, Glu, Ile, Leu, Lys, Thr, Tyr и Val. Попарные предпочтительные контакты Gly с другими остатками не сильно различаются между двумя белками. Это является следствием вторичной структуры, образуемой этим остатком в двух белках. Число контактов, образованное Ile, в α/β-белке больше, чем в αспиральном белке. Таким образом между двумя белками обнаружено большое количество отличий в попарных взаимодействиях. Таблица 1. Предпочтительные попарные взаимодействия остатков. PDB ID 2JWS 2JWS 2JWS 2JWU 2JWU 2JWU 2JWU 2JWU остаток GLY ILE LEU ALA LYS PHE THR TYR ALA 3 11 8 14 24 2 7 5 ARG 0 0 0 0 0 0 0 0 PDB ID 2JWS 2JWS 2JWS 2JWU 2JWU 2JWU 2JWU 2JWU остаток GLY ILE LEU ALA LYS PHE THR TYR LEU 2 11 8 15 17 4 16 8 LYS 1 10 9 24 14 6 16 13 ASN 0 2 3 6 7 0 2 1 MET 0 0 0 0 0 0 0 0 ASP 1 1 3 5 4 0 6 1 PHE 0 1 1 2 6 2 5 4 CYS 0 0 0 0 0 0 0 0 PRO 0 0 0 0 0 0 0 0 GLN 0 0 1 3 4 0 0 0 SER 0 0 0 0 0 0 0 0 GLU 2 6 7 15 20 2 14 3 THR 2 3 6 7 16 5 18 11 GLY 0 2 2 3 1 0 3 0 TRP 1 1 2 2 2 1 4 1 HIS 0 0 0 0 0 0 0 0 ILE 2 6 11 13 13 2 5 4 TYR 0 3 4 5 13 4 11 2 VAL 3 3 7 12 6 2 16 0 Модели гидрофобного окружения и сайты нуклеации. Анализы гидрофобного окружения остатков в двух исследуемых белках обнаружил интересный факт, что существует значительная разница между упаковкой гидрофобных оснований в первых пяти (1-5) и последних пяти (52-56) позициях (рис.2). Рис.2. Гидрофобность окружения для двух исследуемых белков. У всех небольших белков остатки образуют сравнительно маленькие гидрофобные ядра и их укладка скорее всего намного больше зависит от условий окружающей среды, чем в гидрофобных ядрах белков нормального размера, имеющих сплошную гидрофобную оболочку. Остатки 16, 20, 33 и 46 соответствуют пикам на графике на рис.1, что означает, что в этих позициях может быть сайт нуклеации, который начинает или заканчивает αспираль или β-лист. В то же время в α/β-белке обнаружено только два пика, соответствующие остаткам 5 и 52. Поскольку исследуемые белки небольшие, процент остатков, меняющих их структуру может быть большим. Alexander et al. показали, что пять С-концевых остатков в меньшем белке гидрофобные GA расположены взаимодействия в неструктурированно, центре белка GB. но формируют Коэффициенты важные корреляции гидрофобности окружения между родительскими и искусственно созданными белками показаны в Таблице 2. Таблица 2. Взаимная корреляция значений гидрофобности родительскими и искусственно полученными белками. окружения между PDB ID 2FS1 1PGB 2JWS 2JWU 2FS1 1 -0.1 0.72 0.08 1PGB -0.1 1 -0.17 0.52 2JWS 0.72 -0.17 1 -0.01 2JWU 0.08 0.52 -0.01 1 2FS1 – родительский белок, α-спиральный 1PGB – родительский белок, α/β-структурный 2JWS – искусственно созданный α-спиральный белок 2JWU - искусственно созданный α/β-структурный белок В гидрофобности окружения для родительских и искусственных белков видна значительная корреляция, для α-спиральных белков она составляет 0.72, а для α/βструктурных – 0.52. Это может быть обусловлено консервативностью гидрофобных контактов между родительскими и искусственными белками. Следовательно, искусственные белки, несмотря на высокое сходство их последовательностей, сохраняют родительскую укладку благодаря гидрофобному эффекту, который, как полагают, играет ключевую роль в осуществлении самоорганизации структуры белка. Конформационные изменения. В исследуемых белках значения ψ-углов большинства остатков изменяются в более широких пределах, нежели φ-углов. Разница между φ и ψ значениями для этих остатков довольно велика (рис.3). Рис. 3. Разница между значениями φ- и ψ- углов между двумя искусственных белках. Эта разница невелика для несовпадающих остатков 30, 33 и 45 по сравнению с другими несовпадающими остатками. Tyr2 имеет большой сдвиг в 128˚ в φ-значении для принятия конформации β-листа (белок 2JWS) вместо петли, наблюдаемой в белке 2JWU. Сдвиг φ-значения более чем на 100˚ наблюдается для остатков под номерами 12, 36, 37 и 56. При перехода остатков12 и 36 из петли в α-спираль вторичная структура появляется в обоих белках,тогда как для остатков под номерами 37 и 56 большие отличия в φзначениях являются следствием того, что они имеют конформацию петли в обоих белках. Было обнаружено, что разница между φ-значениями в двух белках более высокая для остатков, которые принадлежат α-спирали в одном белке и β-листу в другом. Энергия белков до и после мутации. Несовпадающие остатки в двух белках обладают абсолютно разными значениями энергии силового поля (таблица 3). В белке α/β-структурном белке общая энергия белка дикого типа больше, чем общая энергия α-спирального белка. Даже если энергетическая ситуация несовпадающих аминокислотных остатков демонстрирует большие различия, связывание N- и C-концов белка с α/β-структурой является движущей энергетической силой конформационного изменения. Таблица 3. Энергия силового поля до и после мутаций. изначальный остаток 2JWS до мутации 24 GLY 25 ILE 30 ILE 33 ILE 45 LEU 49 ILE 50 LEU 2JWU после мутации 24 ALA 25 THR 30 PHE новый остаток энергия после минимизации общая энергия энергия после мутации общая энергия ALA THR PHE TYR TYR THR LYS 37.979 17.217 7.535 -0.302 -18.846 15.223 2'-9.886 -673.047 -673.047 -673.047 -673.047 -673.047 -673.047 -673.047 20.187 4724.378 104604.195 29763456.000 -25.884 539.583 -24.761 421.447 9838.915 209628.953 59527336.000 480.036 1476.609 446.337 GLY ILE ILE -6.417 -10.83 -35.899 -1333.709 -1333.709 -1333.709 44.12 26.488 29.581 157.598 -247.574 -204.841 33 TYR 45 TYR 49 THR 50 LYS ILE LEU ILE LEU -93.216 -93.364 16.705 -6.157 -1333.709 -1333.709 -1333.709 -1333.709 2072.873 31.033 252.252 44.227 3987.538 -109.266 79.121 -197.223 4. Обсуждение результатов. Сворачивание белков в пробирке сильно отличается от сворачивания внутри живой клетки. Считается, что процессу сворачивания белков в клетках осуществляют белки шапероны, в то время как in vitro этот процесс обусловлен в основном свойствами аминокислотных остатков, входящих в состав белка. Поскольку за последние несколько лет был достигнут значительный прогресс в области совмещения теоретических и экспериментальных подходов изучения сворачивания белков, было проведено систематическое компьютерное исследование двух искусственно созданных белков GA88 и GB88, предоставившее анализ таких биофизических параметров аминокислотных остатков, как предрасположенность к формированию разных вторичных структур, взаимодействия между остатками, окружающая гидрофобность, геометрия и параметры силового поля. Белки обладают несколькими уровнями организации, начинающимися с единичных аминокислот, которые формируют небольшие участки, способные принимать одну из двух полурегулярных конформаций: конформацию спирали или листа, что делает возможным проведение сравнительного анализа структур белков. Пока неизвестно, насколько сильно формирование вторичной структуры подвержено влиянию других сил, кроме как обусловленных внутренними свойствами последовательности. Эволюционно близкие белки по всей предрасположенности контактов несмотря следовательно, имеют похожие видимости сохраняют похожие на различные последовательности, и, пространственные структуры. В то же время последовательности GA88 и GB88 получены из двух различных белков, не являющихся эволюционно близкими. Несмотря на то, что последовательности этих белков совпадают на 88% , в них нет сходных контактов между аминокислотными остатками. Анализ выявил определенные предпочтения относительно разделения последовательности и взаимодействия остатков. Замена ILE33 на TYR33 в белке с α/βструктурой привела к кардинальным изменениям в формировании дальних взаимодействий с другими структурными элементами белка. Также гидрофобные взаимодействия возможно формируются на ранних этапах укладки белка, и после их формирования этот процесс протекает быстро. Следовательно, отсутствие серии этих гидрофобных остатков и их необходимых контактов, формирующих компактное специфическое ядро белка, может являться причиной. По которой белок принимает вытянутую, а не спиральную структуру. В спиральном белке можно выделить шесть гидрофобных участков, в то время как в белке с α/β-структурой есть только два таких участка в позициях 5 и 52. Это говорит о природной гибкости белковых последовательностей, позволяющей им приспосабливаться к окружающим условиям (гидрофобное окружение всего αспирального белка и отсутствие такового у белка с α/βструктурой). Более того, больше 50% белков занимают остатки A, E, K, L и Т. Проведенные анализы позволяют предположить, что конформационные изменения этих конкретных остатков могут изменять вторичные структуры в белке с одной на другую. Из анализа этих белков можно сделать вывод, что локальные предпочтения N- и Сконцевых участков исследуемых белков в принятии конформации петли или тяжа может быть определяющим фактором в формировании различных укладок. На раннем этапе формирования укладки оба белка возможно могут выбирать различные энергетически подходящие пути формирования различных укладок. 5. Список литературы