ТРНК Задание №1. Укажите в отчете PDB-код, полученный Вами и опишите особенности структуры.цепи) и в дальнейшем работайте только с ней. PDB-код, полученный мною - 1h3e PDB-файл pdb 1h3е.pdb содержит информацию о структуре комплекса ДНК-белок (т.е. комплекс нуклеин-белковый). Этот комплекс состоит, соответственно, из двух частей. нуклеиновой и белковой. Нуклеиновая часть - Тирозил-тРНК(нуклеиновая кислота состоит из одной цепи В. Белковая часть - тирозил-тРНК синтетаза (белок). Так же как и тирозил-тРНК, он состоит из одной цепи. Эта синтетаза получена из организма THERMUS THERMOPHILUS, а вот откуда получена нуклеиновая кислота, к сожалению, не написано. Можно сделаьт ошибочный вывод, что этот белок и нуклеиновую кислоту моно получить только из одного организма, поэтому название организма не писали второй раз просто за ненадобностью. Однако, изучив несколько других pdb-файлов, понимаем, что это не так нуклеиновую и белковую часть комплекса могут получать из разных организмов. Более того, они могут даже принадлежать к разным таксонам - прокариоты и эукариоты. Однако о данном комплексе тирозил-тРНК - тирозил-тРНК синтетаза ничего этого нельзя сказать за неимением организма из которого получили тирозил-тРНК. Вся эта информация была взята из файла 1h3е.pdb, поля COMPND и SOURSE. Содержание этих полей: COMPND 1 MOL_ID: 1; COMPND 2 MOLECULE: WILD-TYPE TRNATYR(GUA); COMPND 3 CHAIN: B: COMPND 4 ENGINEERED: YES; COMPND 5 MOL_ID: 2; COMPND 6 MOLECULE: TYROSYL-TRNA SYNTHETASE; COMPND 7 CHAIN: A; COMPND 8 SYNONYM: TYROSINE--TRNA LIGASE; COMPND 9 EC: 6.1.1.1; SOURCE 1 MOL_ID: 1; SOURCE 2 SYNTHETIC: YES; SOURCE 3 MOL_ID: 2; SOURCE 4 ORGANISM_SCIENTIFIC: THERMUS THERMOPHILUS; SOURCE 5 STRAIN: HB27; SOURCE 6 EXPRESSION_SYSTEM: ESCHERICHIA COLI; SOURCE 7 EXPRESSION_SYSTEM_STRAIN: BL21(DE)PLYSS; SOURCE 8 EXPRESSION_SYSTEM_PLASMID: PET29B На рисунке изображен этот комплекс, ленточная модель, синим показана тРНК, голубым белок, раскраска "chain" (изображение построено с помощью программы RasMol) Задание №2. Изучить, входят ли в структуру тРНК какие-либо особенности - модифицированные основания, пропуски в нумерации и/или вставки ("insertion codes"), с какого атома начинается нумерация тРНК. GGGCAGGUUCCCGAGCGGCCAAAGGGGACGGUCUGUAAAACCGUUGGCGUAU GCCUUCGCUGGTUCGAAUCCAGCCCUGCCCACCA Заданная тРНК состоит из 86 остатков (выше приведена нукл. последовательность). 4 остатка из 86 содержат являются модифицированными. Т.е. мутации в исследуемой тРНК составляют около 4,5 %. Среди них: PSU Псевдоуридин-5'-монофосфат 5MU 5-метилуридин-5'монофосфат MAD 6-гидро-1-метиладенозин-5'-монофосфат Для изучения нумерации остатков тРНК использовали команду 'ATOM.........P.......B' 1h3e.pdb > res.txt Т.е. остались только строки, описывающие фосфор. Получив этот файл и изучив его, можно сделать некоторые утверждения: нумерация тРНК начинается с 3405 и заканчивается 4827 номером; имеются пропуски 17;35;54;58 имеются две вставки ("insertion codes") 20A,20B и 47A-47I Почему это так? Первое. Нумерация атомов тРНК начинается не с первого, а аж с 3405 атома! Скорее всего, это связано с тем, что в PDB файле нумерация не начинается каждый раз по новой с началом новой субъединицы. Она одна для белка, нуклеиновой кислоты, АТФ. тРНК цепь В, а белок - цепь А. Естественно, что сначала пронумеровали белок, а нумерация тРНК началась с 3405 атома. Второе (и сразу третье) - почему имеются вставки и пропуски? Скорее всего, это объясняется тем, что в одной из цепей выпетливание. Нкулеотиды, участвующие в нем, нумеруются как раз №а, №b, а номера атомов, которые находятся напротив выпетливания, пропадают, чтобы не нарушать последовательную нумерацию в спиральном участке. А все обычные, стандартные пары оснований пронумерованы как обычно. Схематично это выглядит примерно так: Остается невыясненным только одно: почему вставки две, а пропуска четыре? Возможно, это помогут выяснить следующие задания. Задание №3. Проанализируйте структуру программой find_pair. Кратко опишите полученный результат. С помощью программы RasMol был создан файл, содержащий только нужную цепь (команда "save 1h3e_trna.pdb"). С помощью программы find_pair полученная структура была изучена (find_pair -t 1H3E_TRNA.PDB stdout | analyze). Найдено 3 спирали, длина 1 спирали = 12 нуклеотидов, 2 спирали = 13 нуклеотидов, 3 спирали = 1 нуклеотид. Задание №4. Создайте картинку в формате GIF, на которой была бы изображена только ваша цепь тРНК в остовной модели, найденные спирали покрашены в разные цвета, при атомах фосфора 5'-концевого и 3'концевого нуклеотидов подписаны номера остатков. Приведите в отчёте последовательность команд, использованную для создания картинки. На данной картинке в формате GIF изображена моя цепь тРНК в остовной модели, найденные спирали покрашены в разные цвета, при атомах фосфора 5'-концевого и 3'концевого нуклеотидов подписаны номера остатков. Вот список команд: background white restrict rna wireframe off backbone 300 define helix1 1-7:B,49-53:B,55:B,18:B,61-72:B select helix1 color blue define helix2 8-15:B,23-33:B,36-44:B,48:B select helix2 color purple define helix3 19:B, 56:B select helix3 color red define helix4 20:B, 47:B select helix4 color yellow define helix5 46:B,47:B,47:B,47:B select helix5 color qreen define helix6 47:B, 47:B select helix6 color grey select atomno=2 label 74 select atomno=1715 label 1 Задание №5. Пользуясь средствами RasMol, проанализируйте структуру. Приведите в отчёте пример внеспирального стекинг-взаимодействия между основаниями; пример водородных связей между основаниями, не сводящийся к Уотсон-Криковскому спариванию комплементарных оснований. Аргументированно объясните, на какую из форм ДНК похожи спирали РНК. Потенциально возможные типы взаимодействий между белками и нуклеиновыми кислотами (случай комплекса 1h3e.pdb): 1. взаимодействие между фосфатами и положительно заряженными группами аминокислот ; 2. водородные связи между фосфатами, сахарами, основаниями нуклеиновых кислот и пептидными группами или гидрофильными боковыми цепями аминокислотных остатков; 3. стекинг-взаимодействия между боковыми группами ароматических аминокислот (Trp, Tyr, Phe, His) и основаниями.; 4. гидрофобные взаимодействия между основаниями и боковыми группами неполярных аминокислот. Это основные нуклеотид-белковые взаимодействия. Рассмотрим два из них (как требется в задании). Внеспиральные стекинг-взаимодействия Данное изображение иллюстрирует стекинг-взаимодействия между 2-72, 18-19-57 основаниями. Энергия стекинг взаимодействий ~ 3 -15 ккал/моль. Список команд: background white select * wireframe 50 restrict rna and not backbone select (oxygen,nitrogen) and rna and not backbone spacefill 200 select oxygen color red select nitrogen color blue zoom 140 select * and not (18:B,19:B,57:B,2:B,72:B) spacefill off Водородные связи На этой картинке изображении водородные связи между основаниями, не сводящиеся к Уотсон-Криковскому спариванию комплементарных оснований 13-9:B, 15-48:B, 20-47:B, 33-36:B, 37-32:B, 44-26:B, 47-47:B Список команд: background white select * wireframe 40 define helix1 1-7:B,49-53:B,55:B,18:B,61-72:B select helix1 color green define helix2 8-15:B,23-33:B,36-44:B,48:B select helix2 color purple define helix3 19:B,56:B select helix3 color black define helix4 20:B,47:B select helix4 color blue define helix5 46:B,47:B,47:B,47:B select helix5 color orange define helix6 47:B,47:B select helix6 color cyan restrict rna and not backbone select (oxygen,nitrogen) and rna and not backbone spacefill 120 select * and not (33:B,36:B,37:B,32:B,44:B,26:B,13:B,9:B,15:B,48:B,20:B,47:B) spacefill off define hh 33:B,36:B,37:B,32:B,44:B,26:B,13:B,9:B,15:B,48:B,20:B,47:B select (oxygen) and hh color red select (nitrogen) and hh color blue zoom 150 Анализ формы спирали На данный момент мне известны два типа определения формы спирали (А или В форма). Первый - с помощью программы RasMol, опираясь на визуальное впечатление и небольшие механические (сделанные вручную) вычисления. Второй - с помощью программы analyse. Ниже приведена картинка, построенная с помощью програмы Pymol. Здесь изображена тРНК нукле-белкового комплекса из pdb-файла 1h3e.pdb, в модели cartoons, раскраска chain. Если рассмотреть эту структуру тРНК, нельзя сделать какого-то однозначного вывода о форме ее спиралей, т.к. эти спирали достаточно сложно выделить, две спирали не очень длинные, а последняя вообще состоит из одного остатка. Конечно, можно было воспользоваться командой find_pair, но мне хотелось всё же попытаться сделать это каким-то образом, опираясь исключительно на визуальную оценку. Как известно, одним из основных отличий А- и В-форм является конформация, которую приминает второй углерод рибозы.Если он принимает C2-эндо конмормацию, то это Аформа, а если С3-эндо - то это В-форма спирали (...). На этой картинке изображен произвольно взятый остаток из области тРНК, более или менее напоминающий спираль. Остаток брался и из первой, и из второй спирали абсолютно произвольно. Остаток изображен в модели sticks, раскраска по атомам (с помощью программы Pymol): Видно, что углерод находится в C2-эндо конмормации. Делаем вывод - эти спирали больше напоминают А-форму. Теперь возьмем произвольный остаток из петли, а не из более или менее напоминающего спираль участка. Понятно, что он не может быть похож на ту или иную форму спирали, т.к. петли исследуемой тРНК сами по себе не похожи на спирали. Однако интересно, в какой конформации находится углерод на этом участке. Остаток (опять же взяли несколько произвольно выбранных остатков и сравнили получили один результат) изображен в модели sticks, раскраска по атомам (с помощью программы Pymol): А этот углерод уже принимает C3-эндо конмормацию. Конечно, из этого нельзя делать вывод, что петля похожа на А-форму спирали. Однако вполне логично, что углерод принимает другую конформацию, потому что если бы конформация не менялась, спираль скорее всего продолжалась бы и не удалось бы образовать такие причудливые петли. Итак, делаем вывод, что спирали исследуемой тРНК больше напоминают А-форму. Задание №5. Найти возможные двуспиральные участки в последовательности исследуемой РНК с помощью программы einverted из пакета EMBOSS. Для выполнения команды с помощью программы einverted был использован файл trna.fasta, в котором модифицированные основания были заменены на N, что значит "любой". При запуске программы строка запроса в Unix следующая: einverted т.е. пишем только название команды, всё остальное она спросит сама. Она спрашивает, например, имя файла, с которым надо работать, другие параметры : gap penalty (оставляем по умолчанию 5), match score (оставляем по умолчанию 5), mismatch score (оставляем по умолчанию -4) и minimum score threshold (меняем только его - с 50 до 20. Иначе никаких результатов не было получено). Вот что выдала программа einverted. Причем если проводить работу с параметром minimum score threshold от 50 до 25, то на выходе получаем пустой файл. А если значение этого параметра - от 20 до 5, то информация в выходном файле одинаковая (см. выше). Это связано с тем, что инвертированные повторы считаются за выравнивания, соответственно вес зависит от количества комплементарных пар. Т.к. участки, подаваемые на вход, достаточно малы, приходится понижать порог. Итак, программа einverted нашла один достаточно короткий участок. А вот программа find_pair нашал их больше, что подтверждается визуальным анализом с помощью RasMol. Возможно, это связано с тем, что einverted учитывает не учитывает неканонические взаимодействия, а они на самом деле очень важны при формировании вторичной структуры тРНК. Т.к. они не посчитаны, получается, что комплиментарных канонических взаимодействий достаточно мало - поэтому и такое короткий кусочек, причем только один. Это лишний раз доказывает предположение, что неканонические взаимодействия чрезвычайно важны и про них ни в коем случае нельзя забывать. Задание №6. Проанализировать последовательность тРНК программой mfold mfold. Для создания файлов с помощью программы mfold был использован файл tRNA_1.fasta, в котором все модифицированные основания были заменены на близкий канонический нуклеотид (PSU, 5MU->U; MAD->A). Также была создана отдельная папка, потому что программа выдает очень много разных файлов (mfold - по названию программы), в которой и проводилась работа. Для работы использовалась команда mfold . Строка запроса в Unix: mfold SEQ=tRNA.fasta P=X - значение параметра, которое изменялось от 10 до 20% - на сколько процентов энергия выдаваемой структуры может отличаться от оптимальной. Было произведено несколько запросов - про возможном отклонении энергии на 10%, 15% и 20%. В выдаче ОЧЕНЬ много различны хфайлов, среди них есть *.GIF, в которых содержатся различные изображения тРНК. По заданию надо выбрать картинку, на которой структура тРНК наиболее похожа на классическую - в форме кленового листа. Все картинки находятся здесь. А ниже приведены два изображения тРНК - при возможном отклонении энергии на 15% и на 20%: И всё же большее предпочтение отдается изображению, полученному при возможном отклонении энергии на 15%, потому что существование такой структура более реально.