На правах рукописи ЧЕРЕЗОВ Роман Олегович ХАРАКТЕРИСТИКА РЕГУЛЯТОРНОЙ ЗОНЫ ПЕРЕКРЫВАЮЩИХСЯ ГЕНОВ lawc и Trf2 у Drosophila melanogaster 03.02.07 – генетика АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук Москва 2013 Работа выполнена в лаборатории генетических основ морфогенеза ФГБУН «Институт биологии развития им. Н.К. Кольцова Российской академии наук» Научный руководитель: кандидат биологических наук СИМОНОВА Ольга Борисовна Официальные оппоненты: доктор биологических наук ЕВГЕНЬЕВ Михаил Борисович ФГБУН «Институт молекулярной биологии им. В.А. Энгельгардта Российской академии наук» заведующий лабораторией кандидат биологических наук КЛЁНОВ Михаил Сергеевич ФГБУН «Институт молекулярной генетики Российской академии наук» старший научный сотрудник Ведущая организация: Московский государственный университет им. М.В. Ломоносова, биологический факультет Защита диссертации состоится «18» декабря 2013 года в «1500» часов на заседании диссертационного совета Д 002.238.01 в Институте биологии развития им. Н.К. Кольцова РАН по адресу: 119334, г. Москва ул. Вавилова, д.26. С диссертацией и авторефератом можно ознакомиться в библиотеке и на сайте Института биологии развития им. Н.К. Кольцова РАН: http://idbras.ru/. Автореферат разослан « » ноября 2013 года. Ученый секретарь диссертационного совета кандидат биологических наук О.В. Бойко ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность проблемы. Изучение регуляции экспрессии генов является одной из актуальных проблем современной генетики. Важную роль в регуляции экспрессии генов играют их регуляторные зоны, которые наряду с наличием в них сайтов связывания регуляторных белков могут являться источником разных типов регуляторных РНК. В настоящее время показано, что значительная часть генома эукариотических организмов способна транскрибироваться в двух направлениях (смысловом и антисмысловом), то есть многие гены эукариот перекрываются. Так, у Drosophila melanogaster перекрывается 26.2 % кодирующих белки генов. Такое строение генома приводит к появлению общих для разных генов регуляторных зон и возникновению перекрывающихся РНК, как кодирующих, так и не кодирующих белки. В свою очередь, перекрывающиеся регуляторные элементы, и, главным образом, перекрывающиеся транскрипты, представляют собой дополнительный способ регуляции экспрессии генов. Эволюционная и биологическая значимость этого явления не совсем ясна. Большинство найденных перекрытий возникает между генами, транскрибируемыми с противоположных цепей одного и того же локуса. Часто в перекрытие вовлекается не кодирующий белок транскрипт. Накапливаются данные, что антисмысловые транскрипты участвуют во множестве клеточных процессов, таких как геномный импринтинг, инактивация Х-хромосомы, альтернативный сплайсинг, сайленсинг генов и метилирование, трансляция. Наличие перекрывающихся транскриптов и их регуляторная роль показаны для ряда генов у разных организмов, среди которых гены, вовлечённые в онкогенез и развитие других патологий. Существуют разные модели механизмов регуляции смысловой мРНК антисмысловым транскриптом. Одной из них является модель транскрипционной интерференции (ТИ) (или транскрипционного столкновения). Согласно этой модели, процесс транскрипции одного гена подавляет транскрипцию перекрывающегося с ним другого гена. Большинство исследований перекрывающихся генов и антисмысловой транскрипции проводится in vitro или in silico и остро нуждаются в подтверждении результатов in vivo. Ранее в нашей лаборатории была открыта мутация D. melanogaster, нарушающая правильную экспрессию многих нейрогенов и транскрипционных факторов, контролирующих развитие организма. По данным GenBank район локализации мутации содержал два гена leg-arista-wing complex и TBP-related factor 2 (lawc/Trf2), предположительно имеющих общую 5’-регуляторную зону. Транскрипты, синтезирующиеся с данного локуса, представляли собой набор разнонаправленных мРНК, количество и структура которых неизвестны. По нашим предварительным данным по крайне мере один из транскриптов гена lawc должен перекрываться с транскриптами гена Trf2. Мы предположили, что гены lawc и Trf2 взаимодействуют, а зона перекрытия и разнонаправленные транскрипты могут участвовать в координировании экспрессии обоих генов. 3 Исследование 5’-регуляторной области генов lawc и Trf2 важно не только для понимания механизмов контроля экспрессии данного локуса, но и для получения знаний о способах и механизмах регуляции экспрессии перекрывающихся генов у эукариот. Описание 5’-регуляторной зоны lawc/Trf2 позволит в дальнейшем использовать данный локус в качестве модели для исследования взаимодействия перекрывающихся генов in vivo. Цель и задачи исследования. Основная цель работы состояла в исследовании регуляторной 5’-зоны перекрывающихся генов leg-arista-wing complex и TBPrelated factor 2 у Drosophila melanogaster. В ходе выполнения работы были поставлены следующие задачи: 1) установить экзон-интронную структуру гена lawc; 2) исследовать экспрессию мРНК перекрывающихся генов lawc и Trf2 на разных стадиях развития D. melanogaster и в культуре клеток Schneider 2; 3) провести сравнительный анализ экспрессии перекрывающихся генов lawc и Trf2 у мутантов с различными нарушениями регуляторных областей; 4) исследовать эффект подавления экспрессии lawc-транскриптов на уровень экспрессии перекрывающихся с ними противоположно направленных транскриптов Trf2 in vitro в культуре клеток Schneider 2 и in vivo; 5) исследовать паттерн экспрессии перекрывающихся генов lawc и Trf2 у разных видов дрозофил. Научная новизна и практическая значимость работы. Обнаружено, что часть регуляторной области локуса lawc/Trf2 входит в состав нескольких разнонаправленных транскриптов и является общей для двух генов. Открыт новый экзон и установлены реальные точки старта транскрипции известных ранее сплайс-вариантов мРНК гена lawc. Изолировано шесть новых сплайсвариантов мРНК гена lawc; нуклеотидная последовательность одного из них внесена в базу данных Genbank под номером JX546150. Впервые показано наличие у гена Trf2 не описанных ранее коротких транскриптов длиной 1,1 т.н. и 3,1 т.н., формирующихся в 5`-регуляторной зоне. Впервые выявлены новые полоспецифические (специфичные только для самок или самцов) транскрипты обоих генов. Выявлены возможные регуляторные зоны, ответственные за тканеспецифическую регуляцию экспрессии генного комплекса в репродуктивной системе самок. Показано, что экспрессия прямых и обратных перекрывающихся транскриптов lawc/Trf2 в раннем эмбриогенезе пространственно не совпадает, что предполагает регуляцию экспрессии этих генов по механизму транскрипционной интерференции на данном этапе развития. Впервые охарактеризована природа мутантных аллелей исследуемого района. В экспериментах in vivo и in vitro по избирательному посттранскрипционному подавлению экспрессии гена lawc показана зависимость уровня экспрессии гена Trf2 от транскрипционной активности гена lawc. Обнаружен активирующий эффект РНК-интерференции на экспрессию одного из двух перекрывающихся генов (увеличение экспрессии вместо подавления), что очень важно учитывать на практике, поскольку в литературе всё больше уделяется внимание проблеме лечения ряда генетических 4 заболеваний (включая рак) с помощью генотерапии на основе РНКинтерференционного подавления экспрессии «испорченного» гена. Показана эволюционная консервативность района перекрытия генов lawc и Trf2 для близкородственных видов дрозофил подгруппы melanogaster. Степень достоверности и апробация результатов. Результаты проведенных исследований являются достоверными, что подтверждено публикациями в рецензируемых журналах, воспроизводимостью результатов в различных условиях и на различных моделях. Исследования проводились на сертифицированных и откалиброванных приборах, для анализа полученных данных были использованы современные методы обработки данных, применяемые для исследования биологических процессов. Результаты работы докладывались на ежегодных конференциях молодых ученых ИБР РАН (Москва, 2008; 2009; 2010; 2011); на Х Всероссийской медико-биологической научной конференции молодых учёных «Фундаментальная наука и клиническая медицина» (Санкт-Петербург, 2007), на Международной молодёжная научно-методическая конференция «Проблемы молекулярной и клеточной биологии» (Томск, 2007), на Х Всероссийская конференция «Человек и его здоровье» (Санкт-Петербург, 2009), на Международной конференции «Современное состояние генетики в Казахстане (Алмата, 2010), на Всероссийском симпозиуме «Структура и функции клеточного ядра (СанктПетербург, 2010), а также на международных конференциях по дрозофиле (ADRC) в США (San Diego, 2008; Chicago, 2009; Washington, 2010; Washington, 2013) и в Испании (Barcelona, 2013). Личное участие автора. Представленная работа полностью выполнена автором, включая разработку экспериментальных моделей и планирование экспериментов, получение исходных экспериментальных данных и непосредственное участие в научных экспериментах, статистическую обработку и интерпретацию полученных результатов, подготовку основных публикаций по проделанной работе и представление результатов исследований на конференциях соответствующей тематики. Структура и объем диссертации. Диссертационная работа изложена на 125 страницах машинописного текста, содержит 16 рисунков, 3 таблицы и состоит из введения, обзора литературы, материалов и методов, результатов и обсуждения, заключения, выводов, списка литературы, включающего 223 цитируемых источника и одного приложения. Публикации. По материалам диссертации опубликовано 19 печатных работ, в том числе 4 в журналах, соответствующих Перечню ВАК, одна электронная публикация и 14 тезисов докладов и материалов конференций. МАТЕРИАЛЫ И МЕТОДЫ ИССЛЕДОВАНИЯ Исследования выполнялись на плодовой мушке Drosophila melanogaster и культуре клеток дрозофилы Schneider 2 (S2). Использовались линии мух самостоятельно полученные в данной работе, а также линии из мировых коллекционных центров. 5 РНК выделяли с помощью Tri Reagent (Sigma, США) в соответствии с рекомендациями производителя. Полноразмерную кДНК транскриптов гена lawc получали методом быстрой амплификации 5’и 3’-концевых фрагментов кДНК (5’, 3’-RACE) с помощью наборов реагентов Step-Out RACE (Evrogen, Россия) и FirstChoice RLM kit (Ambion, США) в соответствии с рекомендациями производителей. Сравнительный анализ количества и размера прямых и обратных транскриптов проводили методом нозерн-блот анализа по методике Sambrook J. and Russel D.W. (Molecular cloning, 2001) с изменениями. Для нозерн-блот гибридизации в качестве зондов использовали меченые 32Р ДНК-пробы, а также одноцепочечные 32Р меченые рибопробы из района перекрывания транскриптов. В качестве референсного гена использовали зонды к гену альфатубулина. Сравнительный анализ экспрессии генов lawc и Trf2 проводили методом количественной полимеразной цепной реакции в реальном времени (ПЦР-РВ) с использованием зондов, меченных флуоресцентными красителями (зонды TaqMan®). Праймеры подбирались из транслируемых областей обоих исследуемых генов. В качестве эндогенного контроля использовался ген рибосомального белка Rpl32. Гибридизацию in situ на целых эмбрионах проводили, используя дигоксигенин-меченые рибопробы из района перекрытия генов lawc/Trf2. РНК-интерференцию в культуре клеток дрозофилы проводили по методике Ausubel F.M. (Ausubel et al., 2003). Фрагмент кДНК гена lawc, содержащий транслируемую последовательность, апмплифицировали с помощью ПЦР (рис. 1). Каждый праймер содержал кроме последовательности гена сайт связывания T7 полимеразы на 5’-конце. Полученные продукты амплификации использовали в качестве матрицы для синтеза двухцепочечной РНК (дцРНК) in vitro, которую трансфецировали в клетки согласно методике Ausubel F.M. (Ausubel et al., 2003). В качестве неспецифического контроля использовали дцРНК, содержащую последовательность гена GFP или стерильную воду в объеме, равном объему вносимой дцРНК. Эффект РНКинтерференции оценивали по уровню мРНК целевых генов с использованием ПЦР-РВ. Трансгенные инактивирующие конструкции, экспрессирующие РНКшпильку, направленную на пост-транскрипционное подавление мРНК гена lawc по пути РНК-интерференции, были созданы на основе вектора pUAST (Brand, Perimon, 1993). Каждая конструкция содержала два фрагмента транскрибируемой области гена lawc, клонированные в направлении «хвост-кхвосту» по отношению друг к другу. Фрагменты были комплементарны транслируемым или нетранслируемым участкам в зависимости от дизайна конструкции (рис. 1). ДНК созданных конструкций была инъецирована в полярную плазму эмбрионов дрозофилы на стадии прецеллюлярной бластодермы. Полученные линии трансгенных дрозофил использовались в генетических экспериментах с применением дрожжевой двухкомпонентной 6 системы UAS/GAL4. Для этого мухи, экспрессирующие дрожжевой белокактиватор Gal4 под контролем убиквитарного промотора гена тубулина tubGal4/TM3, Tb, были скрещены с трансгеннными мухами UAS-Ri/UAS-Ri, несущими инактивирующую конструкцию, контролируемую дрожжевым промоторным элементом UAS. Рисунок 1. Схема создания инактивирующих конструкций (Ri и Rif) для подавления lawc. (I) - геномная организация перекрывающихся генов lawc и Trf2. Серым цветом окрашена область перекрывающихся экзонов, черным - обозначены районы, кодирующие белок, неокрашены – некодирующие экзоны. (II) - фрагменты инактивирующей конструкции UAS-Ri (слева) и UAS-Rif (справа). Внизу представлена схема формирования РНК-шпильки при активации конструкций в системе UAS/GAL4. (III) - карта плазмид pUAST-lawcRNAi (Ri/Rif), mini-white – маркерный ген; 3’P, 5’P – концевые повторы Р-элемента, 5хUAS – 5 копий дрожжевого промотерного элемента UAS (Upstream activating sequence), SV40 polyA – фрагмент, содержащий сигнал полиаденилирования мРНК вируса SV40. В результате нарабатывался белок Gal4, который связывался с сайтами UAS и повсеместно вызывал экспрессию РНК-интерференционной шпильки в организме мухи tub-Gal4/UAS-Ri. Восстановление жизнеспособности (rescue–тест) проводили генетическими методами. В rescue-экспериментах использовали три трансгенные линии, содержащие генетические конструкты, конститутивно экспрессирующие различные домены TRF2. При приготовлении препаратов кутикулы погибших эмбрионов хорион удаляли вручную, кутикулу просветляли в капле раствора Хойера с добавлением 30% молочной кислоты в течение часа при 60°С. 7 Препараты анализировали с использованием оборудования Центра коллективного пользования «Биология развития на основе использования клеточных технологий и оптических методов исследований» при Институте биологии развития им. Н.К.Кольцова РАН. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ Экспрессия прямых и обратных транскриптов комплекса lawc/Trf2 Паттерн экспрессии разнонаправленных транскриптов исследовали с помощью Нозерн-блот анализа поли(А)+РНК (рис. 2). Для Trf2 было выявлено пять новых полос гибридизации. Среди них три лёгких (менее 1,5 т.н.), две из которых полоспецифические, характеризующие, возможно, некодирующие, транскрипты Trf2 (рис. 2Б). Для lawc было выявлено 6 полос гибридизации, 3 из которых полоспецифические - характерные самкам – соответствующие транскриптам длиной ~3.7 т.н., ~0.8 т.н. и ~0.6 т.н. (рис. 2Б). Таким образом, впервые были обнаружены новые транскрипты изучаемых генов, не описанные ранее в литературе, и, вероятно, имеющие регуляторное значение. В связи с этим возникла необходимость клонирования и изучения структуры новых транскриптов гена lawc. 2 т.п.н. Рисунок 2. Анализ экспрессии прямых и обратных транскриптов комплекса lawc/Trf2 у мух дикого типа и у гипоморфных мутантов lawcp1. А. Карта перекрывающихся транскриптов lawc/Trf2. Направление транскрипции указано стрелками, широкие прямоугольники – экзоны, закрашенные прямоугольники – кодирующие белок области экзонов. Зона перекрытия транскриптов заштрихована. Cиним цветом указаны зонды. 8 Треугольником показано место инсерции Р-элемента у мутанта lawcp1. Б. Нозерн-блот анализ поли(А)+РНК мух дикого типа. Гибридизацию проводили с зондом из зоны перекрытия: слева ДНК-зонд р3.3, далее – рибопробы, выявляющие прямые Trf2транскрипты и обратные lawc-транскрипты из района р3.3 и 3’-района. Красные стрелки – транскрипты Trf2, зелёные – транскрипты lawc, голубые – совпадающие по размеру прямые и обратные транскрипты, обведены овалом полоспецифические lawc-транскрипты, обведены квадратом полоспецифические некодирующие Trf2-транскрипты. Составные профили гибридизации (с зондом lawc3’) скомбинированы из радиоавтографов, полученных с одного фильтра, но с разной экспозицией. Справа показана схема нозерн-блот гибридизации с разными зондами. Красным показаны транскрипты гена lawc, зеленым – Trf2, синим – совпадающие по размеру прямые и обратные транскрипты. В. Нозерн-блот анализ поли(А)+РНК мух дикого типа и гипоморфного мутанта lawcp1. Обозначены lawc- и Trf2транскрипты мутанта, имеющие в своём составе последовательность Р-элемента. Знак вопроса указывает на исчезающие у мутанта транскрипты. Внизу - нормализующая нозернблот гибридизация того же фильтра с зондом к aльфа-тубулину. Характеристика транскриптов гена lawc Ранее в нашей лаборатории при скрининге библиотеки кДНК из эмбрионов дрозофилы был получен клон части кДНК гена lawc – isofom C (GenBank # DQ296481) (Simonova O.B. et al., 2005). Для изолирования полноразмерной кДНК гена lawc была проведена быстрая амплификация 5’концевых фрагментов кДНК (5’-RACE). В результате был получен клон размером 3437 н., который был длиннее транскрипта lawc - isoform C на 714 н. (рис. 3). Рисунок 3. Структурная организация и схема сплайсинга транскриптов гена lawc. Прямоугольниками обозначены экзоны, чёрным выделен район, кодирующий белок, зеленым выделена зона перекрытия транскриптов lawc и Trf2, синим обозначены новые транскрипты, обнаруженные у самок (F1-4), оранжевым – у самцов (М1-2). Штриховкой обозначены установленные в данной работе границы 5’-районов соответствующих транскриптов и новый экзон гена lawc. 9 Сравнение его нуклеотидной последовательности с последовательностью геномной ДНК показало, что ген lawc имеет протяженную 5’--нетранслируемую область и перекрывается со вторым экзоном Trf2 на протяжении 408 п.н. Для изучения структуры остальных lawc-транскриптов транскриптов мы использовали метод 5'-RLM-RACE и 3’--RACE. В результате из взрослых особей (самцов и самок) были получены и секвенированы кДНК-клоны кДНК клоны новых сплайс-вариантов мРНК гена lawc,, не описанные ранее (F1-4, ( M1-2 на рис. 2Б и рис. 3), а также получены полноразмерные кДНК известных ранее сплайс-вариантов сплайс вариантов isoform A и isoform B (рис. 3).. Картирование кДНК сплайс-вариантов сплайс isoform A и isoform B показало, что они перекрываются со вторым экзоном гена Trf Trf2 на протяжении 149 п.н. При сравнении новых сплайс-вариантов сплайс c геномной ДНК и с последовательностями базы данных GenBank оказалось, что транскрипты F3 и F4 4 содержат новый экзон. Кроме того эти и другие д (F1, 1, F2 и M1, M2) транскрипты имеют новые новы сайты старта транскрипции. Нуклеотидная последовательность транскрипта F44 внесена в базу данных Genbank под номером JX546150. Таким образом, мы показали, что в районе перекрывающихся генов lawc/Trf2 транскрибируется множество разнонаправленных (в том числе полоспецифических)) сплайс-вариантов сплайс вариантов мРНК, как кодирующих кодирующих, так и не кодирующих белки. Экспрессия генов lawc и Trf2 на разных стадиях развития D D. melanogaster и в культуре клеток S2 Анализ картины и уровня экспрессии генов lawc и Trf2 в развитии проводили с помощью нозерн озерн-блот блот гибридизации и ПЦР в реальном времени. Б относительный уровень мРНК А lawc Эм Л1 Л2 Л3 К1 К2 К3 ♂ ♀ 1.8- 1,6 1,4 1,2 1 0,8 0,6 0,4 0,2 0 Рисунок 4. Анализ экспрессии lawc и Trf2 на разных стадиях развития D. melanogaster и в культуре клеток S2. (А) Нозерн-блот Нозерн блот гибридизация мРНК с зондом р3.3 из зоны перекрытия lawc/Trf2 (см. рис.. 2А). Для нормализации использовали ДНК-зонд зонд к альфа альфа-тубулину. (Б) ПЦР-РВ-анализ анализ экспрессии транскриптов lawc и Trf2 на разных стадиях развития. Обозначения: Em (Эм) – эбрионы, Л1-Л3 Л1 личинки 1-3-го возрастов, К1--К3 – стадии куколки (ранняя, средняя, поздняя), ♂ - самцы, ♀ - самки, S2 – культура клеток S22. 10 Оказалось, что экспрессия этих генов не является убиквитарной, т.е. количество транскриптов и их уровень экспрессии меняется в зависим зависимости от стадии развития (рис. 4А). Наиболее аиболее сильная экспрессия генов совпадает по времени с основными событиями морфогенеза (эмбриогенез, метаморфоз) (рис. 4Б). Нозерн-блот блот анализ поли(А)+РНК из культуры клеток S2 показал одновременную экспрессию генов lawc/Trf2.. В связи с этим возник вопрос, совпадают ли пространственно паттерны экспрессии изучаемых генов в живом организме. Гибридизация in situ на целых эмбрионах показала показала, что гены Trf2 и lawc экспрессируются практически во всех тканях (рис. 5) 5), но с разной интенсивностью.. На поздних стадиях эмбрионального развития экспрессия обоих генов падает. Гибридизация in situ на целых эмбрионах с РНК-зондами зондами из района перекрытия генов Рисунок 5. Гибридизация in situ на целых эмбрионах с РНК-зондами зондами из района перекрытия генов. Стрелками показана экспрессия Trf2 и lawc. Наиболее информативной для анализа явилась стадия поздней бластодермы, так как она сравнительно просто устроена и представляет собой однослойный клеточный мешок. Оказалось, что транскрипты гена lawc экспрессируются преимущественно в полярных клетках на зад заднем полюсе эмбриона, а транскрипты Trf2, в отличие от lawc, выявлялись в центральной области эмбриона (рис. 5). Таким образом, экспрессия прямых и обратных перекрывающихся транскриптов lawc/Trf2 в раннем эмбриогенезе пространственно не совпадает, что предполагает регуляцию экспрессии этих генов по механизму транскрипционной интерференции на данном этапе развития. Экспрессии кспрессии транскриптов lawc и Trf2 в мутантных линиях Ранее в нашей лаборатории была была получена гипоморфная мутация lawcp1. Было показано, что она вызвана инсерцией двойной копии мобильного Pэлемента (Модестова и др., 2003). Нозерн-блот Нозерн блот гибридизация с зондом, содержащим последовательности зоны перекрытия генов, показа показала увеличение размера ряда транскриптов обоих генов на размер P-элемента элемента (+ (+P на рис. 2В). 11 Самки другой линии - lawcu3 - стерильны из-за нарушения самовоспроизведения стволовых клеток яичников. Нозерн-блот гибридизация показала отсутствие у стерильных самок lawcu3 полоспецифического транскрипта Trf2 (рис. 6Б, зелёная стрелка) и перекрывающегося с ними обратного полоспецифического lawc-транскрипта (3,7 т.н.) (рис. 6В, синяя стрелка). Было обнаружено избирательное утяжеление общего для самок и самцов транскрипта Trf2 и общего для самок и самцов транскрипта lawc (рис. 6Б, В, красные стрелки), возможно, вызванное инсерцией мобильного элемента в общий для этих транскриптов район. 2 т.п.н. Рисунок 6. Анализ экспрессии транскриптов комплекса lawc/Trf2 в линии lawcu3. А. Карта перекрывающихся транскриптов lawc/Trf2. Описание как на рис. 2. Cиним цветом указаны РНК-зонды: зонд lawc3’, зонд анти-lawc является рибопробой ДНК-зонда р3.3, специфичной к обратным lawc-транскриптам. lawc6 – ДНК-зонд. Б. Нозерн-блот анализ поли(А)+РНК диких (OR) и мутантных lawcu3 самок и самцов с ДНК-зондом lawc6. Красной стрелкой указаны утяжеленные транскрипты Trf2 общие для самцов и самок. Зеленой – отсутствие полоспецифического транскрипта размером 9.5 т.н. у стерильных самок. В. Нозерн-блот анализ поли(А)+РНК диких (OR) и мутантных lawcu3 самок и самцов с использованием зондов, выявляющих lawc-транскрипты. Синие стрелки указывают lawcтранскрипты, отсутствующие у мутантов, красные стрелки указывают увеличенный в размере транскрипт (общий для самцов и самок), зелёные указывают на транскрипты, размер которых не изменился. Г. Уровень экспрессии мРНК lawc в мухах дикого типа (OR) и в мутантах (lawcu3). 12 Анализ уровня мРНК обоих генов с помощью ПЦР-РВ показал сильное снижение экспрессии гена lawc в линии lawcu3 (рис. 6Г). Мы предполагаем, что стерильность самок lawcu3 вызвана нарушением некой регуляторной зоны, специфически контролирующей экспрессию полоспецифических транскриптов lawc/Trf2 в оогенезе. Возможно, эта зона находится в районе «промотор-первый интрон Trf2» или в районе второго интрона Trf2 (район зонда lawc3’ и р3.3 (рис. 6А)), так как в этих районах нами обнаружены хромосомные перестройки, вызвавшие утяжеление lawcтранскриптов самок (0.8 т.н.) и самцов (0.9 т.н.) до 2.9 т.н. и 3.0 т.н. соответственно (рис. 6В слева, красные стрелки). Отсутствие утяжелённой полосы при гибридизации с рибопробой анти-lawc (рис. 6В справа) вызвано высокоспецифичностью рибопроб, так как они не гибридизуются с частично комплементарными РНК. Дополнительно мы проанализировали линию lawcEF520/FM4. Гомозиготные самки lawcEF520 и гемизиготные самцы lawcEF520/Y погибают на эмбриональной стадии развития (рис. 7Б). Рисунок 7. Анализ экспрессии lawc/Trf2 в линии с эмбриональной летальной мутацией lawcEF520. А. Карта перекрывающихся транскриптов lawc/Trf2. Описание как на рис. 1. Внизу синим цветом указаны ДНК-зонды, ниже прерывистой линией обозначена делеция в линии lawcpdel. Df18 и Df9 – небольшие делеции в линии с мутацией lawcEF520. Б. Фенотип кутикулы эмбрионов дикого типа (вверху) и погибших мутантных эмбрионов lawcEF520 (внизу). Стрелками указана область головного отдела. В. Нозерн-блот анализ поли(А)+РНК гетерозиготных мутантных самок lawcpdel/lawcEF520(520/Df), самок lawcpdel (Df), самок lawcEF520/FM4 (520/+) и самок дикого типа (+). Транкированный транскрипт мутанта указан красной стрелкой. Для нормализации использовали ДНК-зонд к альфа-тубулину. 13 Ранее было показано, что у мух в линии с мутацией lawcEF520 есть небольшие делеции в транслируемой области гена Trf2, однако роль этих делеций в проявлении мутантного фенотипа не исследовалась. С помощью нозерн-блот анализа мы выявили в мухах этой линии укороченные транскрипты гена Trf2, возможно, кодирующие транкированный белок (рис. 7В, зонд р3.3 и зонд lawc6). Обнаружить и продемонстрировать укороченный транскрипт в мухах линии с летальной хромосомой lawcEF520 позволило использование комбинации аллелей lawcpdel/lawcEF520, где lawcpdel несёт делецию в районе используемого зонда р3.3, позволяя выявлять транскрипты мутантов lawcEF520 (рис. 7А). Транскрипция укороченной мРНК пересекает район зонда lawc6, но не доходит до района зонда trf2, поскольку гибридизация с зондом trf2 выявляет только транскрипты lawcpdel в мухах lawcpdel/lawcEF520 (рис. 7В, зонд trf2). Отсутствие полноразмерных транскриптов Trf2 у lawcEF520 говорит о том, что мутация lawcEF520 является ноль-мутацией по гену Trf2. Таким образом, анализ трех мутантных линий выявил нулевой аллель Trf2 в одной из них и показал, что фенотип мух двух остальных линий обусловлен нарушениями регуляторной зоны lawc/Trf2. Более того, мы показали, что регуляторная зона lawc/Trf2 содержит область, необходимую для активации экспрессии полоспецифических транскриптов lawc/Trf2 в репродуктивной системе самок. Регуляторное влияния lawc на экспрессию Trf2 Мы исследовали влияние подавления экспрессии гена lawc на функционирование противоположно направленного гена Trf2 in vitro на культуре клеток S2 и in vivo в мухах, используя метод РНК-интерференции. Рисунок 8. Подавление экспрессии lawc в культуре клеток S2. Желтым показан уровень экспрессии мРНК гена lawc, зеленым – уровень экспрессии Trf2. dsLAWC, dsGFP– уровень мРНК при введении дцРНК, гомологичной гену lawc (опыт) или GFP (контроль), соответственно. Для экспериментов in vitro была получена дцРНК, содержащая последовательность транслируемой области lawc (рис. 1). Введение в клетки дцРНК неожиданно привело к сильному повышению уровня мРНК гена lawc и 14 снижению экспрессии Trf2 (рис. 8). Таким образом, возможно, транскрипционная активность гена lawc в ядре или его мРНК в цитоплазме могут регулировать экспрессию Trf2. Для экспериментов in vivo были созданы линии трансгенных дрозофил UAS-Ri, несущих конструкции, способные экспрессировать РНК-шпильку, направленную на пост-транскрипционное подавление мРНК гена lawc по пути РНК-интерференции (рис. 1). Активация конструкции с помощью убиквитарно экспрессирующегося драйвера Tub-Gal4 приводила к массовой (до 97% в зависимости от температуры развития, поскольку активность драйвера зависит от температуры) гибели потомства UAS-Ri/Tub-Gal4 на эмбриональной стадии развития (рис. 9). Рисунок 9. Выживаемость дрозофил после активации конструкции Ri. Синие столбики – выживаемость дрозофил после активации конструкции UAS-Ri белком Gal4, экспрессирующегося под контролем промотора гена тубулина (TubGal4>UAS-Ri) при различной температуре развития, коричневый и желтый столбики - выживаемость (Rescue-test) на фоне эктопической экспрессии двух изоформ белка TRF2: укороченной и полноразмерной соответственно. По оси абсцисс – температура развития, °С. По оси ординат – частота выживаемости, %. Исследование фенотипа погибших эмбрионов показало наличие у них ряда аномалий, характерных для эмбрионов со сниженной экспрессией TRF2 (рис. 10Б). Введение дополнительных конструкций, экспрессирующих TRF2, восстанавливало жизнеспособность мух, обосновывая факт того, что эмбриональная гибель в трансгенных линиях является результатом снижения уровня экспрессии Trf2 (рис. 9, коричневый и жёлтый столбики). Данные генетических экспериментов были подтверждены в сравнительном анализе экспрессии генов lawc и Trf2, выполненном при помощи метода ПЦР в реальном времени (рис. 10А). Оказалось, что у мух после активации конструкции UAS-Ri, уровень экспрессии Trf2 действительно резко падает, в то время как экспрессия lawc увеличивается более чем в два раза по сравнению с мухами, содержащими неактивную конструкцию UAS-Ri (рис. 10А). Таким образом, эксперименты по подавлению экспрессии гена lawc in vivo и in vitro дали сходные результаты: попытка ингибировать экспрессию lawc по пути РНК-интерференции приводит к увеличению экспрессии гена lawc и снижению экспрессии Trf2. 15 Мы провели анализ фенотипа кутикулы эмбрионов, погибших в результате снижения экспрессии Trf2 (рис. 10Б). Рисунок 10. Нарушение развития эмбрионов со сниженной экспрессией TRF2. (А) Количественная характеристика уровня экспрессии генов Trf2 и lawc у дрозофил в условиях РНК-интерференции lawc. Контроль - уровень экспрессии lawc и Trf2 до активации конструкции UAS-Ri; (Б) Фенотип эмбрионов, погибших после подавления экспрессии транскриптов lawc комплекса lawc/Trf2. (I) Эмбрион дикого типа. А1-А8 – абдоминальные сегменты. А, Р – передний и задний полюса эмбриона соответственно, (II) Фенотип “Doubleline”, с нарушенной D/V полярностью (зубчатые полоски в спинном отделе показаны стрелками), 22%. (III) Фенотип “Ghost”, нарушение A/P и D/V полярностей, 11%. (IV) Нарушение слияния трахей, 67 %. (В) Карта района lawc/Trf2 по данным UCSC Genome Browser: места локализации «открытого» хроматина в регуляторной зоне и предположительные районы связывания ключевых факторов раннего развития (ТФ). У многих эмбрионов не происходило слияния фрагментов трахей в единую сеть на финальных этапах её формирования, что приводило к нарушению целостности дыхательной системы. У других нарушалась сегментация: фенотип «двойная линия» («double line»), либо отсутствовали кутикулярные структуры тела: фенотип «призрак» («ghost»). Фенотип 16 «призрак» представляет собой дезинтегрированную клеточную массу, которая возникает в результате нарушения дорсо-ветральной (D/V) и антериопостериорной (A/P) полярностей эмбриона. Известны ключевые гены, определяющие полярность эмбриона. Мы предположили, что регуляторная зона lawc/Trf2 должна содержать сайты связывания белков этих генов. Анализ с использованием базы данных UCSC Genome Browser (Fujita P.A. et al., 2010) подтвердил наши предположения (Рис. 10В). Были обнаружены сайты связывания для Dorsal (D/V полярность), Hanchback и Caudal (A/P полярность). Дополнительно были выявлены сайты связывания для белков Kruppel и Dichaete, которые также контролируют ранний эмбриогенез. На возможность связывания этих транскрипционных факторов с конкретными участками регуляторной зоны указывает совпадение их локализации с районами «открытого» хроматина, доступного для связывания с регуляторными факторами (рис. 10В). Экспрессия транскриптов lawc и Trf2 у разных видов дрозофил В ряде работ показано, что перекрывающиеся гены обладают малой эволюционной консервативностью между разными видами и подвергаются отрицательному отбору. Сравнительный анализ базы данных показал, что не у всех видов Drosophila присутствуют транскрипты, экспрессирующие гомологи белков Lawc и Trf2. Тем не менее, мы решили проверить, сохраняются ли перекрытия между транскриптами генного комплекса lawc/Trf2 у близкородственных видов дрозофил подгруппы melanogaster и эволюционно отдалённых видов дрозофил группы virilis и дрозофил вида D. funebris (рис. 11А). Нозерн-блот гибридизация поли(А)+РНК, выделенной из эволюционно отдалённых видов дрозофил группы virilis: D. virilis, D. ezoana, D. borealis, D. texana и вида D. funebris группы funebris, с зондом p3.3 из района перекрытия lawc/Trf2 у D. melanogaster показала наличие полос гибридизации, характерных для транскриптов Trf2 и отсутствие полос гибридизации, характерных для перекрывающихся с ними транскриптов lawc (рис. 11Б). Таким образом, у эволюционно отдалённых видов перекрывание транскриптов в исследуемой зоне отсутствует. Размер транкриптов Trf2 у дрозофил исследуемых видов группы virilis и funebris гораздо меньше по сравнению с Trf2-транскриптами дрозофил из подгруппы melanogaster. Другой результат показала нозерн-блот гибридизация поли(А)+РНК, выделенной из близкородственных видов дрозофил подгруппы melanogaster: D. erecta, D. yakuba и D. simulans, с зондом p3.3. Мы увидели наличие полос гибридизации, характерных, как для Trf2, так и для lawc. Таким образом, у эволюционно близких к D. melanogaster видов дрозофил экспрессия перекрывающихся транскриптов lawc и Trf2 сохраняется, хотя размеры некоторых транскриптов и их количество слегка варьирует (рис. 11Б). В целом, анализируя полученные результаты, можно сделать два вывода. Во-первых, эволюция гена Trf2 и lawc шла в направлении увеличения размеров 17 транскриптов этих генов. Во-вторых, перекрытие в исследуемой зоне между генами lawc и Trf2 эволюционно возникло как минимум на этапе формирования подгруппы melanogaster и сохраняется среди близкородственных видов дрозофил этой подгруппы. A Б Рисунок 11. Анализ экспрессии транскриптов lawc/Trf2 у различных видов дрозофил группы melanogaster. А. Упрощённая схема эволюционного дерева рода Drosophila. Б. Нозерн-блот гибридизация поли(А)+РНК, выделенной из разных видов дрозофил, с зондом р3.3 из района перекрытия генов lawc и Trf2 у D. melanogaster. Обозначения: D.mel – D. melanogaster, D.sim – D. simulans, D. er – D. erecta, D.yak – D. yakuba, D. vir – D. virilis, D.bor – D. borealis, D. tex – D. texana, D. ezo – D. ezoanna, D.fun – D. funebris Таким образом, однажды возникнув в ходе эволюционного процесса, район перекрытия генов lawc и Trf2 сохраняет консерватизм и не подвергается отрицательному отбору. 18 ЗАКЛЮЧЕНИЕ Ранее для Trf2 были описаны только четыре транскрипта с большим молекулярным весом, для lawc - три. В настоящей работе мы показали, что, как для Trf2, так и для lawc характерны короткие сплайс-варианты транскриптов, активно экспрессирующиеся на эмбриональной и куколочной стадиях развития. Мы обнаружили новый экзон в составе гена lawc и показали, что некоторые транскрипты имеют альтернативные сайты старта транскрипции. Ряд транскриптов этих генов не кодируют белки и являются полоспецифическими. Анализ базы UCSC Genome Browser показал, что регуляторная область lawc/Trf2 насыщена сайтами связывания важных белковых факторов, контролирующих эмбриогенез, поэтому одна из вероятных функций некодирующих РНК генов lawc и Trf2 – обеспечение доступности хроматина для этих регуляторных факторов, путём привлечения хроматинремоделирующих комплексов. Регуляция экспрессии смыслового гена антисмысловыми длинными некодирующими РНК на уровне хроматина описана для гена человека CDKN2B (Yu et al., 2008), генов крысы Nefl и Vim (Tomikawa et al., 2011) и генов Evx1 и Hoxb5/6 мыши (Dinger et al., 2008). Продукт гена Trf2 является базовым транскрипционным фактором. Несмотря на это мутации гена Trf2 проявляют специфичный эффект, выраженный в гомеозисной трансформации аристы в элементы тарзуса у одних мутантов и стерильности самок у других. Это указывает на существование тканеспецифических регуляторных элементов в структуре гена lawc/Trf2. В результате наших экспериментов показано наличие регуляторного района специфически функционирующего у самок. В дальнейших экспериментах необходимо установить точные границы этого района. Нами впервые показано наличие зоны перекрытия между разнонаправленными транскриптами lawc и Trf2. Наличие такой зоны позволяет предположить регуляцию экспрессии этих генов на уровне взаимодействия их РНК. Дуплекс между разнонаправленными транскриптами может являться субстратом, как для белков пути РНК-интерференции, так и для аденозиндеаминазы (ADAR), или влиять на сплайсинг пре-РНК обоих генов. Образование РНК-дуплекса возможно при коэспрессии перекрывающихся генов в одной клетке. Мы показали, что в культуре клеток перекрывающиеся транскрипты lawc/Trf2 экспрессируются одновременно. Перекрывающийся паттерн экспрессии разнонаправленных транскриптов, полученный при гибридизации in situ на целых эмбрионах, также указывает на коэкспрессию этих генов. Однако в раннем эмбриогенезе, на стадии клеточной бластодермы, экспрессии этих генов не совпадают. Такой паттерн экспрессии характерен для регуляции транскрипции перекрывающихся генов по модели транскрипционной интерференции, или транскрипционного столкновения. Большинство исследований по изучению регуляции перекрывающихся генов проводятся in silico с использованием анализа баз данных или ex vivo на культуре клеток. Наличие системы перекрывающихся транскриптов lawc/Trf2 позволило нам поставить эксперименты по влиянию подавления обратных 19 транскриптов на экспрессию прямых в условиях in vitro и in vivo. Результаты этих экспериментов показали увеличение экспрессии гена lawc в ответ на введение инактивирующих конструкций и дцРНК, содержащих последовательности транслируемой области гена. Таким образом, мы обнаружили, что подавление экспрессии в живом организме с использованием РНК-интерференции не всегда приводит к снижению уровня мРНК целевого гена, но может и вызвать его повышение. Результат нашего эксперимента противоречит общепринятым представлениям о РНК-интерференции, как о механизме, с помощью которого можно осуществлять избирательное подавление синтеза белков через деградацию информационной РНК. Почему же попытка снизить экспрессию всех lawc-транскриптов привела к обратному результату? Возможно, что сначала индукция РНК-интерференции in vitro или in vivo вызывает снижение уровня белка Lawc. И это, вероятно, приводит к включению специфических компенсаторных механизмов, увеличивающих экспрессию мРНК гена lawc. Мы считаем, что такая суперактивация транскрипции lawc должна была бы помешать нормальной работе РНК-полимеразы, синтезирующей мРНК перекрывающегося с ним и идущего в обратном направлении гена Trf2, то есть привести к транскрипционной интерференции. Этот механизм, исходно открытый у дрожжей играет, как считается, немалую роль в регуляции экспрессии генов. В пользу подобного сценария при РНК-интерференции гена lawc говорит ещё один наш эксперимент, в котором мы снижали экспрессию только одного его транскрипта - lawc-isoform C (рис. 1, конструкция UAS-Rif). В этом случае драматического результата с массовой гибелью дрозофил не наблюдалось, вероятно, оттого, что экспрессия оставшихся транскриптов обеспечивала необходимый уровень белка LAWC. В результате интенсивность транскрипции lawc повышалась незначительно, что не мешало работе гена Trf2. Наблюдаемое снижение экспрессии гена Trf2 в ответ на активацию транскрипции гена lawc позволяет предположить модулирующую роль lawc в регуляции транскрипции гена Trf2. Такое взаимодействие могло сложиться в ходе эволюционного процесса при формировании подгруппы melanogaster, поскольку у эволюционно более древних видов дрозофил (группа virilis, funebris) гены lawc и Trf2 не имеют перекрытия в изучаемом районе, хотя этот район и входит в состав Trf2-транскриптов, что говорит о его функциональной значимости. Сохранение же района перекрытия в геноме исследуемых дрозофил близкородственных видов подгруппы melanogaster, очевидно говорит об эволюционной значимости данного района, возможно, приспособленного для тонкой регуляции транскрипционного процесса, и не подвергающегося отрицательному эволюционному отбору у этих видов. 20 ВЫВОДЫ 1) мРНК гена lawc транскрибируется с восьми альтернативных промоторов и имеет девять сплайс-вариантов: 3 транскрипта кодируют белки, 6 транскриптов являются некодирующими. 2) В районе lawc/Trf2 транскрибируется кластер разнонаправленных транскриптов, часть из которых перекрывается. Выявлены новые полоспецифические транскрипты генов lawc и Trf2. 3) В культуре клеток Schneider 2 и во время эмбриогенеза наблюдается коэкспрессия разнонаправленных перекрывающихся транскриптов lawc/Trf2. В раннем эмбриогенезе экспрессия прямых и обратных перекрывающихся транскриптов lawc/Trf2 пространственно не совпадает. 4) Регуляторная зона lawc/Trf2 содержит контролирующий экспрессию Trf2 в оогенезе. участок, специфически 5) Попытка подавления белок-кодирующих транскриптов гена lawc по пути РНК-интерференции, как in vitro, так и in vivo, вызывает активацию экспрессии его мРНК. 6) Показано модулирующее влияние транскрипционной активности гена lawc на экспрессию Trf2. 7) Зона перекрытия экзонов генов lawc и Trf2 обладает эволюционным консерватизмом, сохраняясь у видов дрозофил подгруппы melanogaster (D. melanogaster D. simulans, D. erecta, D. yakuba). Список работ, опубликованных по теме диссертации Статьи в журналах, соответствующих Перечню ВАК 1. Воронцова Ю.Е., Черезов Р.О., Зацепина О.Г., Слезингер М.С., Кузин Б.А., Симонова О.Б. Модуляция экспрессии генов – эволюционный резерв адаптационных изменений морфогенеза конечностей насекомых // Известия РАН. Сер. Биол. 2012. № 2. С. 228–236. 2. Симонова О.Б., Модестова Е.А., Воронцова Ю.Е., Черезов Р.О. Выявление геномных районов, влияющих на экспрессию lawc/Trf2 в процессе развития D. melanogaster // Онтогенез. 2012. Т.43. № 5. С. 366-384. 21 3. Черезов Р.О., Воронцова Ю.Е., Мерцалов И.Б, Куликова Д.А., Симонова О.Б. Влияние РНК-шпильки, специфичной к гену lawc, на экспрессию перекрывающихся генов комплекса l0awc/Trf2 у D. melanogaster // Известия РАН. Сер. Биол. 2013. № 2. С. 133–137. 4. Воронцова Ю.Е., Черезов Р.О., Симонова О.Б. Влияние мутаций гена lawc/Trf2 на формирование хромоцентра и расхождение хромосом у Drosophila melanogaster // Генетика. 2013. Т. 49. № 5. С. 1–12. Электронный ресурс 5. Tcherezov R.O., Simonova O.B. Drosophila melanogaster leg arista wing complex (lawc) mRNA, 3'UTR // GenBank: JX546150. Submitted (28-AUG-2012). Режим доступа: http://www.ncbi.nlm.nih.gov/nuccore/JX546150. 22