6681 УДК 577.32 УЗНАВАНИЕ ПРОТЯЖЕННЫХ МОЛЕКУЛ НА БОЛЬШОМ РАССТОЯНИИ А.А. Анашкина Институт молекулярной биологии им. В.А. Энгельгардта РАН Россия, 119991, Москва, Вавилова ул., 32 E-mail: nastya@eimb.ru Н.Г. Есипова Институт молекулярной биологии им. В.А. Энгельгардта РАН Россия, 119991, Москва, Вавилова ул., 32 E-mail: nge@eimb.ru В.Г. Туманян Институт молекулярной биологии им. В.А. Энгельгардта РАН Россия, 119991, Москва, Вавилова ул., 32 E-mail: tuman@eimb.ru В.А. Намиот Институт ядерной физики им.Д.В. Скобельцина, Московский государственный университет им.М.В. Ломоносова Россия, 119991, Москва, Ленинские горы, д.1, стр.2, ГСП-1 E-mail: vnamiot@gmail.com Ключевые слова: протяженные молекулы, ДНК, распознавание ДНК-белок Аннотация: В работе предлагается гипотеза, что специфическое взаимодействие, приводящее к распознаванию определенных сайтов на протяженных макромолекулах, таких как ДНК возможно, если между такими сайтами возникает дальнодействующее взаимодействие, обладающее, в то же самое время, достаточно высокой селективностью. Очевидно, что для того, чтобы такие дальнодействующие взаимодействия в принципе могли бы обеспечить «быстрый» поиск необходимых участков цепей, требуется, чтобы узнающие участки цепочек могли бы достаточно свободно перемещаться друг относительно друга и чтобы эти участки взаимодействовали бы между собой гораздо более эффективно, чем те участки, которые связываться не должны. В предлагаемой работе протяженные молекулы аппроксимируются цепочками зарядов. В приближении, когда характерный размер взаимодействующих между собой участков цепочек существенно меньше характерного расстояния между этими участками выведена в общем виде формула для энергии взаимодействия. Показано, что в местах комплементарного расположения зарядов на больших расстояниях между цепочками наблюдается глобальный минимум. Также гипотеза была проверена на цепочках зарядов, полученных проекцией зарядов ДНК на спираль, проходящую по центру большой бороздки, и цепочки, полученной проекцией зарядов белка на отрезок прямой, проходящей вдоль ДНК-связывающего участка (на основе структур специфических комплексов белок-ДНК). В этом случае также показано, что на больших расстояниях функция энергии имеет глобальный минимум в местах наблюдаемого связывания ДНК белком. XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ ВСПУ-2014 Москва 16-19 июня 2014 г. 6682 1. Введение Происходящие в биологических системах процессы во многом обуславливаются взаимодействиями молекул белков и ДНК друг с другом, поэтому трудно переоценить важность понимания механизма такого взаимодействия. Взаимодействие между молекулами можно характеризовать потенциалом взаимодействия или силой взаимодействия. Общепринято разделение сил, действующих на молекулы, на дальнодействующие и короткодействующие. В данной работе предлагается гипотеза, что специфическое взаимодействие, приводящее к распознаванию определенных сайтов на протяженных макромолекулах, таких как ДНК возможно, если между такими сайтами возникает дальнодействующее взаимодействие, обладающее, в то же самое время, достаточно высокой селективностью. Такого рода модель была теоретически разработана ранее в диссертации [1] в общем виде. В работах [2,3] такая гипотеза была предложена для сворачивания белка. 2. Оценка энергии взаимодействия протяженных макромолекул 2.1. Механизмы распознавания ДНК белком В литературе встречается несколько возможных механизмов поиска белком специфического участка на ДНК [4]: ассоциацию и диссоциацию, когда белковая молекула проводит поиск специфического сайта путем постоянного присоединения и отсоединения с ДНК, и таким образом это случайный диффузионный поиск; межсегментальный обмен, когда молекула белка «прыгает» с одного сайта ДНК на расположенный недалеко другой сайт. В этом случае требуется близкое пространственное расположение сегментов ДНК, например суперскрученная/конденсированная ДНК. «Прыжок» происходит без макроскопической диссоциации с ДНК; прыжки, когда происходит ассоциация и диссоциация белка с ДНК – однако белок остается вблизи ДНК, в электростатическом потенциале; скольжение – перемещение белка вдоль ДНК – одномерное случайное движение с единицей шага. Отличается от предыдущего случая наличием взаимодействий с неспецифической ДНК; направленное движение – ассиметричное одномерное движение вдоль ДНК с единицей шага и строгой корреляцией энергии по направлению к сайту связывания – положительная корреляция будет направлять белок к сайту связывания, тогда как негативная корреляция будет останавливать движение. Таким образом, это энергетически управляемое скольжение. В литературе также встречается под названием управляемая диффузия. Показано, что неспецифически связывающиеся белки скользят вдоль бороздки ДНК, вращаясь вокруг оси ДНК в процессе скольжения [5]. Теоретически механизм скольжения и прыжков был исследован методом Монте-Карло в работе [6]. Скольжение и прыжки эндонуклеазы EcoRV были исследованы в работе [7]. В статье 2012 года [8] было показано, что лактозный репрессор скользит вдоль ДНК. Несомненно, что процесс посадки белка на ДНК это сложный многостадийный процесс, который включает в себя разные элементы. В том числе, ориентацию белка относительно ДНК и пространственное сближение. Однако, вне зависимости от конXII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ ВСПУ-2014 Москва 16-19 июня 2014 г. 6683 кретного механизма, который использует данный белок в процессе посадки на ДНК, очевидно, что для того, чтобы объемные взаимодействия в принципе могли обеспечить «быстрый» поиск сайта связывания белка на ДНК, требуется, чтобы одновременно выполнялись два условия. Во-первых, требуется, чтобы в процессе распознавания белок мог бы достаточно свободно перемещаться относительно ДНК. Без этого в принципе невозможно обеспечить возможность выбора «правильного» сайта среди всех возможных других в процессе поиска. Во-вторых, нужно, чтобы белок и ДНК взаимодействовали между собой таким образом, чтобы исключить «ошибочное» связывание. Другими словами, нужно, чтобы ДНК и правильный сайт взаимодействовали между собой гораздо более эффективно, чем остальная ДНК. 2.2. Вывод формулы для оценки энергии взаимодействия двух цепочек зарядов В предлагаемой работе протяженные молекулы мы аппроксимируем цепочками зарядов. Энергия взаимодействия двух цепочек, расположенных параллельно друг другу на расстоянии R, с распределением зарядов 1 ( r ) и 2 ( r ) , в общем виде может быть записана как E 1 ( r ) 2 ( r )dv 2 2 ) 2 4 2 ( r ) – уравнение Пуассона 2 2 2 x x x Представим плотность распределения заряда и потенциал в виде Фурье-образов ik ( r R ) 1 ( 1,2 ( r ) k 1,2 )e 1,2 dk , (2 )3 где 2 ( 2 1,2 ( r ) 1,2 ( r ) 1 1 (2 ) 3 1,2 ik ( r R ) ( k 1,2 )e 1,2 dk (2 )3 ik ( r R ) dk , 1,2 (k )e 2 ik ( r R ) 4 ik ( r R1,2 ) ( )( ) ( k k e dk k 1,2 1,2 )e 1,2 dk (2 )3 (2 )3 1 В приближении, когда характерный размер взаимодействующих между собой участков цепочек с распределением зарядов 1 ( r ) и 2 ( r ) существенно меньше характерного расстояния R между этими участками, путем дальнейших преобразований выведем в общем виде формула для энергии взаимодействия между двумя цепочками, расположенными параллельно друг другу на расстоянии R: 1 1 ( k ) 2* ( k )dk ik ( R1 R2 ) (1) E e dk , (2 ) 2 k2 где плотность распределения заряда представлена в виде Фурье-образов. 2.3. Метод поиска оптимального сайта взаимодействия двух цепочек зарядов Заметим, что формула (1) под интегралом содержит Фурье-образы распределений зарядов на цепочках. Процедура вычисления Фурье-образов осуществляется только один раз, поскольку в нашей задаче распределение зарядов не меняется, а меняется только расположение цепочек относительно друг друга. Таким образом, для поиска опXII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ ВСПУ-2014 Москва 16-19 июня 2014 г. 6684 тимального места взаимодействия производится только вычисление интеграла на разных расстояниях R и с разным сдвигом S цепочек относительно друг друга. 3. Апробация метода поиска на цепочках зарядов со случайно сгененированными последовательностями Для проверки гипотезы были искусственно созданы пары цепочек точечных зарядов. Длинная цепочка содержала 512 зарядов, взятых случайным образом из диапазона [-1.0;+1.0]. Короткая цепь из 16 зарядов бралась комплементарной некоторому участку на длинной цепи, т.е. повторяла заряды на участке длиной в 16 зарядов длинной цепи, только взятые с обратным знаком. Для удобства применения метода Фурье-анализа обе цепочки моделировались длинными цепями из 1024 точек и дополнялись нулями. 1.5 1 0.5 -0.5 -1 -1.5 Рис. 1. Пример распределения зарядов на двух цепочках. Розовым цветом показано распределение на длинной цепи (512 зарядов), синим – короткой цепи (16 зарядов). Распределение зарядов на короткой цепи есть распределение зарядов середины длинной цепи, взятое с обратным знаком. Для удобства применения метода Фурье-анализа обе цепочки моделируются длинными цепями из 1024 точек и дополняются нулями. XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ ВСПУ-2014 Москва 16-19 июня 2014 г. 988 950 912 874 836 798 760 722 684 646 608 570 532 494 456 418 380 342 304 266 228 190 152 114 76 0 38 0 6685 1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97 103 109 115 121 127 Рис. 2. Энергия взаимодействия двух цепочек (в условных единицах), длинной и короткой, рассчитанная по формуле (1), на разном расстоянии между цепочками с шагом 4 А. Наиболее пологая кривая соответствует расстоянию 60 А, наименее пологая – 4 А. Глобальный минимум на расстоянии 60 А располагается в центре рисунка. Для проверки адекватности метода мы проводили одновременный расчет энергии взаимодействия по закону Кулона (рис. 3). 0,6 0,4 0,2 0 1 45 89 133 177 221 265 309 353 397 441 485 529 573 617 661 705 749 793 837 881 925 969 -0,2 -0,4 -0,6 -0,8 Рис. 3. Энергия взаимодействия двух цепочек на разном расстоянии, от 60 А до 4 А, рассчитанная по закону Кулона (условные единицы). Таким образом, мы получили, что разработанный подход отражает электростатические взаимодействия между цепочками зарядов. Мы показали, что в местах комплементарного расположения цепочек зарядов на больших расстояниях между цепочками наблюдается глобальный минимум. Кроме того, у разработанного метода есть существенный выигрыш в использовании, заключающийся в значительном сокращении числа вычислений. XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ ВСПУ-2014 Москва 16-19 июня 2014 г. 6686 4. Апробация метода поиска сайта связывания на реальной структуре белок-ДНК 4.1. Аппроксимация структур макромолекул цепочками зарядов В качестве первого объекта реальной структуры был выбран комплекс белок-ДНК 1an4, в котором две протяженные «руки» из альфа-спиралей «обхватывают» ДНК с двух сторон по большой бороздке (рис. 4). С нашей точки зрения, этот комплекс наиболее соответствует введенному приближению и ограничениям при разработке формулы (1). Для применения нашего метода необходимо создать цепочки зарядов, отражающие расположение реальных зарядов на альфа-спирали белка и вдоль большой бороздки ДНК. Более короткая цепочка зарядов будет создана по участку альфа-спирали, участвующему в распознавании ДНК. Для этого этот участок альфа-спирали аппроксимируем отрезком прямой, проходящей через две точки. Уравнение прямой в трехмерном пространстве задается параметрическим уравнением t ( x0 t ( x1 x0 ), y0 t ( y1 y0 ), z0 t ( z1 z0 )) , где ( x0 , y0 , z0 ) и ( x1 , y1 , z1 ) – координаты двух различных точек, лежащих на прямой. Тогда заряд будем проецировать на основание перпендикуляра, опущенного из точки расположения заряда на прямую. Рис. 4. Структура комплекса 1an4 – фактор ядра активированной T клетки и AP-1 гетеродимера, Fos-Jun, кооперативно связывающий ДНК и активирующий экспрессию генов иммунного ответа. Предполагается, что участки протяженных альфа-спиралей белка участвуют в специфическом распознавании. XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ ВСПУ-2014 Москва 16-19 июня 2014 г. 6687 Рис. 5. Спираль, проходящая по центру большой бороздки ДНК. Длинная цепочка зарядов будет создаваться путем проекции зарядов атомов ДНК на спираль, проходящую по большой бороздке ДНК. Уравнение спирали в трехмерном пространстве задается параметрическим уравнением (рис. 5) t ( a cos t , a sin t , bt ) , где а – радиус спирали, b – шаг спирали (расстояние между соседними парами нуклеотидов). Если в качестве системы отсчета брать длину спирали, то ( ds ) 2 ( dx ) 2 ( dy ) 2 ( dz ) 2 ds dx dy a 2 sin 2 t a 2 cos2 t a2 ( )2 ( )2 1 1 , 1 dz dz dz b2 b2 b2 поскольку d ( a cos t ) d ( a sin t ) a sin t dy a cos t dt dt ,а . d (bt ) d (bt ) b dz b dt dt Таким образом, получаем, что расстояние вдоль спирали линейно зависит от расстояdx dz a2 1) z . Переходя от параметрического вида уравнения b2 z z спирали, получаем, что координаты точек спирали ( a cos , a sin , z ) , а вектор касаb b z z тельной в этих точках определяется производной ( a sin , a cos , b) . Заряд каждого b b атома проецируем на спираль следующим образом: если заряженный атом оказывается в плоскости, перпендикулярной оси спирали, его заряд проецируется на спираль в точке пересечения этой плоскости и спирали. Таким образом, скалярное произведение вектора из точки заряда в точку на спирали и вектора производной спирали в этой точке должно быть равно нулю. Соответственно заряд может проецироваться на несколько точек на спирали, если не введено ограничение по удаленности заряда от точки проекции. Для нашей задачи разумно ограничиться первой, наиболее близкой проекцией. ния вдоль оси спирали s ( 4.2. Результаты метода поиска сайта связывания на реальной структуре белок-ДНК Две цепочки зарядов, полученные путем аппроксимации трехмерной структуры комплекса 1an4, далее использовали для поиска сайта посадки белка на ДНК. На рис.6 видно, что в области 121 наблюдается глобальный минимум, соответствующий сайту посадки «руки» белка на ДНК. XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ ВСПУ-2014 Москва 16-19 июня 2014 г. 6688 0.00006 0.00004 0.00002 0 -0.00002 1 25 49 73 97 121 145 169 193 217 241 265 289 313 337 361 385 409 433 457 481 505 529 553 577 601 -0.00004 -0.00006 -0.00008 -0.0001 Рис. 6. Энергия взаимодействия двух цепочек (в условных единицах), длинной и короткой, полученные путем аппроксимации реальных структур комплекса 1an4, рассчитанная по формуле (1), на разном расстоянии между цепочками с шагом 4 А. Наиболее пологая кривая соответствует расстоянию 60 А, наименее пологая – 8 А. По оси х – положение участка с зарядами белка на спирали, проходящей вдоль большой бороздки ДНК. В области 121 наблюдается глобальный минимум, соответствующий сайту посадки «руки» белка на ДНК. 5. Заключение В зависимости от формы и распределения заряда белки присоединяются в соответствующих местах вдоль ДНК. Ввиду теплового движения молекул белки постоянно связываются и отделяются. Белки тоже могут связываться с другими белками, образуя новую единицу под названием комплекс. Обычно комплекс приобретает иные по сравнению с исходной молекулой очертания и распределение заряда. Такую перемену, играющую главную роль в сборке белка, поскольку меняются «ключи» и «замки», именуют конформационным изменением. Сама молекула ДНК характеризуется высокой линейной плотностью отрицательного заряда, поскольку каждая пара оснований несет на себе две полностью депротонированные фосфатные группы. Среднее расстояние между проекциями фосфатных групп на ось двойной спирали составляет 1.7 нм. Возникающее электростатическое отталкивание обуславливает большую жесткость ДНК в растворе, которая при физиологической ионной силе образует рыхлый клубок большого объема. В то же время, in vivo молекула ДНК локализована внутри объема, который в тысячи раз меньше. Можно ли считать, что сахарофосфатный остов ДНК на протяжении всей ДНК одинаков? Повидимому, можно. Все известные эпигенетические модификации затрагивают только нуклеиновые основания. Таким образом, можно предположить, что именно последовательность расположения нуклеиновых оснований важна для распознавания. Однако есть предположение, что сахарофосфатный остов все же оказывает значительное влияние на распознавание. Дело в том, что, как показал в своей работе Комаров В.М., неплоский характер водородного связывания азотистых оснований в большинстве известных пар с двумя или тремя водородными связями является изначальным, внутренним свойством самих пар. Это свойство определяет у 28 возможных типов пар не один, плоский вариант Н-связывания, а в общем случае 81 вариант геометрии спаривания оснований. Получено, что: а) для уотсон-криковских AT пар, как и для многих других пар, в водородном связывании которых принимает участие одна аминогруппа, характерно двукратное вырождение Н-спаривания, с реализацией двух зеркальносимметричных структур типа «пропеллера»; б) для уотсон-криковских GC и других пар, с двумя аминогруппами в водородных связях, характерно четырехкратное вырожXII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ ВСПУ-2014 Москва 16-19 июня 2014 г. 6689 дение спаривания, с образованием попарно симметричных структур «пропеллера» и «ступеньки»; в) диапазон углов пропеллера и излома в некопланарных конфигурациях пар довольно широк и составляет +40 - –40 градусов. Показано сохранение некопланарного полиморфизма уотсон-криковских пар в условиях структуры двойных спиралей олигонуклеотидов. Проиллюстрировано, как накопление геометрических отличий в укладке AT и GC пар может инициировать зависимость формы спирали от нуклеотидной последовательности [9]. Таким образом, последовательность нуклеотидов в двойной цепи ДНК обеспечивает локальную конформацию спирали ДНК, и, соответственно, может возникать влияние зарядов сахарофосфатного остова на потенциал в бороздках. Форма ДНК, таким образом, влияет на связывание – меняется проекция зарядов на спираль, проходящую по бороздкам. Можно предположить, что распознающие белки узнают реальные структуры ДНК. Нам представляется, что искривление от прямой линии оси ДНК является важным составляющим моментом белок-ДНК распознавания. В качестве дальнейшей идеи для проверки необходимо показать отличия в электростатическом потенциале в большой бороздке для реальных и идеальных фрагментов ДНК (с идентичными последовательностями). Есть предположение, что идеальная ДНК не даст глобального минимума для взаимодействия. Теорема Ирншоу (Samuel Earnshaw) гласит, что всякая равновесная конфигурация точечных зарядов неустойчива, если на них кроме кулоновских сил притяжения и отталкивания ничто не действует. Таким образом, невозможно объяснить процесс распознавания ДНК белком, рассматривая только электростатику. Для осуществления движения белка вдоль ДНК должны удовлетворяться следующие условия: белок должен притягиваться к ДНК, однако само движение белка вдоль ДНК должно происходить на некотором расстоянии, не позволяющем образование неспецифических короткодействующих взаимодействий, таких как водородные связи и ван-дер-ваальсовые взаимодействия. Очевидно, что для предотвращения такого неспецифического связывания должны существовать дополнительные факторы. Нам представляется, что таким фактором может быть, в частности, вода, находящаяся в связанном состоянии вблизи ДНК. Кроме того, в качестве силы, препятствующей плотному связыванию белка на неспецифическом месте посадки, также можно предложить наличие отрицательных зарядов в сайте связывания белка. Таким образом, движение белка вдоль бороздки будет происходить на некотором расстоянии, и плотное связывание будет реализовано только в месте точного соответствия картин зарядов. Мы показали, что в местах комплементарного расположения зарядов на больших расстояниях между цепочками наблюдается глобальный минимум. Также гипотеза была проверена на цепочках зарядов, полученных проекцией зарядов ДНК на спираль, проходящую по центру большой бороздки, и цепочки, полученной проекцией зарядов белка на отрезок прямой, проходящей вдоль ДНК-связывающего участка (на основе структур специфических комплексов белок-ДНК). В этом случае также показано, что на больших расстояниях функция энергии имеет глобальный минимум в местах наблюдаемого связывания ДНК белком. Разработанный подход представляется применимым для предсказания специфических сайтов связывания на ДНК. Также, в сочетании с применением туннельного микроскопа и способа закрепления макромолекул на подложке, предложен нехимический метод чтения последовательностей ДНК [10]. Работа выполнена при частичной финансовой поддержке Программы Президиума РАН Молекулярная и клеточная биология и грантов Российского фонда фундаментальных исследований 12-04-01776-a и № 12-07-00634-а. XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ ВСПУ-2014 Москва 16-19 июня 2014 г. 6690 Список литературы 1. Намиот В.А. Дальнодействующие взаимодействия между макромолекулами в упорядоченных средах. Диссертация на соискание ученой степени доктора физико-математических наук. Москва. 1984. 2. Намиот В.А., Батяновский А.В., Филатов И.В., Туманян В.Г., Есипова Н.Г. К вопросу об оптимальном сворачивании белковых молекул // Биофизика. 2011. Т. 56, № 4. С. 594-601. 3. Namiot V.A., Batyanovskii A.V., Filatov I.V., Tumanyan V.G., Esipova N.G. General theory of the longrange interactions in protein folding // Physics Letters A. 2011. Vol. 375, No. 32. P. 2911-2915. 4. Murugan R. DNA-protein interactions under random jump conditions // Phys Rev E Stat Nonlin Soft Matter Phys. 2004. Vol. 69, No, 1. Pt. 1. 5. Blainey PC, Luo G, Kou SC, Mangel WF, Verdine GL, Bagchi B, Xie XS. Nonspecifically bound proteins spin while diffusing along DNA // Nat Struct Mol Biol. 2009. Vol. 16, No.12. P. 1224-1229. 6. DeSantis MC, Li JL, Wang YM. Protein sliding and hopping kinetics on DNA // Phys Rev E Stat Nonlin Soft Matter Phys. 2011. Vol. 83, No. 2. Pt. 1. 7. Bonnet I, Biebricher A, Porte PL, Loverdo C, Benichou O, Voituriez R, Escude C, Wende W, Pingoud A, Desbiolles P. Sliding and jumping of single EcoRV restriction enzymes on non-cognate DNA // Nucleic Acids Res. 2008. Vol. 36, No. 12. P. 4118-4127. 8. Hammar P, Leroy P, Mahmutovic A, Marklund EG, Berg OG, Elf J. The lac repressor displays facilitated diffusion in living cells // Science. 2012. Vol. 336, No. 6088. P. 1595-1598. 9. Комаров В.М. Полиморфизм водородного связывания нуклеотидов и структурная организация молекулы ДНК. Диссертация на соискание ученой степени доктора физико-математических наук. Пущино. 2004. 10. Намиот В.А., Анашкина А.А., Филатов И.В., Туманян В.Г., Есипова Н.Г. Секвенирование ДНК на основе анализа специфических дальнодействующих взаимодействий макромолекул // Биофизика. 2012. Т. 57, № 6. С. 925-932. XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ ВСПУ-2014 Москва 16-19 июня 2014 г.