Введение в кристаллографию макромолекул Лекция 3 Владимир Юрьевич ЛУНИН Институт Математических Проблем Биологии РАН Пущино http://www.impb.ru/lmc Вычисление коэффициентов ряда Фурье Любая функция на отрезке [0,1] может быть разложена, при этом единственным образом, в ряд Фурье. x A0 2 Ah cos 2 hx Bh sin 2 h x h 1 1 Ah x cos2 hx dx 0 1 Bh x sin 2 hx dx 0 Ah cos 2 hx Bh sin 2 h x Fh cos2 hx h Ah Fh cos Fh Ah2 Bh2 B tg h h Ah Bh Fh sin hmax x F0 2 Fh cos2 hx h h 1 Fh , h - модуль и фаза коэффициентов Фурье, отвечающих частоте h Ряды Фурье для функций нескольких переменных x, y, z 0 x, y, z 1 x, y, z A000 2Ahkl cos 2 hx ky lz Bhkl sin 2 h x ky lz hkl x, y, z F000 2 Fhkl cos2 hx ky lz hkl hkl Ahkl x, y , z cos2 hx ky lz dxdydz V Bhkl x, y , z sin 2 hx ky lz dxdydz V Fhkl A B 2 hkl 2 hkl tg hkl Bhkl Ahkl r xa yb zc Рентгеновский эксперимент с монокристаллом позволяет измерить интенсивность волн, рассеянных в направлениях, определяемых условиями σ σ0 σ σ0 , a h, , b k, σ σ0 ,c l h,k,l - целые Вклады в амплитуду и фазу рассеянной волны, зависят от Bhkl распределения 2 2 tg hkl Fhkl Ahkl Bhkl электронной плотности Ahkl в элементарной ячейке Ahkl x, y , z cos2 hx ky lz dxdydz и могут быть V рассчитаны по Bhkl x, y , z sin 2 hx ky lz dxdydz формулам V 1. Рентгеновский дифракционный эксперимент с эксперимент с монокристаллом позволяет измерить модули коэффициентов в разложении функции распределения электронной плотности в ряд Фурье. x, y, z F000 2 Fhkl cos2 hx ky lz hkl hkl 2. Знание значений модулей и фаз дает возможность рассчитать "синтез Фурье электронной плотности" ~ x, y , z F 2 F cos2 hx ky lz S 000 hkl S hkl hkl 3. Наличие модели структуры дает возможность рассчитать гипотетические значения модулей и фаз и сравнить модули с экспериментальными значениями Подходы к решению фазовой проблемы SIR - Single Isomorphous Replacement Однократное изоморфное замещение; MIR - Multiple Isomorthous Replacement Множественное изоморфное замещение; AD - Anomalous Dispersion Аномальное рассеяние; MAD - Multiwavelength Anomalous Diffraction Многоволновое аномальное рассеяние; MR - Molecular Replacement Молекулярное замещение; Direct Methods (ab initio methods) "Прямые" методы. Подходы к решению фазовой проблемы SIR - Single Isomorphous Replacement Однократное изоморфное замещение; изоморфное производное "нативный" белок {FPH} {FP} {P} • метод позволяет решать фазовую проблему; • наличие каналов в кристаллах белка позволяет получать производные; • изоморфизм имеет место лишь приближенно; • проблема определения мест присоединения тяжелых меток; • проблема создания тяжелых меток для больших макромолекулярных комплексов • фазы определяются неоднозначно; необходимо несколько производных. MIR - Multiple Isomorthous Replacement Множественное изоморфное замещение; AD - Anomalous Dispersion Аномальное рассеяние Из кинематической теории рассеяния следует, что F s F s (закон Фриделя). При наличии аномально рассеивающих атомов (а.р.а.) закон нарушается. Измерения F(-s) и F(s) становятся независимыми. Их сравнение позволяет решать фазовую проблему. • метод позволяет решать фазовую проблему; • в белках встречаются а.р.а.; можно использовать производные с тяжелыми атомами; • проблема определения мест нахождения аномально рассеивающих атомов; • фазы определяются неоднозначно; MAD - Multiwavelength Anomalous Diffraction Многоволновое аномальное рассеяние; В основе подхода лежит изменение интенсивности аномального рассеяния при изменении длины волны. • один из активно используемых методов решения фазовой проблемы; • возможность использования селен-метиониновых производных; • проблема определения мест нахождения аномально рассеивающих атомов; • не всегда получается. Sd Methionin N Ca O Se Синтез Фурье электронной плотности для белка альдоз-редуктазы. Разрешение 0.9Å. Фазы определены методом MAD. MR - Molecular Replacement Молекулярное замещение; Комбинированные синтезы Фурье модель структурные факторы r1, r2 ,..., rM ,...rN full Fhklfull , hkl r1, r2 ,..., rM part Fhklpart , hkl Синтез Фурье full Fhklfull , hkl part Fhklpart , hkl part Fhklfull , hkl r1, r2 ,..., rM rM ,...rN + + ? + ? Комбинированные синтезы Фурье модель структурные факторы r1, r2 ,..., rM ,...rN full Fhklfull , hkl r1, r2 ,..., rM part Fhklpart , hkl Синтез Фурье full Fhklfull , hkl part Fhklpart , hkl part Fhklfull , hkl r1, r2 ,..., rM + + + rM ,...rN + 1/2 Комбинированные синтезы Фурье модель структурные факторы r1, r2 ,..., rM ,...rN full Fhklfull , hkl r1, r2 ,..., rM part Fhklpart , hkl u1,...uL Синтез Фурье full Fhklfull , hkl part Fhklpart , hkl part Fhklfull , hkl r1, r2 ,..., rM + + + rM ,...rN u1,...uL + - + 1/2 1/2 MR - Molecular Replacement Молекулярное замещение; План действий: А. Найти в банке белок с известными координатами (пробную модель), чья структура ожидается быть похожей на структуру исследуемого белка. Б. Разместить пробную модель в элементарной ячейке так, чтобы получить максимальное соответствие этой модели исследуемой структуре. В. Рассчитать по оптимально размещенной пробной модели значения фаз структурных факторов. MR - Molecular Replacement Молекулярное замещение; ? пробная модель В общем случае положение твердого тела определяется шестью параметрами (a, b, g, tx, ty, tz). углы вращения вектор трансляции MR - Molecular Replacement Молекулярное замещение; Оптимальное размещение пробной модели Для каждого допустимого набора параметров (a, b, g, tx, ty, tz) можно рассчитать соответствующие calc a , b ,g , tx , t y , tz значения модулей структурных факторов Fhkl Хотим иметь наилучшее совпадение с экспериментально obs определенными модулями Fhkl F a , b , g , t , t , t F calc hkl x y z obs 2 hkl min hkl Задачу можно разделить на два этапа: поиск углов вращения ("функция вращения") и поиск трансляции ("функция трансляции"). MR - Molecular Replacement Молекулярное замещение; С нахождением оптимальной ориентации и положения пробной модели работа не кончается! Надо откорректировать модель. MR - Molecular Replacement Молекулярное замещение; • один из наиболее используемых методов решения фазовой проблемы; • чем больше белков исследовано, тем шире возможности метода; • необходимо наличие гомологичной пробной модели; • результат зависит от обоснованности гипотезы о гомологии между пробной моделью и исследуемой структурой. MR - Molecular Replacement Молекулярное замещение; Где взять гомологичную пробную модель? • • • • среди структур, определенных РСА; среди структур определенных ЯМР; электронная микроскопия; теоретическое предсказание модели. "Прямые" методы Основаны на информации общего типа: • атомность; • неотрицательность функции распределения электронной плотности; • разделенность атомов в пространстве; • связность областей высокой электронной плотности; • гистограммы синтезов Фурье. Низкомолекулярные структуры рутинное использование; Небольшие белки, высокое разрешение ряд успешных попыток; Большие комплексы, среднее разрешение в процессе разработки, отдельные успешные попытки. Модель структуры ATOM 30 N SER 2 13.117 9.840 39.210 1.000 12.49 c Z b X Y абсолютные координаты (X,Y,Z) Ортогональная система координат, единица измерения Å. CRYST1 SCALE1 SCALE2 SCALE3 a b относительные координаты (x,y,z): r=xa + yb +zc 49.430 66.790 47.400 90.00 0.020231 0.000000 0.000848 0.000000 0.014972 0.000000 0.000000 0.000000 0.021116 S a g 92.40 90.00 0.000000 0.000000 0.000000 U xfrac = S11X + S12Y + S13Z + U1 yfrac = S21X + S22Y + S23Z + U2 zfrac = S31X + S32Y + S33Z + U3 Температурный фактор (temperature factor / Atomic Displacement Parameter / ADP) (e/Å3) 30 25 20 B=0 15 10 5 r (Å) 0 -3 4 r C j j 1 Bj 5 3 -2 4 2 r 2 2 exp B j -1 0 1 2 3 Радиальное распределение электронной плотности в атоме углерода при разных значениях температурного фактора B. (e/Å3) 30 25 20 B=0 15 10 5 r (Å) 0 -3 3 -2 4 2 r 2 4 2 exp r C j Bj B B B j 1 j 5 -1 0 1 2 3 Радиальное распределение электронной плотности в атоме углерода при разных значениях температурного фактора B. (e/Å3) 30 25 20 B=0 B=2 15 10 5 r (Å) 0 -3 3 -2 4 2 r 2 4 2 exp r C j Bj B B B j 1 j 5 -1 0 1 2 3 Радиальное распределение электронной плотности в атоме углерода при разных значениях температурного фактора B. (e/Å3) 30 25 20 B=0 B=2 B=5 15 10 5 r (Å) 0 -3 3 -2 4 2 r 2 4 2 exp r C j Bj B B B j 1 j 5 -1 0 1 2 3 Радиальное распределение электронной плотности в атоме углерода при разных значениях температурного фактора B. (e/Å3) 30 25 20 B=0 B=2 B=5 B=10 15 10 5 r (Å) 0 -3 3 -2 4 2 r 2 4 2 exp r C j Bj B B B j 1 j 5 -1 0 1 2 3 Радиальное распределение электронной плотности в атоме углерода при разных значениях температурного фактора B. (e/Å3) 30 25 20 B=0 B=2 B=5 B=10 B=20 15 10 5 r (Å) 0 -3 3 -2 4 2 r 2 4 2 exp r C j Bj B B B j 1 j 5 -1 0 1 2 3 Радиальное распределение электронной плотности в атоме углерода при разных значениях температурного фактора B. (e/Å3) 30 25 B=0 B=2 B=5 B=10 B=20 B=50 20 15 10 5 r (Å) 0 -3 3 -2 4 2 r 2 4 2 exp r C j Bj B B B j 1 j 5 -1 0 1 2 3 Радиальное распределение электронной плотности в атоме углерода при разных значениях температурного фактора B. (e/Å3) 5 B=0 B=2 B=5 B=10 B=20 B=50 B=100 r (Å) 0 -3 3 -2 4 2 r 2 4 2 exp r C j Bj B B B j 1 j 5 -1 0 1 2 3 Радиальное распределение электронной плотности в атоме углерода при разных значениях температурного фактора B. B 8 2 u 2 u - смещение атома (e/Å3) 5 B=0 B=2 B=5 B=10 B=20 B=50 B=100 r (Å) 0 -3 3 -2 4 2 r 2 4 2 exp r C j Bj B B B j 1 j 5 -1 0 1 2 3 Радиальное распределение электронной плотности в атоме углерода при разных значениях температурного фактора B. B 8 2 u 2 u - смещение атома B u 2 0.16 5 0.25 10 0.36 20 0.50 50 0.80 100 1.13 B=0 B=2 B=5 B=10 B=20 B=50 B=100 2 r (Å) 0 -3 3 -2 4 2 r 2 4 2 exp r C j Bj B B B j 1 j 5 (e/Å3) 5 -1 0 1 2 3 Радиальное распределение электронной плотности в атоме углерода при разных значениях температурного фактора B. B 8 2 u 2 u - смещение атома B u 2 0.16 5 0.25 10 0.36 20 0.50 50 0.80 100 1.13 B=0 B=2 B=5 B=10 B=20 B=50 B=100 2 r (Å) 0 -3 3 -2 4 2 r 2 4 2 exp r C j Bj B B B j 1 j 5 (e/Å3) 5 -1 0 1 2 3 Изотропный температурный фактор 3 4 2 r 2 4 2 exp r C j Bj B B B j 1 j 5 s2 f s f s exp B 4 ATOM 30 N SER 2 13.117 9.840 39.210 1.000 12.49 Анизотропный температурный фактор ATOM ANISOU 30 30 N N SER SER 2 2 13.117 9.840 39.210 1.000 12.49 1510 2105 1130 447 -393 -1019 Коэффициент заполнения / заселенность / occupancy Идеальный кристалл - содержимое всех элементарных ячеек идентично. Коэффициент заполнения / заселенность / occupancy "Реальный" кристалл - молекула "воды" присутствует только в 73% элементарных ячеек. Коэффициент заполнения / заселенность / occupancy Для данных координат атома коэффициент заполнения показывает какой процент элементарных ячеек кристалла содержат атом в указанной позиции. ATOM 6626 O HOH 4951 21.882 X 15.425 Y 26.797 0.500 Z s2 f j s T j f j s exp B j 4 T 8.74 B Коэффициент заполнения / заселенность / occupancy Альтернативные конформации ATOM 5490 N ATRP 295 ATOM 5514 N BTRP 295 29.848 2.643 16.199 0.499 7.13 30.271 2.787 16.200 0.501 6.52 Уточнение параметров модели x , y , z , B , T j j j j j - параметры модели calc x j , y j , z j , B j , Tj - рассчитанные по модели модули Fhkl структурных факторов calc Fhkl - экспериментально определенные модули структурных факторов Хотим иметь RX ray F calc hkl obs 2 hkl F min hkl Получили задачу на минимизацию (нелинейный "метод наименьших квадратов" / least squares / LSQ). Стандартный фактор достоверности / R-factor R calc obs F F hkl hkl hkl F obs hkl 100% hkl Типичная задача: endonuclease Sm Число неводородных атомов Число независимых параметров Число независимых ограничений (1.1Ǻ set) 3 694 36 940 108 000 Проблемы: • много локальных максимумов; возможно только локальное уточнение; радиус сходимости ~ 0.7Å; • модель "рассыпается". Стереохимические ограничения 1 j 5 1.46Å 1.24Å 1.37Å 2 x , y , z , B , T 3 1.02Å 1.52Å 4 j j j - параметры модели j d ijcalc - расстояние между i-ым и j-ым атомами в модели dijexact - идеальное расстояние между i-ым и j-ым атомами в модели Хотим иметь d calc 12 1.46 d 2 calc 23 1.37 d 2 calc 34 1.52 d 2 calc 35 1.24 min 2 Стереохимические ограничения 1 j 5 1.46Å 3 1.02Å j j j - параметры модели j d ijcalc - расстояние между i-ым и j-ым атомами в модели 1.24Å 1.37Å 2 x , y , z , B , T 1.52Å dijexact - идеальное расстояние между i-ым и j-ым атомами в модели 4 Хотим иметь d calc 12 1.46 d 2 calc 23 1.37 d 2 Rdist d ij calc ij calc 34 d 1.52 d 2 exact 2 ij min calc 35 1.24 min 2 RX ray F calc hkl obs 2 hkl F min hkl Rdist d calc ij d exact 2 ij min ij Составной критерий R wX ray RX ray wdistRdist wX ray F calc hkl hkl obs 2 hkl F wdist d ij А как выбрать веса wX-ray, wdist ? calc ij d exact 2 ij min Стереохимические ограничения x , y , z , B , T j 5 1 j j j - параметры модели calc - угол между i,j,k -ыми атомами aijk 122. 123.5 2 j в модели 3 120.5 exact - идеальный угол между i,j,k aijk ыми атомами в модели 4 Хотим иметь a calc 123 122. a 2 calc 235 123.5 a 2 calc 534 120.5 min calc exact min Rangle aijk aijk 2 ijk R wX ray RX ray wdistRdist wangleRangle 2 Двугранные углы Плоские группы Хиральность R-free рабочие уточнение модели все рефлексы только контроль контрольные R-free Вода, водороды. Обычное уточнение Частичная модель r M j j 1 "Потерянные" атомы uk kNM 1 calc, part obs r jtrue Fhklcalc,lost utrue Fhklfull,true Fhkl F k hkl Fcalc, part Fcalc,lost F obs Подгонка Fcalc,part к Fobs может сдвигать координаты атомов с их правильных значений. raw (partial) model {rj} Fhobs Максимизация правдоподобия Fhpart({rj}) randomly added ‘solvent’ atoms {uk} Likelihood-based refinement Fhsol({uj}) Fhcalc({rj}+{uk})= |F hpart({rj})+Fhsol({uk})| calculated magnitudes for ‘mixed’ (real and imaginary atoms) model L({rj})= Probability {Fhcalc({rj}+{uk})=Fhobs for all h} maximum T.Terwilliger Pyrobaculum aerophilum A pilot project in structural genomics A test case to find the bottlenecks: summary of results from all laboratories in the project Step Number of genes Cloned Expressed in E. coli Purified Crystallized X-ray structures NMR structures 274 168 43 24 10 1 ? Next: how to increase the success rate? X-ray structure analysis Intensities Is of diffracted beams crystal registration X-ray source X-ray experiment h 0 0 0 0 0 0 k l 0 6 0 8 0 20 1 6 1 7 1 8 F 46.09 212.95 98.75 188.33 14.88 226.02 σ 2.74 5.00 3.15 5.06 8.00 7.9 Kinematic theory of diffraction X-ray structure analysis The solving of the structure h 0 0 0 0 0 0 k l 0 6 0 8 0 20 1 6 1 7 1 8 F 46.09 212.95 98.75 188.33 14.88 226.02 σ 2.74 5.00 3.15 5.06 8.00 7.9 Wk={r: S(r) > k} The phase problem refined model preliminary model Protein Data ATOM ATOM Bank ATOM ATOM ATOM ATOM 6 7 8 9 10 11 CA C O CB OG1 CG2 MET MET MET THR THR THR A A A A A A 1 1 1 2 2 2 0 0 0 0 0 0 X Y 1.530 1.452 1.808 -0.430 -1.549 -0.265 3.431 4.960 5.574 7.045 7.435 7.733 Z T 5.646 5.500 4.503 7.578 6.701 8.906 1.00 1.00 1.00 1.00 1.00 1.00 B 9.39 7.10 10.54 23.54 27.09 21.71 1. Дж.Гласкер, К.Трублад. Анализ кристаллической структуры. "Мир", Москва, 1974 2. М.А.Порай-Кошиц. Основы структурного анализа химических соединений. Москва, "Высшая школа", 1989 3. Т.Бландел, Л.Джонсон. Кристаллография белка. "Мир", Москва, 1979 4. Ч.Кантор, П.Шиммел. Биофизическая химия, том 2. Москва, "Мир", 1984 5. International Tables for Crystallography, vol. F. Crystallography of biological macromolecules. by Kluwer Academic Publishers, Dordrecht/Boston/London, 2001 X-RAY CRYSTALLOGRAPHY From : “Nobel Prizes for X-Ray science”. Published by the Advanced Photon Source at Argonne National Laboratory on the occasion of the Centennial Meeting of the American Physical Society. «A Century of Physics», March 20-26, 1999