Блок 3. Семейства белков II. Мотивы, паттерны и профили Первый курс, весна 2008, А.Б.Рахманинова Что мы можем узнать нового? Попарное выравнивание: * 20 XYLR_ECOLI : GYPSLQYFYSVFKKAYDTTPKEYR : 24 XYLR_HAEIN : GYPSIQYFYSVFKKEFEMTPKEFR : 24 Множественное выравнивание: * 20 APPY_ECOLI : GYNSTSYFICAFKDYYGVTPSHYF CELD_ECOLI : GYSSPSLFIKTFKKLTSFTPKSYR CFAD_ECOLI : GISSASYFIRVFNKHYGVTPKQFF ENVY_ECOLI : GYSSTSYFISVFKAFYGLTPLNYL FAPR_ECOLI : GYTSVSYFIKTFKEYYGVTPKKFE MELR_ECOLI : GFRSSSRFYSTFGKYVGMSPQQYR RHAS_ECOLI : GFSDSNHFSTLFRREFNWSPRDIR ROB_ECOLI : RFDSQQTFTRAFKKQFAQTPALYR TETD_ECOLI : QFDSQQSFTRRFKYIFKVTPSYYR XYLR_ECOLI : GYPSLQYFYSVFKKAYDTTPKEYR XYLR_HAEIN : GYPSIQYFYSVFKKEFEMTPKEFR g s F Fk tP : : : : : : : : : : : 24 24 24 24 24 24 24 24 24 24 24 Множественное выравнивание, весна 2008 Что хотим найти ? НАД-связывающий сайт/центр Домен, связывающий сахар Сайты возможной посттрансляционной модификации (РТМ) ДНК-связывающий домен Суперсемейства Ортологи Гомологичное семейство: особенности последовательностей, характерный тип структуры, функции, таксономия и т.п. Семейство 1 Семейство 2 Семейство 3 Основные понятия и термины • Место, сайт(site) - • Мотив (motif) – • Домен (domain) – • Семейство – • Суперсемейство - ? • Паттерн (pattern) – • Позиционно специфическая матрица весов (PSSM) – • Профиль–PSSM – • Профиль–HМM • Подпись (signature) – • «Oтпечатки пальцев» (fingerprints) – • Кластер - Домен – единица эволюции, структуры и функции белков. Домен – компактная, относительно независимо сворачивающаяся структура, относительно консервативная в процессе эволюции. Белки могут состоять из одного или многих доменов. nitrogen fixation positive activator protein Мотив ? • Мотив в аминокислотной последовательности ─ набор консервативных остатков, важных для функции белка и расположенных на определенном (обычно коротком) расстоянии друг от друга в последовательности. • Мотив структуры (структурный мотив) – часто встречающийся в белках элемент пространственной структуры (-спираль, -шпилька, -поворот). Структурные мотивы не обязательно соответствуют мотивам в аминокислотным последовательностях. Один домен может содержать один или несколько мотивов в аминокислотной последовательности. Мотив может не входить в домены. Не в любом выравнивании легко найти мотив. Основные понятия и термины • Место, сайт(site) - • Мотив (motif) – • Домен (domain) – • Семейство – • Суперсемейство - ? • Паттерн (pattern) – • Позиционно специфическая матрица весов (PSSM) – • Профиль–PSSM – • Профиль–HМM • Подпись (signature) – • «Oтпечатки пальцев» (fingerprints) – • Кластер - БД белковых доменов, семейств и функциональных сайтов. Содержит описание объектов + описание паттернов, профилей и правил для их обнаружения. Выравнивание хорошо изученного семейства Функционально важные остатки 4-5 консервативных остатков Паттерн Поиск в UniProt Если находим только«правильные», то ОК Если много лишнего, то увеличиваем паттерн Паттерн – регулярное выражение UNIX’a: [AC]-x-V-x(4)-{ED} Ala или Cys- х-Val- х- х- х - х- (любой, но не Glu и не Asp) PROSITE ─ биологически значимые сайты, паттерны и профили, http://www.expasy.ch/prosite/ Релиз 20.31 08-Apr-2008 1514 документов, 1318 паттернов, 784 профилей + 784 ProRule Профиль или весовая матрица (PSSM) F F Y F F L F K K P P K E K L A I V V F L L F V V L I L S G G K A S G H Q Q EA AC ED E N F G H I K L M N P Q R S T V W Y C T E A V C V L L V M F Q L L G -18 8 -3 3 -10 -2 I -10L -1K -8 -22 I -33A -18D -18 -22 -26 22 -24 -19 -35 0I -32Q-33 -7 6 -17 -34 -31 I -27 15 -25 -26 -9 23 -9 -24 -23 L V C 60 -30 -13 3 -26 14 3 -22 -30 -32 -18 -22 -10 0 9 34 -30 -20 -12 -27 25 -28 -15 -6 24 5 9 -8 -10 -25 -25 -18 12 -28 -25 21 -25 19 10 -24 -26 -25 -22 -16 -6 22 -18 -1 14 -32 -25 25 -27 27 14 -27 -28 -26 -22 -21 -7 25 -19 1 -26 28 -16 -29 -6 -27 -17 1 -14 -9 -10 11 -5 -19 -25 -23 -29 -14 14 -23 4 -20 -10 8 -10 24 0 2 -8 -26 -27 -12 -15 -23 -22 -8 -15 -9 -9 -15 -22 -16 -18 -1 2 6 -34 -19 4 -33 -22 33 -27 33 25 -24 -24 -17 -23 -24 -10 19 -20 0 12 -27 -23 19 -26 26 12 -24 -26 -23 -22 -19 -7 16 -17 0 -8 -7 0 -1 -29 -5 -10 -23 0 -21 -11 -4 -18 7 -4 -4 -11 -16 -28 -18