Предсказание оксидирования метионина по третичной структуре белка Студент: Гайдай И.О. Руководитель: Яковлев П.А. СПбАУ, 2015 1/13 Аминокислоты Аминокислоты состоят из атомов. Общая структура аминокислоты: 2/13 Оксидирование метионина 3/13 Проблема свертки белка 4/13 Существующие решения ● ● ● ● ● ● AMS (2012) GPS (2008) KinasePhos (2007) PPSP (2006) PredPhospho (2004) Scansite (2003) ● COPA(2008) 5/13 Цель Научиться предсказывать вероятность оксидирования метионина. Задачи 1. Найти достоверные данные 2. Найти значимые предикторы 3. Подобрать оптимальные методы и параметры 6/13 Данные Третичная структура Метки классов Данные 7/13 Предикторы Наиболее значимые предикторы: ● Типы соседей ● Расстояния до соседей ● Доступность растворителю (SAS, SES) ● Вторичная структура 8/13 Методы ● ● ● ● Решающее дерево Случайный лес Бустинг на деревьях SVM 9/13 10/13 11/13 12/13 Спасибо за внимание! 13/13 Подбор параметров решающего дерева AUC = 0.68 14/13 ROC-кривая для предсказания на тестовой выборке для решающего дерева AUC = 0.737 15/13 Подбор параметров случайного леса AUC = 0.785 16/13 ROC-кривая для предсказания на тестовой выборке для случайного леса AUC = 0.767 17/13 Зависимость ошибки от числа деревьев в лесу 18/13 Подбор параметров бустинга на деревьях AUC = 0.715 19/13 ROC-кривая для предсказания на тестовой выборке для бустинга на деревьях AUC = 0.611 20/13 Зависимость ошибки от числа деревьев 21/13 Подбор параметров SVM AUC = 0.816 22/13 ROC-кривая для предсказания на тестовой выборке для SVM AUC = 0.78 23/13