Разработка методологии и системы автоматизации для решения современных аналитических задач в банковской сфере Матрос Е.А., президент IASA-RMG Головко М.И., аналитик IASA-RMG ematrox@ukr.net 1 РЫНКИ: –Фрагментация –Новые каналы –Новые услуги –Спрос на ресурсы РЕГУЛЯТОРЫ: ТЕХНОЛОГИИ: –Базель 2 –Отчетность НБУ –Хранилища данных –Поиск знаний БАНК БИЗНЕС: –Глобализация –Дерегуляция –Повышение конкуренции 2 Внешняя среда Снижение внутренней доходности Увеличение рисков Уменьшение маржи Увеличение прозрачности бизнеса Рост конкуренции Рост кредитных рисков Рост рыночных и операционных рисков Повышение пруденциальных требований Базель 2. 3 Новые потребности Использование невоспользованых ранее ресурсов (точное прогнозирование остатков на текущих счетах, более стройное управление активами и пассивами…) Создание адекватных моделей измерения рисков (VaR, RARORAC, анализ дюраций…) Глубокий анализ клиентов и продуктов, гибкая тарифная политика («не всякий клиент хорош»…) 4 Направления анализа ДОХОДНОСТЬ ОТНОШЕНИЕ С КЛИЕНТАМИ ИНТЕГРИРОВАННАЯ ОЦЕНКА БАНКА УПРАВЛЕНИЕ РИСКАМИ УПРАВЛЕНИЕ АКТИВАМИ И ПАССИВАМИ 5 Классы систем автоматизации По по способу хранения и обновления данных системы автоматизации делятся на: Системы, ориентированные на операционную (трансакционную) обработку данных (OLTP Online Transaction Processing) Системы, ориентированные на аналитическую обработку данных (OLAP - Online Analytical Processing) 6 OLTP Обычно системе типа OLTP для ее работы нужна лишь информация, актуальная на текущий момент, а предыдущие (исторические) сведения ее не интересуют. Поэтому система OLTP постоянно выполняет операции обновления текущей информации, а информация, которая утратила актуальность для текущей работы, уничтожается вообще или регулярно переносится в архивы 7 OLAP Для этих систем часто используется срок "система поддержки принятия решений" (СППР) (Decision Support System - DSS). В отличие от OLTP, такие системы накапливают информацию для ее ретроспективного анализа; при внесении более новых по времени данных предыдущие данные не изымаются и не корректируются. Информация, занесенная в систему, в дальнейшем используется исключительно в режиме чтения. 8 Автоматизация аналитики Возможные пути решения - создание ПО на базе: Операционный день банка (ОДБ) Создание ПО отдельно под каждую задачу (мини программы на базе MS Office) Создание СППР на базе хранилища данных 9 Автоматизация на основании доработки ОДБ Недостатки: Не совсем целесообразно – ОДБ это OLTP-система и возможна реализация только тех аналитических задач, которые не требуют большого массива данных. Разработчики ОДБ не всегда имеют возможность вовремя дописать необходимые модули. Выполнение аналитических функций может тормозить выполнение транзакционных задач. Плюсы: По идее входит в задачу сопровождения и не требует дополнительных финансовых затрат. 10 Мини программы под каждую задачу. Недостатки: Несистемность решения. Отсутствие глобального контроля и методологии (и как следствие – противоречие решений, на вход могут подаваться непроверенные данные…) Учет мини программ (их может быть сотни…) Плюсы: В короткий срок позволяют решить необходимые аналитические задачи. Не требует больших финансовых затрат. Может быть тестовой платформой для дальнейшей реализации в СППР на базе ХД 11 СППР на основании хранилища данных Недостатки: Стоимость. Сложность изначального проектирования Плюсы: Полноценная система поддержки принятия решений, которая дает возможность решать не только отдельные задачи, но и выстраивать общую оценку финансового учреждения. 12 Определение хранилища данных Хранилище данных - это предметноориентированная, интегрированная, вариантная по времени, неизменяемая совокупность данных, предназначенная для поддержки принятия управленческих решений. 13 Определение хранилища данных на основе OLAP Хранилище данных на основе OLAP – это не просто база данных. Это – многомерный информационный куб, и каждый отчет который можем получить – это определенный срез по определенным измерениям в этом кубе. 14 Архитектура СППР на ХД СРЕДСТВА УПРАВЛЕНИЯ ХРАНИЛИЩЕМ СРЕДСТВА ЗАГРУЗКИ ДАННЫХ (ETL) АНАЛИТИЧЕСКАЯ СИСТЕМА: ХРАНИЛИЩЕ ДАННЫХ (OLAP) – Витрины данных – Стандартная и нестандартная отчетность – Средства прогнозирования – Аналитические методики РЕПОЗИТАРИЙ 15 Загрузка Загрузка – это не просто копирование. Это: Идентификация, преобразование Применение сложных фильтров Проверка исходных данных на целостность, полноту, непротиворечивость. Проверка на адекватность. Проверка исходных данных на предмет непротиворечивости и отсутствия дублирования с данными в хранилище 16 Метаданные и репозитарий Метаданные: Экономические – описание показателей, методик их подсчета, шаблоны отчетности… Технологические – описание моделей данных, структур источников данных, алгоритмов загрузки, бизнес-правил проверки… Функции репозитария – хранение метаданных. 17 Уровни поддержки принятия решений Уровень детализированных данных: Уровень агрегированных и вторичных показателей. Сводная отчетность Стандартные запросы Аналитические методики расчета показателей Уровень закономерностей Data Mining Имитационные модели Оптимизационные задачи 18 IASA-RMG На данный момент IASA-RMG имеет практику не только создание математических моделей, поддерживающих деятельность банков, но и их автоматизацию как на базе решения отдельных задач так и создание корпоративной СППР на базе ХД 19