Аналитика завтрашнего дня от Oracle От бизнес-анализа к исследованию данных Ольга Горчинская Директор по исследовательским проектам Форс www.fors.ru Бизнес-анализ Тенденции развития In-Memory Analytics 1990s Mobile Analytics Big Data Analytics Cloud Delivery 2000s BI-системы Интерактивные дэшборды OLAP анализ 1980s Регламентная отчетность www.fors.ru Стратегия Oracle в области бизнес-анализа Любые данные Любая аналитика Любой доступ Экстремальная производительность www.fors.ru Любые типы данных Не только корпоративные, не только структурированные Любые данные и источники Your Data: Принятие решений на основе внутренних источников данных Big Data: Принятие решений на основе всей информации Транзакционные Oracle SAP Документы Социальные сети Автоматически сгенерированные данные www.fors.ru Любые средства анализа данных От классического BI до платформы Data Discovery Любая аналитика Отчеты & анализ Исследование информации Предиктивная аналитика Моделирование, планирование www.fors.ru Oracle Endeca Information Discovery – платформа для интуитивного исследования структурированных, слабо-структурированных и неструктурированных данных в условиях нечетких критериев поиска www.fors.ru Что такое Data Discovery? • • • • Инструменты обеспечивают высокую степень удобства (usability), гибкости управления процессом моделирования и создания контента Высокая степень интерактивности и расширенные возможности визуализациии интерфейса, основанного на in-memory архтектурах и быстрым развертыванием Возможность пользователям исследовать данные самостоятельно без предварительного обучения Примеры: QlikTech QlikView, Tableau, Tibco Spotfire, Microsoft PowerPivot, Oracle Endeca Information Discovery (previously Endeca Latitude) **Source: Gartner, June 17, 2011, “Emerging Technology Analysis: Visualization-Based Data Discovery Tools” • • • • Быстрая разработка и ускоренная реакция на быстро меняющиеся бизнес-требования Инкрементальное внедрение, быстрое прототипирование Данные, метаданные и приложения (отчеты, дэшборды) не разделяются («one and the same») Легкость и простота создания новых приложений и изменения существующих **Source: Forrester, “April 22, 2010, “Agile BI Out of the Box,” Boris Evelson www.fors.ru Особенности подхода Data Discovery Цель исследования – понять причину события, формирование идей, проверка гипотез Большая доля информационно-поисковых операций (совместно с вычислениями) «BI beyond Data Warehouse» («Аналитика за пределами хранилища данных») Разнообразие данных и наличие большого числа внешних источников Неструктурированные текстовые данные Схемы исходных данных часто меняются www.fors.ru Oracle Endeca Information Discovery Платформа для исследования данных Endeca Server Поисково-аналитическая база данных, NoSQL Endeca Integrator Загрузка данных в Endeca Server Endeca Information Discovery Быстрая компонентная разработка приложений для исследования данных Endeca Information Discovery Unified Querying Interactive Exploration App Composition Endeca Server Faceted Data Model Integration Enrichment www.fors.ru Особенности интерфейса пользователей Удобство и простота использования На основе 10-летнего опыта работы в области разработки поисковых систем для электронной коммерции Поиск + Фасетная навигация + Визуальный анализ Поиск и выбор атрибутов в стиле вэб сайтов Интерактивные исследования Без заранее определенного сценария www.fors.ru Oracle Advanced Analytics Статистические исследования и предиктивная аналитика Новая опция для СУБД Oracle Database 11g, объединяет Oracle Data Mining и среду статистических исследований Oracle R Enterprise R www.fors.ru Встроенная в базу данных статистика и аналитика Oracle R Enterprise Распространенный язык статистических исследований R -open source Встроен в Oracle Database – Rвычисления транслируются и выполняются в Oracle Database R Integrated with Hadoop & OBIEE Oracle Data Mining Встроенные в базу данных процедуры data mining R API для разработки приложений, встраивания data mining в существующие приложения и системы Oracle Data Miner www.fors.ru Oracle R Enterprise Встроенный в Oracle Database язык R Open source проект, R Foundation Язык для статистических исследован ий и работы с графикой (Росс Айхэк, Роберт Джентельмен, Оклендский ун-т, 1997) Широкий спектр различных функций (временные ряды, прогнозирование, классификация, кл Возможность расширения, технология разработки дополнительных пакетов участниками проекта астеризация и др) Oracle R Enterprise -- Выполнение Rпрограмм внутри Oracle Database www.fors.ru Работает в любой архитектуре Традиционно, в облаках, с мобильных устройств Любой доступ Мобильный доступ без дополнительной разработки Офлайн аналитика Расширенная визуализация Все инструменты www.fors.ru Экстремальная производительность Программно-аппаратный комплекс Exalytics Экстремальная производительность Аналитика в оперативной памяти www.fors.ru Oracle Exalytics Business Intelligence Machine • Программно-аппаратный комплекс для бизнес-анализа • Экстремальная производительность • Неограниченные возможности визуализации и анализа www.fors.ru Аппаратное обеспечение Exalytics • • • • Оперативная память 1 TB RAM, 1033 MHz Процессоры 4 Intel® Xeon® E7-4870, 40 cores Сетевые интерфейсы 40 Gbps InfiniBand – 2 ports 10 Gbps Ethernet – 2 ports 1 Gbps Ethernet – 4 ports Дисковая память 3.6 TB HDD Capacity www.fors.ru Программное обеспечение Oracle Business Intelligence Oracle Essbase Oracle TimesTen for Exalytics Адаптивные in-memory Oracle Business Intelligence акселераторы Essbase TimesTen for Analytics Адаптивные in-memory акселераторы www.fors.ru Oracle BI – «классический» бизнес-анализ • Инструменты для • корпоративной отчетности • интерактивного анализа • информационных панелей • Единая бизнес-модель • Интеграция с любыми системами, приложениями и бизнес-процессами 20 www.fors.ru Times Ten for Exalytics На основе Oracle TimesTen In-Memory Database In-memory RDBMS Высокая производительность Снижение времени отклика Высокая пропускная способность SQL, ODBC/JDBC интерфейсы Client-Server Application TimesTen Client Lib Client/ Server JDBC / ODBC / OCI / PLSQL Быстрый доступ к данным Checkpoint Files Для Exalytics Аналитические функции: RANK, DENSE_RANK, SUM, AVG, ORDER BY NULLS FIRST|LAST Временные функции: TIMESTAMPADD, TIMESTAMPDIFF OLAP групповые функции: CUBE, ROLLUP, GROUPING SETS Колоночная компрессия Log Files Memory-Resident Database www.fors.ru Oracle Essbase Для Exalytics Универсальный OLAP сервер Высокая производительность Моделирование сложной аналитики Основа для Hyperion Planning • Хранение часто используемых блоков в памяти (Smart Storage Manager) • Оптимизация доступа к блокам данных (In-Memory Cache) • Увеличение степени параллельности выполнения операций (Lock Manager) www.fors.ru Адаптивные in-memory акселераторы Реализация in-memory аналитики In-Memory Data Warehouse Хранение в оперативной памяти всего хранилища данных In-Memory Intelligent Result Cache Хранение в оперативной памяти результатов выполненных запросов In-Memory Essbase Cubes Кэширование в оперативной памяти Essbase-кубов In-Memory Adaptive Data Marts Кэширование в TimesTen Автоматическое формирование витрины на основе статистики запросов www.fors.ru Первая Exalytics в России Приобретена компанией ФОРС Получена в октябре 2012 Первые шаги Установка всех компонент Конфигурирование Разворачивание демо-примера www.fors.ru Готова к тестированию! Форс предоставляет возможность тестирования на Exalytics ваших аналитических систем Что можно тестировать Приложения, разработанные на основе Oracle BI EE Аналитические Essbase-приложения Системы планирования и бюджетирования для Hyperion Planning www.fors.ru Спасибо за внимание! www.fors.ru