Advanced information technologies и бизнес искусство или технология миф или реальность? Об Авторах Александр Рыжов – к.т.н., к.ф.м.н., доцент механико-математического факультета МГУ им. М.В.Ломоносова, МВА (IEDC – Bled School of Management) Валерий Расторгуев – директор компании «Аналитические технологии для бизнеса (Snowcactus)» О Проблеме Что такое advanced information technologies? Игрушка для больших мальчиков или оружие для профессионалов? Об Аудитории CIO, IT директора Инвесторы, директора по развитию Студенты МВА Структура Современные ERP системы – умный калькулятор или тупой консультант? Что определяет интеллектуальный уровень системы? Какие технологии и как дают «value» для бизнеса? Примеры, обобщения, рекомендации. Что такое ERP? Google: 69 800 000 для ERP «стандартом де-факто» - терминология Американской ассоциации по управлению запасами и производством (American Production and Inventory Control Society, APICS) Словарь APICS: «ERP-система» (Enterprise Resource Planning — Управление ресурсами предприятия) может употребляться в двух значениях. Два Значения Во-первых, это — информационная система для идентификации и планирования всех ресурсов предприятия, которые необходимы для осуществления продаж, производства, закупок и учета в процессе выполнения клиентских заказов. Во-вторых (в более общем контексте), это — методология эффективного планирования и управления всеми ресурсами предприятия, которые необходимы для осуществления продаж, производства, закупок и учета при исполнении заказов клиентов в сферах производства, дистрибьюции и оказания услуг. Как устроены ERP системы Большинство современных ERP-систем построены по модульному принципу. Такими типовыми функциями являются: Ведение конструкторских и технологических спецификаций Управление спросом и формирование планов продаж и производства Планирование потребностей в материалах Управление запасами и закупочной деятельностью Планирование производственных мощностей Финансовые функции Функции управления проектами Методология – Чья? 200 лет капитализма 20 лет перестройки ГОСТы, финотчетность, взятки, “Орден Мужества”, … Sexual harassment, Sarbanes-Oxley Act, … ERP ist ordnung ERP = “Правильный” документооборот “Правильный” документооборот – главная задача бизнеса? «Что, Зачем, Почему» вопросы и «Как, Кто, Когда, Где» вопросы Данные Сохраняются Порядком Информация = антихаос (термодинамика) «Кто владеет информацией тот владеет миром» (политика) Кто владеет данными, тот лишь потенциально владеет миром Информация vs. данные Инновации Не Рождаются Порядком «Ошибки подождут. Пользователь ждать не может…» Examples of the major technologies developed from university laboratories that resulted in creation if new industries (hits for technology transfer): The 1940s development of the electronic calculator at the University of Pennsylvania that led to the computer industry The 1960s launch of fiber optics at MIT that stimulated telecommunications The 1070s investigations in DNA at Stanford and US Berkeley that provided the basis for the biotechnology industry The 1980s supercomputing at the University of Illinois that advanced the Internet and sequencing of DNA/the Human Genome at Cal Tech and Jons Hopkins that advanced pharmacogenomics Как Обрабатывать Данные, Чтобы Получить Информацию? «Арифметика» vs. «Искусственный Интеллект» Что лучше: «Суперкомпьютер» или «простая модель»? Какие знания бывают Неопределенность – свойство любой модели Неопределенность Как С Ней Бороться Моделирование (теория нечетких множеств) Обучение (нейронные сети, генетические алгоритмы) Умный перебор (углубленный анализ данных – data mining) Классическая математика (мир объектов) vs. advanced technologies (мир объектов и людей) Моделирование – Теория Нечетких Множеств Понятие нечеткого множества (Zadeh, 1965) Нечеткая логика Нечеткие управляющие системы. Японский проект LIFE Нечеткие бизнес-приложения. Ограничения Примеры (FLIDB) Обучение – Нейронные Сети История (Мак-Коллок – Питс, 1956; Минский – Пейперт, 1971) Типы. Прямое и обратное обучение Нейросетевые бизнес-приложения Ограничения (Теорема Колмогорова), недостатки Примеры Обучение – Нейронные Сети а) функция единичного скачка; б) линейный порог (гистерезис); в) сигмоид – гиперболический тангенс; г) сигмоид – формула (3) Однослойный перцептрон Двухслойный перцептрон Визуальное представление работы НС с рисунка 5 Обучение – Генетические Алгоритмы История (Де Джонг, Холланд 1975) Понятие генетического алгоритма. Скрещивание и мутация Ограничения и недостатки. Теорема Холланда Бизнес-приложения Примеры Обучение – Генетические Алгоритмы P0 , , l, s, , f, t, где P0 = (ao1,a o2,…, a o) - исходная популяция; а oj - решение задачи, представленное в виде хромосомы (1 i ); - целое число ( размер популяции ); l - целое число ( длина каждой хромосомы); s - оператор отбора; - отображение, определяющее рекомбинацию (скрещивание и мутацию); f - функция оптимальности; t - счетчик поколений (критерий останова). Обучение – Генетические Алгоритмы Родитель 1 0000000000 000~0000000 111~0000000 Потомок 1 Родитель 2 1111111111 111~1111111 000~1111111 Потомок 2 Углубленный Анализ Данных История Data Mining – широкое и узкое определения Бизнес приложения Примеры Углубленный Анализ Данных Data Mining — это процесс выделения из данных неявной и неструктурированной информации и представления ее в виде, пригодном для реализации. Data Mining — это процесс анализа, выделения и представления детализированных (detailed data) данных неявной конструктивной информации для решения проблем бизнеса (NCR). Data mining — это процесс выделения (selecting), исследования и моделирования больших объемов данных для обнаружения неизвестных до этого структур (patterns) с целью достижения преимуществ в бизнесе (SAS Institute). Data mining — это процесс, цель которого — обнаружить новые значимые корреляции, образцы и тенденции в результате просеивания большого объема хранимых данных с использованием методик распознавания образцов плюс [применение] статистических и математических методов (Gartner Group). Data mining — это процесс автоматического выделения действительной, эффективной, ранее неизвестной и совершенно понятной информации из больших баз данных и использование ее для принятия ключевых бизнес-решений. Data mining - это процесс обнаружения в сырых данных ранее неизвестных нетривиальных практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. (GTE Labs) Углубленный Анализ Данных Углубленный Анализ Данных Какие бизнес-проблемы решает data mining? Data mining можно использовать для решения любых бизнес-проблем, в которых фигурируют данные, включая: Увеличение прибыльности подразделения или целого предприятия Понимание желаний и потребностей Идентификация клиентов, приносящих прибыль, и приобретение новых Сохранение клиентов и повышение лояльности Увеличение отдачи от инвестиций (ROI) и снижение расходов на продвижение товаров и услуг Продажа дополнительных товаров и услуг существующим клиентам Выявление случаев мошенничества, нерационального и нецелевого расходования средств Оценивание кредитных рисков Увеличение отдачи от Веб-сайта Повышение пропускной способности магазина и оптимизация расположения товаров для увеличения продаж Мониторинг эффективности бизнеса Углубленный Анализ Данных Примеры применения Data Mining в различных отраслях: розничная торговля: выявление товаров, которые стоит продвигать совместно; выбор местоположения товара в магазине; анализ потребительской корзины; прогнозирование спроса; маркетинг: поиск рыночных сегментов, тенденций покупательского поведения; финансы: выявление правил экспертных систем для андеррайтинга; классификация дебиторских задолженностей по возможностям взыскания; прогноз изменений на валютных рынках; здравоохранение: определение результатов лечения пациентов; анализ контрактов; промышленное производство: диагноз неисправностей. Углубленный Анализ Данных Боб Моран, вице-президент Бостонского отделения компании Aberdeen Group: «Многие Мнение Херба Эдельштайна (Herb Edelstein), известного в мире эксперта в области Data Mining, Хранилищ данных и CRM: «Недавнее исследование компании Two Crows показало, что полагают: стоит только дать специалисту по маркетингу средства DM, и „секретный рецепт“ будет у вас в руках. Но такого рецепта не существует. Метод Data Mining в основном оперирует оттенками серого, но никогда точно не скажет, где черное, а где белое» Data Mining находится все еще на ранней стадии развития. Многие организации интересуются этой технологией, но лишь некоторые активно внедряют такие проекты. Удалось выяснить еще один важный момент: процесс реализации Data Mining на практике оказывается более сложным, чем ожидается.IT-команды увлеклись мифом о том, что средства Data Mining просты в использовании. Предполагается, что достаточно запустить такой инструмент на терабайтной базе данных, и моментально появится полезная информация. На самом деле, успешный Data Mining проект требует понимания сути деятельности, знания данных и инструментов, а также процесса анализа данных» Грегори Пиатецкий-Шапиро (Gregory Piatetsky-Shapiro), руководитель проекта в исследовательской лаборатории корпорации GTE: «Сложность — существенный барьер для внедрения Data Mining». Большинству пользователей не нужен реактивный двигатель. Им нужен всего лишь автомобиль с водителем, который доставит их из пункта A в пункт B». Мэри Келли (Mary Kelley), вице-президент отдела маркетинга компании Charles Schwab & Co.: «Очевидно, что необходимы хорошие специалисты, и применение сложных инструментов предъявляет все большие требования к людям, которые необходимы компании. Однако специалистов по Data Mining, которые бы хорошо разбирались в бизнесе, очень не много». Гибридные Системы Обучение нечетких моделей на базе нейронных сетей и генетических алгоритмов Анализ данных по обобщенным понятиям Информационный мониторинг сложных систем и процессов Хочу Применить Завтра Затраты на advanced technologies Outsourcing – таблетка от головной боли Компании - провайдеры на Российском рынке