Кластерный анализ Демьянюк Антон Ромашина Мария Лисяк Марина НИУ ВШЭ, Москва, 2012 Кластерного анализа • Термин «кластерный анализ» был введен математиком Р. Трионом в 1939 году; • Кластерный анализ -один из методов разбиения выборки на группы по каким-либо критериям. • Кластер = тип Высшая школа экономики, Москва, 2012 2 Цели • Понимание данных; • Сжатие данных; • Обнаружение новизны. Высшая школа экономики, Москва, 2012 3 Преимущества • Можно применять в различных ситуациях; • Не требует априорных предположений о наборе данных; • Не накладывает ограничения на представление исследуемых объектов; • Позволяет анализировать показатели различных типов данных; • Позволяет сокращать размерность данных, делать ее наглядной. Высшая школа экономики, Москва, 2012 4 Задачи • Разработка типологии или классификации; • Исследование полезных концептуальных схем группирования объектов; • Порождение гипотез на основе исследования данных; • Проверка гипотез. Высшая школа экономики, Москва, 2012 5 Этапы кластерного анализа • Отбор выборки для кластеризации; • Определение множества переменных, по которым будут оцениваться объекты в выборке; • Вычисление значений той или иной меры сходства (или различия) между объектами; • Применение метода кластерного анализа для создания групп сходных объектов; • Проверка достоверности результатов кластерного решения. Высшая школа экономики, Москва, 2012 6 Недостатки • Может давать неустойчивые кластеры; • Он реализует индуктивный метод исследования от частного к общему; • Имеет множество особенностей, связанных с внутренними методами; Высшая школа экономики, Москва, 2012 7 Использование кластерного анализа Анализ проектной деятельности Высшая школа экономики, Москва, 2012 Выполнение работ в рамках проекта 8 Анализ проектной деятельности • Анализ портфеля проектов Инвестиционный портфель проектов Портфель реальных проектов • Оценка эффективности реализуемых проектов Высшая школа экономики, Москва, 2012 9 Кластерный анализ Критерий Проект 1 …….. Проект N Фактор 1 х х х х х х ………… Фактор N Высшая школа экономики, Москва, 2012 10 Графическое отображение Риск Доходность Высшая школа экономики, Москва, 2012 11 Предназначение кластерного анализа • Анализ портфеля проектов: Балансировка портфеля Разработка общих процессов управления проектами • Оценка эффективности реализуемых проектов Выявление групп сходных проектов, для проведения регрессионного анализа Высшая школа экономики, Москва, 2012 12 Пример. Создание бренда для продукта «Орский мясокомбинат» Производство колбасных изделий и деликатесов Производство мясной консервации «Говядина тушеная ГОСТ высший сорт» •70% продаж •80% прибыли 13 Проведение исследования Данные: исследовательская компания Комкон Сбор: заполнение дневников участниками панели Преимущества: размер выборки, стоимость и скорость Этапы исследования потребителей : • Выявление списка эмоциональных и функциональных выгод • Разделение потребителей на группы: – Факторный анализ (Выявлено 3 фактора) – Кластерный анализ (на базе 3-х факторов сформированы кластеры методом Варда) 14 Кластеры «ищущие качество» «большое содержание мяса в банке» (86,3%) «нет сои» (83,8%) «высокое качество» (79,4%) «по ГОСТу» (77,5%) «ищущие вкус» «вкусная» (100%) «не жирная» (92,6%), «содержит мало желе» (92,6%) «не острая» (85,2%) «ищущие низкую цену» «не дорогая» (100%) «безопасность с точки зрения отравления» (100%) «калорийная» (62,8%) «стеклянная банка» (48,8%) 15 Итоги исследования «ищущие качество» Частота покупки: средняя Возраст: 25-34 года Личный доход: от 5 до 15 тыс. рублей «ищущие вкус» Частота покупки: низкая Возраст: 45-54 лет Личный доход: более 20 тыс. рублей «ищущие низкую цену» Частота покупки: высокая Возраст: старше 55 Личный доход: менее 5 тыс. рублей 16