Кластерный анализ Буянова Мария Фаттахова Вероника Чиркин Кирилл Высшая школа экономики, Москва, 2013 www.hse.ru Понятие и цели кластерного анализа Термин «кластерный анализ» - Р. Трион, 1939 фото «The cluster» - группа, пучок, куст, объединение каких-то однородных явлений. Основная цель: классификация = типологическая фото группировка данных на основе множества признаков Высшая школа экономики, Москва, 2013 2 Цели кластеризации • Понимание данных • Сжатие данных • Обнаружение новизны фото Высшая школа экономики, Москва, 2013 3 Задачи кластерного анализа • Разработка типологии или классификации • Построение новых классификаций для слабоизученных явлений фото • Проверка гипотез Высшая школа экономики, Москва, 2013 4 Этапы кластерного анализа • Отбор выборки для кластеризации • Определение множества переменных • Вычисление значений той или иной меры сходства между объектами фото • Применение метода кластерного анализа • Проверка достоверности результатов Высшая школа экономики, Москва, 2013 5 Методы кластерного анализа • Иерархические • Неиерархические (итеративные) фото Высшая школа экономики, Москва, 2013 6 Иерархические методы фото Высшая школа экономики, Москва, 2013 7 Итеративные методы. Метод K-средних фото Исходные точки и случайно выбранные начальные точки Высшая школа экономики, Москва, 2013 Точки, отнесённые к начальным центрам. Разбиение на плоскости Вычисление новых центров кластеров Предыдущие шаги повторяются, пока алгоритм не сойдётся. 8 Практическое применение Риск фото Доходность Высшая школа экономики, Москва, 2013 9 Пример использования кластерного анализа в исследовании Исследование взаимодействия в виртуальных командах* Выборка: • 175 студентов MBA из США и Японии, разделённые на 35 виртуальных команд Суть исследования: фото • Решение кейса в условиях коммуникации через интернетпортал *Massey A. P., Montoya-Weiss M. M., Hung Y. Because Time Matters: Temporal Coordination in Global Virtual Project Teams Высшая школа экономики, Москва, 2013 10 Пример использования кластерного анализа в исследовании Переменные для кластеризации. Относительное время взаимодействия, затраченное на: • Высказывание своих мыслей • Оценка собеседников • Общение фото на темы, не связанные с заданием • Направление процесса деятельности Высшая школа экономики, Москва, 2013 11 Пример использования кластерного анализа в исследовании Высказывание своих мыслей Оценка собеседников Общение на другие темы Направление процесса 0.12 0.08 0.13 0.19 0.29 0.39 0.24 0.17 0.3 0.16 фото0.74 0.23 0.62 0.43 0.22 0.11 0.07 1 Высшая школа экономики, Москва, 2013 0.36 0.16 0.01 2 3 4 5 12 Back-up Пример использования кластерного анализа в исследовании Кластер Высказывание своих мыслей Оценка собеседников Общение на другие темы Направление процесса Размер кластера 1 0.07 0.74 0.08 0.12 6 55,83 2 0.22 0.23 0.16 0.39 5 29,4 3 0.01 фото 0.62 0.24 0.13 7 56,57 4 0.11 0.43 0.17 0.29 12 18,75 5 0.16 0.36 0.30 0.19 5 10,6 Высшая школа экономики, Москва, 2013 Индекс эффективности 15