Этапы кластерного анализа

реклама
Welcomе to
CLASтеризейшЫн
!
Начнем?
Кластерный анализ (КА) – это процесс группировки
данных в классы или кластеры таким образом,
что объекты одного кластера имеют высокую
схожесть друг с другом и высокую степень
отличия от объектов других классов.
Результат кластерного
анализа обозначен
раскрашиванием точек в
соответствии с
принадлежностью к одному
из трёх кластеров.
Подсказка: Не забывай название темы!
К.А. – это круто потому, что:


Важная деятельность человека.
Применяется во многих областях:
* Статистика;
* Биология;
* Бизнес;
* Маркетинг………………………
Ну, в общем, везде! 
Подсказка: Не забывай лицо собаки!
Этапы кластерного анализа
1.
Выявление подходящих классов;
2. Описание каждого полученного
класса.
Подсказка: Все таки прикольное да лицо у
собаки было? 
Типы данных в кластерном
анализе
Предупреждение! Это большая глава,
которая содержит в себе следующие
компоненты:


Две структуры данных;
И, собственно, сами типы данных
Подсказка: Расслабь мозг, ща объясним!
Какие матрицы?

Матрица данных

Матрица различий
Подсказка: См. названия матриц!
Что-то там про переменные еще было…


Вещественнозначные переменные – это
количественные измерения каких-либо
свойств. Например, вес, рост,
продолжительность, координаты по
вертикали и по горизонтали, температура и
т.д
Бинарные переменные - Переменная
называется бинарной, если она может
принимать только два значения: 0 и 1.
Подсказка: я знаю, что слайд перегружен
текстом!
Там ЕЩЕ были переменные!


Номинальная переменная – это
обобщение бинарной переменной в
том смысле, что она может принимать
более двух состояний.
Порядковые переменные так же, как и
номинальная переменная, может
принимать несколько различных
состояний.
Подсказка: да, и этот тоже!
Алго - РИТМ - мы


Алгоритм k-средних;
Алгоритм k-медоидов.
ШпасЫбЭ !
Скачать