Кластеризация в задачах ассортиментного планирования в торговых сетях Аннотация: В статье рассматриваются особенности кластеризации каналов реализации торговых розничных сетей при ассортиментном планировании. Выявлены следующие особенности: множество метрик и критериев оценки эффективности. Основная идея состоит в использовании методов кластеризации с ограничениями на объединения и методов многокритериальной оптимизации для поиска наиболее эффективных разбиений. Abstract: The article contains the observation of features of clustering in retail chains assortment planning processes. Following features are unveiled: huge amount of metrics and amount of efficiency criteria. The main idea is based on using constrained clustering and multicriteia optimization algorithms. Ключевые слова: торговые сети, кластеризация, ассортиментное планирование, парето-эффективность Keywords: retail chains, clustering, assortment planning, pareto-efficiency Лавренко Антон Сергеевич аспирант Московский государственный университета печати им. Ивана Федорова cnt.anton@rambler.ru Сфера товарного обращения в настоящее время отличается концентрацией финансовых, трудовых и материальных ресурсов в рамках сетевых структур – торговых розничных сетей, которые можно определить как основанные на логистических принципах торговые организации, объединяющие в единую структуру специализированные магазины в виде отдельных строений, магазинов на территории крупных торговых центров или арендуемых отделов универмагов. [2] С деятельностью торговых розничных сетей тесно связано понятие формата розничной торговли – совокупности параметров, по которой определяется принадлежность торгового предприятия к одному из распространенных в мировой практике видов. Основными параметрами отнесения предприятия к какому либо из форматов являются площадь торгового зала, присутствующие в ассортименте категории товара, ширина ассортимента, количество позиций в категориях, глубина ассортимента, форма обслуживания, списочное количество персонала, уровень цен на базовые позиции ассортимента и проч. В таблице 1 представлены наиболее распространенные форматы торговых предприятий. [2] Таблица 1 - Форматы торговых предприятий Параметры Площа дь торгового зала, кв.м. дь кв.м. Гипера Супер Дискау маркет маркет нтер 4 000 – 10 000 000 Площа склада, 000 Количе ство позиций в ассортименте, тыс. До 2 500 – 2 250 – 4,5 – ность персонала, 900 Незначи 100 – 200 тельны или отсутствуют 1 – 2,5 0,8 – 1,2 50 190 200 – 400 15 Уровен Специа Выше ь цен по льная ценовая среднего рынку политика Числен – 800 600 25 – 50 450 «М агазин у дома» – Низкий Ср едний 34 28 чел. Уровен й ь логистических издержек розничного торговца Средни Высок Низкий ий Вы сокий Данные форматы ориентированы на покупателя, и отражают свойства, важные для него. При планировании ассортимента значимость приобретают индивидуальные характеристики магазинов, зависящие от внешних факторов, таких как предпочтения потребителей в отдельном регионе, климатические условия, паттерны продаж магазинов. Таким образом, при планировании ассортимента приходится учитывать эти особенности и объектом управления в данном случае становится отдельный магазин. Очевидно, что с ростом числа магазинов процесс ассортиментного планирования усложняется и дорожает. Это выражается в следующем: увеличение числа работников, привлеченных к процессам планирования ассортимента, увеличение сроков составления ассортиментных матриц для магазинов, увеличение времени информационных систем. обработки информации, загрузка С другой стороны, уместно предположить, что среди значительного количества магазинов имеются магазины, обладающие схожими паттернами продаж. Таким образом, разделение множества магазинов на однородные группы позволило бы сократить количество объектов управления, уменьшая при этом затраты на управление, сроки подготовки ассортиментных матриц, а также устраняя дублирование операций. Одним из наиболее популярных подходов к формированию таких групп являются методы кластерного анализа, позволяющие на основе заданной меры сходства выявлять группы объектов (кластеры) при отсутствии обучающей выборки и, в некоторых методах, заранее известного количества кластеров. В задаче кластеризации магазинов торговых розничных сетей можно выделить две значимые особенности: 1. В процессе анализа и принятия управленческих решений при ассортиментном планировании объекты (магазины) оцениваются сразу по нескольким мерам сходства (метрикам), в соответствии с информационными потребностями коллективных и индивидуальных пользователей. 2. Разбиение на группы при ассортиментном планировании носит противоречивый характер: с одной стороны, сокращение количества объектов управления позволяет ускорить процессы принятия решений и сократить издержки; с другой – качество управления снижается, так как при группировке пропадает индивидуальный подход, и чем крупнее группы, тем ниже качество управления. Таким образом, для решения задачи кластеризации каналов реализации торговых розничных сетей следует решить две задачи: выбрать алгоритм, позволяющий проводить кластеризацию при оценке объектов по различным метрикам, и выбрать метод поиска разбиения, компромиссного с точки зрения затрат на управления и качества ассортиментного планирования. Для решения первой задачи можно в рамках кластеризации использовать одну метрику в качестве основной, а остальные относить в область экспертных оценок. Подобный подход был использован в [4]. В алгоритме «кластеризации с ограничениями» (constrained clustering), предложенном Вагстафом и Карди для кластеризации методом k-средних, для принятия решения о присоединении объекта к классу используется не только мера сходства (метрика), но и определенные ограничения, отражающие экспертную оценку возможности объединения объектов в один кластер. Ограничения могут быть представлены в виде: o ограничений на объединение объектов по значениям метрик, ограничений на характеристики образуемых рассматриваемых в различных пространствах признаков. o кластеров, То есть, можно оценить возможность объединения объектов по второстепенным метрикам до начала кластеризации и таким образом создать ограничения на объединения при кластеризации по основной метрике. Допустим, мы имеем множество объектов , сходство которых оценивается по двум метрикам – , , . Пусть выбрана основная метрика – , а на основании значений происходит экспертная оценка сходства объектов. Например, введено ограничение на значение , выполнение которого говорит о том, что объекты могут быть объединены в один кластер. Тогда матрицы для и множества , могут быть составлены , , где z – ограничение на метрику , установленное экспертом. При этом для каждой пары , , существует пара , , причем множество таких пар позволяет однозначно ранжировать все пары объектов по степени сходства. Очевидно, что пары объектов, для которых = 0, исключаются из рассмотрения, а оставшиеся ранжируются по значениям . В случае, когда количество метрик больше двух, имеем множество матриц экспертных оценок где , и ни одна из Очевидно, множество матрице согласно правилу , где не является основной метрикой. можно привести к единственной На рис. 1 представлена блок-схема двухуровневая схема попарного выбора объектов для объединения в кластер в процессе кластеризации магазинов. Лучше всего такая схема может быть реализована в составе иерархического агломеративного алгоритма. [1] Тогда алгоритм кластеризации принимает следующий вид: Инициализация множества (каждый объект является кластером) , некластеризованных . Цикл o Расчет o Составление , , , . матриц , где o Составление объектов , множества пар , . кластеров, удовлетворяющих ограничениям o Поиск пары объектов , таких что Объединение , включение в . o До тех пор, когда , в один кластер или , исключение , из . Результат кластеризации напрямую зависит от установленных ограничений. Очевидно, чем жестче ограничения, тем больше групп получится на выходе в процессе кластеризации, и наоборот – несущественные ограничения приведут к созданию небольшого количества крупных групп. Таким образом, проявляется вторая задача – задача оценки возможных разбиений при различных ограничениях и выбора наиболее эффективных. Пусть , – критерии, позволяющие определить эффективность использования разбиения магазинов на кластеры при ассортиментном планировании, где k – количество кластеров в разбиении , – в определенном смысле гладкие функции. Рис. 1 - Блок-схема алгоритма, реализующего двухуровневую схему выбора пары объектов для объединения в кластер В качестве критериев могут служить, например, затраты на управление и качество управления. Затраты на управление прямо зависят от количества кластеров – объектов управления. , где CST – затраты на управление одним объектом, – количество кластеров, и, соответственно, количество объектов управления при t-ой кластеризации; Качество управления можно выразить как точность прогноза прибыли при использовании кластеров в сравнении исходной ситуацией, когда объектом управления является каждый канал реализации. , где величина – прогноз при отсутствии группировки объектов по кластерам – постоянна и не меняется в зависимости от t, . При наличии противоречивых критериев уместно воспользоваться методами многокритериальной оптимизации для поиска эффективных решений. В рамках поставленной задачи наиболее уместным является диалоговый алгоритм Соболя-Статникова. [3] Будем считать, что искомое решение, то есть искомое разбиение на кластеры, является одним из разбиений, соответствующих множеству парето-эффективных точек в пространстве критериев. Тогда решение задачи состоит из следующих этапов: Установка интервалов значений, которые могут принимать ограничения , т.е. определяется пространство допустимых установок ограничений; В пределах случайные пробные точки; определяются пространство равномерно – распределенные Кластеризация объектов при различных ограничениях, соответствующих случайным точкам. Переход от результатов кластеризации к значениям критериев через пробных точек; , где t – количество Отражение результатов в построение парето-эффективной границы. критериальном пространстве, На рис. 2 приведен пример парето-эффективной границы на множестве решений задачи кластеризации магазинов торговой розничной сети. Рис.2 - Кривая Парето на множестве решений задачи кластеризации КР торговой сети, отраженном в пространстве критериев Таким образом, рассмотрены проблемы кластеризации каналов реализации торговых сетей. Предложено решение задачи кластеризации при наличии нескольких метрик и противоречивых критериях оценки эффективности использования различных разбиений при ассортиментном планировании в торговых сетях. Преимуществами предложенного решения являются: решение проблемы многометричности за счет выделения основной метрики и отнесения остальных в область экспертных оценок; возможность поиска эффективных решений по внешним критериям; автоматизация выбора альтернативных экспертных оценок и поиск эффективных решений; Расширение возможности экспертной оценки. К недостаткам можно отнести трудоемкость пост-анализа при большом количестве метрик или внешних критериев. Библиографический список: 1. Мешалкин Айвазян С.А., В.М. Бухштабер, И.С. Енюков, Л.Д. Прикладная статистика: Классификация и снижение размерности: Справ. Изд. — М: Финансы и статистика, 1989 2. Ковалев К., Уваров С., Щеглов П. Логистика в розничной торговле: как построить эффективную сеть – СПб: Питер, 2007 3. Соболь И.М., Статников Р.Б. Выбор оптимальных параметров в задачах со многими критериями. М. : Наука, 1981 4. Background Wagstaff K., Cardie C. Constrained K-means Clustreing with Knowledge. Proceedings of the Conference on Mahine Learning, 2001, p. 577-584 Eighteen International