ОБРАБОТКА ДАННЫХ, ИЗМЕРЕННЫХ В ШКАЛЕ ЛАЙКЕРТА, С ПОМОЩЬЮ ТЕОРИИ НЕЧЕТКИХ МНОЖЕСТВ Л.И. Маруцак (г. Кемерово, Кемеровский государственный университет) PROCESSING OF DATA MEASURED IN THE LIKERT SCALE USING THEORY OF FUZZY SETS L.I. Marutsak (s. Kemerovo, Kemerovo State University) The article touches upon a new approach to processing of data measured by Likert scale. Fuzzy sets are used for measuring the interval between variants of responses and for calculating weighting factors. При проведении социальных исследований нередко возникает необходимость получить количественную оценку отношения респондентов к рассматриваемой проблеме. Часто при этом испытуемым предлагается опросник, использующий шкалу Лайкерта [1]. Пункты анкеты представляют собой простые утверждения, которым необходимо дать оценку, например, «согласен», «скорее согласен», «скорее не согласен» и «не согласен». Кроме того, предлагаемые суждения делятся на позитивные и негативные. Позитивные выражают положительное отношение к явлению, ответ «согласен» оценивается в 5 баллов, «не согласен» – 1 балл. Негативные суждения, в свою очередь, выражают отрицательное отношение и имеют обратную кодировку. Ответ испытуемого отражает степень выраженности интересуемого компонента, измеренную в ранговой шкале. Однако к данным, измеренным в ранговой шкале неприменима операция алгебраического сложения из-за того, что не известно расстояние между соседними отсчетами шкалы [2]. Для решения этой проблемы можно применить аппарат теории нечетких множеств, который позволяет перевести данные из ранговой шкалы в количественную [3]. При этом подходе каждое утверждение анкеты представляется в виде лингвистической переменной, а варианты ответа составляют её терм-множество. В начале проводится процедура фаззификации. Каждому терму ставится в соответствие своя функция принадлежности . График полученной функции будет иметь трингулярный или трапециевидный вид, а площадь, ограниченная этим графиком и осью абсцисс, будет равна частоте выбора данного варианта ответа. Функцию принадлежности такого вида удобнее всего описать четырьмя точками: , , , , где и – концы интервала толерантности, на котором функция принадлежности принимает значение, равное 1, а точки и – соответственно левый и правый нуль функции. Итоговое численное значение, соответствующее позиции респондента, является центроидом терма, основные четыре точки которого находятся как взвешенные суммы основных точек термов, соответствующих выбранным вариантам ответов [4]: 1 3 . Поскольку часто испытуемые дают положительные ответы на позитивные вопросы и отрицательные – на негативные, суждения, которым даны наиболее различающиеся оценки, имеют большую степень важности. Рассмотрим способ получения весовых коэффициентов. Назовем эталонным утверждение, имеющее равномерное распределение выбора вариантов ответов. Обозначим функции принадлежности эталонного утверждения как . Для каждого варианта ответа утверждения найдем отношение площади пересечения графиков эталонной и рассматриваемой функции принадлежности к площади ох объединения. Сумма таких отношений по всем термам даст близость утверждения к эталонному: . 880 Значение непосредственно весового коэффициента находится как отношение близости данного вопроса к сумме близостей всех рассматриваемых в анкете утверждений. . ∑ Для того, чтобы полученные результаты были сопоставимы, значения центроид переводятся в диапазон [0;1] путем нормировки: норм Приведем пример использования описанного выше алгоритма, получив количественную оценку отношения респондента к нарушению трудового кодекса работодателем. Пусть дано четыре утверждения, два из которых (У1, У2) являются позитивными, и два (У3, У4) – негативными. Данные о частоте выбора вариантов ответов, а также полученные координаты функций принадлежности и весовые коэффициенты представлены в табл. 1. Таблица 1 Частоты выбора вариантов ответов, координаты функций принадлежности и веса У1 (0,199) У2 (0,342) У3 (0,328) У4 (0,131) 1 0,1 (0;0;0,05;0,15) 0,19 (0;0;0,09;0,285) 0,16 (0;0;0,08;0,24) 0,02 (0;0;0,01;0,03) 2 0,21 (0,05;0,15;0,21;0,41) 0,35 (0,09;0,285;0,37;0,71) 0,25 (0,08;0,24;0,29;0,53) 0,2 (0,01;0,03;0,12;0,32) 3 0,23 (0,21;0,41;0,42;0,66) 0,4 (0,37;0,71;0,79;0,93) 0,24 (0,29;0,53;0,53;0,77) 0,28 (0,12;0,32;0, 36;0,64) 4 0,46 (0,42;0,66;1;1) 0,14 (0,79;0,93;1;1) 0,35 (0,53;0,77;1;1) 0,5 (0,36;0,64;1;1) В результате позиция респондента, выбравшего варианты ответа 4, 2, 4, 1, соответствует оценке 0,547. После нормировки получаем значение 0,379, которое свидетельствует о негативном отношении респондента к нарушению трудового кодекса. Таким образом, в работе описан механизм использования теории нечетких множеств для перевода данных, измеренных в шкале Лайкерта, в количественные, а также получение весовых коэффициентов предложенных в анкете утверждений. Список литературы 1. Ядов В.А. Стратегии и методы качественного анализа данных. / В.А. Ядов – Социология: 4М, 1991. №1. 14-30 с. 2. Chiu-Keung Law. Using fuzzy numbers in educational grading system / Chiu-Keung Law // Fuzzy Sets and Systems, 1996, V. 83, 311-323 pp. 3. Каган Е.С. Применение нечетких множеств для преобразования шкалы Лайкерта в шкалу отношений [Текст] / Е.С. Каган, Л.И. Маруцак // Векторы развития современной науки: сб. статей. – Уфа, 2014. С. 122-125. 4. Леоненков А.В. Нечеткое моделирование в среде MATLAB и fuzzyTECH / А.В. Леоненков – СПб.: БХВ-Петербург, 2003. 736 с. 881