Е.В. ЛОБАНОВА (Москва, Россия) К МЕТОДИКЕ ИСЧИСЛЕНИЯ КОЭФФИЦИЕНТА КОНЦЕНТРАЦИИ (АНАЛОГ ФОРМУЛЫ ДЖИНИ-ИНДЕКСА) Объединение отдельных элементов в более крупные совокупности - концентрация является характерной чертой многих социально-экономических процессов. Для изучения этого явления обычно используется метод группировок. Давая определенное представление о временных и территориальных различиях данного процесса и их динамике, метод группировок, однако, не дает общей оценки уровня концентрации во всем множестве совокупностей. В данном случае будем рассматривать в качестве элемента рабочего, совокупности - промышленное предприятие, множества совокупностей отрасль промышленного производства. Для получения оценки концентрации 53 эффективно использовать коэффициент концентрации или Джини-индекс (Iк ). Джини-индекс измеряет степень неравномерности распределения в множестве совокупностей (или в выборке из него).Будучи изображенным графически, он представляет собой кривую, располагающуюся между осями X и Y в квадрате с единичными сторонами. В теории статистики ее называют кривой Лоренца. Если распределение абсолютно пропорционально, то последовательность имеет форму прямой линии. Так называемая лини равенства располагается под углом 45o между осями координат. Чем более неравномерным является распределение, тем дальше отходит линия Лоренца от линии равенства и становится более выпуклой. Построив на графике несколько линий Лоренца, возможно сравнивать уровни концентрации по степени кривизны этих линий. С помощью графика Лоренца можно качественно установить, где уровень концентрации выше, но нельзя количественно выразить, насколько он выше. Поэтому на его базе сконструирован количественный показатель. Числовое выражение уровня концентрации (Джини-индекс) определяется через отношение площади, заключенной между линией равенства и линией Лоренца (факторной площади), к максимальному пределу, достигаемому этой площадью. Формула коэффициента концентрации имеет следующий вид: 5000 − I k = n ∑ (1 / 2 X i Y i + X i Y i−1 ) i=1 5 0 (1 0 0 − X n ) где Хi - доля группы в совокупности по первому показателю, Yi - доля группы в совокупности по второму показателю, Yi-1 - кумулятивный итог по объему явления, 50 (100 - Xn) - предел факторной площади. Значение Джини-индекса лежит в границах от нуля (полное равенство) до единицы (полное неравенство). Эта формула используется в отечественных исследованиях, как правило, для определения уровня концентрации рабочей силы и производства. За рубежом ею активно пользуются для определения концентрации имущества, дохода, земли и т.д. Данная формула создана в предположении о том, что первичные данные группируются. Несомненно, такой подход целесообразен, если анализ ведется в масштабах целого государства. В этом случае число элементов в совокупности и число совокупностей достаточно велико и существует необходимость объединения их в группы. При предварительной группировке встает проблема определения минимально допустимого числа групп (на графике интервалов), при котором значение индекса объективно характеризует степень неравномерности. Эта проблема не возникает, если использовать несгруппированные, исходные данные, упорядоченные по объему явления. Такой подход представляется более естественным и в масштабах отдельных регионов, отраслей, производств, где число совокупностей не слишком велико. Построим индекс концентрации, соответствующий этому случаю, т.е. без предварительной группировки. Для получения формулы используем следующие исходные данные {q X } N X =1 где qx -численность рабочих на Х-ом предприятии, N -общее число предприятий. Упорядочим набор qx по возрастанию численности рабочих. Получим множество { } q*X N X =1 54 где q x * -упорядоченная численность рабочих на - q * X −1 ≤ q * X ≤ q * X +1 предприятии, такая, что , X = 2, 3, ..., N-1. Введем величину объема явления Y n - cуммарную численность рабочих в группе из n первых предприятий (для n = 1, 2, 3, ..., N) Y n n ∑q = i=1 * X где n - количество предприятий в группе, т .е. первая группа предприятий (n = 1) включает первое предприятие: Х = 1 вторая - "- " - " - " - " - " - (n = 2) включает два первых: Х =1, Х = 2 третья - " - " - " - " - " - " - (n = 3) включает три первых: Х = 1, Х = 2, Х = 3, когда n = N, X = 1, X = 2, ..., X = N Cледующим шагом найдем Yn - долю рабочих в группе из n cамых первых предприятий (для n = 1, 2 , 3, ..., N) по отношению к их общему числу на всех N предприятиях Y n = Y Y n N C помощью полученных величин найдем факторную площадь, заключенную между линией Лоренца и линией равенства 1 N −1 n S f = N − 1 ∑n = 1 ( N − Y n ) Индекс концентрации находится через отношение площадей S f è S ∆ (максимального предела, достигаемого факторной площадью), но т.к. площадь треугольника составляет половину площади квадрата, а площадь квадрата равна единице, то 2 S 2 S I k = 2 S ∆f = 1 f = 2 S j Следовательно индекс концентрации будет определятся по формуле 2 N −1 n I k = N − 1 ∑n = 1 ( N − Y n ) Зарубежные исследователи также определяют Джини-индекс не через отношение площадей, а как помноженную на два факторную площадь. Новизна и оригинальность предложенной методики заключается в отсутствии предварительной группировки статистических данных, что дает, на мой взгляд, более точные результаты. На основе предложенной формулы была создана программа для персонального компьютера. Она позволяет графически представить уровни концентрации (графики Лоренца) и вычислить соответствующие индексы. 55 Данная методика была применена дл подсчета индексов концентрации производства и рабочей силы по всем отраслям петербургской промышленности за 1909 и 1914 г.г. Предварительно в компьютер были введены данные о числе рабочих и стоимости производства каждого промышленного заведения Петербургской губернии за два года. Результаты, полученные на основе традиционной формулы и модифицированной, построенной без предварительной группировки, показали, что значения индексов, рассчитанных по новой формуле, ниже, однако динамические тенденции повышения и понижения уровней концентрации, а также различи в уровнях концентрации производства и рабочей силы, в частности, превышения первой над второй, сохранены. Я приношу благодарность за помощь в создании аналога формулы Джини-индекса доктору физико-математических наук Института математики им. Cтеклова РАН Б.C. Кашину и кандидату физико-математических наук Института вычислительной математики РАН Г.А. Бочарову. Таблица Индексы концентрации рабочей силы и производства в Петербургской промышленности в 1909 и 1914 гг. Отрасли промышленного производства Выплавка и обработка металлов Обработка минеральных вещ-в Химическая промышленность Обработка питат. и вкусовых вещ-в Обработка животных продуктов Механическая обработка дерева Бумажное и полиграфич. пр-во Текстильная промышленность Смешанные производства старые данные 1909 1914 раб. си- пр-ва раб. си- пр-ва лы лы 0.8418 0.8535 0.8445 0.8832 новые данные 1909 1914 раб. си- пр-ва раб. си- пр-ва лы лы 0.7788 0.7905 0.7836 0.8288 0.6079 0.6236 0.6153 0.6345 0.5316 0.5421 0.5467 0.5725 0.7081 0.7024 0.7204 0.7816 0.6187 0.6104 0.6512 0.6873 0.8001 0.8126 0.8061 0.8118 0.7138 0.7258 0.7419 0.7482 0.7186 0.8282 0.7235 0.8000 0.6702 0.7172 0.6667 0.7163 0.6682 0.6943 0.6049 0.7324 0.5891 0.6206 0.5144 0.6246 0.7175 0.7297 0.7223 0.7661 0.6691 0.6714 0.6914 0.6948 0.7647 0.8080 0.7843 0.8636 0.7005 0.7515 0.7159 0.7732 0.6177 0.6624 0.6774 0.7252 0.4648 0.4715 0.5552 0.5569 56