Сравнительный анализ механизмов распределения ресурсов на

реклама
СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕХАНИЗМОВ РАСПРЕДЕЛЕНИЯ
РЕСУРСОВ НА ОСНОВЕ ЭКСПЕРИМЕНТОВ В ФОРМЕ ДЕЛОВЫХ ИГР
Коргин Н.А., Корепанов В. О.
Федеральное государственное бюджетное учреждение науки
Институт проблем управления им. В. А. Трапезникова Российской академии наук, Москва
Skoltech Center for Energy Systems, Москва
В
докладе
обсуждаются
результаты
сравнительного
анализа
механизмов
распределения ресурсов на основе экспериментов в форме деловых игр. Актуальность
данного исследования определяется тем фактом, что для целого ряда актуальных
социально-экономических задач имеются разные подходы к их решениям, что приводит к
разным правилам принятия решений используемым на практике.
В работе рассматривался частный пример следующей общей постановки задачи
распределения ресурсов. Организационная система состоит из одного центра и
множества N = {1, …, n} агентов. У центра имеются ресурсы в ограниченном количестве
– R
1

, которые могут быть распределены между агентами в любой пропорции.
Полезность каждого агента i  N относительно количества выделяемых ему ресурсов
xi  [0, R] определяется функцией ui () :
1


1
, принадлежащей некоторому множеству
допустимых функций полезности Ui. Множество допустимых распределений ресурса
определяется как
A  {x  ( x1 ,..., xn ) :  xi  R, x 
iN
n

}, множество возможных профилей
полезности агентов как U  {u  (u1 (),..., un ()) : ui () U i , i  N }.
Задача заключается в нахождении такого отображения g () : U  A, которое является
утилитарно эффективным, т.е. максимизирует суммарную полезность всех агентов от
распределенного ресурса для любого из возможных профилей полезности u U :
g (u )  Arg max  ui ( xi ).
x A
iN
Сравнивались следующие механизмы. Механизм последовательного распределения
ресурсов, обеспечивающий эффективное решение данной задачи при отсутствии
трансферабельной полезности и реализующий его как равновесие в доминантных
стратегиях в игре агентов [1,7] – т.н. механизм последовательного распределения
ресурсов. Механизм со сбалансированными платежами, предложенный в [2], на основе
правила Гровса-Лейдярда [6], которые обеспечивает эффективное решение задачи как
равновесие Нэша в игре агентов и его модификация, уменьшающая размерность
пространства действий агентов. Механизм из класса механизмов с пропорциональным
правилом распределения ресурсов [2,8]. В этом механизме эффективное распределение
ресурсов также является равновесием Нэша в игре агентов, но платежи не являются
сбалансированными. Заключительный механизм, участвовавший в сравнении – был
изначально предложен как алгоритм распределенной оптимизации и его разработчики
проиллюстрировали
рассматриваемой
его
теоретическую
постановке
задачи
применимость
распределения
к
задачам,
ресурсов
[4].
подобным
Более
того,
теоретические исследования, проводимые в настоящее время, показали, что концепция
функционирования данного алгоритма, подразумевающая действия агентов с целью
максимизации собственной полезности, очень близка к идеологии равновесия Нэша. Всего
в сравнении участвовало 5 механизмов.
Эксперимент проводился в форме серии деловых игр, по каждому механизму
проводилось две игры – обучающая, в ходе которой игроки знакомились с механизмом и
контрольная, результаты которой шли в зачет эксперимента. В каждой игре все участники
разбивались на группы по три человека. В обучающих играх состав каждой группы был
известен ее участникам и им разрешалось взаимодействие между собой. В контрольных
играх разбиение производилось случайным образом и любые взаимодействия между
участниками эксперимента вне игровой системы (созданной на основе платформы z-Tree
[5]) не допускались. Примерная длительность всего эксперимента составляла 8-10 часов.
Всего было проведено 4 серии экспериментов, в которых сравнивались все 5 механизмов,
с общим числом сравнений – 14. В разных сериях принимало разное количество
участников – 15, 12, 9 и 6. По результатам контрольных игр участники экспериментов
получали денежное вознаграждение пропорционально их выигрышам.
Сравнение механизмов производилось по двум основным направлениям. Во первых,
по критериям эффективности решения задачи – т.е. по суммарной полезности участников
каждой игры от распределенного ресурса и по близости полученного распределения к
эффективному.
Кроме
того,
т.к.
разные
механизмы
подразумевали
разные
дополнительные платежи, механизмы также сравнивались по суммарному выигрышу
участников в игре. Помимо этих, «объективных» критериев, проводилась также
«субъективная» оценка механизмов - всех участников эксперимента просили упорядочить
исследуемые механизмы с точки зрения их применимости для решения поставленной
задачи распределения ресурсов.
Помимо вполне ожидаемого расхождения теоретических оценок объективной
эффективности механизмов и их экспериментальной реализации (все механизмы за
исключением первого в теории должны обеспечивать эффективное распределение
ресурсов при трансферабельной полезности), в ходе эксперимента было показано, что
более эффективные по объективным критериям механизмы не оценивались участниками
эксперимента как «наилучшие» в общем упорядочении всех исследуемых механизмов.
Работа выполнена при частичном финансировании грантами Президента РФ МД6075.2015.9 и РФФИ № 14-07-00875-а.
Литература
1.
2.
3.
4.
5.
6.
7.
8.
БУРКОВ В.Н.,
ДАНЕВ Б.,
ЕНАЛЕЕВ А.К.
Большие
системы:
моделирование
организационных механизмов. – М.: Наука, 1989. – 248 с.
Коргин Н.А., Корепанов В.О. Решение задачи эффективного распределения ресурсов на
основе механизма Гровса-Лейдярда при трансферабельной полезности // Управление
большими системами.- 2013. - №46.- С.216-265.
BASAR T., MAHESWAREN R. Social welfare of selfish agents: Motivating efficiency for divisible
resources // Proc. Control Decision Conf. (CDC). – 2004. – P. 361–395.
BOYD S., PARIKH N., CHU E. Distributed Optimization and Statistical Learning via the
Alternating Direction Method of Multipliers // Foundations and Trends in Machine Learning. – 2011.
– Vol. 3, №1. – P. 1–122.
FISCHBACHER U. z-Tree – Zurich Toolbox for Ready-made Economic Experiments // Experimental
Economics. – 2007. – Vol. 10, №2. – P. 171–178.
GROVES T., LEDYARD J.O. The Existence of Efficient and Incentive Compatible Equilibria with
Public Goods // Econometrica. – 1980. – №6. – P. 1487–1506.
SPRUMONT Y. The division problem with single-peaked preferences: A characterization of the
uniform rule // Econometrica. – 1991. – Vol. 59. – P. 509–519.
YANG S., HAJEK B., Revenue and stability of a mechanism for efficient allocation of a divisible
good. − mimeo. Urbana Champaign: University of Illinois, 2005 − 35 p.
Скачать