Федеральное агентство по образованию Российской Федерации Федеральное государственное образовательное учреждение высшего профессионального образования «ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ» Теория полезности фон Неймана-Моргенштерна и расчет оптимальных портфелей для различных моделей финансовых рынков Учебное пособие Зинченко А.Б. Ростов-на-Дону 2007 г. Оглавление Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1. Теория полезности фон Неймана-Моргенштерна . . . . . . . . . . . . . 6 1.1. Предпочтение и полезность . . . . . . . . . . . . . . . . . . . . . . . . 6 1.2. Функция выбора . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.3. Функция полезности . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2. Теория полезности в кооперативной теории . . . . . . . . . . . . . . . 27 2.1. Основные понятия. Модель торговой сети . . . . . . . . . . . . . . . . . 27 2.2. Сбалансированность . . . . . . . . . . . . . . . . . . . . . . . . . . . .35 2.2.1. Ядро . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 2.2.2. Условия существования ядра . . . . . . . . . . . . . . . . . . . . 42 2.3. Равновесие по Нейману-Моргенштерну . . . . . . . . . . . . . . . . . 49 2.4. Операторы значения . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 2.4.1. Утилитарный подход . . . . . . . . . . . . . . . . . . . . . . . . . 53 2.4.2. Эгалитарный подход . . . . . . . . . . . . . . . . . . . . . . . . . 56 Литература . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 1 Предисловие Теория полезности Неймана-Моргенштерна является аксиоматической теорией рационального поведения людей в процессе производства благ в мире ограниченных ресурсов [1]. Монография Джона фон Неймана и Оскара Моргенштерна Теория игр и экономическое поведение (1944 г., в русском переводе – 1970 г.) положила начало теории принятия решений, которая в настоящее время используется не только в экономике, но и в политологии, социологии, при разработке систем искусственного интеллекта, в математической психологии. Данное пособие содержит изложение классической теория полезности, ее приложение к теории кооперативных игр с трансферабельной полезностью и к расчету оптимальных портфелей для различных моделей финансовых рынков. Цель пособия – подготовить студентов к проведению самостоятельных исследований в области теории принятия решений, а также научить моделированию и анализу реальных экономических ситуаций. Для чтения пособия желательно иметь предварительное знакомство с основами теории вероятностей, линейной алгебры, математического программирования, теории множеств, теории графов. В первой части пособия излагается методологическая база теории рационального поведения, то есть предположения, позволяющие дать удобное количественное выражение для исходного качественного отношения предпочтения. Одним из основных понятий теории предпочтений является бинарное отношение. Описаны бинарные отношения (нестрогого предпочтения, предпочтения, безразличия) на множестве альтернатив (объектов, событий, возможностей), их свойства, способы представления. Используя эти бинарные отношения можно упорядочить множество альтернатив и выбрать альтернативу, наиболее пред2 почтительную с точки зрения лица, принимающего решение. Рассматриваются случайные полезности, математические лотереи. Приводятся аксиомы, гарантирующие существование вещественной функции (функции полезности), согласованной с предпочтениями лица, принимающего решение. Обсуждаются парадоксы теории полезности. С теорией полезности тесно связана теория игр, так как любая экономическая ситуация, любой экономический процесс, как и многие другие явления окружающего нас мира, содержат элементы конфликта. Дж. фон Нейман и О. Моргенштерн рассматривают общественную экономику как игру с фиксированным числом участников (n) [1, с..59]. Пусть экономическая система состоит из продавцов, каждый из которых обладает предпочтениями и располагает некоторым количеством товаров. Имеется возможность заключения контрактов (образование коалиций), улучшающих благосостояние участников экономического процесса. Характеристическая функция соответствующей кооперативной игры определяется через индивидуальные функции полезности и указывает, какой выигрыш члены коалиции могут себе гарантировать, если коалиция будет сформирована. Конфликт интересов состоит в том, что каждый из участников экономической системы стремится сократить свои затраты (усилия, вклад), но максимизировать прибыль (полезность, выгоду). Для выбора оптимального вектора выигрышей x R n или множества таких векторов можно использовать, как и в общей теории полезности, отношения предпочтения, определенные на множестве дележей. Известно, что распределение благ между продавцами, являющееся оптимальным для некоторой системы цен (конкурентное равновесие), содержится в ядре кооперативной игры. Во второй части пособия излагаются основы теории кооперативных игр. Наиболее распространенным средством анализа экономических ситуаций являются кооперативные игры с трансферабельной полезностью, допускающие перераспределение полезности между игроками (побочные платежи). Платежи могут осуществляться в виде денежных выплат (премий, взяток) или как передача материальных ценностей. Поскольку целью таких платежей является воз3 действие на полезность (выигрыш) игрока, то частью описания исходов, на множестве которых определена функция полезности, должно быть количество денег или материальных ценностей, являющихся средством обмена Кооперативная теория не выработала единой концепции справедливого распределения полезности между игроками. Существует много понятий решения игры и все время появляются новые. Такая "множественность" не является недостатком теории, а необходимым свойством игровой модели, т.к. ее представление в форме характеристической функции не учитывает массу факторов (личные качества игроков, симпатии и антипатии, родственные связи, возможность влияния одних игроков на других и т.д.). Участники каждой конкретной игры вначале должны выбрать принцип оптимальности, а затем – оптимальный дележ. Дележ, удовлетворяющий выбранному принципу оптимальности, называется решением игры в смысле этого принципа, а игра, обладающая решением, - разрешимой. Игра, разрешимая относительно некоторого принципа оптимальности, может быть неразрешимой относительно другого принципа. Если решение не единственно, то окончательный выбор осуществляется с помощью дополнительной концепции равновесия или дополнительной информации о каждой конкретной игре. В таблице указано соответствие между разделами пособия и литературными источниками, которые использовались при его написании. Разделы 1.1 1.2 1.3 2.1 2.2 Литература [1]-[5] [1],[5],[6] [1],[3],[7]-[11] [13]-[27] [14]-[17],[28] Разделы 2.3 2.4 3.1 Литература [1], [26], [32] [28]-[26] Текст пособия разделен на части, параграфы и пункты. Формулы (таблицы, рисунки, теоремы и т.д.) нумеруются в пределах каждого пункта (вначале указывается номер раздела, а затем – порядковый номер формулы). 4 Пособие содержит упражнения разной степени сложности, иллюстративные примеры и модели реальных экономических ситуаций. 5 1. Теория полезности Неймана-Моргенштерна 1.1. Полезность и предпочтение Методологическую основу теории полезности (теории рационального поведения), разработанной Дж. фон Нейманом и О. Моргенштерном, составляют следующие предположения. Экономическое сообщество, в условиях которого действуют участники экономики обмена, состоит из предпринимателей и потребителей. Предприниматель стремиться к получению максимальной прибыли, а потребитель – к получению максимума полезности или удовлетворения. В отличие от понятия прибыль, полезность и удовлетворение являются такими понятиями, что их нелегко определить количественно. Полезность может выражаться не в деньгах (или вообще в вещественных числах), а в виде повышения престижа, увеличения возможности влияния и т.д. Для описания поведения предпринимателей и потребителей с единых позиций, Дж. фон Нейман и О. Моргенштерн предположили, что объектом деятельности участников экономики общественного обмена является некоторый неограниченно делимый и свободно перераспределяемый товар (похожий на деньги), тождественный с любым удовлетворением или полезностью. Измерение полезности должно основываться на некотором непосредственном ощущении предпочтения одного объекта или события над другим. Предполагается полнота системы индивидуальных предпочтений, то есть лицо, принимающее решение (ЛПР), может указать, какую из любых двух альтернатив он предпочитает, или сказать, что обе альтернативы для него равнозначны. 6 Предполагается также, что ЛПР может сравнивать не только события, но и комбинации событий с заданными вероятностями. Рассмотрим пример иллюстрирующий разницу между непосредственно деньгами и их полезностью. Пример 1.1.1. [2, стр.7]. Имеются два способа вклада капитала (две альтернативы) и два вкладчика А и В. Можно вложить 20 000 долл. и с равными вероятностями либо получить валовый доход в 100 000 долл., либо нулевой доход. Ожидаемый чистый доход в этом случае составляет 100000/2-20000=30 000 (долл.). Можно вложить 5 000 долл. и получить 23 000 долл. с вероятностью 1/2 или ничего не получить (таблица 1.1.1). Таблица 1.1.1 № Вклад (долл.) 1 20 000 2 5 000 Валовый доход (долл.) 100 000 или 0 (с равными вероятностями) 23 000 или 0 (с равными вероятностями) Ожидаемый чистый доход (долл.) 30 000 6 500 Потеря суммы в 20 000 долл., может привести предпринимателя А к банкротству. Следовательно, вкладчик А (если предположить, что он действует разумно) выберет вторую альтернативу, хотя ожидаемая в этом случае чистая прибыль в 6 000 долл. намного меньше, чем 30 000 долл., ожидаемые при выборе первой альтернативы. Напротив, предприниматель В, располагающий бездействующим капиталом, значительно превышающим 20 000 долл., может охотно пойти на риск. Этот пример показывает значение отношения лица принимающего решение к ценности или полезности денег (полезность не всегда пропорциональна количеству денег). Одним из основных понятий теории предпочтений является бинарное отношение. 7 Пусть A={ a1 ,… a n } – непустое м н о ж е с т в о а л ь т е р н а т и в (объектов, событий, возможностей, способов поведения). Б и н а р н ы м о т н о ш е н и е м P на множестве A называется подмножество PAA, где AA множество упорядоченных пар ( ai , a j ), ai , a j A. Запись ai P a j означает, что для ( ai , a j ) отношение P выполняется (истинно). Запись ( ai P a j ) означает, что для ( ai , a j ) отношение P не выполняется (ложно). Бинарные отношения могут иметь следующие свойства [3,4]. Р е ф л е к с и в н о с т ь : ai P ai для каждого ai A. А н т и р е ф л е к с и в н о с т ь : ( ai P ai ) для каждого ai A. С и м м е т р и ч н о с т ь : из ai P a j следует a j P ai . А с и м м е т р и ч н о с т ь : существуют такие ai , a j A, что ai P a j и ( a j P ai ), то есть бинарное отношение асимметрично, если оно не является симметричным. А н т и с и м м е т р и ч н о с т ь в ш и р о к о м с м ы с л е : из ai P a j и a j P ai следует ai = a j . А н т и с и м м е т р и ч н о с т ь в с т р о г о м с м ы с л е : из ai P a j следует ( a j P ai ). Т р а н з и т и в н о с т ь : из ai P a j и a j P ak следует ai P ak . О т р и ц а т е л ь н а я т р а н з и т и в н о с т ь : из ( ai P a j ) и ( a j P ak ) следует ( ai P ak ). С в я з н о с т ь (полнота): ai P a j или a j P ai для всех ai , a j A С л а б а я с в я з н о с т ь : из ai a j следует ai P a j или a j P ai . Заметим, что рефлексивность и антирефлексивность являются противоречивыми свойствами, то есть они не могут выполняться одновременно. Если 8 P, то симметричность и антисимметричность в строгом смысле также являются противоречивыми свойствами. Антисимметричность в строгом смысле и отрицательная транзитивность означают транзитивность. Из связности следует слабая связность. Транзитивное, рефлексивное и симметричное бинарное отношение называется о т н о ш е н и е м э к в и в а л е н т н о с т и . Отношение эквивалентности можно использовать для разбиения множества альтернатив на классы эквивалентности (классы безразличия) Пример 1.1.2. Пусть A – множество товаров. Бинарное отношение ai P a j ai дороже, чем a j является антирефлексивным, антисимметричным в строгом смысле, транзитивным и отрицательно транзитивным. Пример 1.1.3. Пусть A – множество однотипных товаров, отличающихся ценой, окраской, объемом, качеством и т.д. Бинарное отношение ai P a j цена ai равна цене a j есть отношение эквивалентности, оно разбивает множество A на подмножества товаров одинаковой цены. Бинарное отношение P можно задать в виде квадратной матрицы M(P) порядка n (м а т р и ц а о т н о ш е н и я P ), элементы которой mij определены следующим образом mij =1 ai P a j , mij =0 ( ai P a j ). Наиболее наглядным способом представления бинарного отношения на множестве альтернатив A является ориентированный граф G(P) (г р а ф о т н о ш е н и я P), вершины которого соответствуют альтернативам, а дуги – упорядоченным парам альтернатив ( ai , a j )P. Матрица M(P) бинарного отно- 9 шения P есть матрица смежности орграфа G(P). Свойства бинарного отношения отражаются на структуре соответствующего графа [5]: - в графе рефлексивного отношения при каждой вершине имеется петля; - в графе симметричного отношения между любыми смежными вершинами имеются две противоположно ориентированные дуги; - в графе транзитивного отношения каждый путь ( ai1 , ai2 ,…, aik ) замкнут дугой ( ai1 , aik ); - в графе антисимметричного в строгом смысле отношения нет петель, и каждая пара смежных вершин соединена одной дугой; - дополнительный к G(P) граф есть граф бинарного отношения (AA)\P. Пример 1.1.4. Рассмотрим множество A={ x1 , x 2 , x 3 , x 4 }, элементами которого являются точки x1 =(2,0), x 2 =(1,1), x 3 =(0,2), x 4 =(0,0) плоскости, и бинарное отношение xi P x j d i d j , (1.1.1) где d i = ( x1i ) 2 + ( x2i ) 2 - квадрат расстояния от точки x i до начала координат (рис.1.1.1), т.е. d 1 =4, d 2 =2, d 3 =4, d 4 =0. Получаем P={( x1 , x1 ),( x 2 , x 2 ), ( x 3 , x 3 ),( x 4 , x 4 ),( x1 , x 2 ),( x1 , x 3 ),( x 3 , x1 ),( x1 , x 4 ),( x 2 , x 4 ),( x 3 , x 2 ),( x 3 , x 4 )}. Матрица этого отношения приведена на рис 1.1.3.(a). Используя граф G(P) (рис.1.1.2), нетрудно проверить, что бинарное отношение (1.1.1) является рефлексивным, асимметричным, транзитивным и связным. 10 x1 2 x5 x3 2 4 3 x2 1 x1 -1 1 x4 1 x2 2 Рис. 1.1.1. Графическая иллюстрация множества альтернатив (примеры 1.1.4, 1.2.1) 1 0 1 0 1 1 1 0 1 0 1 0 Рис. 1.1.2. Граф бинарного отношения (пример 1.1.4). 0 0 0 0 0 1 1 1 1 (a) 1 0 1 1 0 0 1 0 1 0 1 1 0 0 0 0 0 0 1 0 (b) Рис. 1.1.3. Матрицы бинарных отношений (примеры 1.1.4, 1.2.1) Для описания процесса сравнения альтернатив лицом, принимающим решение, используются три типа бинарных отношений предпочтения. 1. R – отношение нестрогого предпочтения: ai R a j или ai a j тогда и только тогда, когда для ЛПР альтернатива ai не менее предпочтительна, чем альтернатива a j . 2. P – отношение (строгого) предпочтения : ai P a j или ai > a j тогда и только тогда, когда для ЛПР альтернатива ai более предпочтительна (лучше), чем альтернатива a j . 11 3. I – о т н о ш е н и е б е з р а з л и ч и я (неразличимости, индифферентности): ai I a j или ai a j тогда и только тогда, когда для ЛПР обе альтернативы одинаково предпочтительны. Отношения предпочтения могут отражать физические ощущения или степень соответствия альтернатив целям лица, принимающего решение. Если ЛПР предпочитает альтернативу ai альтернативе a j , то для него полезность ai больше (или не меньше) полезности a j . Бинарные отношения R , P и I связаны следующими соотношениями ai P a j ai R a j и ( a j R ai ), (1.1.2) ai I a j ai R a j и a j R ai , (1.1.3) ( a j P ai ), (1.1.4) ai I a j ( ai P a j ) и ai R a j или ai I a j . ai P a j (1.1.5) Матрицы отношений предпочтения имеют вид: ai aj ai aj 1 1 0 1 ai aj ai R a j ai aj 0 1 0 0 ai aj ai P a j ai aj 1 1 1 1 ai I a j В качестве основного (базового) бинарного отношения в теории полезности используется либо отношение нестрогого предпочтения R либо отношение (строгого) предпочтения P. Выбор основного отношения зависит от личного вкуса исследователя. Если в качестве основного бинарного отношения выбрано R, то отношения P и I определяются соотношениями (1.1.2), (1.1.3). Если основным отношением является P, то R и I определяются (1.1.4), (1.1.5). Упражнения. 12 1.1.1. Пусть A={ a1 ,… a5 } – множество альтернатив. Записать матрицы M(P1), M(P 2), M(P 3) бинарных отношений P 1={( a1 , a1 ), ( a1 , a 2 ), ( a1 , a3 ), ( a3 , a5 ), ( a 4 , a 2 ), ( a5 , a1 ),}, P 2={( a1 , a 2 ), ( a 2 , a3 ), ( a3 , a 4 ), ( a 4 , a 2 ), ( a 4 , a3 ), ( a5 , a 2 )}, P 3={( a1 , a 4 ), ( a1 , a5 ), ( a 2 , a3 ), ( a 2 , a 4 ), ( a 4 , a5 )}. 1.1.2. Построить графы G (P 1), G (P 2) и G (P 3). 1.1.3. Для каждого из отношений P 1, P 2 и P 3 определить, является ли оно: рефлексивным, антирефлексивным, симметричным, асимметричным, антисимметричным в широком смысле, антисимметричным в строгом смысле, транзитивным, отрицательно транзитивным. 1.2. Функция выбора Для выбора наилучшей относительно предпочтений ЛПР альтернативы из множества A, это множество нужно упорядочить [6]. Транзитивное, рефлексивное и антисимметричное в широком смысле бинарное отношение называется отношением п о р я д к а . Транзитивное и антисимметричное в строгом смысле бинарное отношение называется отношением с т р о г о г о п о р я д к а . Каждому отношению P строгого порядка на множестве A={ a1 ,… a n } соответствует одно и только одно отношение порядка n P ( ( ai , ai ) . Бинарное отношение порядка, обладающее свойством i 1 ai P a j либо a j P ai для всех ai , a j A, называется отношением с о в е р ш е н н о г о п о р я д к а 13 Если ( ai , a j )P и P есть отношение порядка, то говорят, что альтернативы ai и a j с р а в н и м ы . Множество A, на котором задано бинарное отношение порядка P называется у п о р я д о ч е н н ы м . Упорядоченное множество, в котором не все элементы сравнимы, называется ч а с т и ч н о у п о р я д о ч е н н ы м . Элемент ai упорядоченного множества A называется м а к с и м а л ь н ы м , если нет такого элемента a j A, a j ai что a j P ai . Элемент ai упорядоченного множества A называется н а и б о л ь ш и м , если ai P a j для всех a j A, a j ai . Заметим, что наибольший элемент, если он существует, является единственным. Аналогично определяются минимальный и наименьший элементы упорядоченного множества, а также аналогичные понятия для отношения строгого порядка. Если граф бинарного отношения P не содержит контуров, то множество его вершин можно разбить на подмножества ( у р о в н и ) и пронумеровать уровни так, что если вершина принадлежит уровню k, то следующая за ней вершина принадлежит уровню с номером большим k. Другими словами, отношение P упорядочивает подмножества альтернатив из A. Пример 1.2.1. Рассмотрим множество A={ x1 ,…, x 5 }, состоящее из точек x1 =(2,0), x 2 =(1,1), x 3 =(0,2), x 4 =(0,0), x 5 =(-1,1) плоскости и бинарное отношение xi P x j d i > d j , (1.2.1) где d i = ( x1i ) 2 + ( x2i ) 2 - квадрат расстояния от точки x i до начала координат (рис.1.1.1.), т.е. d 1 =4, d 2 =2, d 3 =4,, d 4 =0, d 5 =2. Получаем P={( x1 , x 2 ), ( x1 , x 4 ),( x1 , x 5 ),( x 3 , x 2 ),( x 2 , x 4 ),( x 3 , x 4 ),( x 3 , x 5 ),( x 5 , x 4 )}. Матрица этого отношения и его граф приведены на рис 1.1.3 (b), 1.2.1. На рис.1.2.2. представлено разбиение множества вершин графа отношения (1.2.1) на три уровня. Каждый 14 уровень содержит вершины, соответствующие точкам, имеющим одинаковое расстояние до начала координат. Уровни упорядочены по убыванию величины d i . Отношение (1.2.1) является строгим порядком. Элементы x1 и x 3 являются максимальными относительно P, элемент x 4 - минимальным, а также и наименьшим. Множество A не имеет наибольшего элемента, а отношение (1.2.1) не является совершенным порядком. При любом способе упорядочения множества A необходима транзитивность отношения предпочтения PAA. Несмотря на очевидную разумность предположения о транзитивности, имеются многочисленные примеры нетранзитивных предпочтений. Нетранзитивность обычно возникает в случаях, когда альтернативы включают несколько характерных признаков или критериев. 1 1 2 2 4 5 5 3 3 4 (1) Рис. 1.2.1. Граф бинарного отношения (пример 1.2.1). (2) (3) Рис.1.2.2. Разбиение вершин графа на уровни (пример 1.2.1). Пример 1.2.2 [3, с.455]. Молодому ученому предлагается выбрать одну из трех альтернатив a1 , a 2 или a3 , где a1 - должность ассистента в очень известном университете с окладам 15 тыс. долл.; a 2 - должность доцента в менее известном университете с окладом 18 тыс. долл.; a3 - должность профессора в колледже с окладом 21 тыс. долл. 15 Для молодого ученого альтернатива a1 предпочтительней, чем a 2 , так как, по его мнению, ради очень престижного места работы можно согласиться с меньшим окладом. Он предпочитает a 2 альтернативе a3 , так как работа в университете престижней, чем в колледже, а разность в окладах небольшая. Но при сравнении a1 с a3 должность профессора и большой оклад перевешивают престижность, поэтому альтернатива a3 для ученого предпочтительней, чем a1 . В данной ситуации предпочтения образуют цикл a1 P a 2 , a 2 P a3 , a3 P a1 Следующий пример показывает, что и отношение безразличия тоже может быть не транзитивным. Пример 1.2.3 [3, с.456]. Множество альтернатив A={ a1 ,… a n } состоит из чашек кофе, причем альтернатива ai означает чашку кофе с i кусочками сахара. Если предположить, что кусочки малы, то для лица, принимающего решение, альтернатива ai будет иметь ту же ценность (полезность), что и ai 1 . Однако, трудно представить безразличное отношение к чашкам кофе, в одной из которых 2 кусочка сахара, а в другой, например, – 50 кусочков. Теория выбора, которая может учесть и разрешить циклические предпочтения, должна быть богаче и глубже, чем рассматриваемая в данном пособии теория полезности. Для того чтобы отношения предпочтения упорядочивали множество альтернатив, они должны иметь некоторые свойства, сформулированные в [1] как аксиомы, являющиеся формализацией интуитивного представления о рациональном поведении индивидуума (а к с и о м ы п о л е з н о с т и или а к с и о м ы р а ц и о н а л ь н о г о п о в е д е н и я ). А к с и о м а 1 (трихотомический закон Неймана-Моргенштерна). Для любых двух альтернатив ai , a j A должно выполняться одно и только одно из отношений ai P a j , ai P a j или ai I a j . А к с и о м а 2 (рефлексивность отношения безразличия). 16 Для всех ai A должно выполняться ai I ai . А к с и о м а 3 (симметричность отношения безразличия). Если ai I a j , то a j I ai . А к с и о м а 4 (транзитивность отношения безразличия). Если ai I a j и a j I ak , то ai I ak . А к с и о м а 5 (транзитивность отношения предпочтения). Если ai P a j и a j P ak , то ai P ak . А к с и о м а 6 (транзитивность P относительно I). Если ai P a j и a j I ak , то ai P ak . Если ai I a j и a j P ak , то ai P ak . Аксиомы 2-4 означают, что отношение безразличия I является отношением эквивалентности. Классы эквивалентности совпадают с подмножествами альтернатив, имеющих одинаковую полезность (к л а с с ы б е з р а з л и ч и я , к о н т у р ы р а в н о й п о л е з н о с т и ). Все аксиомы вместе задают строгое упорядочение альтернатив от наиболее предпочтительных до наименее предпочтительных. Функция C(A ,P)={ ai A a j A: ( a j P ai )}, выделяющая из A подмножество максимальных относительно бинарного отношения P альтернатив, называется ф у н к ц и е й в ы б о р а . Аналогично определяется функция выбора для нестрогого отношения предпочтения R C(A , R)={ ai A a j A, a j ai : ( a j R ai )}. Упражнения 1.2.1. Пусть A={ a1 ,… a 4 }. Построить графы бинарных отношений P1={( a1 , a1 ), ( a 2 , a 2 ), ( a3 , a3 ), ( a 4 , a 4 ), ( a 2 , a 4 ), ( a 4 , a 2 ), ( a1 , a3 ), ( a3 , a1 )}, P2={( a1 , a1 ), ( a 2 , a 2 ), ( a3 , a3 ), ( a 4 , a 4 ), ( a1 , a 2 ), ( a1 , a3 ), ( a1 , a 4 ), ( a 2 , a 4 )}, 17 P3=={( a1 , a 2 ), ( a1 , a3 ), ( a1 , a 4 ), ( a 2 , a 4 )}. Является ли P1, P2 и P3 отношениями: - порядка, - нестрогого порядка, - эквивалентности, - совершенного порядка? 1.2.2. Записать бинарное отношение PAA, A={ a1 ,… a5 }, соответствующее ациклическому графу, приведенному на рис.1.2.3. Разбить вершины графа на уровни, как в примере 1.2.1. Определить множества максимальных и минимальных элементов A. Существует ли в A наибольший элемент? Существует ли в A наименьший элемент? 1.2.3. Пусть A={ a1 ,… a5 }. Проверить, что отношение предпочтения P={( a 2 , a1 ),( a 2 , a3 ),( a 2 , a5 ),( a 4 , a1 ),( a 4 , a3 ),( a 4 , a5 ),( a5 , a1 ),( a5 , a3 )} и отношение безразличия I={( a1 , a1 ),( a 2 , a 2 ),( a3 , a3 ),( a 4 , a 4 ), ( a5 , a5 ),( a1 , a3 ),( a3 , a1 ),( a 4 , a 2 ),( a 2 , a 4 } удовлетворяют аксиомам 1- 6. Построить графы отношений P и I. Определить классы эквивалентных относительно I альтернатив. Записать функцию выбора C(A ,P). Является отношение P совершенным порядком? 1 2 3 6 4 5 Рис. 1.2.3. Граф бинарного отношения (упражнение 1.2.2) 18 1.3. Функция полезности Бинарные отношения и функция выбора не всегда удобны для моделирования экономических систем и анализа этих моделей. Гораздо чаще используется функция, которая в числовой форме выражает предпочтения лица, принимающего решение. В микроэкономике это понятие используется для объяснения поведения предпринимателей и потребителей, в макроэкономике предпочтения рассматриваются с точки зрения государственных интересов. Вещественная функция u, определенная на множестве A и удовлетворяющая условиям u ( ai ) > u ( a j ), тогда и только тогда, когда ai P a j , (1.3.1) для любых ai , a j A , называется п о р я д к о в о й ф у н к ц и е й п о л е з н о с т и для отношения P на A. Если для отношение предпочтения P определена функция полезности u, то u( ai )=u( a j ), тогда и только тогда, когда ai I a j . Отсюда следует, что классами безразличия в A будут подмножества альтернатив c одинаковыми значениями функции u. Пример 1.3.1 [3, с. 459]. Пусть A={ a1 , a 2 , a3 } и a1 P a 2 , a 2 P a3 , a1 P a3 . Положим u( a1 )=1000, u( a 2 )=999, u( a3 )=0, v( a1 )=1000, v( a 2 )=1, v( a3 )=0. Функции u и v являются порядковыми функциями полезности для отношения P на A, несмотря на то, что в первом случае полезность альтернативы a 2 равна 999, а во втором – только 1. Каким же условиям должно удовлетворять отношение предпочтения P, чтобы вместо него можно было рассматривать функцию полезности? Этот вопрос до сих пор является предметом дискуссий. Дело в том, что дополнитель19 ные требования к отношению предпочтения вводятся аксиоматически и обоснованность той или иной системы аксиом не является бесспорной. Если множество A состоит из детерминированных исходов, то для существования функции полезности достаточно выполнения аксиом 1- 6. Однако, эксперт (инвестор, ЛПР), поставленный перед проблемой выбора, не всегда с полной определенностью знает последствия этого выбора. Например, полезность покупки может оказаться меньше (или больше) ожидаемой из-за изменений условий ее использования. Кроме того, результаты некоторых действий всегда имеют случайный характер (ситуации с элементами риска). Рисковые ситуации часто возникают в банковской сфере, на финансовых рынках, в инновационной и предпринимательской деятельности промышленных предприятий и т.д. Дж. фон Нейман и О.Моргенштерн предположили, что потребитель в случайных ситуациях ведет себя рационально, то есть из многочисленных альтернатив он выбирает ту, которая дает наибольшую ожидаемую полезность. Вероятности возможных исходов должны быть известны. П р о с т о й л о т е р е е й (или л о т е р е е й ) L=(p,x;(1- p),y) называется случайное событие с двумя возможными исходами x и y, вероятности которых равны p и (1-p), 0≤ p≤1. На рис.1.3.1.(a) дана графическая иллюстрация случайного события z, являющегося лотереей L=(p,x;(1- p),y). Аналогично определяется лотерея с тремя и большим числом возможных исходов. Теория полезности предполагает, что для каждой пары лотерей лицо, принимающее решение, может определить, какая лотерея для него предпочтительней (лучше). Отношения предпочтения на множестве лотерей аналогичны бинарным отношениям R, P и I на множестве альтернатив A. Детерминированное событие можно рассматривать как частный случай лотереи. 20 x p z L 1-p y Рис.1.3.1. Лотерея с двумя исходами Для измерения ожидаемой полезности уже не достаточно выбирать шкалы, согласованные друг с другом только в отношении порядка. Пример 1.3.2. Пусть A={ a1 , a 2 , a3 } и a1 P a 2 , a 2 P a3 , a1 P a3 . Рассмотрим две порядковые функции полезности для отношения P на A u( a1 )=20, u( a 2 )=12, u( a3 )=10, v( a1 )=200, v( a 2 )=180, v( a3 )=100. 1 1 2 2 Сравним теперь промежуточную альтернативу a 2 с лотерей L=( , a1 ; , a3 ), состоящей в случайном выборе между наилучшей альтернативой a1 и наихудшей альтернативой a3 . Получаем: u(L)= 1 2 1 1 2 2 u( a1 )+ u( a3 )=15>u( a 2 ), v(L)= 1 v( a1 )+ v( a3 )=150< v ( a 2 ). 2 Таким образом, при использовании функции u, ожидаемая полезность лотереи L больше, чем полезность альтернативы a 2 , а при использовании функции v наоборот. Для моделирования рисковых ситуаций используется функция, удовлетворяющая более жестким требованиям, чем порядковая функция полезности. Вещественная функция u, определенная на множестве A, удовлетворяющая (1.3.1) и условию 21 u(p, ai ;(1- p), a j ) = p u( ai ) + (1- p) u( a j ), (1.3.2) для любых ai , a j A и p[0,1], называется л и н е й н о й ф у н к ц и е й п о л е з н о с т и (ф у н к ц и е й п о л е з н о с т и Н е й м а н а - М о р г е н ш т е р н а ) для отношения P на A. Для существования линейной функции полезности нужны дополнительные предположения. Аксиома 7. Из ai P a j и 0<p<1 следует ai P(p, ai ;(1-p), a j ). Если альтернатива ai предпочтительней, чем a j , то ai должна быть предпочтительней, чем лотерея, в которой ai достижима с вероятностью p. А к с и о м а 8 (независимость). Из ai P a j и 0<p<1 следует (p, ai ;(1-p), ak ) P (p, a j ;(1-p), ak ), для любого ak A. А к с и о м а 9 (правила комбинирования). ( p, ai ; (1 p), a j ) I ((1 p), a j ; p, ai ) ( p, ( g , ai ; (1 g ), a j ); (1 p), a j ) I ( pg , ai ; (1 pg ), a j ) . Лотереи, отличающиеся процедурой их осуществления, эквивалентны, если конечные результаты и вероятности этих результатов равны (на рис.1.3.2 дана графическая иллюстрация эквивалентных лотерей). А к с и о м а 1 0 (непрерывность). Из ai P a j , a j P ak , ai P ak следует существование такого p(0,1), что (p, ai ;(1- p), ak ) P a j . Можно выбрать такую вероятность p, что лотерея, состоящая в случайном выборе между наилучшей альтернативой ai и наихудшей альтернативой ak будет предпочтительней, чем промежуточная альтернатива a j . 22 0,4 x 2 L 0,5 1 L 1 L 0,6 0,5 y 0,8 0,2 x y y Рис.1.3.2. Эквивалентные лотереи. Теорема 1.3.1. Если выполняются аксиомы 1-10, то существует линейная функция полезности для отношения P на A . Доказательство громоздко, его можно найти в [1],[7]. В соответствие с аксиомами 1-10, лицо, принимающее решение, должно всегда выбрать альтернативу с максимальной ожидаемой полезностью (г и п о т е з а о ж и д а е м о й п о л е з н о с т и ). Областью значений линейной функции полезности является выпуклое подмножество вещественной оси, то есть интервал. Эта функция определена с точностью до линейного преобразования. Для преобразования старых полезностей u( ai ) в новые полезности v( ai ) достаточно выбрать положительное вещественное число , а также произвольное вещественное число и положить v( ai )= u( ai ) + , ai A. Не единственность функции u связана с отсутствием определения нулевой полезности, единицы полезности и шкалы измерения полезностей. Это свойство функции полезности не имеет принципиального значения: различие между двумя функциями определяется различием в положении нуля и единицы на шкале измерения, подобно различию между температурными шкалами Цельсия и Фаренгейта. 23 Вскоре после появления теории Неймана-Моргенштерна были получены экспериментальные данные о том, что предпочтения человека не всегда соответствуют нормам рационального поведения, т. е. опровергают аксиомы теории полезности, а следовательно и существование линейной функции полезности. Пример 1.3.3. 1. Пусть для ЛПР получение подарка стоимостью 2 тыс. долл. (альтернатива a1 ) предпочтительней, чем получение подарка стоимостью 1 тыс. долл. (альтернатива a 2 ) и обе альтернативы предпочтительней, чем потеря всего капитала, равного 1000 тыс. долл. (альтернатива a3 ). Из аксиомы 10 следует, что ЛПР должен предпочесть лотерею, в которой с ненулевой вероятностью возможна потеря всего капитала, гарантированному исходу, при котором он сохраняет капитал и получает подарок стоимостью 1 тыс. долл.. Теоретически это может вызвать сомнение, но практически, кто из людей не рисковал жизнью перебегая дорогу перед близко идущим транспортом из-за несопоставимо малого выигрыша во времени? 2. Предположим теперь, что ЛПР сравнивает лотереи L1 = (p, a1 ;(1- p), a3 ) и L2 = (p, a 2 ;(1- p), a3 ), где p – очень мало (близко к нулю). В каждой из лотерей вероятность потери всего капитала (1000 тыс. долл.) близка к 1, а вероятность получения подарка практически равна 0. Для ЛПР обе лотереи, скорее всего, будут равнозначны, что противоречит аксиоме 8. Многочисленные экспериментальные данные свидетельствуют о неустойчивости системы индивидуальных предпочтений. Когда студентам были предложены четыре лотереи, позволяющие полностью воплощать типовую стратегию максимизации ожидаемой полезности, или стратегию минимизации риска, 5% испытуемых выбрало первый вариант, 45% - второй, 50% участников колебались от одной лотереи к другой [9]. Таблица 1.3.1. 24 Лотерея (I) Красный (1/100) Белый (89/100) Голубой (10/100) Билет A 1 млн. долл. 1 млн. долл. 1 млн. долл. Билет B 0 долл. 1 млн. долл. 5 млн. долл. Лотерея (II) Красный (1/100) Белый (89/100) Голубой (10/100) Билет C 1 млн. долл. 0 долл. 1 млн. долл. Билет D 0 долл. 0 долл. 5 млн. долл. Пример 1.3.4 (П а р а д о к с А л л е [10]). Имеется урна, содержащая 1 шар красного цвета, 89 белых шаров и 10 голубых шаров. Игроки, таким образом, точно знают о вероятностях тиража. Предлагаем игрокам принять участие в двух последовательных лотереях (I и II), и в каждой лотерее они должны выбрать между двумя различными билетами. В таблице 1.3.1 указаны выигрыши лотерей в зависимости от цвета шара и типа билета. При проведении эксперимента, большинство игроков предпочитает билет A в первой лотерее и билет D во второй. Анализ проблемы, установленной этими двумя лотереями, показывает две возможные стратегии. Либо мы пытаемся максимизировать потенциальные доходы (гипотеза ожидаемой полезности), чему соответствуют билеты B и D, либо пытаемся минимизировать риск, чему соответствуют билеты A и C. В действительности игроки меняют стратегию во время лотерей, доказывая, что их предпочтения при выборе между прибылью и риском неустойчивы. Чтобы избежать парадоксов теории, в некоторых современных моделях рисковых ситуаций рассматриваются упрощенные функции полезности. Например, для описания поведения инвесторов используются нелинейные функции (степенные или экспоненциальные). Пусть f(d) – функция, аргументом которой является получаемый доход. Конкретный вид функции выбирается 25 в зависимости от отношения инвестора к риску, связанному с получением дохода d. При несклонности инвестора к риску функция полезности может иметь вид: f(d) = a bd cd 2 ; f(d) =1 e a ( d b) ; f(d) = ad b , 0 < < 1, d b / a . При стремлении инвестора к риску можно использовать функцию f(d)= 1 e a ( d b) , d b . Методики нахождения функций полезности, моделирующих поведение конкретных инвесторов (экспертов, ЛПР), можно найти в [11]. В настоящее время теория ожидаемой полезности является активно развивающейся отраслью экономической науки и, несмотря на парадоксы, используется во многих математических моделях выбора решений в условиях риска. Упражнения. 1.3.1. Пусть A={ a1 ,… a5 }, P={( a1 , a 2 ), ( a1 , a 4 ),( a1 , a5 ),( a3 , a 2 ),( a 2 , a 4 ), ( a3 , a 4 ),( a3 , a5 ), ( a5 , a 4 )}. Какие из функций, приведенных в таблице 1.3.2. являются порядковыми функциями полезности для отношения P на A? Таблица 1.3.2. 1.3.2. a1 a2 a3 a4 a5 u 0 -1 0 -4 -1 v 100 50 100 -100 50 w 10 5 8 2 5 Определить порядковую функцию полезности для отношения P={( a 2 , a1 ),( a 2 , a3 ), ( a 2 , a5 ),( a 4 , a1 ),( a 4 , a3 ),( a 4 , a5 ), ( a5 , a1 ),( a5 , a3 )} на A={ a1 ,… a5 }. 1.3.3. Пусть потребитель определил, что набор товаров A предпочтительнее набора B, а набор B предпочтительнее набора C. Являются ли следующие функции 26 v(A )=100, v(B )=99, v(C)=7 u(A)=3, u(B )=2, u(C)=1, порядковыми функциями полезности, моделирующими предпочтения потребителя? 27 2. Теория полезности в кооперативной теории 2.1. Основные понятия. Модель торговой сети Кооперативные игры были введены для моделирования экономических ситуаций, интересы участников которых хотя и не совпадают, но и не являются противоположными. Например, при установлении цены на товар покупатель и продавец энергично торгуются, несмотря на то, что сделка выгодна обоим. При строительстве объекта общего пользования, несмотря на то, что кооперация выгодна всем, каждый из участников соглашения стремится сократить свою долю затрат. В литературе описаны примеры успешного применения кооперативных игр для анализа экономики обмена, экономики производства, экономики общественных продуктов, проблем ценообразования [14]-[19]. Кооперативная теория интенсивно развивается: предлагаются новые принципы оптимальности, модифицируются стандартные концепции решения, развивается аксиоматическое направление, пересматривается понятие характеристической функции и коалиции, вводятся новые классы игр (игры с неделимыми выигрышами, многокритериальные игры, расплывчатые игры и т.д.) [20]-[25]. Кооперативные игры относятся к классу непозиционных (нестратегических) игр. Они могут быть заданы в стандартной (нормальной) форме и в новой форме, не свойственной антагонистическим играм. Действия игроков заключаются в образовании коалиций для получения максимального выигрыша. В классических кооперативных играх предполагается, что полезности игроков обладают свойством трансферабельности, т. е. измеримы по одной шкале и могут передаваться от одного игрока к другому без потерь и ограничений. 28 Кооперативной игрой с трансферабельной полезностью называется пара G=(N,), где N={1,…,n} – конечное множество, называемое м н о ж е с т в о м и г р о к о в (агентов), : 2NR - функция, ставящая в соответствие каждому непустому подмножеству множества N вещественное число, ()=0. Функция называется х а р а к т е р и с т и ч е с к о й . Игра обычно отождествляется с ее характеристической функцией. Модель кооперативной игры предельно проста. Она используется для формализации ситуаций, в которых детальное описание действий игроков либо не представляет интереса, либо настолько сложно, что трудно ожидать математических результатов. Непустое подмножество S множества N называется к о а л и ц и е й . Значение (S) интерпретируется как максимальная полезность (выигрыш, доход), которую коалиция S может получить независимо от поведения других игроков. Выигрыш любой коалиции S можно произвольно распределять между игроками. И с х о д о м и г р ы называется вектор x =( x1 ,…, xn ), где xi интерпретируется как п л а т е ж игроку i. Ц е л ь и г р ы – определить, какие коалиции образуются и как будут разделены между игроками выигрыши этих коалиций. Если все игроки объединяются в максимальную коалицию N, то исход x должен удовлетворять у с л о в и ю э ф ф е к т и в н о с т и xi = (N), (2.1.1) iN Исход x , удовлетворяющий (2.1.1) и условиям xi (i), iN, (2.1.2) называется д е л е ж о м . Условие (2.1.2) называют и н д и в и д у а л ь н о й р а ц и о н а л ь н о с т ь ю - игрок не присоединится к максимальной коалиции, если его выигрыш будет меньше полезности, которую он может гарантировать себе сам. Дележ можно содержательно понимать как договор между игроками о распределении общей полезности (N). Множество всех дележей игры G=(N,) обозначается через D(). В некоторых случаях условие (2.1.1) может оказаться слишком сильным, так как игроки не всегда достигают консенсуса (согласия), 29 но большинство существующих концепций решения исключает все исходы x , не удовлетворяющие (2.1.1). Пример 2.1.1. ("И г р а т р е х ф е р м е р о в " [20] ). Игроки 1, 2 и 3 имеют фермы, каждая из которых при орошении приносит прибыль, равную 18 денежным единицам. Первая ферма наиболее близка к источнику воды, третья – наиболее удалена, то есть вода должна пройти через первую и вторую ферму прежде чем она достигнет земли третьего фермера. Затраты, связанные с пропусканием воды через одно владение, равны 6 денежным единицам. Возникает кооперативная трех лиц, в которой нужно определить, объединятся ли фермеры и как они будут делить прибыль: (1)=18-6=12, (2)=18-12=6, (3)=18-18=0, (1,2)=36-12=24, (1,3)=36-18=18, (2,3)=36-18=18, (1,2,3)=54-18=36. Дополнительная прибыль от кооперации равна (1,2,3)-(1)-(2)-(3)=12. Рас- x =(16,10,4), для копределив ее равномерно между игроками, получаем дележ ~ торого ~ xi >(i), iN={1,2,3}, ~x + ~ 1 x2 =26>(1,2)=24, ~x + ~ 1 x3 =20>(1,3)=18, ~ x3 =20>(2,3)=18. Каждая коалиция получает больше ее собственных возx2 + ~ x может быть одобрен всеми игроками. можностей, следовательно дележ ~ Игра, удовлетворяющая условию ( S1 ) + ( S 2 ) ( S1 S 2 ) , S1 S 2 =, S1 , S 2 N, (2.1.3) называется с у п е р а д д и т и в н о й . Супераддитивность означает, что две непересекающиеся коалиции S1 и S 2 после объединения получают не меньший доход, чем действуя самостоятельно. Большинство игр, возникающих в экономике, - супераддитивны. В таких играх максимальную полезность получает коалиция всех игроков. Задача заключается в таком распределении (N) между участниками игры, чтобы ни одна из промежуточных коалиций S N не смогла или не захотела противостоять всеобщей кооперации. Рассмотрим две игры G1 = (N, 1 ), G 2 = (N, 2 ) с одинаковым количеством игроков. Игры G1 и G 2 называются с т р а т е г и ч е с к и э к в и в а л е н т 30 н ы м и , если существуют такие вещественные числа i , iN, и такое положительное вещественное число , что 2 (S) = 1 (S) + i , S N, iS (2.1.4) т.е. 2 можно получить из 1 посредством линейного преобразования. Формула (2.1.4) интерпретируется следующим образом. При переходе от G 1 к G 2 каждому игроку iN выплачивается сумма i , затем единицы, в которых эти платежи измерялись, меняют, умножая значения исходной характеристической функции на . Игра с неотрицательной характеристической функцией называется 0 р е д у ц и р о в а н н о й . От любой супераддитивной игры G=(N,), можно перейти к стратегически эквивалентной 0-редуцированной игре G=(N,), используя формулу (S ) = (S ) (i), S N . (2.1.5) iS Некоторые из рассмотренных выше понятий относятся к играми д е л е ж а п р и б ы л и . Аналогично определяются кооперативные игры р а с п р е д е л е н и я у б ы т к о в . Чтобы не менять определения, игру G=(N,) распределения убытков преобразуют к стратегически эквивалентной игре дележа прибыли G=<N,>, где (S)= - (S), S N. (2.1.6). Затем переходят к 0-редуцированной игре G=<N,>. Если x - дележ игры G, то соответствующий дележ исходной игры имеет вид xi (i) xi , iN. (2.1.7) Пример 2.1.2. (Р а с п р е д е л е н и е з а т р а т ). Множество агентов состоит из потенциальных потребителей объекта общего пользования. Каждый агент может быть либо обслужен, либо нет, например, подключен к системе водоснабжения или нет. Значение (S) - минимальные затраты на обслуживание 31 коалиции S наиболее эффективным для нее способом. Нужно обслужить всех потребителей и поделить затраты. Пусть n=3, (1)=120, (2)=140, (3)=120, (1,2)=170, (1,3)=160, (2,3)=190, (1,2,3)=255. Используя формулы (2.1.6) и (2.1.5) перейдем к стратегически эквивалентной 0-редуцированной игре дележа прибыли (1)=(2)=(3)=0, (1,2)=90, (1,3)=80, (2,3)=70, (1,2,3)=125. Рассмотрим, например, вектор x =(50,50,25)D(). Из (2.1.7), получаем соответствующий x дележ (70,90,95) исходной игры. Если характеристическая функция а д д и т и в н а (все условия (2.1.3) выполняются как равенства), то (i) =(S), iS S N. Такая игра называется н е с у щ е с т в е н н о й , множество ее дележей состоит из единственной точки x 0 с координатами x i0 =(i), iN ("т о ч к а р а з л а д а "). Если (i) <(N), то игра называется с у щ е с т в е н н о й . iN Говорят, что игра задана в ( 0 , 1 ) - н о р м а л ь н о й ф о р м е , если ее характеристическая функция удовлетворяет условиям (i)=0, iN; (N)=1. При таком представлении игры значение (S) непосредственно демонстрирует с и л у коалиции S, т.е. дополнительную прибыль, которую получают игроки коалиции S, образовывая ее. Заметим, что смешанные стратегии в бескоалиционных играх и дележи в (0,1)-нормальных кооперативных играх описываются одним и тем же способом – как точки симплекса { x R n : xi =1, x 0}. Но iN компонентами смешанной стратегии игрока являются вероятности тех или иных его действий (чистых стратегий), а компоненты дележа – доли выигрышей различных игроков. Теорема 2 . 1 . 1 . Каждая существенная игра стратегически эквивалентна единственной (0,1)-нормальной игре , имеющей вид 32 (S ) [ (S ) (i)] /[ ( N ) (i)] , S N. iS (2.1.8) iN Доказать эту теорему предлагается читателю (упражнение 2.1.3). Преобразование (2.1.8) называется ( 0 , 1 ) - н о р м а л и з а ц и е й . Стратегическая эквивалентность является рефлексивным, симметричным и транзитивным отношением на множестве всех игр n лиц, т.е. отношением эквивалентности, следовательно, теорема 2.1.1 позволяет выбрать по одной конкретной игре (N, k ) из каждого класса эквивалентности Kk. Все остальные игры класса Kk будут иметь такие же свойства, что и (N, k ). Приведем теперь пример конкретной экономической ситуации, моделируемой кооперативной игрой с трансферабельной полезностью. Пример 2.1.3. (М о д е л ь т о р г о в о й с е т и [18]). В условиях современной экономики покупателям могут предлагаться близкие по потребительским свойствам товары, произведенные в разных регионах или странах. Это приводит к появлению разветвленных дилерских сетей, причем конкурентоспособность товара определяется не только себестоимостью, но и расходами, связанными с его доставкой к месту продажи. Пусть N={1,…,n} множество компаний (агентов), находящихся в различных географических регионах и занимающихся производством и продажей одного вида продукции; mi – объем производства; ci - себестоимость единицы продукции; si – объем продажи в своем регионе; ri - цена единицы продукции для своего региона; xij – объем товара, который компания i продает компании j; pij - цена единицы товара, передаваемого от i-й компании к j-й компании. Цены pij - договорные, то есть являются результатом переговоров между компаниями. Передача каждой единицы товара от i-й компании к j-й влечет транспортные расходы ij , которые оплачивает компания, принимающая товар. Следовательно, чистый доход i-й компании от продажи единицы товара j-й компании равен pij , а затраты j-й 33 компании при покупке единицы товара у i-й компании равны pij + ij . Если у некоторой компании iN есть возможность продать товар компании jN более выгодно, чем на внутреннем рынке ( pij > ri ) и j-й компании выгодно приобретать товар у i-й компании, то они могут заключить соглашение о поставке товара. Таким образом, торговая сеть представляет собой ориентированный граф, вершины которого соответствует компаниям, а дуги – соглашениям между ними. Пусть x= ( xij )i, jN , i j - матрица объемов продаж между компаниями, p= ( pij ) i, jN , i j - матрица цен, m= (mi )iN - вектор производства, s= (si )iN вектор продаж в своем регионе. Для каждого агента iN должен выполняться товарный баланс закупок и продаж xij + si = x ji + mi , j i j i то есть объем продаж агента равен сумме его объема закупки и объема производства. Прибыль i-й компании равна разности между доходом от продажи товара и затрат по его приобретению или производству pij xij + ri si ( p ji ji ) x ji j i j i Переговорный процесс между агентами моделируется с помощью кооперативной игры, в которой значение характеристической функции для коалиции T, равно гарантированной прибыли, которую она может получить, формируя торговую сеть только между своими участниками. v(T) = max ( (ri si ci mi ij xij )) , ( m, s , x )T T iT jT \ i где (m, s, x)T (mi , si , ( xij ) jT \ i )iT , а множество T определено условиями xij + si = x ji + mi , 0≤ mi ≤ M i , 0≤ si ≤ S i , 0≤ xij ≤ X ij , i T , j T \ i . jT \i jT \ i Полученная игра принадлежит классу LP-игр (кооперативных игр, в которых значения характеристической функции вычисляются с помощью задач линейного программирования). К этому же классу принадлежат игры, моделирующие 34 холдинговые ситуации (holding games [26]), производственные процессы (production games [27]) и некоторые другие актуальные экономические задачи. Упражнения 2.1.1. Вычислить характеристическую функцию следующей игры. Три предприятия могут выпускать товары двух типов Т 1 и Т 2 . Предприятие 1 может выпускать товары первого типа в объеме 600 ед., предприятие 2 – товары первого типа в объеме 700 ед., предприятие 3 – товары второго типа в объеме 1000 ед. Имеется спрос только на комплекты, состоящие из одной единицы товара Т 1 и одной единицы товара Т 2 . Стоимость одного комплекта – 1 денежная ед. Нужно определить, объединятся ли предприятия и как они будут делить прибыль. Выполнить (0-1)-нормализацию. Является ли игра супераддитивной? 2.1.2. Вычислить характеристическую функцию следующей игры [29, с.237]. Авиакомпании должны распределить затраты на строительство взлетнопосадочной полосы, причем для обслуживания самолетов, принадлежащих авиакомпании i, достаточно, чтобы длина взлетно-посадочной полосы была равна сi , iN={1,…,n}. Предполагается, что затраты пропорциональны длине взлетно-посадочной полосы. Нужно определить, какие коалиции образуются и как они разделят затраты. 2.1.3. Доказать теорему 2.1.1. 2.1.4. Для игры четырех лиц: (1)=1, (2)=(3)=(4)=0, (1,2)=4, (1,3)=5, (1,4)=6, (2,3)=4, (2,4)=5, (3,4)=(1,2,3)= (2,3,4)=6, (1,2,4)=7, (1,3,4)=8, (1,2,3,4)=10 определить вектор x ( ( N ) / n,..., ( N ) / n) . равномерного распределения полезности максимальной коалиции. Какие коалиции могут возражать против дележа x ? Определить вектор равномерного распределения дополнительной x ( (1) [ ( N ) (i)] / n,..., (n) [ ( N ) (i)] / n) . Какие коприбыли ~ i N i N x? алиции могут возражать против дележа ~ 35 2.1.4. Записать 0-редуцированную (2)=(3)=(4)=2, (1,2)=4, форму игры (1,3)=5, (1,4)=6, четырех лиц: (2,3)=4, (1)=1, (2,4)=5, (3,4)=(1,2,3)=(2,3,4)=8, (1,2,4)=9, (1,3,4)=10, (1,2,3,4)=12. Является ли эта игра: существенной, супераддитивной, с нулевой суммой? 2.2. Сбалансированность 2.2.1. Ядро Среди различных концепций решения кооперативной игры центральное место занимает понятие С-ядра (core), при определении которого используется следующий способ сравнения дележей. Говорят, что дележ x = ( x1 ,..., xn ) д о м и н и р у е т дележ y = ( y1 ,..., yn ) по коалиции S ( x S y ), если: 1. xi > yi , iS, 2. iS x (S)) i Говорят, что дележ x д о м и н и р у е т дележ y ( x y ), если x S y для некоторой коалиции SN. Множество всех недоминируемых дележей называется C - я д р о м (я д р о м , c o r e ) и обозначается C (), то есть C ()=D()\dom D(), где domD() – множество дележей, доминируемых каким-либо другим дележом. Игра, имеющая непустое С-ядро называется с б а л а н с и р о в а н н о й . Рассмотренное доминирование является довольно сложным отношением. Оно не рефлексивно и в общем случае не транзитивно. Пример 2.2.1. Дана игра пяти лиц: (S)=0 для s=1; (S)=2 для s=2,3; (S)=4, s=4,5; где s – мощность коалиции S. Для дележей x=(1,1,0,0,2) и y=(0,0,1,1,2) получаем x {1, 2} y , y {2,3} x 36 x y и y x. Пример 2.2.2. Дана игра трех лиц: (i)=0, iN; (N)=1, (1,2)=(1,3)=(2,3)=2/3. Для дележей x=(1/2,1/3,1/6), y=(1/3,5/12,1/4), z=(9/24,1/3,7/24). получаем z {1,3} y , y {2,3} x z y , y x , но ( z x ). Следующая теорема определяет С-ядро как множество решений линейной системы. Теорема 2.2.1. Для того чтобы дележ x принадлежал С-ядру, необходимо и достаточно выполнение условий xi (S), S N, (2.2.1) i S Доказательство. Для несущественных игр теорема очевидна, поэтому ее достаточно доказать для существенных игр в (0-1)-редуцированной форме. Пусть дележ x удовлетворяет (2.2.1) и не принадлежит С-ядру, тогда существует такой дележ y и коалиция S, что x S y . Получаем xi < yi (S) iS (про- iS тиворечие). Обратно, если дележ x принадлежит С-ядру и не удовлетворяет (2.2.1), то существует такая коалиция S, что xi <(S). Положив i S yi = xi ( (S ) - xi )/s, s S , iS, yi = (1 ( S ) )/(n-s), iS, получаем i S yi =1, yi 0 iN и y S x. Представим, что игроки обсуждают возможность выбора дележа x1 в качестве решения игры. Если x1 не удовлетворяет условию (2.2.1) для некоторой коалиции S, то она будет возражать против такого дележа, требуя более выгодного для себя распределения общего дохода (N), например, распределения x 2 D(), для которого xi2 > x1i , iS. Выдвигая такое требование, игроки из S угрожают в противном случае блокировать образование максимальной коалиции и эта угроза реальна, т.к. для достижения наибольшего дохода требуется единодушное согласие всех игроков. Таким образом, С-ядро можно интер37 претировать как подмножество дележей, устойчивых относительно коалиционных угроз, а условие (2.2.1) – как т е с т н а о т д е л е н и е . Условие (2.2.1) называется также к о л л е к т и в н о й р а ц и о н а л ь н о с т ь ю . n В общем случае С-ядро определяется системой, содержащей ( 2 + n - 1) ограничений и n переменных, т.е. число ограничений экспоненциально растет при увеличении количества игроков. Однако для конкретных игр часть ограничений можно не рассматривать. Для неотрицательной характеристической функции зависимыми являются неравенства системы (2.2.1), соответствующие (S)=0, S >1. Если S1 и S2 такие коалиции, что S1 S2 , то соответствующее S2 неравенство системы (2.2.1) является зависимым. Если S1 и S2 такие коалиции, что S1 S2 =N, то соответствующие S1 и S2 неравенства системы (2.2.1) также является зависимыми Пример 2.2.3 ("М у з ы к а н т ы " [14, с.145]). Певец, пианист и ударник могут получить 1000 долларов за совместное выступление в ночном клубе Певец и пианист без ударника могут получить 800 долларов, певец и ударник 500 долларов, пианист и ударник – 650 долларов, один певец - 200 долларов, пианист – 300 долларов. Ударник один ничего не может заработать. Нужно определить, в каком составе выгодно выступать и как распределить гонорар. В данном случае N ={1,2,3}. Пусть игрок 1 – певец, игрок 2 – пианист, игрок 3 – ударник, тогда (1)=200, (2)=300, (3)=0, (1,2)=800, (1,3)=500, (2,3)=650, (1,2,3)=1000. В данной игре (1,2)>(1)+(2), (1,3)>(1)+(3), (2,3)>(2)+(3), (1,2,3)>(1)+(2)+(3), (1,2,3)>(1,2)+(3), (1,2,3)>(1,3)+(2), (1,2,3)>(2,3)+(1), следовательно, будет образована максимальная коалиция. Рассмотрим равно1 1 1 мерное распределение x =(333 3 333 3 333 3 ) гонорара максимальной коали, , ции. Оно принадлежит множеству дележей, но против "уравниловки" x будет 38 2 возражать коалиция {1,2}={певец, пианист}, т.к. x1 + x2 =666 3 , а самостоятельно этот дуэт зарабатывает (1,2)=800 (дол.). Вычислим дополнительный доход (1,2,3)-(1)-(2)-(3)=500 от совместного выступления музыкантов. 2 2 2 Его равное распределение дает дележ x =(366 3 ,466 3 ,166 3 ). Однако, при де1 леже x коалиция {2,3}={пианист, ударник} получает x2 + x3 =633 3 (дол.), что меньше ее собственного дохода (2,3)=650 (дол.). Таким образом, эта коалиция скорее отделится, чем будет терпеть ущерб. С-ядро игры определяется системой x1 + x2 + x3 =1000, . x1 200, x2 300, x3 0, x1 + x2 800, x1 + x3 500, x2 + x3 650. x2 1000 C 800 600 400 200 0 A 200 B 400 600 800 1000 x1 Рис. 2.2.1. Графическая иллюстрация С-ядра (пример 2.2.3). Размерность соответствующего многогранника равна 2, поэтому его вершины можно определить графическим методом. Так как x3 =1000- x1 - x2 , то получа39 ем систему 200 x1 350, 300 x2 500, 800 x1 + x2 1000. Множество всех дележей соответствует треугольнику ABC рисунка 2.2.1, а С-ядро – маленькому заштрихованному треугольнику внутри него. Вершинами С-ядра ются дележи (350,450,200), (350,500,150), явля- (300,500,200), то есть выигрыш каждого игрока определяется с точностью до 50 долларов. Справедливым ком* 1 1 1 промиссом внутри С-ядра является его центр x =(333 3 , 483 3 , 183 3 ) (среднее арифметическое вершин). Запишем (0,1)-нормальную форму данной игры: (i ) =0, i=1,2,3; (1,2)=3/5, (1,3)=3/5, (2,3)=7/10, (1,2,3)=1. После такого преобразования становится ясно, что коалиции {1,2}={певец, пианист} и {1,3}={певец, ударник} имеют одинаковую силу, которая меньше силы коалиции {2,3}={пианист, ударник}. Пример 2.2.4 ("Р а с п р е д е л е н и е п р и б ы л и " [15, с.135]). Объект коллективного пользования может обслуживать четырех потребителей (районы, фирмы и т.п.). Каждый потребитель может быть либо обслужен, либо нет, например, подключен к локальной системе водоснабжения или нет. Минимальные затраты на обслуживание пользователей наиболее эффективным способом таковы: один потребитель - 40, два потребителя - 60, три потребителя - 70, четыре потребителя - 80, т.е. функция затрат симметрична и имеет вид Подключение к рассматриваемому объекту приносит пользователям следующие доходы: b1 =41, b2 =24, b3 =22, b4 =12. Ясно, что потребителю i не выгодно обслуживаться, если он должен заплатить больше, чем bi . Вычислим характеристическую функцию. Максимально возможная прибыль любой коалиции пользователей есть наибольшая прибыль по всем ее подкоалициям, включая нулевую прибыль, когда никто не обслуживается (S)= max { bi c(T ), 0} , T S iT (3,4)=max{0, 22 - 40, 12 - 40, (22 + 12) - 60}=0, (1,2)=max{0, 41 - 40, 24 - 40, (41 + 24) - 60}=5, 40 (1,4)=max{0, 41 - 40, 12 - 40, (41 + 12) - 60}=1 и т.д. Таким образом, игроки 3 и 4 не могут получить никакой прибыли ни по отдельности, ни вместе, поскольку их доходы слишком малы. Если коалиция состоит из игроков 1 и 2, то они получают прибыль в 5 единиц. Если игрок 4 присоединяется к игроку 1, то ему это в действительности не помогает, т.к. обслуживаться будет только игрок 1. Окончательно получаем: (1)=1, (2)=(3)=(4)=0, (1,2)=5, (1,3)=3, (1,4)=1, (2,3)=(2,4)=(3,4)=0, (1,2,3)=17, (1,2,4)=7, (1,3,4)=5, (2,3,4)=0, (1,2,3,4)=19. Максимальная прибыль достигается при совместном обслуживании всех пользователей. Задача заключается в ее распределении ее между игроками. С-ядро определяется системой x1 1, x2 , x3 , x4 0, x1 + x2 5, x1 + x3 3, x1 + x2 + x3 17, x1 + x2 + x4 7, x1 + x3 + x4 5, x1 + x2 + x3 + x4 =19, из которой исключены зависимые неравенства. С-ядро не совпадает с множеством дележей, но устанавливает достаточно широкие границы распределения прибыли. С-ядру принадлежит дележ x1 =(19,0,0,0), при котором вся прибыль отдается игроку 1, а также дележ x 2 =(1,8,8,2), где игрок 1 остается на своем собственном гарантированном уровне прибыли, а вся выгода от кооперации идет остальным игрокам. Пример 2.2.5 ("Ч и с т ы е т о р г и " [16, с.318]). Администрация города может выделить n фирмам сумму в d долларов для ремонта дорог. Если фирмы не смогут договориться между собой о распределении денег, то деньги не выделяются. Итак, (N)=d >0 и (S)=0, если S< n. Нужно выяснить, смогут ли фирмы договориться. В данной игре С-ядро совпадает с множеством всех дележей D(). Пример 2.2.6 ("В з в е ш е н н а я м а ж о р и т а р н а я и г р а " [16, с.319]). Игрок i имеет ki голосов. Коалиция выигрывает (побеждает), если сумма ее голосов не меньше некоторой доли Q от их общего количества (Q ki ). iN 41 Эта игра задается (n+1)-м числом (Q; k1 ,…, k n ). Характеристическая функция игры имеет вид 1, ki Q, ( S ) iS 0, ki Q. iS Взвешенные мажоритарные игры возникают во многих случаях. Например, игроки могут быть акционерами компании, а число голосов игрока соответствовать его доле акций. В качестве игроков можно рассматривать также избирательные округи. Число голосов, которыми обладает округ в законодательном органе, соответствует численности населения. Число голосов игрока не всегда соответствует его реальной силе. Например, в игре (51; 49, 48, 3) для победы необходимо простое большинство в 51 голос. Выигрывающие коалиции: {1,2}, {1,3}, {2,3} и {1,2,3}. Такие же выигрывающие коалиции имеет игра (2; 1,1,1), у которой все игроки равной силы, т.к. обладают одинаковым числом голосов. Следовательно, и в игре (51; 49, 48, 3) игроки также имеют одинаковую силу относительно их влияния на выбор исхода игры. С-ядро игры (2; 1,1,1) определяется системой x1 , x2 , x3 0, x1 + x2 1, x1 + x3 1, x2 + x3 1, x1 + x2 + x3 =1. Складывая последние три неравенства, получаем x1 + x2 + x3 3/2, что противоречит соотношению x1 + x2 + x3 =1. Следовательно, C ()=. Упражнения 2.2.1.1. Используя графический метод определить все вершины С-ядра следующей игры трех лиц: (1,2,3)=1000, (1)=200, (2)=300, (3)=0, (1,2)=800, (1,3)=500, (2,3)=650. Выбрать два дележа. Один из этих дележей не должен принадлежать С-ядру. Связаны ли дележи отношением доминирования? Проверить, принадлежат ли С-ядру вектор равномерного распределения прибыли x ( ( N ) / n,..., ( N ) / n) 42 и вектор равномерного распределения дополнительного дохода ~ x ( (1) [ ( N ) (i)] / n,..., (n) [ ( N ) (i)] / n) . iN iN 2.2.1.2. Записать характеристическую функцию взвешенной мажоритарной игры (52;19,25,15,20). Из системы, определяющей С-ядро, исключить зависимые неравенства. Существует ли С-ядро у данной игры? Если существует, то определить один из дележей С-ядра. 2.2.1. Условия существования ядра Анализ каждой экономической ситуации, моделируемой кооперативной игрой, обычно начинается с проверки ее сбалансированности. Проверить сбалансированности игры G=(N,) можно с помощью задачи линейного программирования f(x) = xi min, (2.2.2) N xi (S ) , S= 2 \N \ ; (2.2.3) iN iS * Пусть x - оптимальное решение. С-ядро не пусто тогда и только тогда, когда * f( x ) (N). (2.2.4) * Если условие (2.2.4) выполняется, но x не принадлежит С-ядру, то точку x С() можно получить по формуле (N ) * * x , x 0, * i x j xi j N ( N ) , x * 0, n (2.2.5) т.е. x есть проекция x на гиперплоскость xi (N ) . * i N Пример 2.2.7. Рассмотрим (0,1)-нормальную игру пяти лиц: (N)=1; (1,2)=(4,5)=(2,3,4)=1/2;(S)=1/2 для всех собственных коалиций, включающих {1,2} или {4,5} или {2,3,4}; (S)=0 в остальных случаях. Решив задачу f(x) = x1 + x2 + x3 + x4 + x5 min, 43 x1 + x2 1/2, x4 + x5 1/2, x2 + x3 + x4 1/2, x 0 , из ограничений которой исключены зависимые неравенства, получаем опти* * мальное решение x =(0,1/2,0,0,1/2) и оптимальное значение f( x )=1. Условие 5 * (2.2.4) выполняется, следовательно, С() . Так как xi* 1 , то x С(). i 1 Пример 2.2.8. Пусть N={1,…,5}, (N)=1; (1,2)=(4,5)=1/3; (2,3,4)=1/2; (S)=1/3 для собственных коалиций, включающих {1,2} или {4,5}; (S)=1/2 для собственных коалиций, включающих {2,3,4}; (S)=0 в остальных случаях. Решив задачу линейного программирования f(x) = x1 + x2 + x3 + x4 + x5 min, x1 + x2 1/3, x4 + x5 1/3, x2 + x3 + x4 1/2, * x 0, * получаем x =(0,1/3,0,1/6,1/6), f( x )=2/3. Условие (2.2.4) выполняется, т.е. * С(), но x С(). Используя (2.2.5), вычисляем x =(0,1/2,0,1/4,1/4)С(). Необходимое и достаточное условие (2.2.4) существования С-ядра включает оптимальное значение задачи линейного программирования (2.2.2)-(2.2.3), что затрудняет его использование для аналитического описания множества сбалансированных игр. Запишем задачу, двойственную к (2.2.2)-(2.2.3) g() = ( S ) ( S ) max, ( S ) ( S ) = ( N ) , 0, S где (S) - двойственная S переменная, соответствующая коалиции S; (S ) =( 1 ( S ) ,…, n (S )) – характеристический вектор коалиции S 0, i S , 1, i S . i (S ) Допустимая область двойственной задачи полностью определяется количеством игроков, т.е. уже не зависит от характеристической функции и является выпуклым многогранником. Обозначим его через M n , а множество вершин M n - через n . Задача (2.2.2)-(2.2.3) разрешима, поэтому f( x )=g(*)= maxn g ( ) , * 44 следовательно, C-ядро существует тогда и только тогда, когда maxn g ( ) (N), что равносильно ( S ) ( S ) (N), n . (2.2.6) S Рассмотрим игру трех лиц. Задача (2.2.2)-(2.2.3) имеет вид f(x) = x1 + x2 + x3 min, (1) x1 (2) x2 x3 (1), (1,2) x1 + x2 x1 + x3 (1,3) x2 + x3 (2,3) 1 2 3 4 5 6 x0 Запишем двойственную задачу g()=(1)(1)+(2)(2)+(3)(3)+(1,2)(1,2)+(1,3)(1,3)+(2,3)(2,3) max; (1) + (1,2) + (1,3) (2) + (1,2) (3) = 1, + (2,3) = 1, + (1,3) + (2,3) = 1, 0, Многогранника M 3 имеет пять вершин 1 =(1,1,1,0,0,0), 2 =(1,0,0,0,0,1), 3 =(0,1,0,0,1,0), 4 =(0,0,1,1,0,0), 5 =(0,0,0,1/2,1/2,1/2), i (i (1), i (2), i (3), i (1,2), i (1,3), i (2,3)) , i 1,5 . необходимое и достаточное условие получаем сбалансированности игры трех лиц (1) + (2) + (3) (1,2,3), (1) + (2,3) (1,2,3), (2) + (1,3) (1,2,3), (3) + (1,2) (1,2,3), (1,2) + (1,3) + (2,3) 2(1,2,3). 45 Из (2.2.6) где Для супераддитивной характеристической функции первые четыре неравенства всегда выполняются, следовательно, супераддититвная игра трех лиц сбалансирована тогда и только тогда, когда (1,2) + (1,3) + (2,3) 2(1,2,3). Пример 2.2.9. Игра трех лиц (i)=0, iN; (1,2)=(1,3)=2, (2,3)=(1,2,3)=3 супераддитивна, но не сбалансирована. Пример 2.2.10. Игра трех лиц: (1)=(2)=2, (3)=3, (1,2)=3, (1,3)=(2,3)=4, (1,2,3)=5 не супераддитивна, но сбалансирована. Пример 2.2.11. Игра трех лиц: (1)=(2)=2, (3)=3, (1,2)=3, (1,3)=(2,3)=4, (1,2,3)=5 не супераддитивна и не сбалансирована. П р и м е р 2 . 2 . 1 2 ( " О з е р о " [ 1 6 , с . 3 2 0 ] ) . Вокруг озера расположено n предприятий. Обработка стоков перед их сбросом в озеро стоит каждому предприятию В (денежных единиц), а очистка воды для собственных нужд стоит А, где - число предприятий, не обрабатывающих свои отходы. Считая, что А <В < nА, s =S, получаем snA, ( S ) sB s( n s) A, s B / A, s B / A. В этой игре нужно узнать, смогут ли предприятии договориться об обработке отходов. Положим n=3, А=10, В=25. Тогда (1)=(2)=(3)=30, (1,2)=(1,3)+(2,3)=60, (1,2,3)= 75. С-ядро задается системой x1 30, x1 + x3 60, x2 30, x3 30, x2 + x3 60, x1 + x2 60, x1 + x2 + x3 = 75, множеством решений которой является треугольник (рис. 2.2.1) с вершинами x 1 =(30, 30, 15), x 2 =(30, 15, 30), x 3 =(15, 30, 30). Центром С-ядра является точка (25,25,25) равномерного (1,2,3)=75. 46 распределения величины Х2 -60 -45 -15 -30-25 Х1 -15 Х 2 -25 -30 Х 3 Х 1 -45 -60 Рис. 2.2.1. Графическая иллюстрация С-ядра (пример 2.2.12). Для некоторых частных классов игр получены более простые, чем (2.2.6) условия существования С-ядра. Игра называется игрой с п о с т о я н н о й с у м м о й , если (S) + (N \S)=(N), S N. Все несущественные (S)+(N\S)= (i) + iS игры являются играми с постоянной суммой, т.к. (i) = (i) =(N) , но не наоборот. iN \ S iN Теорема 2.2.2. Если - существенная игра с постоянной суммой, то C()=. Доказательство. Если xC(), то xi (S), SN, xi =(N). i S Пусть существует такая коалиция S, что iN xi >(S), тогда xi <(N)- i S (S)=(N\S), что противоречит предположению xC(). Если i N \ S xi =(S) для i S всех коалиций SN, то игра не существенна, что тоже противоречит предположениям. 47 Игра называется п р о с т о й , если (S){0,1}, SN, и (N)=1. Коалиция S называется в ы и г р ы в а ю щ е й , если (S)=1, в противном случае S называется п р о и г р ы в а ю щ е й коалицией. Простую игру можно задать в виде пары (N,W), где W – множество выигрывающих коалиций. Выигрывающая коалиция S называется м и н и м а л ь н о й в ы и г р ы в а ю щ е й к о а л и ц и е й , если любая ее собственная подкоалиция проигрывает, т.е. (T)=0 для T S. Супераддитивную простую игру можно задать в форме (N, Wmin ), где Wmin – множество минимальных выигрывающих коалиций. Игрок i простой игры, в которой (S)=0, если iS, называется в е т о игроком. Теорема 2.2.3. Простая игра сбалансирована тогда и только тогда, когда у нее есть хотя бы один вето игрок, то есть S . SW Доказать эту теорему предлагается читателю (упражнение 2.2.2.1) Пример 2.2.9. Простая игра четырех лиц с множеством выигрывающих коалиций W={{12345},{124},{12},{13},{14}} сбалансирована, так как S ={1}. SW Игра называется с и м м е т р и ч н о й , если значение (S) зависит только от мощности s=S коалиции S, т.е. коалиции с одинаковым числом игроков имеют одинаковый выигрыш. Характеристическая функция симметричной игры имеет вид (S)= f(s), S N. Теорема 2.2.4. Симметричная игра сбалансирована тогда и только тогда (S)/s=(N)/n, S N. Доказательство. Пусть выполняется x ( ( N ) / n,..., ( N ) / n) получаем xi iS (2.2.7) (2.2.7). Для вектора s ( N ) (S), S N, и xi =(N), n iN следовательно, x C ( ) , т.е. C(). Обратно, пусть C(), тогда выполняются условия 48 ( S ) ( S ) (N), M n . (2.2.8) S Рассмотрим квадратную булеву матрицу Asn порядка n, каждая строка и каждый столбец которой содержит s (1≤ s≤ n -1) единиц. Столбцы матрицы Asn являются характеристическими векторами некоторых коалиций S1 ,…, S n . Вектор =( ( S1 ),…, ( S n ), 0,…,0)=(1/ s,…,1/ s, 0,…,0) принадлежит M n , тогда из (2.2.8) получаем ( S i ) ( S i ) (N), то есть ( ( S i )) / s (N). Все коалиiN i N ции S i имеют одинаковую мощность, поэтому ( S1 )=…=( S n )=(S). Получили, что при непустом С-ядре всегда выполняется (2.2.7). Пример 2.2.10. Для симметричной игры четырех лиц 0, s 1, ( S ) 3, s 2, 4, s 3,4 условие (2.2.7) не выполняется, т.е. C()=, а для следующей игры 0, 3, (S ) 4, 6, s 1, s 2, s 3, s4 условие (2.2.7) справедливее, т.е. C(). Упражнения. 2.2.2.1. Доказать теорему 2.2.3. 2 . 2 . 2 . 2 . Существует ли С-ядро у взвешенной мажоритарной игры (10; 5, 3, 3, 1, 1)? 2 . 2 . 2 . 3 . Дана игра трех лиц (1)=1 (2)=2 (3)=3 (1,2)=3 (1,3)=5 (2,3)=7 (1,2,3)=9. Используя необходимое и достаточное условие существования С-ядра, определить максимальное число δ, при котором игра 49 ( N ) ( N ) , (S ) = (S ) , S≠N, имеет непустое С-ядро 2 . 2 . 2 . 4 . Записать характеристическую функцию игры "О з е р о " (три предприятия, А =14, В=25). Перейти к стратегически эквивалентной игре с неотрицательной характеристической функцией. Существует ли С-ядро у данной игры? 2.3. Равновесие по Нейману-Моргенштерну Если С-ядро игры существует, то в качестве исхода игры обычно выбирают дележ, принадлежащий С-ядру. Возможная пустота С-ядра является главным недостатком этого понятия. Указанного недостатка практически не имеет понятие решения, предложенное фон Нейманом и Моргенштерном [1]. . Множество B()D() называется решением Неймана- М о р г е н ш т е р н а (NM–решением, решением), если B()=D()\dom B(), т. е. B() удовлетворяет следующим двум условиям: 1) для любых x1 , x 2 B() выполняется ( x1 x 2 ) и ( x 2 x1 ),. (ни один из дележей множества B() не является предпочтительней другого - в н у т р е н н я я у с т о й ч и в о с т ь ); 2) для любого дележа x 1 B() найдется такой дележ x 2 B(), что x 2 x1 (в н е ш н я я у с т о й ч и в о с т ь ). NM–решение может не существовать, но в крайне редких случаях. Первая игра, не имеющая NM–решения, была получена для n=10. NM–решение не является единственным. В отличие от С-ядра, являющимся выпуклым многогранником, NM–решением может быть невыпуклым и даже не связным. Из определения вытекают следующие свойства NM–решения: - любое NM–решение не может быть подмножеством другого NM–решения; 50 - в сбалансированной игре NM–решение есть замкнутое множество пространства R n , содержащее С-ядро; - если С-ядро является NM–решением, то NM–решение единственно. Пример 2.3.1.. Рассмотрим игру трех лиц, в которой каждый из игроков обязан заплатить двум другим игрокам по единице, если они образуют коалицию. Если интерпретировать (S ) как максимальное количество денег, которое может получить коалиция S, характеристическая функция будет иметь вид 2, S 1, ( S ) 2, S 2, 0, S 3. 0, S 1, После (0-1)-нормализации получаем, ( S ) Эта симметричная 1, S 2,3. простая игра эквивалентна взвешенной мажоритарной игре (2; 1, 1, 1), где выигрывают все коалиции, мощность которых больше 1. Игра не сбалансирована, так как S . Покажем, что множество S : ( S ) 1 B1 ( ) ={ x 1 =(1/2,1/2, 0), x 2 =(1/2,0,1/2), x 3 =(0,1/2,1/2)} является NM–решением. Внутренняя устойчивость U() очевидна. Рассмотрим дележ x=( x1 , x2 , x3 ), тогда x1 , x2 , x3 30, x1 + x2 + x3 =1. Следовательно, не более двух компонент вектора x могут не меньше 1/2. Если две компоненты x равны 1/2, то третья равна 0, то есть x B1 ( ) . В противном случае x имеет не более одной компоненты, не меньшей чем 1/2. Тогда две остальные компоненты меньше 1/2 и x доминируется одним из дележей из B1 ( ) . Возвращаясь к исходной игре, из формулы xi xi [ ( N ) ( j )] (i) , i=1,2,3; jN 51 получаем ее NM–решение B1 ( ) ={(1, 1, -2), (1, -2, 1), (-2, 1, 1)}. Аналогично можно доказать, что для любого [0,1] множества B 2 ( ) {( x1 , 1 x1 , ) R 3 : 0 x1 1- }, B 3 ( ) {(1 x2 , x2 , ) R 3 : 0 x 2 1- } и т.д. тоже являются NM–решениями (0-1)-нормальной формы рассматриваемой игры. Для частных классов игр получен явный вид NM–решений. Теорема 2.3.1. Пусть - простая игра, DS ( ) - множество таких деле- жей x, что xi =0 для всех iS. Тогда DS ( ) есть NM–решение. Доказательство теоремы аналогично доказательству, проведенному в примере 2.3.1. Теорема 2.3.2. Множество V V C ( ), C ( ) , B( ) C ( ) , V V , где V {x D( ) : x1 ( N ) (2,3)} , V {x D( ) : x2 ( N ) (1,3), x3 ( N ) (1,2)}, V {x D( ) : x2 (2,3) (1,2) ( N ), x3 (2,3) (1,3) ( N )}, является NM–решением игры трех лиц. Доказательство можно найти в [32, с.31-32]. Пример 2.3.2. Дана не сбалансированная игра трех лиц: (i)=0, i=1,2,3; (1,2)=(2,3)=2, (1,3)=3, (N)=3. Множество V определяется системой: x1 =1; x2 + x3 = 2; x2 , x3 0 → x1 =1; 0 x2 2 (отрезок АВ, рис. 2.3.1.(a)). Множество V определяется системой: x2 =1; x3 2; x1 + x3 = 3; x1 0 → x1 =0; x2 =1 (точка С, рис.2.3.1.(a)). 52 NM–решение есть объединение отрезка АВ и точки С (рис.2.3.1.(a)). x2 x2 x2 A G 2 2 2 C F 1 D 1 F 1 B 0 L E 1 x 1 0 1 (a) 2 E x 1 0 1 (b) 2 (c) Рис 2.3.1. Графическая иллюстрация NM–решения (пример 2.3.2) Пример 2.3.3. Дана сбалансированная игра трех лиц: (i)=0, i=1,2,3; (1,2)=(2,3)=2, (1,3)=3, (N)=4. Ее С-ядро определяется системой x1 + x2 2, x1 + x3 3, x2 + x3 2, x1 + x2 + x3 = 4 x1 , x2 , x3 0, 0 x1 2, 2 x1 + x2 4, 0 x2 1, (треугольник DEF, рис.2,3.1.(b)). Множество V определяется системой: x1 =2; x2 + x3 = 2; x2 , x3 0 → x1 =2; 0 x2 2 (отрезок GE, рис.2,3.1.(c)). Множество V определяется системой: x2 =1; x3 2; x1 + x3 = 4; x1 0 → 0 x1 1; x2 =1 (отрезок LF, рис. 2.3.1.(c)). Упражнения 2.3.1. Дана игра трех лиц (1)=(2)=(3)=0, (1,2)=4, (1,3)=6, (2,3)=5, (1,2,3)=12. - Определить целое ( S ) ( S ), S N число имеет δ, при С-ядро, котором а игра игра ( N ) ( N ) , ( N ) ( N ) 1, ( S ) ( S ), S N не имеет С-ядра. - Вычислить NM-решение игры . Выполнить графическую иллюстрацию. - Вычислить NM-решение игры . Выполнить графическую иллюстрацию. 2.3.2. Является ли дележ x= (5, 3, 1) NM-решением следующей игры трех лиц: (1) =5, ( 2) =3, (3) =1, (1,2) =8, (1,3) =6, (2,3) =4, (1,2,3) =9? 53 2.4. Операторы значения 2.4.1. Утилитарный подход В идеальном случае анализ кооперативной игры должен был бы приводить к выбору единственного дележа, который и следовало бы принять за решение. Правило, ставящее в соответствие каждой кооперативной игре единственное распределение x =( x1 ,…, xn ) величины (N), называется о п е р а т о р о м з н а ч е н и я , а само распределение x - з н а ч е н и е м и г р ы . Одним из популярных значений, показавших свою применимость к широкому классу экономических моделей, является: цена Шепли (значение Шепли, в е к т о р Ш е п л и ). Цена Шепли ( 1 , ..., n ) приписывает каждому игроку выигрыш, равный его среднему вкладу во все коалиции и вычисляется по формуле i s!(n s 1)! [ ( S {i}) ( S )] , i 1, n , где s S . n! S N \i Цена Шепли отражает утилитарный подход к понятию справедливости. Для утилитариста кооперация хороша настолько, насколько она увеличивает благосостояние отдельных членов общества. Для игры трех лиц цена Шепли имеет вид 1 (1) / 3 [ (1,2) (2) (1,3) (3)] / 6 [ (1,2,3) (2,3)] / 3 , 2 (2) / 3 [ (1,2) (1) (2,3) (3)] / 6 [ (1,2,3) (1,3)] / 3 , 3 (3) / 3 [ (2,3) (2) (1,3) (1)] / 6 [ (1,2,3) (1,2)] / 3 . Для простой игры n лиц формула для цены Шепли упрощается 54 s!(n s 1)! , n ! S i ( s) = S i i 1, n , i где i – множество таких проигрывающих коалиций S, не содержащих игрока i , что коалиция S { i } является выигрывающей. Пример 2.4.1. Четыре акционера обладают следующим количеством акций: 40, 30, 20, 10. Любое решение утверждается акционерами, имеющими простое большинство акций. Это взвешенная мажоритарная игра (51; 40, 30, 20, 10), в которой выигрывают коалиции {1,2}, {1,3}, {1,2,3}, {1,2,4}, {1,3,4}, {2,3,4}, {1,2,3,4}. Определяем множества 1 ={{2},{3},{2,3},{2,4},{3,4}}, 2 ={{1},{1,4},{3,4}}, 3 ={{1},{1,4},{2,4}}., 4 ={2,3}. Вычислив (1) 5 3 3 1 , , ). 12 12 12 12 ( , 1!( 4 1 1)! Цена Шепли 4! = ( 2) 2!( 4 2 1)! 4! 1 12 , получаем не совпадает с "вектором голосования" 4 3 2 1 , , , ) , в котором выигрыш игрока пропорционален его доле акций. В 10 10 10 10 ( отношении цены Шепли, игроки 2 и 3 обладают одинаковой силой (несмотря на разное количество акций, они имеют одинаковые возможности для образования коалиций). Сила игрока 1 больше доли его акций, а сила игрока 4, наоборот, меньше доли акций. Предположим теперь, что игрок 3 приобрел еще 10 акций, т.е. рассмотрим игру (55; 40, 30, 30, 10). В этом случае W={{1,2}, {1,3}, {2,3}, {1,2,3}, {1,2,4}, {1,3,4}, {2,3,4}, {1,2,3,4}}, (1) = (2) 1 12 , 1 ={{2},{3},{2,4},{3,4}}, 2 ={{1},{3},{1,4},{2,4}}, 1 1 1 3 ={{1},{2},{1,4},{2,4}}., 4 =, ( , , , 0) . Цена Шепли также не сов3 3 3 4 3 3 1 падает с "вектором голосования" ( , , , ) и показывает, что дополнитель11 11 11 11 55 ные акции игрока 3 не дают ему преимуществ, а акции игрока 4 обесцениваются (он не может войти ни в одну коалицию, т.е. становится "болваном"). Цена Шепли удовлетворяет следующими аксиомам. А к с и о м а 1 (независимость). Для любого игрока i (i ) , где ((1),…,(n)) – перестановка N , то есть выигрыш игрока не зависит от его номера. А к с и о м а 2 (аксиома болвана). Если (S(i})=(S) для любого SN, то i 0 . А к с и о м а 3 (эффективность). i =(N). iN А к с и о м а 4 (линейность). Пусть 1 , 2 , 3 - векторы Шепли для игр 1 , 2 , 3 и 3 = 1 + 2 , тогда 3 = 1 + 2 . Теорема 2.4.1. Существует единственный вектор распределения величины (N), удовлетворяющий аксиомам 1-4. Это вектор Шепли. Доказательство теоремы можно найти в [15]. Цена Шепли является коалиционно монотонной, т.е. если прибыль (S) некоторой коалиции S увеличить, а прибыли всех остальных коалиций оставить без изменения, то цена i каждого игрока коалиции S не уменьшиться. В симметричной игре цена Шепли делит (N) на n равных частей =((N)/n,…,(N)/n). Цена Шепли может не принадлежать непустому С-ядру. Пример 2.4.2. ("Р ы н о к п е р ч а т о к " [17]). Два игрока (1 и 2) имеют по одной правой перчатке, а два остальных игрока (3 и 4) имеют по одной левой перчатке. Рыночная цена одной перчатки равна нулю, а цена одной пары (с одной правой и одной левой) равна единице. Эта ситуация описывается игрой четырех лиц: (1,3)= (1,4)=(2,3)= (2,4)=(1,2,3)= (1,2,4)=(1,3,4)=(2,3,4)=1, (1,2,3,4)=2, (S) =0 для остальных S. С-ядро, определенное системой: x1 + x3 1, x1 + x4 1, x2 + x3 1, x2 + x4 1, x1 + x2 + x3 + x4 =2, x 0 , 56 является отрезком с концами x 1 =(1,1,0,0), x 2 =(0,0,1,1). Цена Шепли =(1/2,1/2,1/2,1/2) совпадает с равномерным распределением прибыли. Предположим теперь, что игрок 1 имеет две правые перчатки, в то время как остальные игроки располагают прежними (1,3)=(1,4)=(2,3)=(2,4)=(1,2,3)=(1,2,4)=(2,3,4)=1, запасами. Тогда (1,3,4)=(1,2,3,4)=2, (S) =0 для остальных S. Собственная прибыль коалиции {1,3,4} увеличилась на единицу. С-ядро игры задается системой x1 + x3 1, x2 + x4 1,, x1 + x3 + x4 2, x1 + x4 1, x2 + x3 1, x1 + x2 + x3 + x4 =2, x 0 . Оно состоит из един- ственного дележа x 0 = (0,0,1,1), при котором всю прибыль делят владельцы левых перчаток. Цена Шепли =(7/12, 3/12, 7/12, 7/12) увеличивает долю первого, третьего и четвертого игроков, чьи коалиционные возможности возросли, уменьшая долю второго игрока. В данном случае цена Шепли не принадлежит С-ядру. Упражнения 2.3.1.1. Вычислить цену Шепли взвешенной мажоритарной игры (10; 6, 5, 3, 3). Сравнить цену Шепли с "вектором голосования". Какие игроки имеют силу (относительно цены Шепли) превышающую их долю голосов? Принадлежит ли цена Шепли С-ядру 2.3.1.2. Записать характеристическую функцию игры "О з е р о " (три предприятия, А =12, В=27). Вычислить цену Шепли. Дать содержательную интерпретацию полученного дележа. 2.4.2. Эгалитарный подход Эгалитарный принцип справедливости, приводит к понятию N - я д р а (nucleolus) ( 1,..., n ) . Эгалитарный принцип отражает стремление людей к равенству и приводит выравниванию выигрышей всех коалиций. В отли57 чие от цены Шепли, N–ядро всегда принадлежит непустому С-ядру. Оно занимает центральное место внутри С-ядра. Для определения N –ядра вводится понятие э к с ц е с с а e( x, S ) xi ( S ) , i S который является "мерой неудовлетворенности" коалиции S дележом x . Положительный (отрицательный) эксцесс e( x, S ) есть дополнительная прибыль (убыток) коалиции S по сравнению с ее собственной возможностью ( S ) . Для каждой коалиции S желательно, чтобы значение эксцесса e( x, S ) было как можно больше. Каждому дележу x ставиться в соответствие в е к т о р э к с ц е с с о в e( x) = (e( x, S 1 ), e( x, S 2 ),..., e( x , S m )) , компонентами которого являются упорядоченные по неубыванию эксцессы собственных коалиций e( x, S1 )e( x, S 2 )...e( x, S m ) , m 2 n 2 ; S i 2 N \ N \ , i 1, m . Дележ x принадлежит С-ядру тогда и только тогда, когда его вектор эксцессов неотрицателен. Пример 2.4.3. Вычислим, например, вектор эксцессов для цены Шепли =(7/12, 3/12, 7/12, 7/12) игры "Р ы н о к п е р ч а т о к " (пример 2.4.2.) (1,3)=(1,4)=(2,3)=(2,4)=(1,2,3)=(1,2,4)=(2,3,4)=1, (1,3,4)=(1,2,3,4)=2. Определяем вначале эксцессы собственных коалиций e( ,{1}) = e(,{3}) = e(,{4}) =7/12, e(,{1,3}) = e(,{1,4}) =2/12, e( , {3,4}) =14/12, e(,{1,3,4}) = 3/12, Упорядочивая e( ,{2}) =3/12, e( ,{1,2}) =10/12, e( , {2,3}) = e( ,{2,4}) = 2/12, e( ,{1,2,3}) = e(,{1,2,4}) =5/12, e( ,{2,3,4}) =5/12. эти величины по неубыванию получаем e( ) =( e( ,{1,3,4}) , e(,{2,3}) , e( ,{2,4}) , e( ,{1,3}) , e( ,{1,4}) , e( ,{2}) , e(,{1,2,3}) , e( , {1,2,4}) , e( ,{2,3,4}) , e(,{1}) , e(,{3}) , e(,{4}) , 58 e(,{1,2}) , e(,{3,4}) )=(3/12, 2/12, 2/12, 2/12, 2/12, 3/12, 5 /12, 5/12, 5/12, 7/12, 7/12, 7/12, 10/12, 14/12). Вектор эксцессов единственной точки x 0 =(0, 0, 1, 1) С-ядра этой же игры имеет вид e( x 0 ) ( e( x 0 ,{1}), e( x 0 ,{2}), e( x 0 ,{1,2}), e( x 0 ,{1,3}), e( x 0 ,{1,4}), e( x 0 ,{2,3}), e( x 0 ,{2,4}), e( x 0 ,{1,2,3}), e( x 0 ,{1,2,4}), e( x 0 ,{1,3,4}), e( x 0 ,{3}), e( x 0 ,{4}), e( x 0 ,{3,4}) )=(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 2). На множестве E {e( x ): x D( )} векторов эксцессов дележей игры . Говорят, что вектор e( x ) предшествует e( y ) (или e( y ) предпочтительнее e( x ) в смысле G вводится лексикографическое упорядочение лексикографического порядка) e( x ) e ( y ) , k если существует такая коалиция S , что e( x, S i ) = e( y, S i ) , i 1, k 1, e( x, S k ) < e( y, S k ) . Так, например, для вычисленных выше векторов эксцессов e( ) и e( x ) име0 ем e( ) e( x ) . 0 Существует единственный дележ , вектор эксцессов e( ) которого предпочтительнее всех остальных векторов из E e( ) = lexmax e( x ) . e( x ) E (2.4.1) Это и есть N-ядро. Как и цена Шепли, N-ядро удовлетворяет аксиомам анонимности и болвана, но не является коалиционно монотонным. Поэтому возможен случай, когда увеличение величины (N) при сохранении прибылей (S) всех остальных коалиций S N, приводит к уменьшению доли прибыли некоторых игроков. Это очень непривлекательное свойство, т.к. если какие-либо игроки страдают в 59 результате улучшений, то они могут отказаться от участия и тем самым сделать невозможным улучшение ситуации. Для n 5 не существует такого значения кооперативной игры, которое одновременно принадлежит С-ядру и является коалиционно монотонным (теорема Янга [15]). При определении N-ядра рассматриваются эксцессы коалиций, но не учитываются размеры коалиций. Поэтому единица прибыли для одного игрока расценивается так же, как и единица прибыли для его дополнения – коалиции из (n 1) игрока. Это может быть воспринято участниками игры как несправедливость. В некоторых играх, возможно, более предпочтительным окажется понятие п р о п о р ц и о н а л ь н о г о N - я д р а , которое определяется через с р е д н и е (в расчете на одного члена коалиции) э к с ц е с с ы e( x , S ) 1 S e( x , S ) , S 2N \ N \ и обладает теми же свойствами, что и N-ядро. Если желательно увеличить прибыль больших коалиций, то можно рассматривать в з в е ш е н н о е N - я д р о , определенное через в з в е ш е н н ы е э к с ц е с с ы e~ ( x , S ) S e( x , S ) , S 2N \ N \ . Вообще эксцесс коалиции S можно представить в виде e( x , S ) e( x , S ) / d ( S ) , где d (S ) >0 – нормирующий множитель. Соответствующее N-ядро называется о б о б щ е н н ы м N - я д р о м . Обобщенное N-ядро также не является коалиционно монотонным. Для игр с малым числом игроков N–ядро достаточно просто вычисляется с помощью минимальных сбалансированных наборов коалиций. Этим методом получена таблица, задающая N–ядро произвольной супераддитивной игры трех лиц. Однако, уже при n6 использование минимальных сбалансированных наборов коалиций нецелесообразно, так как их становится "слишком много". 60 Для игр с количеством игроков большим шести, N–ядро можно вычислить, используя аппарат линейного программирования. Из соотношения (2.4.1) следует, что для нахождения N–ядра нужно в первую очередь максимизировать минимальную коалиционную прибыль min e( x, S ) max . SI xP (2.4.2) После введения дополнительной переменной z задача (2.4.2) сводится к задаче линейного программирования с (n+1) переменной и ( 2 n 1 ) ограничениями z max , iI xi = (I ) ; z iS xi (S ) , S 0 2 I \ \ I . (2.4.3) Оптимальное значение z 1 этой задачи равно величине первой компоненты вектора эксцессов N–ядра z 1 min e( , S ) . SI (2.4.4) Если задача (2.4.3) имеет единственное оптимальное решение ( z 1 , x 1 ), то оно является N–ядром. В противном случае, из оптимального множества нужно выбрать те дележи, которые максимизируют вторую по минимальности коалиционную прибыль. Для этого необходимо определить, на каких коалициях достигается минимум в соотношении (2.4.4) Рассмотрим двойственную к (2.4.3) задачу ( I ) ( I ) So (S ) (S ) min; (2.4.5) ( I ) ( I ) So ( S ) ( S ) 0 ; (2.4.6) 0 S0 (S ) 1; (S ) 0 , S ; (2.4.7) где (S ) - характеристический вектор коалиции S, 0 R n - нулевой вектор. Из (2.4.7) следует, что оптимальное решение 1 {1 ( S ), S 0 } двойственной задачи содержит по крайней мере одну положительную компоненту, поэтому 1 {S 0 : 1 ( S ) 0} . Используя условия дополняющей нежесткости, получаем, что e( , S ) z1 , S 1 , следовательно, для максимизации второй по минимальности коалиционной прибыли нужно решить задачу 61 z iS x i ( S ), S 0 \ 1 ; iI xi ( I ); z 1 iS x i ( S ), S 1 . z max, (2..4.8) Если она имеет единственное решение ( z 2 , x 2 ), то это N–ядро. В противном случае находим оптимальное решение 2 двойственной к (2.4.8) задачи, имеющей аналогичную (2.4.5)-(2.4.7) структуру и решаем новую задачу z max , iI xi = (I ) ; z iS xi (S ) , S 0 \ 1 \ 2 ; z 1 iS xi (S ) , S 1 ; z 2 iS xi (S ) , S 2 ; где 2 {S 0 \ 1 : 2 ( S ) 0} . Таким образом, на каждом этапе вычислений, по крайней мере, одно из ограничений-неравенств исходной задачи (2.4.3) заменяется ограничениемравенством. Вычисления заканчиваются, когда модифицированная задача будет иметь единственное решение. Это будет иметь место, например, когда получим n линейно независимых уравнений z k iS xi (S ) , S k , k 1, n . Пример 2.4.4. Дана игра трех лиц: (1)=1, (2)=(3)=0, (1,2)=5, (1,3)=1, (2,3)=0, (1,2,3)=8. Решаем соответствующую (2.4.3) задачу ЛП, исключив из ее ограничений зависимые неравенства (таблица 2.4.1, столбец 1). Затем решаем двойственную задачу (таблица 1, столбец 2) и находим 1 {S 0 : 1 ( S ) 0} ={{3},{1,2}}. Результаты решения этой пары двойственных задач ЛП определяют значения первых двух компонент вектора эксцессов N-ядра e()=(e(,{3}, e(,{1,2}),…)=(1.5, 1.5,…), то есть дополнительная прибыль коалиций {3} и {1,2} равна оптимальному значению z 1 =1.5 прямой задачи, а прибыли остальных коалиций S 0 \ 1 будет больше, чем z 1 . 62 Таблица 2.4.1. Задача 1 Двойственная задача min ( (1) 5 (1,2) 8 (1,2,3)) max z +z - 1 - x1 +z 0 - x2 - x3 - x1 - x2 x1 + x2 + x3 x1 0 +z 0 + z -5 = 8 x2 0 x3 0 z- Оптимальное x1 =(2.5, 4, 1.5), (1) 0 (2) 0 (3) 0 (1,2) 0 (1,2,3) - - (1) - (1,2) + (1,2,3) 0 - (2) - (1,2) + (1,2,3) 0 - (3) + (1,2,3) 0 =1 (1) + (2) + (3) + (1,2) 1 1 решение: Оптимальное решение: (1) = (2) =0, z 1 =1.5 1 (3) = 1 (1,2) = 1 (1,2,3) =0.5. Для вычисления значения второй по минимальности компоненты вектора эксцессов N-ядра решаем новую пары двойственных задач (таблица 2.4.2). Получаем: z 2 =2.75 – оптимальное значение прямой задачи: 2 ={{1},{2}} – множество коалиций, дополнительная прибыль которых равна z 2 ; e()=(e(,{3}, e(,{1,2}, e(,{1}, e(,{2}),…)=(1.5, 1.5, 2.75, 2.75,…) – значения первых четырех компонент вектора эксцессов N–ядра. Система ограничений новой задачи ЛП x1 =3.75, x2 =2.75, x3 =1.5, x1 + x2 =6.5, x1 + x2 + x3 =8, содержит три линейно независимые уравнения, то есть имеет единственное решение =(3.75,2.75,1.5). Полученный способ распределения общей полезности (I) между игроками гарантирует каждой коалиции SI положительный дополнительный доход: e(,{3})=e(,{1,2})=1.5, e(,{1})=e(,{2})=2.75, 63 e(,{1,3})= e(,{2,3})=4.25. Таблица 2.4.2. Задача 2 Двойственная задача min ( (1) 1.5 (3) 6.5 (1,2) 8 (1,2,3)) max z +z - 1 - x1 +z 0 - x2 x3 =1.5 x1 + x2 =8 x1 + x2 + x3 x1 0 x2 0 x3 0 z- = 6.5 Оптимальное решение: x 2 =(3.75,2.75,1.5), z 2 =2.75 (1) 0 (2) 0 (3) - (1,2) - (1,2,3) - - (1) + (1,2) + (1,2,3) 0 - (2) + (1,2) + (1,2,3) 0 + (1,2,3) 0 (3) =1 (1) + (2) Оптимальное решение: 2 (1) = 2 ( 2) =0.5, 2 (3) = 2 (1,2,3) =0, 2 (1,2) =0.5. Рис. 2.4.1. Графическая иллюстрация к примеру 2.4.4. Упражнения 2.4.2.1. Вычислить N-ядро выпуклой игры 64 (1) = ( 2 ) = ( 3) =2, (1,2) = (1,3) = ( 2,3) =5, (1,2,3) =9. 2.4.2.2. Вычислить N-ядро игры, приведенной в таблице 15, используя задачи линейного программирования. Вычислить вектор эксцессов N-ядра. Существует ли С-ядро у данной игры? Вычислить пропорциональное N-ядро. Вычислить взвешенное N-ядро. 65 Литература 1. Фон Нейман Дж. Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970. 2. Таха Х. Введение в исследование операций. Том 2. М.: Мир. 1985. 3. Исследование операций. Методологические основы и математические ме- тоды (под редакцией Дж. Моулера и С. Элмаграби). Том 1. М.: Мир. 1988. 4. Кофман А., Анри-Лабордер А. Методы и модели исследования операций. М.: Мир. 1977. 5. Свами М., Тхуласираман К. Графы, сети и алгоритмы. М.: Мир. 1984. 6. Шрейдер ЮА. Равенство, сходство, порядок. М.: Наука. 1971. 7. Фишберн П. Теория полезности для принятия решений. М.: Наука. 1978. 8. Волошин Г.Я. Методы оптимизации в экономике. М.: Дело и сервис. 2004. 9. Сапир Ж. Новые подходы теории индивидуальных предпочтений и ее след- ствия // Экономический журнал ВШЭ. № 3. 2005. С. 325-360. 10. Expected Utility Hypotheses and the Allais Paradox / M. Allais, O. Hagen (åds.). Dordrecht: Reidel, 1979. 11. Шапкин А. С. Экономические и финансовые риски: оценка, управление, портфель инвестиций. М.: Дашков и Ко, 2003. 12. Ларичев О.И. Теория и методы принятия решений. М.: Логос. 2000. 13. Kaneko M., Wooders M. H. Utility Theory in Cooperative Games. Handbook of Utility Theory. P. Hammond and C. Seidel eds., Klauwer Academic Press. 1997 14. Мулен Э. Теория игр с примерами из математической экономики. М.: Мир. 1985. 15. Мулен Э. Кооперативное принятие решений: аксиомы и модели. М.: Мир. 1991. 66 16. Робертс Ф.С. Дискретные математические модели с приложениями к социологическим, биологическим и экологическим задачам. М., 1986. 17. Розенмюллер И. Кооперативные игры и рынки. М.: Мир. 1974 18. Губко М.В. Кооперативная модель формирования торговой сети // Труды МНПК Современные сложные системы управления (СССУ/НТСS 2004). Тверь: ТГТУ. 2004. 19. Жак С.В., Зинченко А.Б. Согласование внутренних цен предприятий как кооперативная игра с побочными платежами // Изв. вузов. Сев.-Кавк. регион. Естеств. науки, №4, 2001. 20. Ball M.A. Outline of the superplayer theory of coalitions. In Proceedings ICM2002GTA. 2002. Р. 35-40. 21. Branzei R., Dimitrov D., Tijs S. Egalitarianism in convex fuzzy games // Working Papers 337, University of Bielefeld, Institute of Mathematical Economics, 2002. 22. Bom P.E.M., Megen F.G.C., Tijs S.H. A perfectness concept fjr multicreteria games // Mathematical Methods of Operations Research. 49(3). 1999. P.401-412. 23. Fernandez F., Hinojosa M, Puerto J. Multi – criteria minimum cost spanning tree games // Eur. J. Oper. Res, 2004, v.158, n.2. P.399-408. 24. Hwang Y.A., Sudholter P. An Axiomatization of the Core on the Universal Domain and other Natural Domains // International Journal of Game Theory. 2001. P.597-623. 25. Sun H. Contributions to set game theory. Twente University Press, China. 2003. 26. Tijs S.H., Meca A., Lopez M.A. Benefit shaning in holding situations // European Journal of Operational Research. 162(1). 2005. P. 251-269. 27. Tijs S.H., Gelekom J.R.G., Potters J.A.M., Reijnierse J.H., Engel M.C/ Characterization of the Owen set of linear production processes // Games and Economic Behavior. 32(1). 2000. P.139-156. 28. Петросян Л.П., Зенкевич Н.А., Семина Е.А.Теория игр (учебное пособие для университетов). СПб . 1998. 29. Печерский С.Л., Беляева А.А. Теория игр для экономистов. Вводный курс. Учебное пособие. СПб.: Европейский университет в СПб. 2001. 67 30. Данилов В.И. Лекции по теории игр. М.: Российская экономическая школа. 2002. 31. Васин А.А., Морозов В.В. Теория игр и модели математической экономики. М.: Макс-Пресс. 2005. 32. Кукушкин Н.С., Морозов В.В. Теория неантагонистических игр. М.: Наука. 1984 33. Воробьев Н.Н. Теория игр для экономистов-кибернетиков. 1985. 34. Дюбин Г.Н., Суздаль В.С. Введение в прикладную теорию игр.1981 35. Оуэн Г. Теория игр. М.: Мир. 1971. 36. Owen G. Game Theory. New York. Academic Press. 1982. 37. Петросян Л.П., Зенкевич Н.А., Семина Е.А.Теория игр (учебное пособие для университетов). 1998. 38. Bhattacharya A. On the equal division core // Social Choice and Welfare. 2. 2004. Р.391-399. 68