ТЕОРИЯ ИГР

Теория игр • Теория игр – это совокупность математических методов анализа и оценки конфликтных ситуаций. • Задача теории игр состоит в выборе такой линии поведения игрока, отклонение от которой может лишь уменьшить его выигрыш. • Моделями теории игр можно описать экономические, правовые, классовые, военные конфликты, взаимодействие человека с природой. • Все такие модели в теории игр принято называть играми. Если имеется несколько конфликтующих сторон(лиц),каждая из которых принимает некоторое решение, определяемое заданным набором правил, и каждому из лиц известно возможное конечное состояние конфликтной ситуации с заранее определенными для каждой из сторон платежами, то говорят, что имеет место игра Определения 1.Ситуация наз-ся конфликтной, если в ней участвуют стороны, интересы которых полностью или частично противоположны. 2. Игра - это действительный или формальный конфликт, в котором имеется по крайне мере два участника, каждый из которых стремится к достижению собственных целей. 3. Допустимые действия каждого из игроков, направленные на достижение некоторой цели, называются правилами игры. 4. Количественная оценка результатов игры называется платежом. 5.Игра называется парной , если в ней участвуют только два лица. 6. Парная игра называется игрой с нулевой суммой, если проигрыш одного игрока равен выигрышу второго. 7. Однозначное описание выбора игрока в каждой из возможных ситуаций, при которой он должен сделать личный ход, называется стратегией игрока. 8.Стратегия игрока называется оптимальной, если при многократном повторении игры она обеспечивает игроку максимально возможный средний выигрыш ( минимально возможнай средний проигрыш). • Рассмотрим простейшую модель – игру, в которой участвуют два игрока, множество стратегий каждого игрока конечно, а выигрыш одного игрока равен проигрышу другого (бескоалиционная, конечная, антагонистическая игра двух лиц). • Такую игру называют матричной. • Пусть 1-й игрок имеет всего m стратегий (i=1,2, …, m), а 2-й – n стратегий (j=1,2,…, n). • Тогда игра полностью определяется заданием матрицы A  aij mn, где aij – выигрыш 1-го игрока при условии, что он выбрал стратегию i (т.е. строку) а 2-й игрок – стратегию j (т.е. столбец). Эти стратегии называют чистыми). • Матрица А называется матрицей игры или платежной матрицей.  mn A  aij max aij i v Схема: a12  a1n  min a   a11   j 1j  a  a 22  a 2 n min a 2 j  21   j  А min aij  v     max j i         a m1 am 2  a mn min a mj    j    max ai1 max ai 2  max ain i  ii min max aij  v j i • Например,  2 3 4 3   А    3 4  5   5  v  3  4 5 6 5   4 4 6 v4 • Соответствующие стратегии: i0=1(максиминная), j0=1;2 (минимаксная). Теорема. Нижняя цена игры всегда не превосходит верхней цены игры: vv • Например,   5 3 1 20   5   А 5 5 4 6  4  v  v  4.   4  2 0  5  5   5 5 4 20 • (2,3)-ситуация равновесная, v =4 – цена игры, i*=2, j*=3 – оптимальные стратегии 1-го и 2-го игроков. Выбрав их, 1-й игрок обеспечит себе выигрыш не менее 4 ед., а 2-й игрок проиграет не более 4 ед. при любом выборе другого игрока. Опр. Вектор, каждая из компонент которого показывает относительную частоту (вероятность) использования игроком соответствующей чистой стратегии, называется смешанной стратегией данного игрока. xi  0 m  xi  1 i 1 n yj  0 yj j 1 1 𝑚 𝑎𝑖𝑗 𝑥𝑖∗ ≥ 𝜈 (𝑗 = 1,2, … , 𝑛) 𝑎𝑖𝑗 𝑦𝑗∗ ≤ 𝜈 (𝑖 = 1,2, … , 𝑚) 𝑖=1 𝑛 𝑗 =1  a11 a12   – платежная матрица • Пусть А    a21 a22  игры . Если она не имеет седловой точки, то единственное решение игры можно найти • 1) решив две системы: a11 y1  a12 y 2  v,  a21 y1  a22 y 2  v,  y  y  1; 2  1 a11x1  a21x2  v,  a12 x1  a22 x2  v,  x  x  1;  1 2 • 2) по формулам: a22  a21 x1  a11  a22  a12  a21 a11  a12 x2  a11  a22  a12  a21 или x2  1  x1 a22  a12 y1  a11  a22  a12  a21 или y2  1  y1 a11a22  a12 a21 v a11  a22  a12  a21 a11  a21 y2  a11  a22  a12  a21 • Найдем, например, решение игры с платежной матрицей  3  1  А    2 4 имеет седловой точки. , которая не • 1) Составим системы: 3x1  2 x2  v,   x1  4 x2  v,  x  x  1.  1 2 3 y1  y 2  v,  2 y1  4 y 2  v,  y  y  1. 2  1 • Решив системы, получим: y1  5 6 y2  1 6 x1  1 3 2 x2  3 7 v 3 7 1 2 * 5 1 • то есть x   ;  y   ;  v  -решение игры. 6 6 3 3 3 * • 2) Найдем решение по формулам: 42 2 1 x1    3  4  2 1 6 3 1 2 x2  1   3 3 4 1 5 y1   3  4  2 1 6 5 1 y2  1   6 6 3  4  2 1 14 7 v   3  4  2 1 6 3 Сведение матричной игры к двойственной задаче линейного программирования • Пусть матрица игры имеет вид  a11   a 21 А ...  a  m1 a12 a 22 ... am 2 a1n   a2n  ... ...   ... a mn  ... ... a11x1  a21x2  ...  am1 xm  v,  a12 x1  a22 x2  ...  am 2 xm  v,         a1n x1  a2 n x2  ...  amn xm  v,  x1  x2  ...  xm  1,   xi  0, i  1,2,..., m. a11 p1  a 21 p 2  ...  a m1 p m  1,  a12 p1  a 22 p 2  ...  am 2 pm  1,         a p  a p  ...  a p  1, mn m 2n 2  1n 1  pi  0, i  1,2,..., m; 1 p1  p 2  ...  p m   min v a11 p1  a21 p2  ...  am1 pm  1, a p  a p  ...  a p  1, m2 m  12 1 22 2        a p  a p  ...  a p  1, mn m  1n 1 2 n 2  pi  0, i  1,2,...,m; a11 y1  a12 y 2  ...  a1n y n  v,  a21 y1  a22 y 2  ...  a2n y n  v,         am1 y1  am 2 y 2  ...  amn y n  v,  y1  y 2  ...  y n  1,   y j  0, j  1,2,..., n. (1) a11q1  a12 q2  ...  a1n qn  1,  a21q1  a22 q2  ...  a2 n qn  1,         a q  a q  ...  a q  1, mn n  m1 1 m 2 2 q j  0, j  1,2,..., n; 1 q1  q2  ...  qn   max v a11q1  a12 q2  ...  a1n qn  1,  a21q1  a22 q2  ...  a2 n qn  1,         a q  a q  ...  a q  1, m2 2 mn n  m1 1 q j  0, j  1,2,..., n; • Пример. Найти решение игры с матрицей   2  2 0   А   2 0  1  0  1  1   • Решение. Перейдем к положительной матрице, прибавив 3 ко всем элементам матрицы А: 1 1 3   А   1 3 2  3 2 2   • Составим двойственную задачу линейного программирования: q1  q 2  3q3  1,  q1  3q 2  2q3  1,  3q1  2q 2  2q3  1, q j  0, j  1,2,3;  1 q1  q 2  q3   max v  p1  p 2  3 p3  1,   p1  3 p 2  2 p3  1,  3 p1  2 p 2  2 p3  1,  pi  0, i  1,2,3; 1 p1  p 2  p3   min v • Решим задачу симплексным методом q1  q 2  3q3  q 4  1,  q1  3q 2  2q3  q5  1, 3q  2q  2q  q  1, 2 3 6  1 q  0, j  1,6;  j 1 q1  q 2  q3   max v 1 1 0 0 0 q1 q2 q3 q4 q5 q6 С0 P0 q4 0 1 1 1 3 1 0 0 q5 0 1 1 3 2 0 1 0 q6 0 1 3 2 2 0 0 1 0 -1 -1 -1 0 0 0 Базис 1-я итерация 1 1 1 0 0 0 q1 q2 q3 q4 q5 q6 С0 P0 q4 0 2/3 0 1/3 7/3 1 0 -1/3 q5 0 2/3 0 7/3 4/3 0 1 -1/3 q1 1 1/3 1 2/3 2/3 0 0 1/3 0 0 -1/3 -1/3 0 0 1/3 Базис 2-я итерация 1 1 1 0 0 0 q1 q2 q3 q4 q5 q6 С0 P0 q4 0 4/7 0 0 15/7 1 -1/7 -2/7 q2 1 2/7 0 1 4/7 0 3/7 -1/7 q1 1 1/7 1 0 2/7 0 -2/7 3/7 3/7 0 0 -1/7 0 1/7 2/7 Базис 3-я итерация 1 1 1 0 0 0 q1 q2 q3 q4 q5 q6 С0 P0 q3 1 4/15 0 0 1 7/15 -1/15 -2/15 q2 1 2/15 0 1 0 -4/15 7/15 -1/15 q1 1 1/15 1 0 0 -2/15 -4/15 7/15 7/15 0 0 0 1/15 2/15 4/15 Базис 4-я итерация 1 • Получаем решение двойственной задачи: 1 2 4 p ; ;   15 15 15   1 2 4 q ; ;   15 15 15  1 7  v 15 • Тогда решение игры с матрицей 1 2 4 y   ; ;  7 7 7 1 2 4 x   ; ;  7 7 7 • Решение исходной игры: 1 2 4 x  ; ;  7 7 7 * 1 2 4 y  ; ;  7 7 7 * 6 v 7 A 15 v 7

ТЕОРИЯ ИГР

Похожие документы

Разделы

Поддержка

ТЕОРИЯ ИГР

Похожие документы

Добавить этот документ в коллекции

Добавить этот документ в сохраненные

Предложите, как улучшить StudyLib