В связи с тем, что исход выбора игроком А решения зависит от выбора решения игроком В, необходимо сделать какие-то предположения о его возможном поведении в процессе решения задачи. Правомерность подобных предположений (гипотез) впрямую зависит от характера информированности сторон о поведении другой стороны. Будем различать следующие основные гипотезы (случаи).
Гипотеза 1. Каждый из субьектов А и В не имеет информации о выборе, который сделан второй стороной. Дополнительные гипотезы о характере поведения второго игрока отсутствуют. В этом случае можно поступать аналогично решению задачи в условиях полной неопределенности. Это, по-существу, в точности тот же случай, и мы можем воспользоваться известным принципом наилучшего гарантированного результата. Для субьекта А гарантированная оценка будет равна
Этому решению соответствует стратегия .
Гипотеза 2. Предполагаем, что субъект B следует принципу максимина и выбирает B* из условия
Тогда мы можем выбирать V** согласно правилу
где - гарантирующее решение второго игрока. Обозначим решение задачи (1.7) через . При этом выполняется свойство решения по гипотезе 2, оценка исхода которого не хуже оценки исхода по гипотезе 1:
V**=V(A**, B*) ³ V*, (1.8)
где V* - наша гарантированная оценка (1.5), получаемая по принципу максимина (гипотеза 1).
Гипотеза 3. Теперь можно допустить, что субъект B рассуждает точно так же, как и мы в предыдущем случае (в соответствии с гипотезой 2), т.е. использует не стратегию B*, а аналогичную стратегию . Мы можем это учесть и выбирать оптимальное решение с учетом уже этой гипотезы:
Гипотеза 4. Возможен другой сорт гипотез: мы по условиям игры знаем первый ход субъекта B (он нам его обязан сообщить). Тогда наше поведение будет определяться стратегией в виде функции A=A(B). Мы можем ее определить в результате решения задачи оптимизации
Условие (1.10) позволяет для каждого фиксированного Bk, k=1,2,…,n, определить искомую стратегию A, т.е. задать функцию A(B).
Для этого случая мы можем определить гарантированный результат:
Результат будет отличаться от значения V*, найденного согласно гипотезе 1. Именно, во всех случаях будем иметь
Таким образом, принятие гипотезы 4 вновь позволяет улучшить решение, полученное по принципу максиминного гарантированного результата.
Гипотеза 5. Пусть субъект В знает наш первый ход. В этом случае естественно предположить, что он будет придерживаться стратегии B=B(A), которая строится в результате решения оптимизационной задачи
(именно так мы и поступали при принятии гипотезы 4). Принятие этих допущений, т.е. допущения о том, что мы сообщили свой ход субъекту В, а также допущения об использовании им стратегии B(A) позволяет нам таким образом воздействовать на выбор субъекта В, чтобы он в максимальной степени соответствовал нашим целям. Именно, мы можем выбирать A из условия
Замечание. Если максимум в соотношении (1.14) достигается не в одной точке Bk, а на некотором множестве M(A), то наш гарантированный результат определяется из условия:
Такая ситуация возникает при решении задачи 1.4.1, варианты e) и f).
Общим для всех рассмотренных случаев (гипотезы 1…5) является предположение, что обе стороны, участвующие в игре, не только точно знают свои цели, но и полностью информированы о целевых функциях «противника» или партнера по игре. Для реальных конфликтных ситуаций это не всегда выполняется. Гораздо чаще мы не знаем точно целей наших партнеров, которые, в свою очередь, имеют ограниченную информацию о наших намерениях. Кроме того, необходимо учитывать и возможную сознательную дезинформацию, «блеф» со стороны каждого из игроков, да и игроков может быть не два, а больше. Формальные модели указанных, а также других игровых ситуаций могут быть построены, но соответствующий материал выходит за рамки данных методических указаний.
Пример 1.1.
Игра задана с помощью таблицы 1, где пары чисел на пересечении строк и столбцов означают выигрыши игроков А и В, соответственно.
Таблица 1
В A | B1 | B2 | B3 |
A1 | (5, 6) | (7, 5) | (-4, 16) |
A2 | (3, -7) | (4, 7) | (2, 6) |
A3 | (-2, 15) | (1, 4) | (14, 11) |
Вычислить оптимальные альтернативы игрока А, пользуясь гипотезами 1…5. Провести анализ результатов.
Р е ш е н и е
При иллюстрации решений опустим комментарии относительно сути применяемых гипотез в связи с тем, что они, также как и формулы в общем виде, приведены выше. Студенты при выполнении заданий должны сопровождать свои решения необходимыми комментариями в полном объеме.
Гипотеза 1
На основании (1.5) получаем:
Согласно гипотезе 1 оптимальным решением является стратегия А2 с оценкой исхода в 2 единицы.
Гипотеза 2
Согласно (1.6) рассчитаем за игрока В его гарантирующее решение:
Для игрока В имеем гарантирующую стратегию В*=В3, а гарантирующую оценку - W*=6.
Теперь, согласно (1.7), находим
Согласно гипотезе 2 оптимальным решением является стратегия А3 с оценкой исхода в 14 единиц. При этом подтвердилось свойство (1.8) решения по гипотезе 2:
V**=14 > V*=2.
Гипотеза 3
Аналогично (1.7) для игрока А (гипотеза 2) рассчитаем для игрока В решение В**:
Так как по первой гипотезе А*=А2,
W**= W(A2, B**)=max{-7, 7, 6}=7 B**=B2.
Обращаем внимание, что по аналогии с (1.8) для игрока В выполняется свойство
W**=7>W*=6.
В соответствии с (1.9)
V***=V(A***, B2)=max{7, 4, 1}=7A***=A1.
Согласно гипотезе 3 оптимальным решением игрока А является стратегия А1 с оценкой исхода в 7 единиц.
Гипотеза 4
Так как игрок В должен сообщить свой ход, для каждой стратегии Bk, мы можем выбрать самую благоприятную для игрока А стратегию, а именно
B1: maxV(A, B1)=max{5, 3, -2}=5=V(A1, B1);
B2: maxV(A, B2)=max{7, 4, 1}=7=V(A1, B2);
B3: maxV(A, B3)=max{-4, 2, 14}=14=V(A3, B3).
В этом случае гарантированный результат согласно (1.11)
При этом подтвердилось свойство (1.12) решения по гипотезе 4:
Гипотеза 5
Если мы сообщим субъекту В свой ход А1, игрок В выберет
при этом мы получим выигрыш V(A1, B3)=-4.
Далее аналогично
A2: =max{-7, 7, 6}=7 V(A2, B2)=4.
A3: =max{15, 4, 11}=15 V(A3, B1)= -2.
Окончательное решение по гипотезе 5:
Анализ результатов
При принятии решения в соответствии с гипотезой 1 наша гарантирующая стратегия - A*=A2, а гарантированная оценка - V*=V(A2,B3)= 2 (если бы мы выбрали другое решение, отличное от А2, то могли бы, в зависимости от действий игрока В, получить и меньшее значение выигрыша, чем 2). Стратегия А2 является решением и по гипотезе 5, при этом выигрыш игрока А составляет =V(A2, B2)=4.
При использовании гипотезы 2 оптимальной является альтернатива А**=А3, таким образом, получило подтверждение неравенство (1.8):
V**=V(A3, B3)=14>V*=V(A2, B3)=2.
В соответствии с гипотезой 3 оптимальной является альтернатива A***=A1 с оценкой V***=V(A1, B2)=7. Стратегия А1 также является оптимальной при использовании гипотезы 4, при этом гарантированный результат составляет
Пример 1.2. Применение гипотез для игры с нулевой суммой
В соответствии с (1.4) игра с нулевой суммой задана платежной матрицей выигрышей игрока А:
Вычислить оптимальные альтернативы игрока А, пользуясь гипотезами 1…3.
Р е ш е н и е
Гипотеза 1
В игре с нулевой суммой решение по гипотезе 1 ничем не отличается от решения для обычной биматричной игры. На основании (1.5) получаем:
Согласно гипотезе 1 оптимальным решением является стратегия А4 с оценкой исхода в 7 единиц.
Гипотеза 2
В игре с нулевой суммой для игрока В элементы аik матрицы А представляют собой потери, поэтому вместо принципа максимина (1.6) необходимо применить принцип минимакса:
и рассчитать за игрока В его гарантирующее решение:
Для игрока В имеем гарантирующую стратегию В*=В2, а гарантированную оценку - W*=8.
Теперь, согласно (1.7), находим
Согласно гипотезе 2 оптимальным решением является стратегия А4 с оценкой исхода в 8 единиц. При этом подтвердилось свойство (1.8) решения по гипотезе 2:
V**=8 > V*=7.
Гипотеза 3
Аналогично (1.16) с учетом матрицы потерь для игрока В рассчитаем решение
Так как по первой гипотезе А*=А4,
Обращаем внимание, что по аналогии с (1.8) с учетом того, что для игрока В матрица А является матрицей потерь,
W**=7<W*=8.
В соответствии с (1.9)
V***=V(A***, B1)=max{12, -6, -8, 7}=12A***=A1.
Согласно гипотезе 3 оптимальным решением игрока А является стратегия А1 с оценкой исхода в 12 единиц.
Анализ результатов
При принятии решения в соответствии с гипотезой 1 наша гарантирующая стратегия - A*=A4, а гарантированная оценка - V*=V(A4,B1)= 7 (если бы мы выбрали другое решение, отличное от А4, то могли бы, в зависимости от действий игрока Б, получить и меньшее значение выигрыша, чем 7).
При использовании гипотезы 2 оптимальной является альтернатива А**=А4 с оценкой исхода V**=8, таким образом, получило подтверждение неравенство (1.8):
V**=V(A4, B2)=8>V*=V(A4, B1)=7.
Анализируя вычисления, можно прийти к выводу: в игре с нулевой суммой оценка решения по гипотезе 2 для игрока А совпадает с гарантированной оценкой игрока Б, полученной им при реализации принципа минимакса (объясните, почему?).
В соответствии с гипотезой 3 оптимальной является альтернатива A***=A1 с оценкой исхода V***=V(A1, B1)=12.
Отметим, что при использовании гипотез 1 и 2 оптимальной является одна и та же стратегия А4, но с разными оценками исходов.
1.3.1. Какой вид имеет платежная матрица биматричной игры?
1.3.2. Как с позиций биматричной игры можно интерпретировать игру с нулевой суммой?
1.3.3. Какой вид будут иметь формулы (1.5)…(1.15), если элементы матрицы вида (1.3) будут представлять потери игроков А и Б, соответственно?
1.3.4. Какой вид будут иметь формулы (1.5)…(1.9), если задана игра с нулевой суммой, представленная матрицей выигрышей игрока А?
1.3.5. Какой вид будут иметь формулы (1.5)…(1.9), если задана игра с нулевой суммой, представленная матрицей потерь игрока А?
1.3.6. Игра с нулевой суммой задана матрицей А. Получены решения с помощью трех первых гипотез. Ответьте на вопросы:
a) С каким из них совпадет решение по гипотезе 4?
b) С каким из них совпадет решение по гипотезе 5?
0 коммент.:
Отправить комментарий