С позиций третьего лица - «арбитра» игра двух лиц с целевыми функциями
может трактоваться как многокритериальная (в данном случае - двухкритериальная) задача оптимизации на множестве
Аргументом при этом является вектор hÎL:
h=(А, В),
а задача (2.1) принимает обычный вид многокритериальной задачи:
Определение. Будем называть точку устойчивым решением или точкой равновесия игры (2.1), если
При выборе устойчивого решения говорят так же, что достигнута ситуация равновесия.
Из приведенного определения непосредственно следует, что неустойчивость какой-либо ситуации проявляется в том, что в случае её возникновения ей грозит распад, который обусловлен возможностями одного из игроков путём изменения только своей стратегии улучшить своё положение за счёт других игроков. На этом основании возник так называемый принцип устойчивости Нэша (по имени американского математика Джона Нэша). Он гласит, что выбор рациональной стратегии h должен производиться среди точек равновесия. Равновесные решения также называются оптимальными по Нэшу. Данный принцип отражает очень важное свойство коллективного решения: если субъекты А и В смогли договориться о том, чтобы придерживаться стратегий и , соответственно, то тот субъект, который нарушает договоренность, прежде всего и пострадает. Свойство устойчивости решения дает известную гарантию против нарушения договоренности (всё вышеизложенное справедливо и для случая N игроков, где N>2).
Пример 2.1.
Игра задана с помощью таблицы 2, где пары чисел на пересечении строк и столбцов означают выигрыши игроков А и В, соответственно.
Таблица 2
В A | B1 | B2 | B3 | B4 |
A1 | (2, 4) | (7, 5) | (-3, 3) | (6, 2) |
A2 | (5, 9) | (4, 2) | (2, 6) | (7, 5) |
A3 | (6, 1) | (6, 4) | (10, 6) | (8, 7) |
Определить пары стратегий, устойчивых по Нэшу.
Р е ш е н и е
а). В соответствии с (2.3) сначала находим максимальное значение выигрыша игрока В в каждой из строк и соответствующий номер стратегии игрока В.
б). Затем аналогичные действия надо реализовать для игрока А.
в). Теперь необходимо проанализировать, имеются ли совпадающие пары индексов (i, k) в строках пунктов а) и б). В нашем примере таких пар две: (i=1, k=2) и (i=3, k=4). Следовательно, в данной игре имеется множество устойчивых по решений
{(А1, В2) и (А3, B4)} (2.4)
г). Найденное в пункте в) первое устойчивое решение (А1, В2) проверим на выполнение свойства коллективного решения (если оба субъекта смогли договориться о том, чтобы придерживаться стратегий и , соответственно, то тот субъект, который нарушает договоренность, прежде всего и пострадает). Оценкой первого устойчивого решения для игрока А является
Если игрок А изменит выбранную стратегию А1 на стратегию А2 или А3, его выигрыши составят, соответственно
V(A2, B2)=4<V(A1, B2)=7
то есть, такие действия игрока А приведут в обоих случаях к уменьшению его выигрыша.
Оценкой первого устойчивого решения для игрока В является
Если игрок В изменит выбранную стратегию В2 на стратегию В1 или В3, или В4, его выигрыши составят, соответственно
W(A1, B1)=4<W(A1, B2)=5
или W(A1, B3)=3<W(A1, B2)=5,
или W(A1, B4)=2<W(A1, B2)=5,
то есть, подтвердилось, что такие действия игрока В приведут во всех трёх случаях к уменьшению его выигрыша.
д). Найденное в пункте в) второе устойчивое решение (А3, B4) проверим на выполнение свойства коллективного решения. Оценкой второго устойчивого решения для игрока А является
Если игрок А изменит выбранную стратегию А3 на стратегию А1 или А2, его выигрыши составят, соответственно
V(A1, B4)=6<V(A3, B4)=8
то есть, такие действия игрока А приведут в обоих случаях к уменьшению его выигрыша.
Оценкой второго устойчивого решения для игрока В является
Если игрок В изменит выбранную стратегию В4 на стратегию В1 или В2, или В3, его выигрыши составят, соответственно
W(A3, B1)=1<W(A3, B4)=7
или W(A3, B2)=4<W(A3, B4)=7,
или W(A3, B3)=6<W(A3, B4)=7,
то есть, подтвердилось, что такие действия игрока В приведут во всех трёх случаях к уменьшению его выигрыша.
Ответ: в биматричной игре (таблица 2) найдено множество устойчивых решений {(А1, В2), (А3, B4)} с оценками исходов {(7, 5), (8, 7)}, соответственно.
Замечание. Аналогично тому, как в матричных играх мы искали равновесную ситуацию в смешанных стратегиях [1], в биматричных играх также возможна равновесная ситуация в смешанных стратегиях, причем известна теорема Нэша [2], которая утверждает следующее: «Всякая биматричная игра имеет хотя бы одну ситуацию (точку равновесия) в смешанных стратегиях». Однако в связи с недостатком времени этот вопрос в рамках дисциплины «Теория оптимальных решений» не рассматривается.
2.3.1. Какое решение называется устойчивым по Нэшу?
2.3.2. Как формулируется свойство коллективного решения в контексте задачи поиска устойчивых решений?
2.3.3. Какой вид будут иметь формулы (2.3), если элементы матрицы вида (1.3) будут представлять потери игроков А и В, соответственно?
2.4.1. Вычислить устойчивые решения, если в примере 2.1 биматричная игра задана потерями игроков А и В.
2.4.2. Биматричная игра задана платежными матрицами выигрышей игроков А и В (задача 1.4.1). Вычислить устойчивые решения для вариантов a), b),и c).
2.4.3. Биматричная игра задана платежными матрицами потерь игроков А и В (задача 1.4.1). Вычислить устойчивые решения для вариантов a), b), c) e) и f).
Замечание. При вычислении устойчивых решений каждый результат необходимо проверить на выполнение свойства коллективного решения.
0 коммент.:
Отправить комментарий