Устойчивость по Нэшу

|

 

С позиций третьего лица - «арбитра» игра двух лиц с целевыми функциями

clip_image002 (2.1)

может трактоваться как многокритериальная (в данном случае - двухкритериальная) задача оптимизации на множестве

clip_image004.

Аргументом при этом является вектор hÎL:

h=(А, В),

а задача (2.1) принимает обычный вид многокритериальной задачи:

clip_image006 (2.2)

Определение. Будем называть точку clip_image008 устойчивым решением или точкой равновесия игры (2.1), если

clip_image010clip_image012clip_image014 (2.3)

При выборе устойчивого решения clip_image016 говорят так же, что достигнута ситуация равновесия.

Из приведенного определения непосредственно следует, что неустойчивость какой-либо ситуации проявляется в том, что в случае её возникновения ей грозит распад, который обусловлен возможностями одного из игроков путём изменения только своей стратегии улучшить своё положение за счёт других игроков. На этом основании возник так называемый принцип устойчивости Нэша (по имени американского математика Джона Нэша). Он гласит, что выбор рациональной стратегии h должен производиться среди точек равновесия. Равновесные решения также называются оптимальными по Нэшу. Данный принцип отражает очень важное свойство коллективного решения: если субъекты А и В смогли договориться о том, чтобы придерживаться стратегий clip_image018и clip_image020, соответственно, то тот субъект, который нарушает договоренность, прежде всего и пострадает. Свойство устойчивости решения дает известную гарантию против нарушения договоренности (всё вышеизложенное справедливо и для случая N игроков, где N>2).

Пример 2.1.

Игра задана с помощью таблицы 2, где пары чисел на пересечении строк и столбцов означают выигрыши игроков А и В, соответственно.

Таблица 2

В

A

B1

B2

B3

B4

A1

(2, 4)

(7, 5)

(-3, 3)

(6, 2)

A2

(5, 9)

(4, 2)

(2, 6)

(7, 5)

A3

(6, 1)

(6, 4)

(10, 6)

(8, 7)

Определить пары стратегий, устойчивых по Нэшу.

Р е ш е н и е

а). В соответствии с (2.3) сначала находим максимальное значение выигрыша игрока В в каждой из строк и соответствующий номер стратегии игрока В.

Для k=1: clip_image022

для k=2: clip_image024

для k=3: clip_image026

для k=4: clip_image028

б). Затем аналогичные действия надо реализовать для игрока А.

Для i=1: clip_image030

для i=2: clip_image032

для i=3: clip_image034

в). Теперь необходимо проанализировать, имеются ли совпадающие пары индексов (i, k) в строках пунктов а) и б). В нашем примере таких пар две: (i=1, k=2) и (i=3, k=4). Следовательно, в данной игре имеется множество устойчивых по решений

{(А1, В2) и (А3, B4)} (2.4)

г). Найденное в пункте в) первое устойчивое решение (А1, В2) проверим на выполнение свойства коллективного решения (если оба субъекта смогли договориться о том, чтобы придерживаться стратегий clip_image018[1]и clip_image020[1], соответственно, то тот субъект, который нарушает договоренность, прежде всего и пострадает). Оценкой первого устойчивого решения для игрока А является

clip_image038=V(A1, B2)=7.

Если игрок А изменит выбранную стратегию А1 на стратегию А2 или А3, его выигрыши составят, соответственно

V(A2, B2)=4<V(A1, B2)=7

или V(A3, B2)=6<clip_image040=7,

то есть, такие действия игрока А приведут в обоих случаях к уменьшению его выигрыша.

Оценкой первого устойчивого решения для игрока В является

clip_image042= W(A1, B2)=5.

Если игрок В изменит выбранную стратегию В2 на стратегию В1 или В3, или В4, его выигрыши составят, соответственно

W(A1, B1)=4<W(A1, B2)=5

или W(A1, B3)=3<W(A1, B2)=5,

или W(A1, B4)=2<W(A1, B2)=5,

то есть, подтвердилось, что такие действия игрока В приведут во всех трёх случаях к уменьшению его выигрыша.

д). Найденное в пункте в) второе устойчивое решение (А3, B4) проверим на выполнение свойства коллективного решения. Оценкой второго устойчивого решения для игрока А является

clip_image038[1]=V(А3, B4)=8.

Если игрок А изменит выбранную стратегию А3 на стратегию А1 или А2, его выигрыши составят, соответственно

V(A1, B4)=6<V(A3, B4)=8

или V(A2, B4)=7<clip_image040[1]=8,

то есть, такие действия игрока А приведут в обоих случаях к уменьшению его выигрыша.

Оценкой второго устойчивого решения для игрока В является

clip_image042[1]= W(A3, B4)=7.

Если игрок В изменит выбранную стратегию В4 на стратегию В1 или В2, или В3, его выигрыши составят, соответственно

W(A3, B1)=1<W(A3, B4)=7

или W(A3, B2)=4<W(A3, B4)=7,

или W(A3, B3)=6<W(A3, B4)=7,

то есть, подтвердилось, что такие действия игрока В приведут во всех трёх случаях к уменьшению его выигрыша.

Ответ: в биматричной игре (таблица 2) найдено множество устойчивых решений {(А1, В2), (А3, B4)} с оценками исходов {(7, 5), (8, 7)}, соответственно.

Замечание. Аналогично тому, как в матричных играх мы искали равновесную ситуацию в смешанных стратегиях [1], в биматричных играх также возможна равновесная ситуация в смешанных стратегиях, причем известна теорема Нэша [2], которая утверждает следующее: «Всякая биматричная игра имеет хотя бы одну ситуацию (точку равновесия) в смешанных стратегиях». Однако в связи с недостатком времени этот вопрос в рамках дисциплины «Теория оптимальных решений» не рассматривается.

2.2. Контрольные вопросы

2.3.1. Какое решение называется устойчивым по Нэшу?

2.3.2. Как формулируется свойство коллективного решения в контексте задачи поиска устойчивых решений?

2.3.3. Какой вид будут иметь формулы (2.3), если элементы матрицы вида (1.3) будут представлять потери игроков А и В, соответственно?

2.3. Список задач

2.4.1. Вычислить устойчивые решения, если в примере 2.1 биматричная игра задана потерями игроков А и В.

2.4.2. Биматричная игра задана платежными матрицами выигрышей игроков А и В (задача 1.4.1). Вычислить устойчивые решения для вариантов a), b),и c).

2.4.3. Биматричная игра задана платежными матрицами потерь игроков А и В (задача 1.4.1). Вычислить устойчивые решения для вариантов a), b), c) e) и f).

Замечание. При вычислении устойчивых решений каждый результат необходимо проверить на выполнение свойства коллективного решения.

Предлагаю ознакомиться с аналогичными статьями: