Платежная матрица биматричной игры

|

В [1] рассматривались игры двух лиц, в которых интересы игроков были прямо противоположны (антагонистические или матричные игры). Решением такой задачи является стратегия clip_image002 с оценкой исхода clip_image004при условии, что игрок В выбрал стратегию clip_image006. Однако ситуации, в которых интересы игроков хотя и не совпадают, но уже не обязательно являются противоположными, встречаются гораздо чаще.

Рассмотрим, например, конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей линии поведения:

игрок А может выбрать любую из стратегий А1, А2, …, Аm;

игрок В - любую из стратегий В1, В2, …, Вn.

При этом всякий раз их совместный выбор оценивается вполне определенно: если игрок А выбрал i-ю стратегию Ai, а игрок B - k-ю стратегию Bk, то в итоге выигрыш игрока А будет равен некоторому числу aik, а выигрыш игрока В - некоторому, вообще говоря, другому числу bik.

Иными словами, всякий раз каждый из игроков получает свой приз. Последовательно перебирая все стратегии игрока А и все стратегии игрока В, можно заполнить их выигрышами две таблицы вида (2.1) в [1], представленными матрицами (1.1) и (1.2).

clip_image008 (1.1)

clip_image010 (1.2)

где V - платежная матрица игрока А, а W - платежная матрица игрока В. При выборе игроком А стратегии с номером i, а игроком В - k-й стратегии, их выигрыши находятся в соответствующих матрицах выплат на пересечении i-х строк и k-х столбцов: в матрице V - это элемент aik, а в матрице W - элемент bik.

Таким образом, в случае, когда интересы игроков различны (но необязательно противоположны), получаются две платежные матрицы: одна - матрица выплат игроку А, другая - матрица выплат игроку В. Отсюда и название, которое обычно присваивается подобной игре, - биматричная игра. В случае биматричной игры её решением является пара стратегий clip_image012 c оценками исходов clip_image014.

Будем представлять матрицы выплат игрокам А и В (1.1) и (1.2) с помощью одной матрицы U, представляющей выигрыши каждого из игроков, соответственно, парой чисел (aik, bik):

clip_image016 (1.3)

Далее мы везде, кроме специально оговоренных случаев, будем считать себя игроком А и проводить рассуждения с позиций его интересов.

Замечание. Рассмотренные ранее матричные игры с нулевой суммой [1], разумеется, можно отнести к биматричным играм, где матрица выплат игроку В противоположна матрице выплат игроку А:

bik= - aik

или

clip_image018 (1.4)

Предлагаю ознакомиться с аналогичными статьями: