Принятие решений на основе гипотез

|

В связи с тем, что исход выбора игроком А решения зависит от выбора решения игроком В, необходимо сделать какие-то предположения о его возможном поведении в процессе решения задачи. Правомерность подобных предположений (гипотез) впрямую зависит от характера информированности сторон о поведении другой стороны. Будем различать следующие основные гипотезы (случаи).

Гипотеза 1. Каждый из субьектов А и В не имеет информации о выборе, который сделан второй стороной. Дополнительные гипотезы о характере поведения второго игрока отсутствуют. В этом случае можно поступать аналогично решению задачи в условиях полной неопределенности. Это, по-существу, в точности тот же случай, и мы можем воспользоваться известным принципом наилучшего гарантированного результата. Для субьекта А гарантированная оценка будет равна

clip_image002 (1.5)

Этому решению соответствует стратегия clip_image004.

Гипотеза 2. Предполагаем, что субъект B следует принципу максимина и выбирает B* из условия

clip_image006 (1.6)

Тогда мы можем выбирать V** согласно правилу

clip_image008 (1.7)

где clip_image010 - гарантирующее решение второго игрока. Обозначим решение задачи (1.7) через clip_image012. При этом выполняется свойство решения по гипотезе 2, оценка исхода которого не хуже оценки исхода по гипотезе 1:

V**=V(A**, B*) ³ V*, (1.8)

где V* - наша гарантированная оценка (1.5), получаемая по принципу максимина (гипотеза 1).

Гипотеза 3. Теперь можно допустить, что субъект B рассуждает точно так же, как и мы в предыдущем случае (в соответствии с гипотезой 2), т.е. использует не стратегию B*, а аналогичную стратегию clip_image014. Мы можем это учесть и выбирать оптимальное решение с учетом уже этой гипотезы:

clip_image016 (1.9)

Гипотеза 4. Возможен другой сорт гипотез: мы по условиям игры знаем первый ход субъекта B (он нам его обязан сообщить). Тогда наше поведение будет определяться стратегией в виде функции A=A(B). Мы можем ее определить в результате решения задачи оптимизации

clip_image018 (1.10)

Условие (1.10) позволяет для каждого фиксированного Bk, k=1,2,…,n, определить искомую стратегию A, т.е. задать функцию A(B).

Для этого случая мы можем определить гарантированный результат:

clip_image020 (1.11)

Результат clip_image022будет отличаться от значения V*, найденного согласно гипотезе 1. Именно, во всех случаях будем иметь

clip_image022[1]³ V*. (1.12)

Таким образом, принятие гипотезы 4 вновь позволяет улучшить решение, полученное по принципу максиминного гарантированного результата.

Гипотеза 5. Пусть субъект В знает наш первый ход. В этом случае естественно предположить, что он будет придерживаться стратегии B=B(A), которая строится в результате решения оптимизационной задачи

clip_image025 (1.13)

(именно так мы и поступали при принятии гипотезы 4). Принятие этих допущений, т.е. допущения о том, что мы сообщили свой ход субъекту В, а также допущения об использовании им стратегии B(A) позволяет нам таким образом воздействовать на выбор субъекта В, чтобы он в максимальной степени соответствовал нашим целям. Именно, мы можем выбирать A из условия

clip_image027 (1.14)

Замечание. Если максимум в соотношении (1.14) достигается не в одной точке Bk, а на некотором множестве M(A), то наш гарантированный результат clip_image029 определяется из условия:

clip_image031 (1.15)

Такая ситуация возникает при решении задачи 1.4.1, варианты e) и f).

Общим для всех рассмотренных случаев (гипотезы 1…5) является предположение, что обе стороны, участвующие в игре, не только точно знают свои цели, но и полностью информированы о целевых функциях «противника» или партнера по игре. Для реальных конфликтных ситуаций это не всегда выполняется. Гораздо чаще мы не знаем точно целей наших партнеров, которые, в свою очередь, имеют ограниченную информацию о наших намерениях. Кроме того, необходимо учитывать и возможную сознательную дезинформацию, «блеф» со стороны каждого из игроков, да и игроков может быть не два, а больше. Формальные модели указанных, а также других игровых ситуаций могут быть построены, но соответствующий материал выходит за рамки данных методических указаний.

Пример 1.1.

Игра задана с помощью таблицы 1, где пары чисел на пересечении строк и столбцов означают выигрыши игроков А и В, соответственно.

Таблица 1

В

A

B1

B2

B3

A1

(5, 6)

(7, 5)

(-4, 16)

A2

(3, -7)

(4, 7)

(2, 6)

A3

(-2, 15)

(1, 4)

(14, 11)

Вычислить оптимальные альтернативы игрока А, пользуясь гипотезами 1…5. Провести анализ результатов.

Р е ш е н и е

При иллюстрации решений опустим комментарии относительно сути применяемых гипотез в связи с тем, что они, также как и формулы в общем виде, приведены выше. Студенты при выполнении заданий должны сопровождать свои решения необходимыми комментариями в полном объеме.

Гипотеза 1

На основании (1.5) получаем:

clip_image033

clip_image035

clip_image037

clip_image039

Согласно гипотезе 1 оптимальным решением является стратегия А2 с оценкой исхода в 2 единицы.

Гипотеза 2

Согласно (1.6) рассчитаем за игрока В его гарантирующее решение:

clip_image041

clip_image043

clip_image045

clip_image047

Для игрока В имеем гарантирующую стратегию В*3, а гарантирующую оценку - W*=6.

Теперь, согласно (1.7), находим

clip_image049

Согласно гипотезе 2 оптимальным решением является стратегия А3 с оценкой исхода в 14 единиц. При этом подтвердилось свойство (1.8) решения по гипотезе 2:

V**=14 > V*=2.

Гипотеза 3

Аналогично (1.7) для игрока А (гипотеза 2) рассчитаем для игрока В решение В**:

clip_image051 (1.16)

Так как по первой гипотезе А*2,

W**= W(A2, B**)=max{-7, 7, 6}=7clip_image053 B**=B2.

Обращаем внимание, что по аналогии с (1.8) для игрока В выполняется свойство

W**=7>W*=6.

В соответствии с (1.9)

V***=V(A***, B2)=max{7, 4, 1}=7clip_image055A***=A1.

Согласно гипотезе 3 оптимальным решением игрока А является стратегия А1 с оценкой исхода в 7 единиц.

Гипотеза 4

Так как игрок В должен сообщить свой ход, для каждой стратегии Bk, clip_image057 мы можем выбрать самую благоприятную для игрока А стратегию, а именно

B1: maxV(A, B1)=max{5, 3, -2}=5=V(A1, B1);

B2: maxV(A, B2)=max{7, 4, 1}=7=V(A1, B2);

B3: maxV(A, B3)=max{-4, 2, 14}=14=V(A3, B3).

В этом случае гарантированный результат согласно (1.11)

clip_image022[2]=min{5, 7, 14}=5clip_image059

При этом подтвердилось свойство (1.12) решения по гипотезе 4:

clip_image061 > V*=2.

Гипотеза 5

Если мы сообщим субъекту В свой ход А1, игрок В выберет

clip_image063=max{6, 5, 16}=16clip_image065clip_image067,

при этом мы получим выигрыш V(A1, B3)=-4.

Далее аналогично

A2: clip_image069=max{-7, 7, 6}=7clip_image065[1]clip_image071 V(A2, B2)=4.

A3: clip_image073=max{15, 4, 11}=15clip_image065[2]clip_image075 V(A3, B1)= -2.

Окончательное решение по гипотезе 5:

clip_image077=max{-4, 4, 2}=4clip_image079

Анализ результатов

При принятии решения в соответствии с гипотезой 1 наша гарантирующая стратегия - A*=A2, а гарантированная оценка - V*=V(A2,B3)= 2 (если бы мы выбрали другое решение, отличное от А2, то могли бы, в зависимости от действий игрока В, получить и меньшее значение выигрыша, чем 2). Стратегия А2 является решением и по гипотезе 5, при этом выигрыш игрока А составляет clip_image077[1]=V(A2, B2)=4.

При использовании гипотезы 2 оптимальной является альтернатива А**3, таким образом, получило подтверждение неравенство (1.8):

V**=V(A3, B3)=14>V*=V(A2, B3)=2.

В соответствии с гипотезой 3 оптимальной является альтернатива A***=A1 с оценкой V***=V(A1, B2)=7. Стратегия А1 также является оптимальной при использовании гипотезы 4, при этом гарантированный результат составляет

clip_image081

Пример 1.2. Применение гипотез для игры с нулевой суммой

В соответствии с (1.4) игра с нулевой суммой задана платежной матрицей выигрышей игрока А:

clip_image083

Вычислить оптимальные альтернативы игрока А, пользуясь гипотезами 1…3.


Р е ш е н и е

Гипотеза 1

В игре с нулевой суммой решение по гипотезе 1 ничем не отличается от решения для обычной биматричной игры. На основании (1.5) получаем:

clip_image085

clip_image087

clip_image089

clip_image091

clip_image093

Согласно гипотезе 1 оптимальным решением является стратегия А4 с оценкой исхода в 7 единиц.

Гипотеза 2

В игре с нулевой суммой для игрока В элементы аik матрицы А представляют собой потери, поэтому вместо принципа максимина (1.6) необходимо применить принцип минимакса:

clip_image095

и рассчитать за игрока В его гарантирующее решение:

clip_image097

clip_image099

clip_image101

clip_image103

clip_image105

Для игрока В имеем гарантирующую стратегию В*2, а гарантированную оценку - W*=8.

Теперь, согласно (1.7), находим

clip_image107

Согласно гипотезе 2 оптимальным решением является стратегия А4 с оценкой исхода в 8 единиц. При этом подтвердилось свойство (1.8) решения по гипотезе 2:

V**=8 > V*=7.

Гипотеза 3

Аналогично (1.16) с учетом матрицы потерь для игрока В рассчитаем решение

clip_image109

Так как по первой гипотезе А*4,

clip_image111min{7, 8, 9, 20}=7clip_image113B**=B1.

Обращаем внимание, что по аналогии с (1.8) с учетом того, что для игрока В матрица А является матрицей потерь,

W**=7<W*=8.

В соответствии с (1.9)

V***=V(A***, B1)=max{12, -6, -8, 7}=12clip_image055[1]A***=A1.

Согласно гипотезе 3 оптимальным решением игрока А является стратегия А1 с оценкой исхода в 12 единиц.

Анализ результатов

При принятии решения в соответствии с гипотезой 1 наша гарантирующая стратегия - A*=A4, а гарантированная оценка - V*=V(A4,B1)= 7 (если бы мы выбрали другое решение, отличное от А4, то могли бы, в зависимости от действий игрока Б, получить и меньшее значение выигрыша, чем 7).

При использовании гипотезы 2 оптимальной является альтернатива А**4 с оценкой исхода V**=8, таким образом, получило подтверждение неравенство (1.8):

V**=V(A4, B2)=8>V*=V(A4, B1)=7.

Анализируя вычисления, можно прийти к выводу: в игре с нулевой суммой оценка решения по гипотезе 2 для игрока А совпадает с гарантированной оценкой игрока Б, полученной им при реализации принципа минимакса (объясните, почему?).

В соответствии с гипотезой 3 оптимальной является альтернатива A***=A1 с оценкой исхода V***=V(A1, B1)=12.

Отметим, что при использовании гипотез 1 и 2 оптимальной является одна и та же стратегия А4, но с разными оценками исходов.

1.3. Контрольные вопросы

1.3.1. Какой вид имеет платежная матрица биматричной игры?

1.3.2. Как с позиций биматричной игры можно интерпретировать игру с нулевой суммой?

1.3.3. Какой вид будут иметь формулы (1.5)…(1.15), если элементы матрицы вида (1.3) будут представлять потери игроков А и Б, соответственно?

1.3.4. Какой вид будут иметь формулы (1.5)…(1.9), если задана игра с нулевой суммой, представленная матрицей выигрышей игрока А?

1.3.5. Какой вид будут иметь формулы (1.5)…(1.9), если задана игра с нулевой суммой, представленная матрицей потерь игрока А?

1.3.6. Игра с нулевой суммой задана матрицей А. Получены решения с помощью трех первых гипотез. Ответьте на вопросы:

a) С каким из них совпадет решение по гипотезе 4?

b) С каким из них совпадет решение по гипотезе 5?

Предлагаю ознакомиться с аналогичными статьями: