knigechka: Принятие решений на основе гипотез

В связи с тем, что исход выбора игроком А решения зависит от выбора решения игроком В, необходимо сделать какие-то предположения о его возможном поведении в процессе решения задачи. Правомерность подобных предположений (гипотез) впрямую зависит от характера информированности сторон о поведении другой стороны. Будем различать следующие основные гипотезы (случаи).

Гипотеза 1. Каждый из субьектов А и В не имеет информации о выборе, который сделан второй стороной. Дополнительные гипотезы о характере поведения второго игрока отсутствуют. В этом случае можно поступать аналогично решению задачи в условиях полной неопределенности. Это, по-существу, в точности тот же случай, и мы можем воспользоваться известным принципом наилучшего гарантированного результата. Для субьекта А гарантированная оценка будет равна

(1.5)

Этому решению соответствует стратегия .

Гипотеза 2. Предполагаем, что субъект B следует принципу максимина и выбирает B^* из условия

(1.6)

Тогда мы можем выбирать V^** согласно правилу

(1.7)

где - гарантирующее решение второго игрока. Обозначим решение задачи (1.7) через . При этом выполняется свойство решения по гипотезе 2, оценка исхода которого не хуже оценки исхода по гипотезе 1:

V^**=V(A^**, B^*) ³ V^*, (1.8)

где V^*- наша гарантированная оценка (1.5), получаемая по принципу максимина (гипотеза 1).

Гипотеза 3. Теперь можно допустить, что субъект B рассуждает точно так же, как и мы в предыдущем случае (в соответствии с гипотезой 2), т.е. использует не стратегию B^*, а аналогичную стратегию . Мы можем это учесть и выбирать оптимальное решение с учетом уже этой гипотезы:

(1.9)

Гипотеза 4. Возможен другой сорт гипотез: мы по условиям игры знаем первый ход субъекта B (он нам его обязан сообщить). Тогда наше поведение будет определяться стратегией в виде функции A=A(B). Мы можем ее определить в результате решения задачи оптимизации

(1.10)

Условие (1.10) позволяет для каждого фиксированного B_k, k=1,2,…,n, определить искомую стратегию A, т.е. задать функцию A(B).

Для этого случая мы можем определить гарантированный результат:

(1.11)

Результат будет отличаться от значения V^*, найденного согласно гипотезе 1. Именно, во всех случаях будем иметь

³ V^*. (1.12)

Таким образом, принятие гипотезы 4 вновь позволяет улучшить решение, полученное по принципу максиминного гарантированного результата.

Гипотеза 5. Пусть субъект В знает наш первый ход. В этом случае естественно предположить, что он будет придерживаться стратегии B=B(A), которая строится в результате решения оптимизационной задачи

(1.13)

(именно так мы и поступали при принятии гипотезы 4). Принятие этих допущений, т.е. допущения о том, что мы сообщили свой ход субъекту В, а также допущения об использовании им стратегии B(A) позволяет нам таким образом воздействовать на выбор субъекта В, чтобы он в максимальной степени соответствовал нашим целям. Именно, мы можем выбирать A из условия

(1.14)

Замечание. Если максимум в соотношении (1.14) достигается не в одной точке B_k, а на некотором множестве M(A), то наш гарантированный результат определяется из условия:

(1.15)

Такая ситуация возникает при решении задачи 1.4.1, варианты e) и f).

Общим для всех рассмотренных случаев (гипотезы 1…5) является предположение, что обе стороны, участвующие в игре, не только точно знают свои цели, но и полностью информированы о целевых функциях «противника» или партнера по игре. Для реальных конфликтных ситуаций это не всегда выполняется. Гораздо чаще мы не знаем точно целей наших партнеров, которые, в свою очередь, имеют ограниченную информацию о наших намерениях. Кроме того, необходимо учитывать и возможную сознательную дезинформацию, «блеф» со стороны каждого из игроков, да и игроков может быть не два, а больше. Формальные модели указанных, а также других игровых ситуаций могут быть построены, но соответствующий материал выходит за рамки данных методических указаний.

Пример 1.1.

Игра задана с помощью таблицы 1, где пары чисел на пересечении строк и столбцов означают выигрыши игроков А и В, соответственно.

Таблица 1

В A	B₁	B₂	B₃
A₁	(5, 6)	(7, 5)	(-4, 16)
A₂	(3, -7)	(4, 7)	(2, 6)
A₃	(-2, 15)	(1, 4)	(14, 11)

Вычислить оптимальные альтернативы игрока А, пользуясь гипотезами 1…5. Провести анализ результатов.

Р е ш е н и е

При иллюстрации решений опустим комментарии относительно сути применяемых гипотез в связи с тем, что они, также как и формулы в общем виде, приведены выше. Студенты при выполнении заданий должны сопровождать свои решения необходимыми комментариями в полном объеме.

Гипотеза 1

На основании (1.5) получаем:

Согласно гипотезе 1 оптимальным решением является стратегия А₂ с оценкой исхода в 2 единицы.

Гипотеза 2

Согласно (1.6) рассчитаем за игрока В его гарантирующее решение:

Для игрока В имеем гарантирующую стратегию В^*=В₃, а гарантирующую оценку - W^*=6.

Теперь, согласно (1.7), находим

Согласно гипотезе 2 оптимальным решением является стратегия А₃ с оценкой исхода в 14 единиц. При этом подтвердилось свойство (1.8) решения по гипотезе 2:

V^**=14 > V^*=2.

Гипотеза 3

Аналогично (1.7) для игрока А (гипотеза 2) рассчитаем для игрока В решение В^**:

(1.16)

Так как по первой гипотезе А^*=А₂,

W^**= W(A₂, B**)=max{-7, 7, 6}=7 B^**=B₂.

Обращаем внимание, что по аналогии с (1.8) для игрока В выполняется свойство

W^**=7>W^*=6.

В соответствии с (1.9)

V^***=V(A^***, B₂)=max{7, 4, 1}=7A^***=A₁.

Согласно гипотезе 3 оптимальным решением игрока А является стратегия А₁ с оценкой исхода в 7 единиц.

Гипотеза 4

Так как игрок В должен сообщить свой ход, для каждой стратегии B_k, мы можем выбрать самую благоприятную для игрока А стратегию, а именно

B₁: maxV(A, B₁)=max{5, 3, -2}=5=V(A₁, B₁);

B₂: maxV(A, B₂)=max{7, 4, 1}=7=V(A₁, B₂);

B₃: maxV(A, B₃)=max{-4, 2, 14}=14=V(A₃, B₃).

В этом случае гарантированный результат согласно (1.11)

=min{5, 7, 14}=5

При этом подтвердилось свойство (1.12) решения по гипотезе 4:

> V^*=2.

Гипотеза 5

Если мы сообщим субъекту В свой ход А₁, игрок В выберет

=max{6, 5, 16}=16 ,

при этом мы получим выигрыш V(A₁, B₃)=-4.

Далее аналогично

A₂: =max{-7, 7, 6}=7 V(A₂, B₂)=4.

A₃: =max{15, 4, 11}=15 V(A₃, B₁)= -2.

Окончательное решение по гипотезе 5:

=max{-4, 4, 2}=4

Анализ результатов

При принятии решения в соответствии с гипотезой 1 наша гарантирующая стратегия - A^*=A₂, а гарантированная оценка - V^*=V(A₂,B₃)= 2 (если бы мы выбрали другое решение, отличное от А₂, то могли бы, в зависимости от действий игрока В, получить и меньшее значение выигрыша, чем 2). Стратегия А₂ является решением и по гипотезе 5, при этом выигрыш игрока А составляет =V(A₂, B₂)=4.

При использовании гипотезы 2 оптимальной является альтернатива А^**=А₃, таким образом, получило подтверждение неравенство (1.8):

V^**=V(A₃, B₃)=14>V^*=V(A₂, B₃)=2.

В соответствии с гипотезой 3 оптимальной является альтернатива A^***=A₁ с оценкой V^***=V(A₁, B₂)=7. Стратегия А₁ также является оптимальной при использовании гипотезы 4, при этом гарантированный результат составляет

Пример 1.2. Применение гипотез для игры с нулевой суммой

В соответствии с (1.4) игра с нулевой суммой задана платежной матрицей выигрышей игрока А:

Вычислить оптимальные альтернативы игрока А, пользуясь гипотезами 1…3.

Р е ш е н и е

Гипотеза 1

В игре с нулевой суммой решение по гипотезе 1 ничем не отличается от решения для обычной биматричной игры. На основании (1.5) получаем:

Согласно гипотезе 1 оптимальным решением является стратегия А₄ с оценкой исхода в 7 единиц.

Гипотеза 2

В игре с нулевой суммой для игрока В элементы а_ik матрицы А представляют собой потери, поэтому вместо принципа максимина (1.6) необходимо применить принцип минимакса:

и рассчитать за игрока В его гарантирующее решение:

Для игрока В имеем гарантирующую стратегию В^*=В₂, а гарантированную оценку - W^*=8.

Теперь, согласно (1.7), находим

Согласно гипотезе 2 оптимальным решением является стратегия А₄ с оценкой исхода в 8 единиц. При этом подтвердилось свойство (1.8) решения по гипотезе 2:

V^**=8 > V^*=7.

Гипотеза 3

Аналогично (1.16) с учетом матрицы потерь для игрока В рассчитаем решение

Так как по первой гипотезе А^*=А₄,

min{7, 8, 9, 20}=7B^**=B₁.

Обращаем внимание, что по аналогии с (1.8) с учетом того, что для игрока В матрица А является матрицей потерь,

W^**=7<W^*=8.

В соответствии с (1.9)

V^***=V(A^***, B₁)=max{12, -6, -8, 7}=12A^***=A₁.

Согласно гипотезе 3 оптимальным решением игрока А является стратегия А₁ с оценкой исхода в 12 единиц.

Анализ результатов

При принятии решения в соответствии с гипотезой 1 наша гарантирующая стратегия - A^*=A₄, а гарантированная оценка - V^*=V(A₄,B₁)= 7 (если бы мы выбрали другое решение, отличное от А₄, то могли бы, в зависимости от действий игрока Б, получить и меньшее значение выигрыша, чем 7).

При использовании гипотезы 2 оптимальной является альтернатива А^**=А₄ с оценкой исхода V^**=8, таким образом, получило подтверждение неравенство (1.8):

V^**=V(A₄, B₂)=8>V^*=V(A₄, B₁)=7.

Анализируя вычисления, можно прийти к выводу: в игре с нулевой суммой оценка решения по гипотезе 2 для игрока А совпадает с гарантированной оценкой игрока Б, полученной им при реализации принципа минимакса (объясните, почему?).

В соответствии с гипотезой 3 оптимальной является альтернатива A^***=A₁ с оценкой исхода V^***=V(A₁, B₁)=12.

Отметим, что при использовании гипотез 1 и 2 оптимальной является одна и та же стратегия А₄, но с разными оценками исходов.

1.3. Контрольные вопросы

1.3.1. Какой вид имеет платежная матрица биматричной игры?

1.3.2. Как с позиций биматричной игры можно интерпретировать игру с нулевой суммой?

1.3.3. Какой вид будут иметь формулы (1.5)…(1.15), если элементы матрицы вида (1.3) будут представлять потери игроков А и Б, соответственно?

1.3.4. Какой вид будут иметь формулы (1.5)…(1.9), если задана игра с нулевой суммой, представленная матрицей выигрышей игрока А?

1.3.5. Какой вид будут иметь формулы (1.5)…(1.9), если задана игра с нулевой суммой, представленная матрицей потерь игрока А?

1.3.6. Игра с нулевой суммой задана матрицей А. Получены решения с помощью трех первых гипотез. Ответьте на вопросы:

a) С каким из них совпадет решение по гипотезе 4?

b) С каким из них совпадет решение по гипотезе 5?

knigechka

Принятие решений на основе гипотез

Пример 1.1.

Пример 1.2. Применение гипотез для игры с нулевой суммой

Предлагаю ознакомиться с аналогичными статьями:

0 коммент.:

Архив

Счетчики

Категории

Постоянные читатели

knigechka

Принятие решений на основе гипотез {lang: 'ru'}

Пример 1.1.

Пример 1.2. Применение гипотез для игры с нулевой суммой

Предлагаю ознакомиться с аналогичными статьями:

0 коммент.:

Архив

Счетчики

Категории

Постоянные читатели

Принятие решений на основе гипотез