プリズム

数理的アプローチ


対称な行列ゲームのゲームの値

投稿日時:

最終更新日時:

カテゴリー:

タグ:

対称な行列ゲームのゲームの値は0であり、プレイヤー1とプレイヤー2の最適戦略の集合は一致する。

行列ゲーム$A$が$A=-A^{\rm T}$を満たすとき、対称ゲームと呼ばれる。従って、証明すべきことは

$A=-A^{\rm T}$ならば、以下が成り立つ。

  1. $v(A)=0$
  2. $O_1(A)=O_2(A)$

(証明)

プレイヤー1と2の最適戦略を、各々、$p$と$q$とする。また、各々の任意の戦略を$x$と$y$とする。

まず、以下が成り立つ。

\[ x^{\rm T}Ay = \left( x^{\rm T}Ay \right)^{\rm T} = y^{\rm T} A^{\rm T} x = – y^{\rm T} A x \]
1.

$p$はプレイヤー1の最適戦略なので

\[ p^{\rm T}Ay \ge v(A) \\ -y^{\rm T} A p \ge v(A) \\ y^{\rm T} A p \le -v(A) \\ v(A) = \max_y \min_z y^{\rm T} A z \le -v(A) \]

同様に、$q$はプレイヤー2の最適戦略なので

\[ x^{\rm T}Aq \le v(A) \\ -q^{\rm T} A x \le v(A) \\ q^{\rm T} A x \ge -v(A) \\ v(A) = \min_x \max_z z^{\rm T} A x \ge -v(A) \]

従って、$v(A) \le -v(A) \le v(A)$より、$v(A)=-v(A)$となり、$v(A)=0$となる。

2.

次に、$p \in O_1(A)$なので、

\[ p^{\rm T}Ay \ge 0 \\ -y^{\rm T} A p \ge 0 \\ y^{\rm T} A p \le 0 \\ \]

上記の最後の式が任意の$y$に対して成り立っているので、$p \in O_2(A)$である。また、$q \in O_2(A)$なので、

\[ x^{\rm T}Aq \le 0 \\ -q^{\rm T} A x \le 0 \\ q^{\rm T} A x \ge 0 \\ \]

上記の最後の式が任意の$x$に対して成り立っているので、、$q \in O_1(A)$である。従って、$O_1(A)=O_2(A)$(証明終わり)

次の対称ゲームの最適戦略を求める。このゲームはジャンケンゲームである。

R(ock)S(cissor)P(aper)
R(ock)$0$$1$$-1$
S(cissor)$-1$$0$$1$
P(aper)$1$$-1$$0$

まず、この対称ゲームのゲームの値は$0$である。プレイヤー1の最適戦略を

\[ x = \left( \begin{array}{c} x_{\rm R} \\ x_{\rm S} \\ x_{\rm P} \end{array} \right) \]

とおく。ただし、各要素は非負で、$x_{\rm R}+x_{\rm S}+x_{\rm P}=1$である。

\[ \left( \begin{array}{ccc} x_{\rm R} & x_{\rm S} & x_{\rm P} \end{array} \right) \left( \begin{array}{ccc} 0 & 1 & -1 \\ -1 & 0 & 1 \\ 1 & -1 & 0 \end{array} \right) \ge \left( \begin{array}{ccc} 0 & 0 & 0 \end{array} \right) \]

すなわち

\[ \begin{eqnarray} && &-x_{\rm S}& &+x_{\rm P}& &\ge& 0 \\ &x_{\rm R}& && &-x_{\rm P}& &\ge& 0 \\ -&x_{\rm R}& &+x_{\rm S}& && &\ge& 0 \end{eqnarray} \]

となる$x$を求めればよい。いま、3本すべてが等式で成り立っていると仮定して解くと、$x_{\rm R}=x_{\rm S}=x_{\rm P}=\frac{1}{3}$となる。2本が等式で成り立てば、残りの1本も等式で成り立つ。また、1本が等式で成り立てば、他の2本も等式で成り立つ。従って、プレイヤー1とプレイヤー2の最適戦略はRとSとPを等確率でとる

\[ \left( \begin{array}{c} \frac{1}{3} \\ \frac{1}{3} \\ \frac{1}{3} \end{array} \right) \]

だけである。