行列ゲーム(2人ゼロ和ゲーム)は利害が全く対立する2人の間のゲームである。現実世界では、2人の行為の組み合わせに応じて、ある時は共益的、ある時は共貧的、また、ある時は一方に有利で他方に不利である、状況が多い。すなわち、非ゼロ和的状況が多いので、2人ゼロ和ゲームの結果を適用できることはあまりない。しかし、2人ゼロ和ゲームのナッシュ均衡の構造は2人非ゼロ和ゲーム(双行列ゲーム)とは異なった特徴的な性質を持っているので、それを含めながら、ナッシュ均衡(ゲームの値と最適戦略)の求め方を述べる。
純粋戦略におけるナッシュ均衡
例として、次の行列ゲームを利用する。
L | C | R | T | $5$ | $7$ | $5$ |
M | $4$ | $5$ | $0$ |
B | $5$ | $6$ | $5$ |
プレイヤー1(行プレイヤーとも呼ばれる)は戦略T、M、Bの中らから1つを選び、プレイヤー2(列プレイヤーとも呼ばれる)は戦略L、C、Rの中から1つを選ぶ。例えば、プレイヤー1がMを選び、プレイヤー2がCを選ぶと、Mの行とCの列が交差するところにある$5$の利得がプレイヤー2からプレイヤー1へ支払われる。2人ゼロ和ゲームでは、プレイヤー1が受け取る利得の部分からなる行列でゲームを表現できるので、行列ゲームと呼ばれる。プレイヤー1は行列の中の大きい利得を望み、一方、プレイヤー2は小さい利得を望む。従って、利得を最大化するという意味でプレイヤー1を最大化プレイヤー、利得を最小化するという意味でプレイヤー2を最小化プレイヤーと呼ぶこともある。
さて、戦略の組み合わせがナッシュ均衡であるとは、『「自分以外の人がその戦略の組み合わせでその人に指定されている戦略をとっている時、自分だけがその戦略の組み合わせで自分に指定されている戦略から逸脱して他の戦略をとっても、自分の得る利得が減るかまたは等しい」ということがすべてのプレイヤーについて成り立っている』ことである。
後で確率的に戦略を選ぶ混合戦略が登場するので、それと区別するために、必ずそれをとる戦略を純粋戦略と呼ぶ。純粋戦略におけるナッシュ均衡は次のように求められる。各列に対して、列方向(上下方向)に利得を比較して、最大値の右肩の括弧の中(括弧がなければ括弧と共)に$1$を記入する。次に、各行に対して、行方向(左右方向)に利得を比較して、最小値の右肩の括弧の中(括弧がなければ括弧と共)に$2$を記入する。右肩に$(12)$と書かれた利得があればそれを実現する戦略の組み合わせがナッシュ均衡である。別の表現をすれば、列方向(上下方向)で最大で、行方向(左右方向)で最少となる要素を探す(この例の場合、右肩に$(12)$と書かれた利得がその要素である)。それがあればそれを実現する戦略の組み合わせがナッシュ均衡である。
L | C | R | T | $5^{(12)}$ | $7^{(1)}$ | $5^{(12)}$ |
M | $4$ | $5$ | $0^{(2)}$ |
B | $5^{(12)}$ | $6$ | $5^{(12)}$ |
上の例の場合、4個の戦略の組み合わせ(T,L)、(T,R)、(B,L)、(B,R)がナッシュ均衡であり、その時の利得はすべて$5$である。2人ゼロ和ゲームにおいて、複数のナッシュ均衡が存在する場合、ナッシュ均衡における利得がすべて等しいのは偶然ではない。また、各プレイヤーから見て、ナッシュ均衡をなす戦略の組み合わせの自分の戦略をすべて集めて(プレイヤー1の場合はTとB、プレイヤー2の場合はLとR)、相手が何をとるかを気にせずに自分の戦略を選んでも、例えば、プレイヤー1がTをプレイヤー2がRを選んでも、結果としてできる戦略の組み合わせ、今の場合は、(T,L)がまた、ナッシュ均衡になっている。この事実も偶然ではない。すなわち、2人ゼロ和ゲームにおいては次のことが成立する。
ナッシュ均衡が1個の場合は当然であるが、複数ある場合も
- ナッシュ均衡における(プレイヤー1が得る)利得は等しい(一意に決まる)。
- 各プレイヤーが、ナッシュ均衡になる戦略の組み合わせの自分の戦略を集めた集合からどれを選んでも、結果として得られる戦略の組み合わせは、ナッシュ均衡になる。
ゲームの値と最適戦略
直前に述べたことにより、前述のゲーム(利得行列を$A$とおく。)のナッシュ均衡における利得$5$をこのゲームのゲームの値と呼び、$v(A)=5$と書く。また、ナッシュ均衡に関しては、ゲーム$A$におけるプレイヤー1の最適戦略の集合$O_1(A)$は$O_1(A)=\left\{ \rm{T}, \rm{B} \right\}$、プレイヤー2の最適戦略の集合$O_2(A)$は$O_2(A)=\left\{ \rm{L}, \rm{R} \right\}$である、と表現する。
非ゼロ和ゲームにおいては、複数のナッシュ均衡が存在する場合、ナッシュ均衡によって各プレイヤーがもらう利得が異なることが一般的である。また、ナッシュ均衡は自分の戦略と相手の戦略の組み合わせに対して利用される概念である。しかし、2人ゼロ和ゲームにおいては、相手の戦略を言及することなく、自分の最適戦略と表現できる状態になっている。
ナッシュ均衡を求める際に、2人ゼロ和ゲームにおいてのみ有効な「自分の最悪を最善にする」という考え方
上のゲームのナッシュ均衡が「自分の最悪を最善にする」という考え方で求まることを見てみる。
L* | C | R* | worst | best | |
T* | $5$ | $7$ | $5$ | $5$ | $5$ |
M | $4$ | $5$ | $0$ | $0$ | |
B* | $5$ | $6$ | $5$ | $5$ | |
worst | $5$ | $7$ | $5$ | $5=5$ | |
best | $5$ |
プレイヤー1が戦略Tをとった時の最悪は$5,7,5$の最小値の$5$である。戦略Mをとった時の最悪は$4,5,0$の最小値の$0$である。戦略Bをとった時の最悪は$5,6,5$の最小値の$5$である。これらの最悪の最善は$5,0,5$の最大値の$5$である。この最大値$5$は(プレイヤー1の)マックスミニ値と呼ばれ、それを実現する戦略TとBはマックスミニ戦略と呼ばれる。同様に、プレイヤー2が戦略Lをとった時の最悪は$5,4,5$の最大値の$5$である。戦略Cをとった時の最悪は$7,5,6$の最大値の$7$である。戦略Rをとった時の最悪は$5,0,5$の最大値の$5$である。これらの最悪の最善は$5,7,5$の最小値の$5$である。この最小値$5$はミニマックス値と呼ばれ、それを実現する戦略LとRはミニマックス戦略と呼ばれる。
上記の例では、マックスミニ値とミニマックス値が一致し、それがゲームの値$5$になっている。また、マックスミニ戦略がプレイヤー1の最適戦略に、ミニマックス戦略がプレイヤー2の最適戦略になっている。以上をまとめると、
- マックスミニ値とマックスミニ値が一致すれば、それがゲームの値である。
- その時、マックスミニ戦略はプレイヤー1の最適戦略、ミニマックス戦略はプレイヤー2の最適戦略になっている。
一般的な話(純粋戦略のみを考慮した場合)
今までのところを含め、より一般的な形でまとめる。プレイヤー1と2の(純粋)戦略の集合を、各々、$M=\left\{ 1, \ldots, m \right\}$、$N=\left\{ 1, \ldots, n \right\}$とする。利得行列を$A$とする。すなわち、
\begin{equation} A= \left( \begin{array} {ccc} a_{11} & \cdots & a_{1n} \\ \vdots & \ddots & \vdots \\ a_{m1} & \cdots & a_{mn} \end{array} \right) \end{equation}行列ゲーム$A$の純粋戦略におけるマックスミニ値$\underline{v}(A)$とミニマックス値$\overline{v}(A)$は
\begin{equation} \underline{v}(A) = \max_{i \in M} \min_{j \in N} a_{ij} \\ \overline{v}(A) = \min_{j \in N} \max_{i \in M} a_{ij} \end{equation}一般的には、$\underline{v}(A) \le \overline{v}(A)$が成り立つ(必ずしも等しいとは限らない。)しかしながら、次のことが成り立つことが知られている。
- 行列ゲーム$A$にナッシュ均衡が存在する必要かつ十分条件は$\underline{v}(A) = \overline{v}(A)$である。この時、以下が成り立つ。
- ゲームの値は$v(A) = \underline{v}(A) = \overline{v}(A)$となる。
- プレイヤー1と2の最適戦略の集合は、各々、マックスミニ戦略の集合とミニマックス戦略の集合、すなわち、 \begin{equation} O_1(A) = \left\{ i \in M \left| v(A) = \min_{j \in N} a_{ij} \right. \right\} \\ O_2(A) = \left\{ j \in N \left| v(A) = \max_{i \in M} a_{ij} \right. \right\} \end{equation}
純粋戦略でナッシュ均衡が存在しない例
次の行列ゲームを考察する。
L | C | R | worst | best | |
T | $1^{(2)}$ | $3^{(1)}$ | $4^{(1)}$ | $1$ | $1$ |
B | $6^{(1)}$ | $3^{(1)}$ | $0^{(2)}$ | $0$ | |
worst | $6$ | $3$ | $4$ | $3 \gt 1$ | |
best | $3$ |
右肩に$(12)$が付いた利得がないこと、または、純粋戦略におけるマックスミニ値$1$とミニマックス値$3$が異なることにより、純粋戦略におけるナッシュ均衡はない。しかしながら、以下で述べるように戦略の範囲を純粋戦略から確率的に戦略を選ぶ混合戦略まで拡張すると、マックスミニ値とミニマックス値の差が$0$まで減少し、ナッシュ均衡が存在する。
一般的な話(混合戦略まで考慮した場合)
プレイヤー1が$m$個の純粋戦略を持ち、プレイヤー2が$n$個の純粋戦略を持つ行列ゲーム$A$
\begin{equation} A= \left( \begin{array} {ccc} a_{11} & \cdots & a_{1n} \\ \vdots & \ddots & \vdots \\ a_{m1} & \cdots & a_{mn} \end{array} \right) \end{equation}におけるプレイヤー1の混合戦略の集合を$X$、プレイヤー2の混合戦略の集合を$Y$とすると、
\begin{equation} X = \left\{ \left( \begin{array} {c} x_1 \\ \vdots \\ x_m \end{array} \right) \left| \sum_{i \in M}{x_i} = 1, x_i \ge 0 \left( \forall i \in M \right) \right. \right\} \\ Y = \left\{ \left( \begin{array} {c} y_1 \\ \vdots \\ y_n \end{array} \right) \left| \sum_{j \in N}{y_j} = 1, y_j \ge 0 \left( \forall j \in N \right) \right. \right\} \end{equation}である。ただし、プレイヤー1の混合戦略$x \in X$は確率$x_i$で純粋戦略$i$ををとることを意味する。プレイヤー2に関しても同様である。プレイヤー1が混合戦略$x \in X$を利用し、プレイヤー2が$y \in Y$を利用する時のプレイヤー1がプレイヤー2から得る期待利得$h(x,y)$は
\begin{equation} h(x,y) = \sum_{i \in M} {\sum_{j \in N} {x_i a_{ij} y_j}} = x^{\rm{T}}Ay \end{equation}プレイヤーのとる戦略を純粋戦略から混合戦略へ拡張したので、このゲームを行列ゲーム$A$の混合拡張と呼ぶ。この拡張により、次のミニマックス定理が成り立つことが知られている。すなわち、純粋戦略の範囲内では、プレイヤー1の観点からの自分の最悪を最善にするとして得られた値がプレイヤー2の観点からの自分の最悪を最善にするとして得られた値よりも小さいことがあり得た。しかし、両プレイヤーとももう少し何か工夫をすると(混合戦略まで考慮すると)、これらの値の差を$0$まで縮めることができる。
ミニマックス定理
\begin{equation} \max_{x \in X} \min_{y \in Y} h(x,y) = \min_{y \in Y} \max_{x \in X} h(x,y) \end{equation}従って、行列ゲームは混合戦略まで拡張すれば、ナッシュ均衡が存在する。すなわち、ゲームの値とプレイヤー1と2の最適戦略が求まる。これらの計算に利用しやすいように、結果を以下にまとめる。ただし、$e_i$は第$i$番目の要素のみが$1$で、その他の要素が$0$の単位ベクトル(基本ベクトルと呼ぶ)である。
- 行列ゲーム$A$の混合拡張にはゲームの値$v(A)$が存在し \begin{equation} v(A) = \max_{x \in X} \min_{j \in N} h(x,e_j) = \min_{y \in Y} \max_{i \in M} h(e_i,y) \end{equation}
- プレイヤー1と2の最適戦略$O_1(A)$と$O_2(A)$は、混合戦略におけるマックスミニ戦略の集合とミニマックス戦略の集合である。すなわち、 \begin{equation} O_1(A) = \left\{ x \in X \left| v(A) = \min_{j \in N} h(x,e_j) \right. \right\} \\ O_2(A) = \left\{ y \in Y \left| v(A) = \max_{i \in M} h(e_i,y) \right. \right\} \end{equation}
- 上記の2項目を$\max$と$\min$を利用せずに述べる。ある$x \in X$とある$y \in Y$とある実数$v$に対して、 \[ x^{\rm T} A \ge \left( \begin{array}{ccc} v & \cdots & v \end{array} \right) \] すなわち、 \[ \begin{eqnarray} \sum_{i \in M}{a_{i1}x_i} &\ge& v \\ \vdots && \\ \sum_{i \in M}{a_{in}x_i} &\ge& v \end{eqnarray} \] そして、 \[ A y \le \left( \begin{array}{c} v \\ \vdots \\ v \end{array} \right) \] すなわち、 \[ \begin{eqnarray} \sum_{j \in N}{a_{1j}y_j} &\le& v \\ \vdots && \\ \sum_{j \in N}{a_{mj}y_j} &\le& v \end{eqnarray} \] が成立すれば、$v(A)=v$で$x \in O_1(A)$そして$y \in O_2(A)$となる。
- さらに、$x \in O_1(A)$と$y \in O_2(A)$に対して、 \begin{equation} h(x,e_j) \gt v(A) \implies y_j=0 \\ h(e_i,y) \lt v(A) \implies x_i=0 \end{equation} \begin{equation} y_j \gt 0 \implies h(x,e_j) = v(A)\\ x_i \gt 0 \implies h(e_i,y) = v(A) \end{equation}
プレイヤー1の戦略が2個である(純粋戦略でナッシュ均衡が存在しない)行列ゲームの図的解法
純粋戦略でナッシュ均衡が存在しない先ほどの例を扱う。利得行列($A$とおく)を以下に再掲する。
L | C | R | |
T | $1$ | $3$ | $4$ |
B | $6$ | $3$ | $0$ |
プレイヤー1の混合戦略$\left( \begin{array}{c} x \\ 1-x \end{array} \right)$を$x$で表すと(この混合戦略を$x{\rm T}+(1-x){\rm B}$とも書く)、
\begin{eqnarray} h(x,e_1)&=&1x+6(1-x)=-5x+6 \\ h(x,e_2)&=&3x+3(1-x) = 3 \\ h(x,e_3)&=&4x+0(1-x)=4x \\ v(A) &=& \max_{0 \le x \le 1} \min \left\{ h(x,e_1), h(x,e_2), h(x,e_3) \right\} \end{eqnarray}下図より、ゲームの値は$v(A)=\frac{8}{3}$、プレイヤー1の最適戦略の集合は$O_1(A)=\left\{ \left( \begin{array}{c} \frac{2}{3} \\ \frac{1}{3} \end{array} \right) \right\}$。すなわち、プレイヤー1の最適戦略は$\frac{2}{3}{\rm T}+\frac{1}{3}{\rm B}$である。
次に、プレイヤー2の最適戦略$y$を求める。上のグラフより、$h\left(\frac{2}{3},e_2 \right) \gt \frac{8}{3} = v(A)$より、$y_2=0$である。プレイヤー1は最適戦略において純粋戦略TとBを正の確率でとるので、
\begin{eqnarray} h(e_1,y)&=&v(A) \\ h(e_2,y)&=&v(A) \end{eqnarray}すなわち、
\begin{eqnarray} 1y_1+3\cdot 0 + 4 y_3&=&\frac{8}{3} \\ 6y_1 + 3\cdot 0 + 0y_3&=&\frac{8}{3} \end{eqnarray}従って、プレイヤー2の最適戦略は$\frac{4}{9}{\rm L} + 0{\rm C}+\frac{5}{9}{\rm R}$である。(プレイヤー2の最適戦略の集合は$O_2(A)=\left\{ \left( \begin{array}{c} \frac{4}{9} \\ 0 \\ \frac{5}{9} \end{array} \right) \right\}$である。)
考察
プレイヤー2の最適戦略$\frac{4}{9}{\rm L} + 0{\rm C}+\frac{5}{9}{\rm R}$の構造を詳しく見てみる。まず、最適戦略において正の確率でとる純粋戦略はLとRである。相手のプレイヤー(ここではプレイヤー1)が最適戦略(ここでは、$\frac{2}{3}{\rm T}+\frac{1}{3}{\rm B}$)をとっている限り、プレイヤー2は先ほど述べた純粋戦略LをとろうがRをとろうが同じ期待利得$\frac{8}{3}$をプレイヤー1に支払う。では、なぜ純粋戦略LやRではなく、混合戦略$\frac{4}{9}{\rm L} + 0{\rm C}+\frac{5}{9}{\rm R}$を使う必要があるのか?その理由は、LかRをとることが事前に分かれば、当然プレイヤー1もそれを知っているという前提なので、それに呼応してプレイヤー1の最善の戦略をとってくるので、プレイヤー2は結果として損をする。そのために、プレイヤー2はLとRを確率的に混ぜて、プレイヤー1が自分の最適な混合戦略において正の確率でとるどの純粋戦略をとっても、期待利得がゲームの値$\frac{8}{3}$になるようにしている。すなわち、自分がどちらかをとるか明確にしないことが、自分にとっての最善になっているのである。この混合戦略における最適戦略(更に一般的には、ナッシュ均衡)の構造は一般的に成り立つ。
プレイヤー2の戦略が2個である(純粋戦略でナッシュ均衡が存在しない)行列ゲームの図的解法
例として、次の行列ゲーム$A$を解く。
L | R | |
T | $2$ | $3$ |
M | $3$ | $2$ |
B | $5$ | $0$ |
プレイヤー2の混合戦略$\left( \begin{array}{c} y \\ 1-y \end{array} \right)$を$y$で表すと(この混合戦略を$y{\rm L}+(1-y){\rm R}$とも書く)、
\begin{eqnarray} h(e_1,y)&=&2y+3(1-y)=-y+3 \\ h(e_2,y)&=&3x+2(1-y) = y+2 \\ h(e_3,y)&=&5y+0(1-y)= 5y \\ v(A) &=& \min_{0 \le y \le 1} \max \left\{ h(e_1,y), h(e_2,y), h(e_3,y) \right\} \end{eqnarray}下図より、ゲームの値は$v(A)=\frac{5}{2}$、プレイヤー2の最適戦略の集合は$O_2(A)=\left\{ \left( \begin{array}{c} \frac{1}{2} \\ \frac{1}{2} \end{array} \right) \right\}$。すなわち、プレイヤー2の最適戦略は$\frac{1}{2}{\rm L}+\frac{1}{2}{\rm R}$である。
次に、プレイヤー1の最適戦略$x$を求める。プレイヤー2は最適戦略において純粋戦略LとRを正の確率でとるので、
\begin{eqnarray} h(x,e_1)&=&v(A) \\ h(x,e_2)&=&v(A) \end{eqnarray}すなわち、
\begin{eqnarray} 2 x_1 + 3 x_2 + 5 x_3 &=& \frac{5}{2} \\ 3 x_1 + 2 x_2 + 0 x_3 &=& \frac{5}{2} \end{eqnarray}変形していくと、
\begin{eqnarray} \frac{2}{5} x_1 + \frac{3}{5} x_2 + x_3 &=& \frac{1}{2} \\ x_1 + \frac{2}{3} x_2 + 0 x_3 &=& \frac{5}{6} \\ \\ 0 x_1 + \frac{1}{3} x_2 + x_3 &=& \frac{1}{6} \\ x_1 + \frac{2}{3} x_2 + 0 x_3 &=& \frac{5}{6} \\ \\ x_1 &=& \frac{5}{6} – \frac{2}{3} \lambda \ge 0 \\ x_2 &=& \lambda \ge 0\\ x_3 &=& \frac{1}{6} – \frac{1}{3} \lambda \ge 0 \\ \end{eqnarray}従って、プレイヤー1の最適戦略は$\left( \frac{5}{6} – \frac{2}{3} \lambda \right){\rm L} + \lambda {\rm C}+\left( \frac{1}{6} – \frac{1}{3} \lambda \right){\rm R}$である。ただし、$0 \le \lambda \le \frac{1}{2}$である。(プレイヤー1の最適戦略の集合は$O_1(A)=\left\{ \left. \left( \begin{array}{c} \frac{5}{6} – \frac{2}{3} \lambda \\ \lambda \\ \frac{1}{6} – \frac{1}{3} \lambda \end{array} \right) \right| 0 \le \lambda \le \frac{1}{2} \right\}$である。)このプレイヤー1の最適戦略の集合は$\left( \begin{array}{c} \frac{5}{6} \\ 0 \\ \frac{1}{6} \end{array} \right)$と$\left( \begin{array}{c} \frac{1}{2} \\ \frac{1}{2} \\ 0 \end{array} \right)$を端点とする凸集合(2端点を結ぶ線分)になっている。
線形計画法の利用
純粋戦略におけるナッシュ均衡が存在せず、2人のプレイヤーの純粋戦略の個数が3個以上の場合、今までに述べた方法では一般形の$m$行$n$列の行列ゲーム$A$を解くことができない。しかし、次のように線形計画法を利用すれば求めることができる。プレイヤー1の観点からマックスミニ値を求めると、
\[\begin{array}{l} v(A) = \max v \\ {\rm s.t.} \left\{ \begin{array} {c} \begin{array}{ccccc} a_{11}x_1 &+ a_{21}x_2 &+ \cdots &+ a_{m1}x_m &\ge v \\ \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{1n}x_1 &+ a_{2n}x_2 &+ \cdots &+ a_{mn}x_m &\ge v \\ x_1 &+ x_2 &+ \cdots &+ x_m &= 1 \end{array} \\ x_1, x_2, \ldots, x_m \ge 0 \end{array} \right. \end{array}\]最大値がゲームの値$v(A)$で最大値を与える解$x$がプレイヤー1の最適戦略であり、(後で述べるようにこの問題の双対問題がプレイヤー2の観点からのミニマックス値を求める問題になるので)この双対問題の解がプレイヤー2の最適戦略である。
さて、上記の線形計画問題の双対問題を求める。次のように最小値問題に変形する。
\[\begin{array}{l} \min -v \\ {\rm s.t.} \left\{ \begin{array} {c} \begin{array}{cccccc} a_{11}x_1 &+ a_{21}x_2 &+ \cdots &+ a_{m1}x_m &-v &\ge 0 \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{1n}x_1 &+ a_{2n}x_2 &+ \cdots &+ a_{mn}x_m &-v &\ge 0 \\ x_1 &+ x_2 &+ \cdots &+ x_m & & = 1 \end{array} \\ x_1, x_2, \ldots, x_m \ge 0 \end{array} \right. \end{array}\]この双対問題を作ると、
\[\begin{array}{l} \max z \\ {\rm s.t.} \left\{ \begin{array} {c} \begin{array}{cccccc} a_{11}y_1 &+ a_{12}y_2 &+ \cdots &+ a_{1n}y_n &+ z &\le 0 \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{m1}y_1 &+ a_{m2}y_2 &+ \cdots &+ a_{mn}y_n &+ z &\le 0 \\ -y_1 &- y_2 &- \cdots &- y_n & & = -1 \end{array} \\ y_1, y_2, \ldots, y_n \ge 0 \end{array} \right. \end{array}\]$z=-u$とおき、変形すると、
\[\begin{array}{l} \min u \\ {\rm s.t.} \left\{ \begin{array} {c} \begin{array}{ccccc} a_{11}y_1 &+ a_{12}y_2 &+ \cdots &+ a_{1n}y_n &\le u \\ \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{m1}y_1 &+ a_{m2}y_2 &+ \cdots &+ a_{mn}y_n &\le u \\ y_1 &+ y_2 &+ \cdots &+ y_n & = 1 \end{array} \\ y_1, y_2, \ldots, y_n \ge 0 \end{array} \right. \end{array}\]これはプレイヤー2の観点からのミニマックス値を求める問題になっている。
ゼロ和ゲームにおけるナッシュ均衡の構造
戦略の組み合わせ(R1,L1)と(R2,L2)をナッシュ均衡とし、その時の(プレイヤー1の)の利得を、各々、$v_{11}$と$v_{22}$する。その時、(R1,L2)と(R2,L1)もナッシュ均衡であり、各々の利得を$v_{12},v_{21}$とすると、これらの利得はすべて等しい。すなわち、$v_{11}=v_{12}=v_{21}=v_{22}$である。(この結果は混合戦略でも成立する。)
説明
下図を利用して説明する。
プレイヤー1の戦略R1に対して、プレイヤー2が戦略をL1からL2に変えると、(プレイヤー1の)利得は増えるか等しいので、 \[ v_{11} \le v_{12} \]プレイヤー2の戦略L1に対して、プレイヤー1が戦略をR1からR2に変えると、(プレイヤー1の)利得は減るか等しいので、
\[ v_{11} \ge v_{21} \]プレイヤー1の戦略R2に対して、プレイヤー2が戦略をL2からL1に変えると、(プレイヤー1の)利得は増えるか等しいので、
\[ v_{22} \le v_{21} \]プレイヤー2の戦略L2に対して、プレイヤー1が戦略をR2からR1に変えると、(プレイヤー1の)利得は減るか等しいので、
\[ v_{22} \ge v_{12} \]これら4つの不等式から$v_{11} \le v_{12} \le v_{22} \le v_{21} \le v_{11}$
となるので、結局、すべてが等しい。 \[ v_{11} = v_{12} = v_{21} = v_{21} = v_{22} \]これらの値がすべて等しいので、プレイヤー2が戦略L2をとっていれば、プレイヤー1は戦略R2をとっても最大の利得$v_{22}$を得ているので、(R1,L2)もナッシュ均衡である。また、プレイヤー1が戦略R2をとっていれば、プレイヤー2は戦略L1をとっても最大の利得$v_{22}$を得ているので、(R2,L1)もナッシュ均衡である。従って、ナッシュ均衡における全ての利得が等しい。(説明終わり)