$2 \times 2$ 双行列ゲームのナッシュ均衡の求め方

次の$2 \times 2$ 双行列ゲーム（非ゼロ和ゲーム）を例にとり、（純粋戦略のナッシュ均衡を含む全ての）ナッシュ均衡の求め方を説明する。また、最後の方で、ゼロ和ゲームのナッシュ均衡が持つ性質を非ゼロ和ゲームが持たないことを例示する。

	L	R
T	$2,1$	$4^,2^$
B	$3^,2^$	$1,1$

純粋戦略におけるナッシュ均衡

まず、純粋戦略におけるナッシュ均衡だけを求める場合は、上の双行列に記入してあるように、コンマの左の数字は列方向（上下方向）に比較し最大値の右肩に「$*$」を付ける。コンマの右の数字は行方向（左右方向）に比較し最大値の右肩に「$*$」を付ける。両方の数字の右肩に「$*$」が付けられた利得の組み合わせがある場合、それを実現する戦略の組み合わせが（純粋戦略における）ナッシュ均衡であった。上の表の場合、(B,L)と(T,R)が純粋戦略におけるナッシュ均衡である。

混合戦略におけるナッシュ均衡

確率$x$でTを確率$1-x$でBをとるプレイヤー1の混合戦略を$x\rm{T}+(1-x)\rm{B}$で表し、確率$y$でLを確率$1-y$でRをとるプレイヤー2の混合戦略を$y\rm{L}+(1-y)\rm{R}$で表し、更に簡略化のために、前者を$x$、後者を$y$で表すことにする。ただし、$0 \le x \le 1, 0 \le y \le 1$である。この時プレイヤー1と2の期待利得$h_1(x,y)$と$h_2(x,y)$は次のようになる。

\begin{eqnarray} h_1(x,y)&=&2xy+4x(1-y)+3(1-x)y+1(1-x)(1-y) \\ &=&(3-4y)x+2y+1 \\ h_2(x,y)&=&1xy+2x(1-y)+2(1-x)y+1(1-x)(1-y) \\ &=&(1-2x)y+x+1 \end{eqnarray}

$y$が与えられた時、$h_1(x,y)$を最大にする$x$の値$R_1(y)$（プレイヤー2に対するプレイヤー1の最適反応対応と呼ぶ）を求めると、

\begin{equation} R_1(y) = \begin{cases} 0 & \left( y \gt \frac{3}{4} \right) \\ 任意 & \left( y= \frac{3}{4} \right) \\ 1 & \left( y \lt \frac{3}{4} \right) \end{cases} \end{equation}

同様に、$x$が与えられた時、$h_2(x,y)$を最大にする$y$の値$R_2(x)$（プレイヤー1に対するプレイヤー2の最適反応対応と呼ぶ）を求めると、

\begin{equation} R_2(x) = \begin{cases} 0 & \left( y \gt \frac{1}{2} \right) \\ 任意 & \left( y= \frac{1}{2} \right) \\ 1 & \left( y \lt \frac{1}{2} \right) \end{cases} \end{equation}

グラフ$G_1=\left\{ \left( R_1(y),y \right) \left| 0 \le y \le 1 \right. \right\}$と$G_2=\left\{ \left( x,R_2(x) \right) \left| 0 \le x \le 1 \right. \right\}$の共通部分を求めると、

$G_1 \cap G_2 = \left\{ (0,1), \left( \frac{1}{2} , \frac{3}{4} \right), (1,0) \right\}$ となる。例えば、$ \left( \frac{1}{2} , \frac{3}{4} \right) \left( \in G_1 \cap G_2 \right)$ は$\frac{1}{2} \in R_1 \left( \frac{3}{4} \right), \frac{3}{4} \in R_2 \left( \frac{1}{2} \right)$を意味し、互いが相手に対する最適反応になっているので、ナッシュ均衡となる。従って、このゲームのナッシュ均衡は$(\rm{B},\rm{L})$、$\left( \frac{1}{2}\rm{T} + \frac{1}{2}\rm{B} , \frac{3}{4}\rm{L} + \frac{1}{4}\rm{R} \right)$、$(\rm{T},\rm{R})$の3個になる。純粋戦略は混合戦略の特別な場合なので、純粋戦略におけるナッシュ均衡も同時に求められる。すなわち、すべてのナッシュ均衡を求める場合は上記の方法を用いると良い。

非ゼロ和ゲームとゼロ和ゲームの相違点

ゼロ和ゲームナッシュ均衡の特徴として、複数のナッシュ均衡が存在する時

全てのナッシュ均衡におけるプレイヤー1の利得が等しい。（プレイヤー2にとっても同じ。）従って、その利得をゲームの値と呼んでいた。
（非ゼロ和ゲームでは戦略の組み合わせがナッシュ均衡である。しかし、ゼロ和ゲームでは、ナッシュ均衡の構造が、自分があるナッシュ均衡が指定する自分の戦略をとり、相手がまた別のナッシュ均衡が指定する相手の戦略をとったとしても、その結果の戦略の組み合わせがまたナッシュ均衡になっている。このため）各プレイヤーの最適戦略として捉えることができた。

上記の非ゼロ和ゲームにおいて、ナッシュ均衡は$(\rm{B},\rm{L})$、$\left( \frac{1}{2}\rm{T} + \frac{1}{2}\rm{B} , \frac{3}{4}\rm{L} + \frac{1}{4}\rm{R} \right)$、$(\rm{T},\rm{R})$の3個であり、各々の期待利得は$(3,2),\left( \frac{5}{2}, \frac{3}{2} \right),(4,2)$である。従って、ナッシュ均衡により、各プレイヤーの期待利得が異なる。また、例えば、(B,L)はナッシュ均衡であるが、相手の戦略を言及せずに、プレイヤー1のBが最適戦略である、等と表現できない。

従って、非ゼロ和的状況においてナッシュ均衡の概念に従う限り、相手の行為に言及することなく、自分のある行為の妥当性（ナッシュ均衡が持つ安定性があるなどの妥当性）を語ることができない。

プリズム