ナッシュ均衡その2

ポーカーにおけるナッシュ均衡の使い方について解説します。

ナッシュ均衡についてよくわからない人は、ナッシュ均衡その1をまず読んでください。

ナッシュ均衡その１

ナッシュ均衡についての基本的な考え方

ポーカーにおけるナッシュ均衡
ナッシュ均衡表通りのプレイが最強なのか
ナッシュ均衡はいつ使えばいいのか

ポーカーにおけるナッシュ均衡

このページを読んでいる人は、ナッシュ均衡を理解しているか、ナッシュ均衡その1を読んだ人でしょう。

ナッシュ均衡の意味をまとめると、互いが互いの戦略を把握しており、お互いこれ以上戦略を変更しないほうがいい状態まで突き詰められた状態での戦略の組み合わせ、ということができます。

ポーカーにおけるナッシュ均衡は

「トーナメンでのプッシュオアフォールド（オールインかフォールドか）」

「リバーでプレイヤーAのレンジが大体ナッツとブラフしかなく、プレイヤーBのレンジが大体ブラフキャッチャーしかない状況で、Aはブラフの比率を、そしてBはコールとフォールドの比率を何にすればナッシュ均衡になるか」

「３ベット、４ベット、５ベットのレンジのナッシュ均衡」

などで用いられます。このページでは、トーナメントでのプッシュオアフォールドで説明します。

トーナメントでのプッシュオアフォールドの状況で使うナッシュ均衡は、互いが互いのプッシュレンジとコールレンジを把握しており、これ以上ハンドレンジを変更しないほうがいい状態まで突き詰められた状態でのプッシュレンジとコールレンジの組み合わせ、となります。

ハンドレンジについて理解が追いつかない方は、先に以下の記事をおすすめします。

例えばトーナメント残り3名で全員スタックは10BB、1位に賞金の70%、2位に30%が与えられる場合に、ブラインドヘッズとなった時の、SBのオールインすべき特定のハンドレンジと、BBがコールすべき特定のハンドレンジの、お互いに最適な組み合わせをナッシュ均衡によって導き出します。

SBは、自分がオールインした時にBBが特定のハンドレンジでコールするとわかっていた場合に、最適となる自分のオールインハンドレンジでオールインし、BBは、SBが特定のハンドレンジでオールインしてくるとわかっていた場合に、最適となる自分のコールレンジでコールします。互いにナッシュ均衡を完璧に理解しており、そのとおりにプレイできるのであれば、お互い期待値上は負けません。

ちょっと何いってんのかわからないです、という人のために、プッシュ（オールイン）、コール、オーバーコール（オールインにコールが入ってる状態でコールする）のハンドレンジを示してくれるサイトがあるのでそちらを元に見てみましょう。（英語です）

Nash ICM Calculator - HoldemResources.net

Free push-or-fold Nash ICM calculations for the endgame of NLHE tournaments.

これはICMを元にしたナッシュ均衡から導き出されるプッシュレンジなどを示してくれるサイトです。

ここに以下のように入力して結果を出します。

ブラインド50-100ーAnte0で、全員10BBを持っており、賞金は1位70%、2位30%です。この状態での各プレイヤーのプッシュすべきハンドレンジ、コールすべきハンドレンジなどを見てみます。

結果は以下の通り。

結果へのリンク

用語の説明は以下の通りです。

Player：プレイヤーのポジション
Stack：スタック量
Push%：オールインすべきハンドレンジ
EQPre：このハンドが始まる前の期待値
EQPost：このハンド後の期待値（SBとBBはブラインドを支払うので下がる）
EQDiff：ハンド前とハンド後の期待値の差
PU：（プッシュ）オープンオールインすること。
CA：（コール）オープンオールインにコールすること。
OC：（オーバーコール）オープンオールインにコールが入っている状態でコールすること。
Range：ハンドレンジ。

このナッシュ表からわかるのは、

ボタンは22.8%のハンドレンジでプッシュしなければならない
SBはそれに対して5.9%のハンドレンジでコールしなければならない
BBはそれに対して0.9%のハンドレンジ（KKかAA）でオーバーコールしなければならない
ボタンのプッシュにSBがフォールドした場合、BBは8.4%のハンドレンジでコールしなければならない
ボタンがフォールドした場合、SBは68.3%のハンドレンジでプッシュしなければならない
SBのプッシュにBBは22%のハンドレンジでコールしなければならない

今回の例であげた状況では、ナッシュ均衡となるオールインすべきハンドレンジとコールすべきハンドレンジは上記のようになります。

ボタンがプッシュすべきレンジは22.8%とそれなりのレンジですが、SBのコールレンジは5.9%と非常に狭くなっています。それにさらにオーバーコールすべきBBのレンジはKKとAAのみです。

ボタンがフォールドした時のSBのプッシュレンジは68.3%と非常に広くなっています。そしてBBのコールレンジは、SBのプッシュレンジに比べればもちろん狭いですが、22%と、それなりのレンジでコールしなければなりません。

具体的に例にすると

ボタンはJ9sならオールインしなければならない
その時SBはAToなら降りなければない
BBは77ならそれにコールしなければならない

ナッシュ均衡表のレンジでは上記のアクションが正しいアクションになります。

この表を見て

「SBとBBのコールレンジすげー狭いのならボタンでとにかくなんでもプッシュすればスチールできるじゃん！」

というのは大間違いです。

ナッシュ均衡その1でも説明しましたが、ナッシュ均衡というのはお互いがお互いの戦略を知っている場合の戦略なのです。

ボタンのプッシュレンジがもし100%だとして、それをSB、BBが知っていた場合、コールレンジを調整されてしまい、ボタンの期待値はマイナスとなってしまいます。

あくまでボタンのプッシュレンジは22.8%であり、をそれをSBとBBが知っている（ボタンもSBとBBのコールレンジを知っている）、という状況だからこそ成立しているのです。

ビッグスタックがいる場合、全員ショートスタックの場合、一人だけショートスタックの場合など、いろいろなシチュエーションでシミュレーションしてみましょう。

ナッシュ均衡表通りのプレイが最強なのか

最も利益を生むプレイではありませんが、最も負けないプレイと言えます。

ジャンケンのナッシュ均衡はグーチョキパーを3分の1ずつ出すことで、誰にも負けない戦略ですが、誰にも勝ち越すことはできません。ちょっとでも割合を変更し、そこに相手に付け込まれる（弱点を突かれる）と搾取（Exploit）されます。

また、何度も言いますが互いにナッシュ均衡を理解しており、且つ、お互いが「相手の戦略（レンジ）を把握している」場合でないと意味がありません。（そうでない場合もっと良い戦略があります。）

あなたがSBで後ろにフィッシュのBBがいたとします。ここでナッシュ表通りのプッシュレンジでプッシュしても、相手のコールレンジがナッシュ表とはまったく違うのであれば、あなたのプッシュレンジは正しいものではないかもしれないのです。

お互いにあと10BBしかないとして、BBがルースなフィッシュで、コールレンジが広いのであれば、あなたはプッシュレンジを少しタイト目にすることで期待値を上げれます。

BBがタイトすぎるフィッシュであれば、あなたはプッシュレンジを広げて、スチール多用したほうがいいかもしれません。

逆に、相手があなたのことをルースである、と考えていた場合、相手のコールレンジは広いでしょう。それを知ったあなたは、プッシュレンジをタイト目に調整します。

もしくは相手があなたのことをタイトだ、と考えていた場合、相手はコールレンジを狭めるでしょう。それを知ったあなたはルースにプッシュすることで高いスチール成功率を得ることができます。

このように、本来は、相手のレンジに合わせて自分のレンジを調整することで期待値をあげるべきなのです。

これがExploit（エクスプロイト：搾取）する、ということです。

こうした、相手のレンジの読み合いが極限までいきついた先にあるのがナッシュ均衡です。

ナッシュ均衡にいきつくと、もうそれ以上戦略（レンジ）を変更すると、変更した側の期待値が下がってしまうため、互いにナッシュ均衡通りにプレイするようになります。

ナッシュ均衡はいつ使えばいいのか

上の項でも書きましたが、望ましいのは相手のレンジにあわせて自分のレンジを調整することで期待値をあげることです。

しかし相手のプレイスタイル（レンジ）がわからない、ということもポーカーをしていればよくあることです。

そんな時にナッシュ表通りのレンジでプレイすることは間違いではありません。

最低限の利益（EV）を保証してくれます。

相手を（実はタイトなのに）ルースだと勘違いして自分のレンジを調整した場合損失を被りますし、逆に相手を（実はルースなのに）タイトだと勘違いしても同じです。

そうした勘違いによる損失を最小限に留めて、且つ相手にこちらのレンジによる弱点に付け込ませないのがナッシュ均衡です。

ポーカーをしていて、相手のレンジをこちらが把握しており、相手はこちらのレンジをよくわかってない、そう思える場合は相手のレンジによって自分のレンジを調整しましょう。

もし相手が自分よりもレベルが上で、こちらがどのようなレンジを選択しても相手にそれに対応される、と考える場合は、ナッシュ表通りのレンジでプレイしましょう。

そうすることで、たとえ相手がフィル・アイビーでも搾取されないプレイが可能です。

最後に、ナッシュ均衡を使ったテキサスホールデム全体（プリフロップからリバーまで）の最適解というのは理論上存在しますが、実用は現実的ではありません。

プレイヤーが複数いる
ベットするチップの額（戦略）のパターンが多すぎる

などの理由から、解を導き出すには計算が複雑すぎるのです。

ナッシュ均衡はあくまでプッシュオアフォールドなど、特定の状況で使うようにしましょう。

コメント名前とメアドは必須ではありません

Tyler Carrico より:
2014年4月10日 12:08 PM
「ポーカーにおけるナッシュ均衡はプッシュオアフォールドの状況で主に使われます。」
これはトーナメントに関してだけです。キャッシュゲームの場合（トーナメントにも適用するが）、リバーでプレイヤーAのレンジが大体ナッツとブラフしかなく、プレイヤーBのレンジが大体ブラフキャッチャーしかない状況で、Aはブラフの比率を、そしてBはコールとフォールドの比率を何にすればナッシュ均衡になるか、という問題があります。このような問題の答えは「The Mathematics of Poker」が出版されてから広く知れ渡るようになりました。（AKQゲームはご存知ですか？）これについてはプッシュオアフォールドより多く書かれている上に、ポーカーでプッシュオアフォールドと比べてもっとよくある状況です。最近では３ベット、４ベット、５ベットのレンジのナッシュ均衡の作り方も論じられるようになり、ヘッズアップではその答えが既に出版されています：http://www.amazon.co.jp/Expert-Heads-Limit-HoldEm-Exploitative/dp/1904468942/ref=pd_sim_fb_1?ie=UTF8&refRID=0TDX0DD3Z3S2SJD3KXP3
「相手のレンジによっては、期待値がマイナスになることもあればプラスになることもありますが、被害は最小限におさえることができます。」
これはネガティブな言い方なのでナッシュ均衡はしょうがなく使わなければならないものなのだと勘違いされがちかもしれません。ポジティブな言い方をすれば、「最低限の利益（EV）を保証してくれる」になります。
返信
- 鮫肌より:
  2014年4月14日 7:25 PM
  Tyler Carricoさん
  コメントありがとうございます。
  ＞Aはブラフの比率を、そしてBはコールとフォールドの比率を何にすればナッシュ均衡になるか
  たしかにこういったシチュエーションは多いですし、いくつか書籍やWEBなどでもよく見かけますね。記事を少し修正させていただきますね。
  ＞AKQゲームはご存知ですか？
  存じ上げません。少しぐぐっても見つかりませんでした。これはなんでしょう？
  また、英語の文献は残念ならが私の英語能力の低さゆえ、ほとんど読めておりません。
  読んだほうがいいのは重々承知しておりますｗ
  ＞ポジティブな言い方をすれば、「最低限の利益（EV）を保証してくれる」になります。
  この表現は使わせていただきます！
  返信
  - Tyler Carrico より:
    2014年4月15日 9:03 PM
    日本語に翻訳されているポーカーの本は少ないですよね。でもこのサイトでいろんな英語のポーカー用語を使ってますね。よく知ってるなーと思いました。^^
    AKQゲームはナッシュ均衡をポーカー界で論証する代表的な例で、リバーでバリューベットとブラフをどうやってバランスするかという問題を単純化したものです。このゲームではまずプレイヤー二人（P１とP２）にカードがA一枚、K一枚とQ一枚（合計三枚）のデッキからカードを一枚配られます。ハンドのランキングはA>K>Qです。ポットはP、ベットのサイズは１です。ベッティングは、P１がベットかチェック、P２がコールかフォールドの選択肢があります。このゲームの最適解は次の通りです。
    P１：
    A: 100% ベット
    K: 100% チェック
    Q: 1/(P+1)*100%　ベット（ブラフ）
    P２：
    A: 100% コール
    K: (P-1)/(P+1)*100% コール（ブラフキャッチャー）
    Q: 100% フォールド
    実はこれはAKQゲームの一種に過ぎず、Jのカードをデッキに加えることや、P２にもベットできるようにする、P１がレイズすることを可能にする、ベッティングをノーリミットにする等、多彩な変化があり、より複雑でポーカーに類似したゲームが研究され続けています。
    返信