統計は冷酷だ

ポーカー、ゲーム、サッカーなどについて考えていきたい。自分の為にもブログを更新していこうと思う。

簡易化したリバーのGTOに関しての考察③

どうもこんにちは
今回は過去2回の内容を踏まえて考察していこうと思います。

検証するモデルは
OOP,IPのレンジは[0.1]
potが1、ベットサイズ1
OOPは強制check,OOPはcheck-raiseできない
IPはpotbetのみ
というモデルです。

これらのGTO解については
簡易化したリバーのGTOに関しての考察①
簡易化したリバーのGTOに関しての考察②
をご覧ください

③そのモデルの結果について考察していこうと思います。

ここでは
(1)GTOの特性について
(2)ポットベットに半分より多くのハンドをおりていることについて
の2点を考えていこうと思います。

(1)GTOの特性について

まず、今考えているのはポットベットなのでOOPは1/3の勝率があればcallできます。

実際IPがベットするレンジのうちバリューベット:ブラフベットの比が2:1になっておりOOPのブラフキャッチのレンジ(IPのバリューベットをするレンジには勝っていて、ブラフベットをするレンジには勝っているレンジ)はIPがGTOならばcallしてもfoldしても同じEVです。

この例からもわかるようにGTOは必ずしも一種類の解ではなく、複数存在していることが可能なのです。
また、戦略が有限のゲームにはナッシュ均衡すなわちGTOが必ず存在することが証明されています。


OOPのcall rangeを再掲します。

f:id:takoagemat:20180817185639p:plain
OOP call range


OOPのcall rangには84sまでかなり少ない割合ではありますがGTOはcallしています。
84sでcallするならQハイでfoldしている分をcallした方がいいのではと感じますが、84sでcallしてもこれはGTOであるため、相手はこれをリークとして搾取するのは無理だということです。

実際、混合戦略をとっているハンドはどちらの戦略でも期待値が変わらない選択肢であるのが下の画像からも確認できます。

f:id:takoagemat:20180818034356p:plain

しかしだからといってcall rangeをこれらの混合戦略をとっているハンドのうちどのように選択してもいいわけではありません。

例えばcallする割合を変えずにこのようにOOPのcall rangeを固定して最適戦略を計算し直します。(piosolverのnodelockの機能を使います。)

f:id:takoagemat:20180818040154p:plain
OOP call rage変更


するとIPのベットレンジは以下のようになり、かなりベットする割合が大きくなっています。

f:id:takoagemat:20180818040157p:plain
IPのbet range変更

さらにEVは22.846になっており、先ほどの22.221より大きくなっています。

OOPのコールレンジの偏りによって、OOPが搾取されてしまっているのです。

いかがでしょうか。実際のpokerでのflopからの計算結果をどのように体系化してプレイ方法を学ぶのか難しく自分にもわかりません笑

(2)GTOがpotbetに半分以上のハンドを降りている件について


自分がポーカーを始めた時は、potbetに半分以上降りてくれるならばベットした方がいいのかと思っていました汗
だって半分以上降りてくれるならそれだけでプラスEVじゃんって感じで笑

しかしポーカーはそんな単純じゃありませんでした笑
エクイティが0のハンドは確かにそうなのですが、自分が強いハンドを持っている時はコールしてもらった方が利益に繋がります。

じゃあもしOOPがレンジの上位半分のハンドをコールするならどのように搾取できるのかをpiosolverで計算してみようと思います。

その結果がこちらです。

f:id:takoagemat:20180819161826p:plain
OOPが上位半分をコースする時のIPの最適ベットレンジ

この結果を見てみるとIPはバリューベットのみをしていて全くブラフをしていないことがわかります。

冷静に考えてみると当たり前ですよね。
ブラフしても半分の確率でcallされてしまうのでブラフした時のEVは0なのに対し、ブラフしなければ多少のエクイティがあるのでEVはプラスです。

f:id:takoagemat:20180819162053p:plain
IPのbetとcheckのEV差


IPのEVが22.5になっており、GTOの時の22.221より大きくなっているのでOOPがレンジの半分をコールしたことで搾取されてしまっているがわかります。

OOPがレンジの上位半分をコールしている時に、IPとしてはもしGTO通りのプレイをしているとEVが22.221で相手がGTOの時と変わりませんが、搾取的にブラフをしないでバリューレンジを少し広げることでEVを22.5にあげることができます。


OOPはIPがバリューベットによる利益とブラフによる利益を最小にするためにはポットベットにも半分より多くのハンドをfoldしていいということがですね。

直感的にはこの面積を小さくするということです多分

f:id:takoagemat:20180818015232p:plain


左の紫の面積がバリューベットによるIPの利益、右の緑の面積がブラフベットによるIPの利益です。


ここまで読んでくれた方はありがとうございます。
書いた甲斐があったと思います。間違っている可能性も大いにあります。
気軽にコメントなどお待ちしてます。