古いバージョンのブラウザーを使用しています。MSN を最適にご利用いただくために、サポートされているバージョンをご使用ください。

人間は人工知能に勝てるのか? ポーカーのプロに聞いた

ITmedia PC USER のロゴ ITmedia PC USER 2016/11/05
人間は人工知能に勝てるのか? ポーカーのプロに聞いた: 画像:ITmedia © ITmedia PC USER 提供 画像:ITmedia

 神の一手に最も近いのは、人間か、AI(人工知能)か──。盤上ゲーム、もっと広く言えば頭脳ゲームにおいて、人間とAIの関係はたびたび注目を浴びる。

 チェスではすでにAIが人間を超えたとされており、将棋ソフトもトップ棋士たちに勝ち越すほどの実力を持つまでになった。まだ完全解析は不可能と言われていた囲碁の世界でも、Google DeepMindが開発した囲碁用AI「AlphaGo」がトップ棋士イ・セドルに4勝1敗で勝ち越したことも記憶に新しいだろう。

 もう、頭脳ゲームで人間はAIに太刀打ちできないのか。プロポーカープレイヤーの木原直哉さんは、「人間に得手不得手があるように、AIにも得意分野と苦手な分野がある」と語る。ポーカーの世界について話を聞きつつ、「頭脳ゲームにおける人間とAIの関係」を考えていきたい。

●ポーカーが完全解析されていない理由

 ポーカーにはさまざまな種類があるが、世界中で最も有名なのが、2枚の手札と共通カード5枚を使って役を作る「テキサスホールデム」というゲームだ。

 2枚の手札は自分以外見ることができないため、プレイに必要な情報が全員に共有されない「不完全情報ゲーム」となる。この分野では、まだまだ人間がAIに対して有利だと考えられている。

 2015年に、カナダの大学で「ポーカーの完全解を見つけた」とされる論文が発表されたが、これは「リミットホールデムのヘッズアップ」(ベット額に制限があり、1対1で戦うもの)という特定の条件下での話。仮にこれが事実だとしても、「ポーカーそのものが完全解析された」とは言えないだろう。

 木原さんも、「リミットゲームはやることがほぼ決まっているので、ミスをしなければ勝てるコンピュータ向きのゲーム。それに1対1なら、自分が得する行動をすれば相手が損をするというように、自分の行動が相手の損得に直結するので分かりやすい」と説明する。

 ポーカーは本来、1テーブル6〜10人の多人数でプレイするため、状況はより複雑になる。「多人数の場合ではさまざまな要素が絡み合い、自分の最適解だけを考えていても駄目なので、人間もAIに善戦できる」というわけだ。

 現に木原さんは、「リミットホールデムのヘッズアップなら、長期的に見ると自分はAIにほとんど勝ち目がないが、多人数かつAI以外のメンバーが自分より格下の人間であれば、AIと比べてもより多く勝つ自信があります」と話す。また、ベット額に制限のない「ノーリミットホールデムのヘッズアップなら、恐らくAIに勝てる人間はスペシャリスト中心に世界でも2桁くらいいて、自分は(得意ではない分野というのもあって)勝てない方に入ります。しかし、ノーリミットホールデムの多人数ゲームなら、自分以外がAIもしくは自分と同じレベルのプレイヤーならば、勝てるかどうかぎりぎりのラインにいると思います」と胸中を語った。

 実は、2015年にカーネギーメロン大学が開発したAIとトッププロ4人が「ノーリミットテキサスホールデム」で対決している。開発者たちは「統計学的にみれば引き分け」と主張したが、金額的にはトッププロたちが73万2713ドルと大きく勝ち越した。

 木原さんは、「開発者たちは勝敗の差をブレの範囲と言ったらしいですが、僕の感覚ではそれは誤差とは言いづらいレベルです。やる前は、互角か人間が負けるかもくらいに思ってましたが、案外まだまだ人間もいけるんだなって思いましたね」と笑顔を見せる。

●AIが苦手なゲームと人間が得意なゲーム

 これから研究が進めば、いずれポーカーの解析も進んでいくだろうが、現時点でAIが得意/苦手とするゲーム、人間が得意/苦手とするゲームはどう考えられるだろうか。

 木原さんは、「運の要素が絡むかどうか」と「相手の手の内を完全に知ることができるかどうか」の2つが重要だと説明する。それぞれを以下のように定義したい。

・完全情報ゲーム→全ての情報がプレイヤー間で共有されている

・不完全情報ゲーム→全ての情報がプレイヤー間で共有されていない

・確定ゲーム→運の要素がない

・不確定ゲーム→運の要素がある

 木原さんは「AIは人間と比べて確率に強く、不完全情報ゲームに弱い。逆に、人間はAIと比べて確率に弱く、不完全情報ゲームに強い」と分析する。これを踏まえた上で、各ゲームの特性をまとめてみよう。

・不確定完全情報ゲーム(AIが最も得意とする分野)→バックギャモン

・確定完全情報ゲーム→将棋、囲碁、チェスなど

・不確定不完全情報ゲーム→ポーカー、マージャン

・確定不完全情報ゲーム(定義上は人間が得意とする分野)→概念的に矛盾するため存在しない?

 AIが最も得意とする不確定完全情報ゲームであるバックギャモンでは、2000年代にAIが人間を下し、今は確定完全情報ゲームである将棋や囲碁もAIがトップ棋士に勝ち越すほどの存在感を示している。AIの得意/苦手とする要素をどちらも含む不確定不完全情報ゲームであるポーカーやマージャンのトッププロたちがAIに脅かされるのも時間の問題だろう。

●ポーカーで「強いAI」は生まれるのか?

 また、ポーカーで「強いAI」が登場していない背景にはいくつか理由があるのではないかと木原さんは考えている。1つ目は、将棋や囲碁とのゲームの進行速度の違いだ。将棋では1つの局面を深く読むことで最適解(詰み)を導き出すが、ポーカーの場合は数十秒から長くても十数分で1つのゲームがリセットされて次のゲームに進むため、そもそも1つの場面を解析することが無意味となる。「カジノで電子機器の利用を厳しく制限していない」のも、そもそもソフトを使うこと自体に大したメリットがないためだ。

 木原さんは「ポーカーは将棋のように最後まで読み切るという概念がないので、素人でもプロに勝てるゲーム。僕自身、ポーカーを覚えたのは26歳と遅く、早くから活躍していたプレイヤーとの差を感じることがあります。将棋や囲碁だと、この差は絶対埋められないですよね」と話す。

 ポーカーで強くなる上で欠かせない「アジャスト」という概念もAIが苦手とするものだ。将棋や囲碁では、常に最適解を目指せばよいが、ポーカーの場合は「各プレイヤーに合わせたプレイ」が重要になってくる。格上の相手だろうが、格下の相手だろうが、ただ単に自分が最適なプレイをすればよいのではなく、相手の動きに合わせて自分のアクションも柔軟に変えていく適応力が求められるのだ。AIが理解できない常識外れのアクションをしたときなどに正しく適応できるかどうか、という点だ。

 将棋では「1勝の価値」に差はない(大差でも、辛勝でも同じ勝ち星)が、ポーカーでは「得られるバリューは最大限に、損するリスクは最小限に」が鉄則なので、同じ勝ちでも「どれくらいの金額勝ったか(もしくは、本来得られたバリューを取り損なったか)」が重要になる。人間の方が「大きく得する」ための適応力と柔軟性があるので、木原さんも「現状、ポーカーAIはトッププロに迫るレベルであり、抜かれるのも時間の問題ですが、ゲームにおける直接の脅威とはなりえないと思います」と冷静だ。

 囲碁のトップ棋士を下した後、DeepMindの開発者は「次はポーカーだ」と語った。人間が得意としてきた分野すらもAIが完全解析しまった未来では、一体世界はどう変わってしまうのだろうか。

●木原直哉さんプロフィール

 1981年生まれの北海道出身で、2001年に東京大学理科一類に入学。在学中は将棋部に所属し、バックギャモンやポーカーなどの頭脳ゲームに熱中していく。10年かけて東京大学理学部地球惑星物理学科を卒業し、翌2012年の第42回世界ポーカー選手権大会 (2012 World Series of Poker) の「ポット・リミット・オマハ・シックス・ハンデッド」で日本人初の世界タイトルを獲得。賞金51万2029ドル(約5022万円)を手にした。職業はプロ・ポーカープレイヤー。

 著書に『運と実力の間(あわい)―不完全情報ゲーム(人生・ビジネス・投資)の制し方』(飛鳥新社)、『たった一度の人生は好きなことだけやればいい! 東大卒ポーカー世界チャンプ 成功の教え』(日本能率協会マネジメントセンター)、『東大卒ポーカー王者が教える勝つための確率思考』(中経出版)がある。

(村上万純)

ITmedia PC USERの関連記事

image beaconimage beaconimage beacon