2017年01月10日 19時00分 ソフトウェア

不完全な情報で最適な手が読みにくいゲーム「ポーカー」で人類対AIの頂上決戦「Brains VS. AI」が開催される



人工知能(AI)の進歩はめざましく、2016年にはGoogleのAlphaGoが囲碁の世界チャンピオンに勝ちました。進化を続けるAIの次なるターゲットはポーカーのチャンピオンとなりそうです。



Upping the Ante: Top Poker Pros Face Off vs. Artificial Intelligence

http://www.cmu.edu/news/stories/archives/2017/january/poker-pros-vs-AI.html



Brains vs AI

https://www.riverscasino.com/pittsburgh/BrainsVsAI/



カーネギー・メロン大学によって開発されたAIソフトウェア「Libratus」が、2017年1月11日から1月30日までピッツバーグのリバーズカジノで開催されるポーカー大会「Brains VS. AI」で、世界最高レベルの4人のプロプレイヤーと対決を行います。



囲碁と違ってポーカーは相手の手札がわからないため、すべてのプレイヤーが不完全な情報の中で戦いを強いられるという不確実性を持っています。このため、AIなどのプログラムにとって最も良い手の判断を行うアルゴリズムの開発は非常に難しく、AIの優秀さを測定する指標としてもポーカーはよく用いられているとのこと。また、不完全な情報に基づいて最良の手段を模索しなければいけないという状況は、現実世界の問題解決の場面でも同じであることから、ポーカーゲームで使われるAIプログラムは、現実世界のあらゆる場面で応用可能であると考えられており、具体的にはビジネス、軍事、サイバーセキュリティ、医療などの分野での意志決定への応用が期待されています。



カーネギー・メロン大学のツオマス・サンドホルム教授は「人間のトッププレイヤーを倒すことは、AI研究が始まった頃からの、AIの進化の尺度でした」と話します。





AIとトッププロによるポーカー対決は、すでに2015年4月24日から開催された第1回「Brains VS. AI」で行われました。対決では、4人のトッププロとカーネギー・メロン大学の開発したAI「Claudico」によって、オールインを認める無制限のテキサス・ホールデムによって争われました。テキサス・ホールデムは、5枚のカードを使った一般的なポーカーと違って、プレイヤー全員に開示される共通カードのコミュニティカードと、自分だけのホールカードを組み合わせてできる手で勝敗を競うゲームで、運の要素が大きなポーカーの「読み」の要素をより手厚くしたゲームです。とはいえ、ブラフを駆使していかにして相手を勝負から降りさせるかという「かけひき」が勝負の行方を左右するのは一般的なポーカーと同様です。



第1回大会では、人間・AIの両者で総計1億7000万ドルかけた勝負で人間が約73万ドル分の差で辛くも勝利。Claudicoは4人のプロプレイヤーのうち3人にチップの額で下回りました。





第2回大会に向けてカーネギー・メロン大学はAIソフト「Libratus」において、戦略のスコア化をするプログラムを書くのではなく、戦略を計算するアルゴリズムを設計しているとのこと。約1500万時間分という、Claudicoの開発で費やした200万から300万時間をはるかに上回る演習量でLibratusに計算をさせており、「スーパーコンピューターをクレイジーなまでに酷使している」とサンドホルム教授は述べています。なお、クレイジーな演習は大会まで継続する予定だとのこと。



これに対して人間側は、第1回大会にも参加したジェイソン・レス氏、キム・ドン氏にダニエル・マコーレー氏、ジミー・チョウ氏というトッププレイヤーを加えてLibratusを迎え撃ちます。レス氏は「Claudicoはとてもタフな相手でした。前回から20カ月経って新たにリソースを追加していることから、今回の対決は前回以上に挑戦的なものであると考えています」と話し、最新のAIとの対決に興奮しているそうです。

