レミ・クーロンは10年を費やし、どんなコンピューターよりも上手に囲碁をプレイするソフトウェアを開発した。彼はそのソフトを「Crazy Stone」と名づけた。

2014年に東京で開かれたトーナメントで、彼のソフトは囲碁の達人である依田紀基（世界トップレヴェルの棋士のひとりだ）に立ち向かい、素晴らしい戦いをした。「電聖戦」として知られるこの戦いで、Crazy Stoneはこの達人を打ち負かしたのだ。その“勝利”には注釈が必要であったが。

過去20年間で、コンピューターは多くの知的ゲームにおいて、人間のトッププレイヤーたちを打ち負かしてきた。コンピューターはどんなものにおいても人間に勝てるのではないか、とわたしたちは思い込んでしまいそうだ。

しかし囲碁という、縦横19本の線が交差する盤上に滑らかな石を置いて対戦する東洋のチェスは、いまだにその例外である。たしかに、Crazy Stoneは依田に勝利した。しかしそれは、置き石4つのハンデをつけてのことだ。互角に戦うためには、そうするしかなかったのである。

チェスではすでに、AIは人類を相手に勝利している。写真はガルリ・カスパロフ。PHOTOGRAPH BY ACEKINDRED (CC BY-SA 2.0)

90年代半ば、「Chinook」という名のコンピュータープログラムが、チェッカーで世界最高のプレイヤーに勝利した。その数年後、IBMのDeep Blueがチェスのワールドチャンピオン、ガルリ・カスパロフを破ってチェス界を震撼させた。さらにその後、IBMのWatsonが、クイズ番組「ジェパディ！」のベストプレイヤーを打ち負かしている。

コンピューターは他にも、オセロ、スクラブル、バックギャモン、そしてポーカーを制覇した。だが、Crazy Stoneが依田に勝利したあと、クーロンは、コンピューターがハンデなしで囲碁の達人に勝利するまでには「さらに10年かかるかもしれない」と述べている。

当時は、10年という期間はむしろ短く思えた。囲碁においては、達人たちはしばしば注意深い分析よりも直感に近い何かに頼る。そして、その種の直感を模倣するコンピューターをつくるのは極めて難しいのである。

しかし、ある新兵器のおかげで、コンピューターはずっと早く人間を打ち負かすことができるかもしれない。ディープラーニングだ。

グーグル社員である2人が、同じくグーグルの「20パーセントプロジェクト」を取材して回るYouTubeコンテンツ「Nat & Lo’s 20% Project」。上記動画では機械学習およびディープラーニングがわかりやすく解説されている。

グーグルやフェイスブックといった企業によって、ディープラーニングが画像認識やパターン認識に非常に優れていることが証明されている。この能力は囲碁にも向いている。グーグルとフェイスブックはディープラーニングがもたらす非常に多くの可能性を探っているが、彼らはまた、この古典的なゲームで人間を打ち負かすことのできるAI開発においても競争しているのだ。

フェイスブックの人工知能研究者ヤンドン・ティアンが説明するように、囲碁はAI研究者にとって昔からの課題──途方もなく難しく、途方もなく魅力的な課題である。フェイスブックは、「囲碁という謎」を解決することが彼らのソーシャルネットワークを動かすAIを進歩させるだけでなく、AIの価値の証明にもなると考えている。

同じくフェイスブックのAI研究者、ロブ・ファーガスも同じ考えだ。「目標は、AIを進歩させることです」と彼は言う。しかし彼はまた、グーグルへのライヴァル意識がAI研究の動機になっていることも認める。囲碁の謎の解決には、プライドがかかっているのだ。

「囲碁脳」をつくるために

今日、グーグルとフェイスブックは、ディープラーニングをインターネット上の写真のなかの顔を識別するために使っている。それは電話に向かって話した言葉をコンピューターが認識し、ある言語から別の言語へ翻訳するための技術でもある。人々が会話で使うような言葉、すなわち自然言語を理解することもできる。

このテクノロジーはディープニューラルネットワークと呼ばれる、人間の脳のなかに張り巡らされたニューロンの網にも似た、膨大なコンピューターネットワークに依存するものだ。これらのニューラルネットワークにある系列の写真を十分な枚数インプットすれば、これらのネットワークはその系列を特定できるようになる。十分な数の対話をインプットすれば、まともな（ときどきおかしいことはあるが）会話をすることもできる。そしてもし十分な数の囲碁の手をインプットすれば、囲碁をプレイできるようになるのだ。

「盤上の石のパターンによって多くの判断が下される囲碁をマスターする方法として、ディープニューラルネットワークは非常に適しています。これはパターンから答えを導き出すのが得意なのです」と話すのは、エディンバラ大学のエイモス・ストーキー教授だ。彼もまた、グーグルやフェイスブックと同じく、ディープニューラルネットワークを使って囲碁の謎に挑んでいるひとりだ。

これらのニューラルネットワークが、人間とコンピューターの間のギャップをついに埋めることができる、と彼らは信じている。囲碁の試合を見るとわかるが、達人たちは考えうるすべての手について検討しているわけではない。彼らはしばしば、盤面がどのように見えるかに基づいて手を決めているのだ。

ディープラーニングを使えば、研究者たちはAIにこのアプローチを真似させることができる。上手い手の画像を十分な数ニューラルネットワークにインプットすれば、コンピューターに上手い手とはどのように見えるのかを学習させることができるからだ。「やみくもに最善の手を知ろうとするのではなく、人間が囲碁をプレイする方法から学ぶのです」とストーキー教授は言う。「そうすれば、人間がとる方法を効果的に真似ることができます」

ディープラーニングよりも、もっと深く

囲碁で人間に勝てるコンピューターをつくるのは、単に演算能力の問題ではない。それが、クーロンのプログラムがいまだ人間に勝てない理由だ。Crazy Stoneは「モンテカルロ木探索」と呼ばれる、選択可能なすべての手の結果を分析するシステムに依存している。これはコンピューターが、チェッカーやチェス、その他のさまざまなゲームをマスターした手法だ。これによって、コンピューターは人間よりも先の手まで読むことができたのだ。

Crazy Stoneは日本のゲーム会社アンバランスが発売するゲームソフト「最強の囲碁」シリーズに2011年以降搭載されている。

しかし囲碁の場合は、検討しなければいけない選択肢が多すぎる。チェスでは、ゲーム中のどの時点でも選択可能な手の平均数は35通りだ。囲碁ではそれが、250通りとなる。そして250通りの手のあとに別の250通りの可能性があり…ということが続いていく。モンテカルロ木探索ですべての選択肢の結果を検討するのは（少なくとも妥当な時間内では）不可能なのだ。

しかしディープラーニングは、しらみつぶしな方法ではなくある程度の直感を使うことによって、このギャップを埋めることができる。先日、学術研究サイト『Arxiv』に投稿されたある論文で、フェイスブックがモンテカルロ木探索とディープラーニングを組み合わせた手法を示した。そのシステムは人間との対決でも引けをとらず、人間を感じさせるスタイルでプレイすることもできたという（というのも「本物の人間」から手の打ち方を学んだのだから）。クーロンはこの結果を「極めて鮮烈」と評している。

最終的にはこうした混合アプローチによって謎が解けるのだろう、とクーロンは言う。「人々がやろうとしているのは、2つのアプローチを組み合わせて、それぞれよりも優れた方法をつくることです」。彼はCrazy Stoneが、すでにモンテカルロ木探索と機械学習を組み合わせた手法を使っていると言う。ただその手法は、フェイスブックのニューラルネットワークほど複雑なものではないのだと。

フェイスブックの論文はディープラーニングの力を示しているだけでなく、AIの大きな課題が、最終的には複数のテクノロジーによって解決されることを教えてくれている。ディープラーニングは、多くのことを上手く行うことができる。しかしそれは、いつでも他の種類のAIの助けを借りることもできるのだ。

「かなり大きな驚きとなる」

フェイスブックがこの成果を発表したあと、すぐにグーグルが反応した。グーグルのトップAI研究者デミス・ハサビスが、グーグルは数カ月以内に、囲碁に関して「かなり大きな驚きとなる」発表をするだろうと語ったのだ。グーグルはそれ以上の詳細を明かすことは拒否しているため、彼らが何を突き止めたのかは不明である。「個人的には、グーグルがそれほど早く囲碁のトッププレーヤーたちを打ち負かせる何かをつくり出せるとは考えにくい」とクーロンは述べつつも、彼らがAI研究における重大なステップを踏み出すことは疑っていない。

ほぼ確実に、グーグルの発表も複数のテクノロジーに依存するものだろう。そしてそのひとつは、強化学習と呼ばれるものだと考えられる。ディープラーニングが認知（あるものがどのように見え、聴こえ、振る舞うかの認識）において優れているのに対し、強化学習アルゴリズムは、そうした認知に基づいて行動することをコンピューターに教える手法のことだ。

ハサビスは、グーグルが買収した英ケンブリッジのAIスタートアップ・DeepMind（ディープマインド）を率いる人物だ。そしてディープマインドは、すでにディープラーニングと強化学習アルゴリズムを組み合わせてうまく活用している。

2015年2月、彼らのチームはアタリ社のビデオゲームをプレイするのに、そしていくつかのゲームではプロの人間のプレイヤーを負かすのに、この2つのテクノロジーをいかに活用できるかを記した論文を発表した。

ディープニューラルネットワークがシステムによるゲームの状況判断を助け、強化学習アルゴリズムがトライ・アンド・エラーを繰り返すことで、状況にどう反応すべきかを判断するようシステムを助ける。基本的に、コンピューターはある特定の手を試し、もしその手がいい結果＝ゲームでの得点をもたらせば、それをいい手だと認識する。十分な数の手を試すと、システムはゲームを攻略するための最善の方法を理解するようになる。同じような方法は、囲碁にも使うことができるのだ。

ディープマインドのAIが「ブロック崩し」をプレイする様子。

このアプローチは、いい手とはどんなふうに見えるものかをシステムが「学習する」という点で、標準的な系列探索とは異なる。研究者たちは本番の対戦の前に、システムを訓練しておく。ディープラーニングを使うことで、AIはしらみつぶしな手法を採用するのではなく、ある種の「知性」によってプレイすることができるのだ。

最終的な囲碁の謎を解くためには、コンピューターはこれらのテクノロジーのすべてを必要とするだろう。強化学習はディープラーニングから情報を得られるし、その2つともがモンテカルロ木探索のような伝統的な手法とうまく結合することができる。

囲碁の謎を解くことは、いまでも途方もなく困難なことだ。しかし、現代のAIはそのゴールに近づいている。ハサビスが「大きな驚き」を発表するとき、わたしたちはそれがどこまで近づいたかを知ることになるだろう。