人工知能（AI）を巡る世間の浮かれぶりについて誰かに文句をつけたくなったら、69歳のグーグルの研究員、ジェフ・ヒントンがおあつらえ向きだ。カナダのトロント大学に籍を置くこのひょうきんな教授は、2012年10月にAI研究の世界に衝撃を与え、新たな軌道に乗せた。

ヒントンが2人の大学院生と発表した内容によると、何十年も研究対象として挑み続けてきた時代遅れの技術「人工ニューラルネットワーク」が、機械の画像認識機能を飛躍的に向上させたという。ニューラルネットワークとは、人間の脳をモデルに神経細胞（ニューロン）とそのつながりを人工的に構築したものだ。AIに応用され、与えたデータを基に新しい概念を学習させる際などに活用されている。

その発表から6カ月もたたないうちに、3人の研究者はグーグルの従業員名簿に名を連ねた。いまや、ニューラルネットワークはわたしたちのスピーチを文字に起こし、芝生の上を歩く猫を（犬でもブタでもなく）猫だと認識し、インターネット上の荒らしと闘っている。

しかしヒントンは現在、自身がこの世に生み出すのを助けた技術を大したものではないと考えている。「われわれは（コンピューターに画像認識という“視覚”能力を与える）コンピューターヴィジョン技術における活用法を間違えていると思います。現時点においては何よりもうまく機能していますが、だからといって正しいわけではないのです」と言う。

コンピューターヴィジョンを進化させる新たな概念

代わりにヒントンは、別の“古い”アイデアについて明かした。コンピューターが物事を認識する方法を変える、つまり新たな形態のAIをつくり出すものだ。これは非常に重要な概念である。というのも、コンピューターヴィジョンは自律走行車や医師の役割を果たすソフトウェアに欠かせないからだ。

2017年10月下旬、ヒントンは2つの論文を発表し、40年近く熟考を重ねた考えについて証明した。「これはとても長い期間にわたってわたしにもたらされた、多くの直観によって出来上がったものです。ずっとうまくまとまりませんでしたが、ついに発表することができました」と話す。

ヒントンの新たな研究は「カプセルネットワーク」と呼ばれる。ニューラルネットワークを発展させたもので、画像や動画を通じて機械に世界を理解させやすくすることを目指している。

発表した論文のうちの1つでは、カプセルネットワークの正確さについて、ニューラルネットワークの最高時のパフォーマンスに匹敵したと述べた。ソフトウェアが手書きの数字をどれだけ正確に認識できるかという基準テストを行って得られた結果だという。

2つ目の論文ではカプセルネットワークの誤答率について、ニューラルネットワークのそれが最も低かったときのほぼ半分にまで減少したと発表した。トラックやクルマといったおもちゃを、異なる角度からソフトウェアに認識させる課題を通じて結果を得た。

仮想ニューロンを詰めた“カプセル”で自己学習を促進

ヒントンは現在もこの新しい技術の研究を続けている。同僚は2人、サラ・サブールとニコラス・フロストで、拠点はグーグルのカナダ・トロント支社だ。

カプセルネットワークの目的は、いまある機械学習システムの弱点を克服することにある。すなわち、本来なら発揮できるはずの効果を制限してしまう点を改善しようというものだ。

今日、グーグルや他社で使われている画像認識ソフトウェアでは、あらゆる場面で対象物を確実に認識しようとすると、多くの写真を参考にしなければならない。というのも、こうしたソフトウェアは、学んだことをこれまでにない文脈で一般化するのが得意ではないからだ。例えば、あるモノを別の新しい視点から見て同じものだと判断する作業は、あまり上手ではない。

コンピューターに猫をさまざまな角度から認識させるには、多様な視点で撮影した写真が何千枚も必要だ。人間の子どもであれば、そのようなくどく果てしない訓練を必要としなくても、家で飼っているペットを認識できるようになる。

AIシステムと平均的な幼児との間に横たわる深い溝を狭めるには、世界についての知識をコンピューターヴィジョンのソフトウェアにもう少し組み込む必要がある、とヒントンは考えている。

“カプセル”とは、むき出しの仮想ニューロンの小さな集合体で、猫の鼻や耳のような、ある物体の異なるパーツと、空間におけるそれらの相対的な位置を探知するよう設計されている。多数のカプセルによるネットワークは、新たな場面について、「実はすでにある場面を違う視点から見たものだ」と理解し、その気づきを利用する。

データ量の軽減とスピード化が課題

ヒントンは1979年、視覚システムはもって生まれた幾何学的感覚のようなものを必要としているという直観を得た。人間が心理的なイメージをどのように活用しているかを解明しようとしていたときのことだ。そして2011年、カプセルネットワークの基になる構想を初めて発表した。

上記で紹介した全体イメージは、この分野の研究者たちの間で長らく発表を待たれていたものだ。ニューヨーク大学で画像認識の研究を行うチョ・キュヒョン教授は「みな心待ちにしており、ジェフの次なる躍進に期待していました」と言う。

ヒントンの生み出したアイデアがどれだけ画期的かを断言するにはまだ早い。彼自身もそれをわかっている。AIに長年かかわってきたべテラン研究者たちは当初、ヒントンの直観が証拠によって裏付けられたとして、静かに祝福を送った。しかし、カプセルネットワークはまだ、膨大な画像の山をもって証明される必要があり、既存の画像認識ソフトウェアに比べて速度も遅いことが指摘され始めている。

ヒントンは楽観的で、欠点を克服できると考えている。ほかのAI研究者たちも、彼が長年温めてきたアイデアに期待を寄せている。

ドイツとカナダに拠点を置く画像認識のスタートアップ企業Twenty Billion Neuronsの共同創業者で、カナダ・モントリオール大学教授のローランド・メミセヴィッチは、ヒルトンの基本構想について「与えられたある量のデータから既存のシステムよりも多くの理解を得られます」と話す。

もし、カプセルネットワークの概念がより広範囲で活用できると証明されれば、ヘルスケアのような分野で重宝されるだろう。AIを訓練するための画像データに乏しく、セルフィーのようにインターネット上に氾濫しているわけではないからだ。

ある意味では、カプセルネットワークはAI研究の最新トレンドから離れ、新たな一歩を踏み出す出発点であるといえる。近年のニューラルネットワークの隆盛を解釈する際、ひとつにはAIソフトウェアにはなるべく知識を与えず、物事を自分の力で一から理解させるべきだという意見が、それを裏付けている。

AIのスタートアップ企業を2016年にUberに売却した、ニューヨーク大学教授のゲイリー・マーカスは言う。「ヒントンの最新の業績は、歓迎すべき新たな風の息吹を象徴しています。AI分野の研究者たちは、脳にもともと組み込まれている仕組みを積極的に真似るべきです。視覚や言語といった必須の能力を身に付けるために役立つのですから」

「新たに登場した体系がどこに行き着くかはまだ分かりません。でも、これまでのAI研究が固執し、はまり込んでしまっていた轍から抜け出す方法を見つけたという点において、ヒントンは素晴らしい成果を挙げたといえるでしょう」と、マーカスは話している。