現在、技術は従来にない勢いで進化しています。進化の中心にあるのは、我々の手元にある機器だけではありません。ネットワークの向こうにある、いわゆる「ＡＩ（人工知能）」を使った音声認識や画像認識の技術が圧倒的な速度で進化していて、人間にごく近いレベルに迫っています。マイクロソフトは、そうした技術に注力して次の成長の基盤にしようとしている企業の一つです。彼らの技術開発の一翼を担っているのが、「マイクロソフト・リサーチ（ＭＳＲ）」という組織です。ＭＳＲのアジア部門である「マイクロソフト・リサーチ・アジア（ＭＳＲＡ）」ディレクターであり、コーポレートバイスプレジデントのシャオウェン・ホン氏が来日しました（写真１）。ホン氏は、中国で開発されたＡＩである「シャオアイス」、その日本向けバージョンにあたる「りんな」の開発を、アジアパシフィック地域のＲ＆Ｄ部門トップとして、統括する立場でもあります。マイクロソフトが「ＡＩ」で何を目指すのか、聞いてみました。（ライター・西田宗千佳）

活躍し始めたチャットボット、「人間の知性」に迫るには研究が必須

ホン氏へのインタビューに入る前に、ＭＳＲという組織について、少し解説をしておきましょう。ＭＳＲは、マイクロソフト社内の研究組織なのですが、マイクロソフトの一般的な事業からは独立し、学術的研究を中心に行っています。その成果は最終的にマイクロソフト製品に生かされるのですが、単純なソフトウェア開発にとどまらず、コンピューターの関連する分野について、広範かつ長期的視野に立った研究を行っていることで知られています。なにしろ、その研究内容には、マイクロソフト本社のトップや重役陣ですら口を出すことはできません。１９９１年９月に設立され、すでに２５年以上の歴史を持ちます。

ホン氏が所属するＭＳＲＡは、ＭＳＲの中でもアジアを受け持つ組織で、１９９９年に中国・北京に設立されました。現在は２５０人以上の研究者が所属しています。

ＭＳＲＡは、現在特に「機械学習」と呼ばれる技術に注力して技術開発を進めています。機械学習とは、人が教えるのではなく、大量のデータからソフトウェアが自動的に学習し、判断基準を作る技術の総称です。近年、音声認識や画像認識は劇的に進化していますが、その背景には、機械学習による認識精度の向上があります。機械学習は人が話す言葉に近い文章の作成や効率的な工場機械の稼働など、様々な領域で活用できます。現在ＡＩと呼ばれるものの多くが、この技術を軸に発展しているのは間違いありません。

ホン氏はこう語ります。「ＭＳＲＡが研究している分野自体は、そう大きく変わっていません。しかし現在、コンテンツを扱う領域では大きな変化が起きています。ＡＩです。自然言語の認識にしろ、音声合成にしろ、ＡＩが関わるものばかりです。機械学習の進化は、完全に『ゲームチェンジャー（流れを変えるもの）』でした」

ＭＳＲＡの研究の成果として注目されることが多いのが、「シャオアイス」と「りんな」（画像２）です。ともに人とコミュニケーションを取ることを目的に作られた「チャットボット」と呼ばれるソフトウェアですが、ＡＩと呼ぶ方が現在は通りがいいでしょう。シャオアイスは中国語圏のために作られたもので、りんなはシャオアイスをベースに、日本語に特化して作られたものです。シャオアイスはテレビ番組のキャスターや企業とのコラボレーションでも使われており、中国ではメジャーなＡＩになりつつあります。りんなはＬＩＮＥやツイッターにアカウントを持っていて、ツイッターアカウントのフォロワーは１４万２千を超えます。

「ＡＩを作るにはモデル化が非常に大切です。シャオアイスとりんなでは全く個性が違います。りんなはＬＩＮＥを使う女子高生という設定があり、それに応じてモデル化されています。それぞれ目的に応じたモデルを作り、そこにさらに学習を加えていくことでＡＩが形作られます」（ホン氏）

一方で、今のＡＩはまだまだ不完全。りんなはずいぶん女子高生らしい、人間味もあるユニークな反応をしますが、人間に比べれば不自然です。音声認識などもかなり進歩し、ＡＩが大きなトレンドになっているのは間違いないのですが、ホン氏は「現在はまだまだ初期の段階であり、研究しなければいけないことはたくさんある」と強調します。

「音声の認識率は確かに上がっていますが、それも結局は一つの要素に過ぎません。例えば、現在は解決が難しいものの一つとして『カクテルパーティーエフェクト』の再現があります。あなたがパーティーに参加したとします。とてもざわついています。しかしそんな中でも、あなたは特定の１人の話をきちんと聞き取れる。なぜこういうことを人間ができるかというと、あらゆる部分で『知性』を使っているからです。こうしたことを実現するには、まだまだ大きなチャレンジが残っています」

「ＡＩはたいへん未熟です。人は常識や判断力、時にはボディーランゲージまで使ってコミュニケーションをします。我々はこれからも研究を続けなければなりません。現在の機械学習に使われるディープラーニングは『ブラックボックス』のようなもので、学習の過程でなにが起きているのか、はっきりとわかりません。しかし『推論』をするには、中身がわかる『ホワイトボックス』状にさせる必要があります。それによって、今後の大きな発展が見込めるようになります。実現されれば、人間の知性の多くの部分をモデル化することもできるでしょう」

「ＡＩで日本語は不利」は間違いだ！？

ＡＩでも、チャットボットや音声認識のように、特に言語処理が関わる部分は、我々の生活に密着したものです。そのため、次のように言われることもあります。「ＡＩはデータの量が重要。結局、英語と中国語が強い。日本語は非常に不利だ」

そんな意見もあって、ＡＩを活用したサービスで日本が遅れているという論調も少なくありません。

この疑問をホン氏にぶつけると、次のように明快な答えが返ってきました。「確かにデータの量は重要です。しかし、日本語はそんなに使う人が少ない言葉ではないですよ。たしか、日本の人口は１億３千万人ですよね？ これだけで、世界トップクラスです。中国は確かに人口が多い。でも、多数の方言があり、それらは、関東の言葉と関西の言葉より、はるかに大きな差があります。私もわからないものがありますから。インドも日本より人口が多いですが、１００以上の方言があります。そう考えると、データの量として、日本語が圧倒的に不利とはいえません。これだけの国なのですから、十分に有利な市場で、取り組む価値があります」

「日本語と、英語や中国語では文法が異なりますが、これも致命的なものではありません。もっと重要なことがあります。必要なのは言葉だけではありません。よいチャットボットを作るには、その国の文化などに根ざしたデータが必要です。りんなは、日本市場向けにチューニングされ、最適化されました。ですから、日本の企業であるローソンで採用されたように、企業の案件にも対応できるまでになりました。これは、日本のローカルチームによって実現したものです」

「なんでもＡＩ」と呼ばれることに危機感、もっと広く皆のために使うには

一方で、ＡＩという言葉は流行になっており、多くの場面で使われています。学術的にはきちんと定義があるのですが、一般用語としてはあやふやなものです。ホン氏も、あらゆる技術にＡＩという言葉が使われることには疑問を投げかけます。

「現在、コンピューターが見せる魔法のような処理のほとんどがＡＩによって行われていると捉えられているように見えます。でも、これは間違いです。例えば、暗号通貨に使われる『ブロックチェーン』技術。これは、多くの人々はＡＩではないと思っていたのですが、ＩＢＭはブロックチェーンを（ＡＩ技術である）Ｗａｔｓｏｎの部門で扱っています。ブロックチェーンは、スマートかつ安全に情報を扱うもので、インテリジェントな部分があるため、そこにＡＩが使われている、ということのようです。しかしそうすると、コンピューターが行うスマートな取り組みは、みんなＡＩがやっている、ということになってしまわないでしょうか」

「同じような例が、データマイニング（データを解析し、価値のある情報を取り出す技術）にもあります。データマイニングはデータベースの技術です。スマートな取り組みではありますが、これもＡＩではありません。デジタル技術が起こす革命に、ＡＩは不可欠です。そして、ＡＩは様々な領域にかかわるものです。しかし、技術の中にはＡＩとは異なるものもあることを理解しておくべきです」

ＡＩの進歩により、仕事の多く…