コンピューターによるディープラーニング（深層学習）の技術を活用した、手書き文字の読み取りプログラムが登場した。開発したのは日本語のおぼつかない外国人技術者４人のグループで、わずか数カ月で完成させた。

４人は東京・渋谷に本拠を置く人工知能のベンチャー企業、 リアクティブのエンジニアで、認識率は98.66％に達するという。彼らの深層学習技術は人間の神経回路網の仕組みを人工知能に取り込んだもので、囲碁でプロ棋士に勝つことよりも、もっと実用的なプログラムの開発を目指している。

From left, David Malkin, Joseph Bullard, Philip Irri and Philippe Remy. Photographer: Tomohiro Ohsumi/Bloomberg

「数年前なら、天才じゃないと漢字読み取りプログラムは開発できなかったが、いまならちょっと頭が良ければ便利なプログラムを書くことができる」と、メンバーの１人のデービッド・マルキン氏は話す。同氏は機械学習の博士号を持つが、日本語はほとんどできないという。

これまで人工知能の分野はグーグルやフェイスブックなど有力ＩＴ企業の独壇場だった。最近では開発技術が急速にオープン化されてきたことから、リアクティブのように対象分野の専門知識がない少人数のグループでも、複雑なプログラムを作れるようになってきている。問題は、どう事業化するかだが、リアクティブは学校での手書きの答案用紙の読み取りに活路を見いだそうとしている。

日本語は別物

開発メンバーの１人、ジョー・ブラード氏は今年１月、 グーグルの東京オフィスで手書き文字読み取りプログラムのデモンストレーションを行った。「私がごまかしていないことを示すために、みなさんの好きな文字を言ってください」と、グーグルの参加者にブラード氏が尋ねると、部屋いっぱいの聴衆の中から「ば」という声が上がった。書きあぐねているブラード氏を見て失笑が起きた。

手書きの英文テキストを読み取るのは、深層学習の世界では初級の技術とされる。だが、日本語についてはまったく別物だ。2000以上ある常用漢字の中で画数の多いものとしては、たとえば「鬱（うつ）」の29に及ぶものもある。漢字の場合、文字を構成する部分が単独でも文字として成立するため、１つの文字がどこで始まり、どこで終わっているのかの判別が難しい。さらにひらがなやカタカナも使われている。

難しいのは走り書きや一筆書きのように書かれた文字と、１点、１画きちんと書かれた文字をどう判別するかだ。このプログラムのアルゴリズムは、まずどの文字と一致するかを照合し、それから１点、１画を足して照合する作業を繰り返す。より正確な読み取りを実現するために、彼らは約180万通りの手書き文字のデータセットをトレーニングに活用した。

人間を追い抜く

富士通研究所で手書きの漢字判読のプロジェクトディレクターを務める岡本青史氏は、「深層学習は対象領域とデータ分析の両方の専門家を要らなくする可能性があり、ビジネス面で考えると、適用領域の広さや開発スピードで大きな利点がある」と話す。その上で「深層学習による手書きの漢字認識はすでに人間の能力に追い付きつつあり、ゆくゆくは追い抜くだろう」との見通しを示した。

従来の典型的なプログラムは、ある特定の入力にどう対応するかを指示するものだが、人工知能は生き物の情報処理の仕組みを取り入れているため応用範囲が広い。十分な量の情報をインプットし、幾通りかの望ましいアウトプットを示せば、その中間プロセスは神経回路網がやってくれる。通訳や画像認識など伝統的な処理方法に委ねられてきたものでも、この方法を使うと容易に答えを導き出してくれる。

リアクティブがプログラム開発を始めたのは昨年10月。教育測定研究所から毎年数百万人分の手書き答案用紙の採点について支援を要請されたのがきっかけだった。ＯＣＲソフトも市場には流通していたが、誤って認識することが多過ぎたという。開発開始から３週間後にリアクティブの認識率は87％まで高まり、年末までに試作品が完成した。

言語技術

「文字を書くことは言語というより言語技術です」とブラード氏は話す。同氏はコンピューター科学で修士号を持ち、自然言語処理を研究していた。「なので言語に対する専門知識がなくてもプログラムを作れることは驚きではないのです」と話す。

人工知能の開発は、約10年前からＩＴ企業がユーザーの生み出す膨大なデータのマイニングに資金を投入し始めるようになって再び日の目を見るようになった。調査会社、ＣＢインサイトによると、教育や小売り、農業など多様な分野の人工知能ベンチャーへの投資額は、2015年には３億1000万ドルと、５年前の 約７倍に膨らんだ。

モントリオール大学でコンピューターサイエンスを教えるヨシュア・ベンジオ教授は、高性能コンピューターが一般化してきたことや、大量のデータが入手しやすくなったこと、また基礎科学が発達したことなどで開発が加速していると説明。加えて、グーグルなど大手企業が握っていた開発手段が「民主化」されて誰もが新しいソフトや製品を開発できるようになったことも大きいという。