「東京オリンピックまでには翻訳精度を高めて、世界最高の翻訳アプリを作りたい」。最新の音声翻訳アプリ『VoiceTra（以下、ボイストラ）』のデモ発表会で、人工知能（AI）を使った音声翻訳技術を開発する国立研究開発法人情報通信研究機構（NICT）の開発担当者である隅田英一郎氏は、こう意気込んでいた。

この日は、空港でスーツケースをなくしたという設定で日本語と中国語でタブレットを使用してのやりとりや、病院において採血と血圧を測定するという中での日本語と英語での会話を、「ボイストラ」を使って翻訳するデモを実施した。1秒もかからずに相手国の言葉に訳され、ネイティブスピーカーと変わらないスムーズな翻訳には驚かされた。

今回のデモでは話す人が静かな環境の中、クリアな声で話したため、間違うことなく同時翻訳された。しかし、雑音が多かったり、「あー、うー」といったような前置きが長かったりすると翻訳できないなど改善点が残されており、今後はさらにデータを集積することで、こうした点を修正したいという。

音声翻訳は難しいと言われてきたが、AIなどの進歩により翻訳性能が飛躍的に向上し、2020年の東京オリンピックまでには多くの場所で手軽に使えるようになりそうだ。しかし、米IT大手のグーグルやマイクロソフトなども開発を急いでおり、日本勢がブランド力抜群の巨大IT企業に打ち勝って、音声翻訳アプリの市場で覇権を握れるかどうかが今後のカギとなる。

メーカーからエンジニア選抜し「オールジャパン」で開発

日本で音声翻訳が始まったのは1986年だったが、当時は定型の文章しか翻訳できず、文法に沿っていない会話は翻訳しにくかった。翻訳された音声もロボットが話すような声で、違和感があった。その後93年にできた音声翻訳システムは、1文を翻訳するのに30秒もかかり、実用化には程遠かった。

08年には改良を重ねて翻訳機を作ったものの、弁当箱サイズと大きかったため実用化には適さなかった。「ボイストラ」はそれまでとは異なるコンセプトで10年8月からスマートフォン（スマホ）アプリ用に開発を進めた。あらゆる部品を小型化することにより、「iPhone」「Android」の両タイプにも内蔵できるように改良した。14年からは国家プロジェクトの「グローバルコミュニケーション計画」になり、通信、電機メーカーなどから40人の優秀なエンジニアが参加したオールジャパンで開発を加速させてきた。5年前の段階の「ボイストラ」は誤訳が目立っていたものの、この1〜2年のAIを活用したニューラルネットワーク技術、通信速度の高速化などにより翻訳精度が飛躍的にレベルアップした。

1|2|3|4|5 次のページへ