有料会員の方のみご利用になれます。保存した記事はスマホやタブレットでもご覧いただけます。

サイバーエージェントは2018年12月10日、子会社を通じて提供しているインターネットテレビ局「AbemaTV（アベマティーヴィー）」が人工知能（AI）を導入し、リアルタイムAI字幕を取り入れた配信を試験的に開始したと発表した。

テレビ朝日と共同開発したリアルタイムAI字幕システム「AI（あい）ポン」を活用する。AI（あい）ポンは、生放送中のスタジオで行われる出演者のトークの内容をリアルタイムで音声認識し、字幕として画面に出力できる。米グーグルが提供する音声認識テキスト変換サービス「Cloud Speech-To-Text API」をベースとし、LASSIC（ラシック、鳥取市）が開発した「LASSIC Speech Recognition」を使って構築した。

昼のニュース番組「けやきヒルズ」で、AI（あい）ポンによる字幕表示を12月10日に始めた。同番組の視聴者のなかには「音声をオフ」にして視聴している人も多いことから、スタジオでのトークや会見の生中継などにも、その場で日本語字幕を自動的に入れられるようにした。

出演者の音声を認識し、表示するまでの時間はわずか1秒。現状のテレビ局などで導入されているリアルタイム字幕に比べて、表示にかかる時間を大幅に短縮できているという。今後は最新の機械学習アルゴリズムを使い、日々の配信から固有名詞をコンピューターが習得するなど、音声認識精度のさらなる向上が期待できるとしている。

（日経 xTECH/日経ニューメディア 長谷川博）

［日経 xTECH 2018年12月10日掲載］