米メジャーリーグ・マリナーズに所属するイチロー選手の現役引退会見が、3月22日に行われた。この様子はネットテレビAbemaTVでライブ配信（アーカイブもある）され、音声はリアルタイム字幕「AIポン」（あいぽん）でリアルタイムに文字化された。

だが、「プロ」が「風呂」になったり、「ファン」が「パン」になるなど間違いが多く、「爆笑してしまう」「イチローがいいこと言ってるのに全く頭に入ってこない」など話題に。また、「人望」を一瞬、「ちんぼ」と表示するなど、致命的な間違いもあり、「字幕はいらなかったのでは」という声も聞かれた。

【訂正：2019年3月23日午後8時 初出時、AIが「人望」を「ちんぽ」と誤表示したと記載していましたが、「ちんぼ」（「ぽ」ではなく「ぼ」）の誤りでした。記事の記載を修正しました。】

「AIポン」は、機械学習を使って音声をテキストに変換する米Google「Cloud Speech-To-Text API」をベースに、LASSIC（鳥取県鳥取市）が開発した「LASSIC Speech Recognition」を活用したサービス。テレビ朝日と共同開発したもので、昨年12月から「AbemaTV」で生放送しているニュース番組「けやきヒルズ」で試験放送を行っている。

1時間以上にわたる引退会見は、AIポンによってリアルタイムに字幕化された。質問者もイチロー選手も、ゆっくり、はっきりとした口調で話していたこともあってか、字幕が正しく表示される場面も多かった。

だが、例えば「テレビ東京のスミと申します」が、「鳥のささみです」に、「TBSテレビのジョウジ」が「イギリス移民との情事」に、「フロリダ」が「風呂」に、ニューヨークが「入浴」になるなど固有名詞のミスが目立ったほか、字幕の誤りが続いて意味不明な文章になるケースも少なくなかった。

例えば、「その点で、ファンの方々の存在なくしては、自分のエネルギーは全く生まれないと言っても思っています。え？ おかしなこと言ってます？ 僕、大丈夫です？」という発言が、「サボテンでパンの方々の存在なくしては、自分の家指輪も、全く盛れないと言ってもいいと思います。お菓子もできますが、大丈夫です」と表示されるなど、完全に意味不明になってしまったり、「人望がない、本当にない（ので監督になれない）」と語ったシーンで、「人望」が一瞬「ちんぼ」に変換され、「人望が本当にない」がごく一瞬「ちんぼは、本当に神」と表示されるミスもあった。

AbemaTVより

リアルタイム字幕は、音声を再生できない場面でも発言の雰囲気をつかめたり、耳に障害がある人にとっては便利なものでもあるが、現状での精度はまだまだ低いようで、「字幕、いらなかったのでは」といった声もあった。