便利なネット上の翻訳サービスですが、安易に頼ってしまうと恥ずかしい目に遭うことも。自動翻訳の得意な場面、使う場合の注意点について、研究者に聞きました。

便利なネット上の翻訳サービスですが、安易に頼ってしまうと恥ずかしい目に遭うことも。実際、うどんのメニューがとんでもない変換になっていたり、市役所に思わぬ単語が紛れ込んだり……自動翻訳の得意な場面、使う場合の注意点について、研究者に聞きました。



「声出してわろた」誤訳

昨年11月、ツイッターで投稿された一枚の写真がネットで話題になりました。



うどんの食品サンプル前に置かれた「うどん・そば」の値札には、中国語訳らしいメニュー名。よく見るとあろうことか、アダルトビデオなどで見かけるわいせつな単語が混じっています。



ツイッターでは「声出してわろた」「あうとおおおおおおおおおおwwww」など、面白がるつぶやきが並びました。



当時、私もGoogle翻訳で試してみましたが、確かにそうなりました。もし、本当にお店が誤訳に気付かずに置いていたのなら悲劇です。



誤訳が発覚したお店のメニュー

間違えた店主に聞いてみた

調べていくと、このメニューは実際に、京都市内の和食店に置かれていたことが分かりました。店主にお電話し、経緯を伺いました。



店主によると近年、外国人観光客のお客さんが増え、きちんと対応しようと英語と中国語を併記したメニューを作ったそうです。ご本人は「インターネットはよく分からない」とのことで、詳しい知人に昨年、ネットで翻訳したメニューの札を作ってもらい、店頭に陳列しました。



ところがまもなく、店を訪れた台湾人観光客に「おかしいですよ」と指摘され、とんでもない誤訳になっていることに気付いたそうです。



インターネットを使った翻訳でこうなったことをどう思うか、伺ったところ「気付いてすぐに直した。（誤訳のことは）それでいいでしょう」と厳しい声に。思い出したくもないことだったのかもしれません。



なお、3月22日現在、Google翻訳で訳しても、あの写真のようにはなりません。Google翻訳にはユーザーの指摘を反映するような機能も備えており、修正された可能性があります。



市役所の公式サイトでも発覚

何の気なく使ったネットの機械翻訳が、本人も気付かないまま、とても恥ずかしいことになっている例は他にもありました。



滋賀県栗東市の公式サイトは、サイト上の「Multilingual（多言語翻訳）」というボタンを押すと、Google翻訳の機能でサイト全体を英語や韓国語などに翻訳する機能を付けています。



英語に翻訳すると、栗東市のマスコットキャラクターが女性器の一部を示す英単語に変換されてしまう、という指摘が2013年、東京都在住の翻訳家のブログに載っていました。現在は、栗東市のサイトで翻訳ボタンを押しても、この英単語にはなりません。日本語の文を書き換えて誤訳されないようにしたそうです。



なぜ、こんな誤訳が？ 研究者に聞いてみた

しかしなぜ、こんな誤訳が生まれるのでしょうか？ 機械翻訳を研究する京都大学の研究員、中澤敏明さんに伺いました。



中澤さんによると、Google翻訳などの機械翻訳で現在、主流なのは統計的機械翻訳という手法です。



コンピューターに人間が翻訳した文章と元の文章の膨大なペアを読み込ませ、そこから単語の意味や翻訳前後の言葉の並び替えのパターンを分析。与えられた文章にそのパターンを当てはめて、別の言語に翻訳させる方法です。



翻訳前後で単語や語順がどう変わるかについて、コンピューターは学習に使った翻訳文に沿って確率で把握しています。



例えば英語の「BANK」は、日本語では「銀行」や「（川などの）土手」など、複数の意味があります。そして、「BANK」が出てくる英文のタイプごとに「銀行」が正解になる確率、「土手」が正解になる確率を持っています。コンピューターは、翻訳する文章ごとに正解になる確率が高い意味を採用していきます。



便利なグーグル翻訳だが、限界も…

精度を犠牲にして、幅広い表現に対応

ただ、似ていない言語の間ほど、先ほどの「銀行」と「土手」のような確率的な判断が多くなるため、機械翻訳は難しくなります。





「よく似たヨーロッパの言語間などは機械翻訳の精度は高いです。日本語と韓国語間もいいですね。しかし日本語は一般に、似た言語が少なくい上にくだけた表現も多く、機械翻訳が困難な言語といえます」と中澤さん。



また、単語の意味についても、長い文章を翻訳するならば適切な訳語が出てくる可能性は高まりますが、辞書のように単語一つを翻訳するだけだと、「単に使われる頻度の高い訳語になる可能性が高い」（中澤さん）ことになります。



Googleなどの汎用サービスは、幅広い表現やジャンルにまたがった文章を翻訳するために非常に高度な技術が使われていますが、逆にその幅広い対象が仇となって精度を犠牲にせざるを得ない部分があるそうです。



あと5～10年もすれば飛躍的な改善も期待できると中澤さんはいいますが、当面は利用には十分な注意が必要です。単語の意味を調べるだけなら辞書を使い、文章の機械翻訳の結果も内容を精査し、確認してから使うことが必要でしょう。また、特許関係など文章のジャンルを限った機械翻訳なら、日本語でも精度の高い市販品はあるそうです。



取材中にも発覚「恥ずかしい誤訳」

汎用サービスがどの程度、注意深く扱われているかはまだまだ、怪しいところがありそうです。市役所など自治体の公式サイトで、汎用サービスを使った翻訳ページを設けているところは多数あります。栗東市は昨年、「おかしい」という指摘を受けて対応したあとも、Google翻訳を使い続けています。やめるかどうかは「議論にはならなかった」（広報課）そうです。



今回の取材では、栗東市のホームページ内で誤訳を1カ所見付け、市に伝えました。対応に見逃しがあったことを受け、広報課の担当者は「来年度に予定されているホームページの見直しの中で、翻訳のあり方も検討しようと思います」と言います。



とはいえ「予算の都合もあり、すべての言語でしっかりとした翻訳は作れない」と、悩ましさも打ち明けます。市のサイトに翻訳機能を付けたのは2012年で、増えて来た外国人住民に対応するため、無料で使えるGoogle翻訳を利用した、とのことでした。



中国からの買い物客でにぎわう電器店＝2016年1月6日 出典： 朝日新聞

機械翻訳だけでいいですか？

3年前、栗東市のサイトの誤訳を見付け、ブログで指摘した翻訳家、オノ・フィルバートさんは両親が滋賀県出身で、滋賀県の魅力を外国人に発信するサイトを運営しています。



「機械翻訳任せでは、自治体が知らない間に笑いものになってしまう可能性がある。公式サイトに載せるのは市内の外国人の生活に本当に必要な情報だけに絞り、人間に翻訳してもらったものを載せるということでよいのではないでしょうか」と話しています。