米Googleは7月11日（現地時間）、音声アシスタント「Googleアシスタント」に対してユーザーが話しかけた音声の録音の一部を、社外の人間の「言語の専門家」が聞き、テキスト化していることを認めた。音声はアカウントと関連付けられないようになっており、人間に聞かせることの目的は、サービスの品質向上のためだとしている。

Googleアシスタントへの音声入力を録音し、サーバに保存していることはヘルプページなどでユーザーにも知らされており、「マイアカウント」経由で削除することも可能だが、人間が聞いていることは公表していなかった。

Googleは、ベルギーのメディアvrt NWSが同日、Googleと契約する業務委託者の1人から入手したという1000件以上の音声データに基づいて報じた記事を公開した数時間後に公式ブログで反論した。

vrt NWSの記事

この記事によると、音声は匿名化されてはいるものの、個人の住所を口頭で言っているものや、寝室での会話なども含まれているという。

「Unknown voice command」となっているものは勝手に録音したもの

Googleアシスタントはウェイクワード（「OK Google」や「ねえ、Google」など）をきっかけに音声の録音を開始するが、テレビの音声などでウェイクワードと誤認識することがあり、ユーザーが知らないうちに録音していることもある（Google HomeやGoogle Home Miniの場合、録音中はLEDが点灯して分かるようになっている）。

録音設定を無効にすることもできるし、録音データは1件単位で削除することも可能だ。

Googleは公式ブログで、「より多くの言語での音声技術の開発を目的とする取り組みの一環として、特定言語のニュアンスやアクセントを理解している世界中の言語の専門家と提携している。これらの言語専門家はわれわれが言語をより良く理解するために少量のクエリー（すべての音声データの約0.2％）をレビューし、テキスト化している。こうしたプロセスは、Googleアシスタントのようなサービスを開発するために必要なものだ」と説明する。

Googleは、言語専門家とは厳格な秘密保持契約を結んでおり、今回のように音声データを外部に漏らすような不正行為が二度と起きないようにするとしている。

米Amaonも4月、業務委託社が同社の音声アシスタント「Alexa」が録音した音声データを聞いていることを報じられ、これを認めた。