Duas pessoas passam junto ao logotipo do Google em Paris. C. Platiau / Reuters

O Google admitiu nesta quinta-feira que “especialistas em linguagem” contratados pela empresa escutam aproximadamente 0,2% das conversas mantidas pelos usuários com seu assistente virtual, o que significa que uma parte dessas interações não é completamente privada.

A suposição habitual, frequentemente reiterada pelas empresas que administram assistentes virtuais, como Amazon, Samsung e Apple, além do Google, é que as conversas entre um usuário e seu assistente são totalmente privadas, e que a interação ocorre exclusivamente mediante inteligência artificial, ou seja, os únicos que “ouvem” o usuário seriam robôs.

O Google admitiu na quinta-feira, entretanto, que 0,2% dessas conversas são ouvidas por seres humanos, com o objetivo declarado de melhorar a qualidade do serviço. A revelação lança luz sobre uma prática que as empresas em geral evitam divulgar, embora se saiba dentro do setor que isso, em maior ou menor medida, é algo habitual.

A revelação foi feita pelo diretor de produtos de buscas da empresa californiana, David Monsees, que publicou um post no blog oficial do Google respondendo a uma reportagem do canal belga em língua holandesa VRT NWS, que teve acesso a cerca de mil gravações de indivíduos anônimos.

Esses áudios foram entregues à emissora por um dos especialistas contratados pelo Google na Bélgica para escutar trechos das conversas e “compreender assim as particularidades e sotaques de cada idioma em específico”.

O Google – que prometeu “tomar medidas” por causa do vazamento dos áudios, por considerá-los uma “violação” de suas políticas de segurança de dados – admitiu contar com “especialistas em todo o mundo” cuja função é escutar e transcrever “uma pequena parte dos diálogos para nos ajudar a compreender melhor esses idiomas”.

A empresa de Mountain View garantiu que os fragmentos analisados não ficam associados às contas dos usuários, e que os especialistas são orientados a não transcreverem sons ou conversas de fundo que não sejam dirigidas ao Google.

Entretanto, a televisão belga foi capaz de identificar “endereços postais e outras informações sensíveis” nas gravações, o que lhes permitiu entrar em contato com as pessoas cuja voz tinha sido gravada e confirmar que efetivamente se tratava delas.

“Um casal de Waasmunster (Bélgica) reconheceu imediatamente a voz de seu filho e do seu neto”, informou a VRT NWS a título de exemplo. O Google disse que o assistente virtual só envia as gravações de áudio quando detecta que o usuário está interagindo com o assistente, ao dizer, por exemplo, “Ei, Google”, e que dispõe de várias ferramentas para evitar as “ativações falsas”, ou seja, que o software interprete um som erroneamente como a palavra-chave para ser ativado.

Apesar disso, a VRT NWS disse que, de cerca de mil falas à quais teve acesso (todas em holandês), 153 eram conversas em que o assistente foi acionado sem ninguém ordenar, apenas interpretando erroneamente algum som. O canal disse ter ouvido, entre outras, conversas na cama, entre pais e filhos, telefonemas profissionais, discussões e cenas tanto de sexo como de violência.