Uma mulher trabalha remotamente para sua empresa. CLAUDIO ÁLVAREZ

Em princípio, a escuta de áudios é feita para melhorar o funcionamento do Google Assistente. Ou seja, para que o assistente seja capaz de entender melhor o que os usuários falam. Este trabalho levanta algumas dúvidas principalmente pelo vazamento que pode ocorrer de dados sensíveis. Em especial quando se conhecem as condições de trabalho dos encarregados das transcrições, pelo menos de uma boa parte deles: são cerca de 5.000 gravações ouvidas por semana por revisor, não são funcionários do Google, mas de uma terceirizada, têm um contrato por trabalho e serviço ou até mesmo como freelance e, no caso da Espanha, dificilmente ganham o salário mínimo.

Segundo os trabalhadores consultados, os projetos para rever o que o software entende ou para transcrever o áudio do usuário desde o início (ao falar com o Google Assistente) vão mudando: há aqueles de meras buscas no Google, do Google Maps, de mensagens e até pedidos ao Google Home. Esses especialistas em idiomas são funcionários de uma empresa de tecnologia subcontratada pelo Google, com a qual têm de assinar um contrato de confidencialidade. Entre eles há os que ainda trabalham neste tipo de escuta (até a semana passada, quando surgiu o escândalo e todos os projetos foram suspensos) e antigos transcritores que se dedicaram a esse trabalho por anos.

Juristas consultados por EL PAÍS explicam que, em princípio, essa prática é legal, já que o Google a declara em seus termos e condições. Apesar disso, o procedimento desperta algumas dúvidas. "Na ausência de uma investigação oficial, o que parece existir é um problema de transparência, no sentido de que o usuário não está ciente do que está sendo feito ou do que poderia ser feito a partir de suas interações com o assistente virtual", diz Moisés Barrio, advogado membro do Conselho de Estado e especialista em direito digital.

Entre os transcritores consultados, todos dizem que a maioria das gravações se inicia pelo comando "Ok Google". "Nos casos em que o microfone pula de forma errada, não podíamos transcrever o que se diz. Às vezes, se escuta: 'Google, isso não é para você'. Mas em outras não se dão conta e continuam a conversa, que se ouve no áudio, embora não a escrevamos. Nós também não podíamos escrever quando se mencionam documentos pessoais [de identidade, bancários ...]. O que tínhamos de transcrever eram os números do celular e endereços", explicam vários ex-funcionários da empresa que preferem permanecer anônimos.

O Google argumenta que "os fragmentos de áudio não estão associados a contas de usuários como parte do processo de revisão", segundo afirmou em um comunicado oficial após o vazamento de áudios na Bélgica. E isso é confirmado pelos transcritores. "O sistema só mostra o áudio, sua duração e uma seção onde você pode escrever ou revisar o que já foi escrito. Não temos acesso a nenhum dado pessoal além do que é ouvido", dizem os especialistas em idiomas. No entanto, isso não significa que a empresa não possa relacionar os dados a usuários específicos. Porta-vozes do Google na Espanha não quiseram dar declarações a EL PAÍS sobre essas práticas e apenas se remetem à nota oficial.

Mensagens íntimas

Mas que tipo de buscas ou conversas chegam a esses transcritores? Tudo o que qualquer pessoa pode pesquisar na Internet. "Há conversas familiares, entre amigos, discussões e até papos íntimos de casais. Também muita consulta de endereços e de lugares ou lojas, bem como mensagens de sexo e buscas de sites pornográficos", admitem. No entanto, a privacidade dos usuários é posta em xeque, pois nos áudios se escutam dados sensíveis em um ambiente que o Google não controla por completo.

Nos casos de áudios pertencentes a interações com o Google Home, a ativação do sistema também é feita pelo ‘Ok Google’. Várias vezes, entretanto, a gravação começa sem esse aviso. “Acontece muito que a pessoa diz algo parecido e ativa o microfone. Alguns percebem e até se assustam, mas outros continuam com sua conversa pessoal sem saber que foi ativado”, dizem os transcritores. Nessas gravações, o que se escuta principalmente são pedidos a uma casa conectada: “Sobretudo para acender e apagar a luz, colocar música, abrir a garagem, ligar o ar condicionado...”.

A primeira fissura — conhecida — na couraça que custodia os dados pessoais que os usuários enviam ao Google ocorreu com o vazamento de mil dessas gravações ao canal de televisão belga VRT NWS. Isso provocou o reconhecimento dessa prática através do comunicado oficial da empresa, em que David Mosees, responsável por produto de busca do Google, diz: “Os especialistas em idiomas revisam e transcrevem um pequeno conjunto de consultas para nos ajudar a compreender melhor cada idioma. É uma parte crítica e necessária do processo de criação de tecnologia de voz”.

Isso significa que pelo menos uma parte dessas interações não é completamente privada. Ou seja, se quebra a premissa habitual, e o que frequentemente afirmam as empresas que trabalham com assistentes virtuais como o Google, Amazon, Samsung e Apple, de que as conversas entre um usuário e seu assistente virtual ocorrem somente através da inteligência artificial. Isso é, que os únicos que escutam os usuários são robôs. “Digo aos meus amigos que nunca falem com os assistentes virtuais de qualquer empresa. Nunca se sabe onde esses áudios podem acabar...”, reconhece um dos transcritores.

Após o ocorrido, a empresa californiana começou uma caça às bruxas para encontrar o responsável pelo vazamento de áudios na Bélgica e paralisou todos os trabalhos. “Um dos revisores violou nossa política de segurança de dados ao vazar informação confidencial de áudios. Nossa equipe de segurança e privacidade está investigando e tomaremos medidas. Estamos realizando uma revisão completa de nossas salvaguardas nesse espaço para evitar que uma conduta indevida como essa volte a ocorrer”, afirmou Mosees na nota. Uma ação que faz com que todos os transcritores consultados peçam para se manter no anonimato para não sofrer consequências.