San Francisco | The New York Times

Dezenas de bancos de dados de rostos de pessoas estão sendo compilados sem o conhecimento delas por empresas e pesquisadores. Depois, muitas dessas imagens são compartilhadas no mundo todo, no que se tornou um vasto ecossistema que alimenta a evolução da tecnologia de reconhecimento facial.

Os bancos de dados são montados com imagens de redes sociais, sites de fotos, serviços de namoro como OkCupid e câmeras colocadas em restaurantes e em campus universitários.

Embora não haja um número exato dos conjuntos de dados, ativistas que defendem a privacidade identificaram repositórios que foram formados pela Microsoft, a Universidade de Stanford e outros. Um deles contém mais de dez milhões de imagens, enquanto outro tem mais de dois milhões.

As compilações faciais estão sendo impulsionadas pela corrida para se criar sistemas avançados de reconhecimento facial. Essa tecnologia aprende a identificar pessoas analisando o maior número possível de imagens digitais com "redes neurais", sistemas matemáticos complexos que exigem enormes quantidades de dados para elaborar o reconhecimento de padrões.​

Demonstração da tecnologia de reconhecimento facial - Paula Soprana/Folhapress

Gigantes da tecnologia como Facebook e Google provavelmente acumularam os maiores conjuntos de dados faciais, mas que não são distribuídos, segundo trabalhos de pesquisa. Mas outras empresas e universidades compartilharam amplamente suas imagens com pesquisadores, governos e empresas privadas em Austrália, China, Índia, Cingapura e Suíça, para treinamento de inteligência artificial, segundo acadêmicos, ativistas e trabalhos publicados.

Empresas e laboratórios reúnem imagens faciais há mais de uma década, e os bancos de dados são apenas uma camada na construção da tecnologia de reconhecimento facial. Mas as pessoas muitas vezes não têm ideia de que seus rostos acabaram neles. Embora os nomes normalmente não sejam anexados às fotos, os indivíduos podem ser reconhecidos porque cada face é exclusiva de cada pessoa.

Questionamentos sobre os bancos de dados estão crescendo porque as tecnologias que eles possibilitaram estão sendo usadas de maneiras potencialmente invasivas. Documentos divulgados no último dia 7 revelaram que funcionários da Polícia de Imigração e Alfândega empregaram tecnologia de reconhecimento facial para digitalizar fotos de motoristas e identificar imigrantes não autorizados.

O FBI também passou mais de uma década usando esses sistemas para comparar carteiras de habilitação e fotos de vistos com possíveis criminosos, de acordo com um relatório do Escritório de Prestação de Contas do Governo do mês passado. Na quarta-feira (10), uma audiência no Congresso abordou o uso dessa tecnologia pelo governo.

Não há supervisão dos conjuntos de dados. Ativistas e outros disseram estar irritados com a possibilidade de que as semelhanças das pessoas tenham sido usadas para construir uma tecnologia eticamente questionável, e que as imagens possam ser mal utilizadas. Pelo menos um banco de dados facial criado nos Estados Unidos foi compartilhado com uma empresa da China que tem sido associada à identificação étnica da minoria muçulmana uigur do país.

Nas últimas semanas, algumas empresas e universidades, incluindo a Microsoft e a Stanford, removeram seus conjuntos de dados faciais da internet devido a preocupações com privacidade. Mas como as imagens já estavam bem distribuídas elas provavelmente ainda estão sendo usadas nos Estados Unidos e em outros lugares, disseram pesquisadores e ativistas.

"Você passa a ver que essas práticas são intrusivas, e percebe que essas empresas não respeitam a privacidade", disse Liz O'Sullivan, que supervisionou uma dessas bases de dados na startup de inteligência artificial Clarifai. Ela disse que deixou a empresa de Nova York em janeiro, em protesto contra essas práticas.

"Quanto mais comum se torna o reconhecimento facial, mais todos nós somos expostos a fazer parte do processo", disse.

Google, Facebook e Microsoft se recusaram a comentar.

Um banco de dados, que data de 2014, foi montado por pesquisadores de Stanford. Foi chamado Brainwash, nome de um café em San Francisco onde os pesquisadores utilizaram uma câmera.

Durante três dias a câmera fez mais de 10.000 imagens, que foram para o banco de dados, escreveram os pesquisadores em um artigo em 2015. O trabalho não abordou se os clientes do café sabiam que suas imagens estavam sendo captadas e usadas numa pesquisa. (O café já fechou.)

Os pesquisadores de Stanford então compartilharam o Brainwash. De acordo com documentos da pesquisa, ele foi usado na China por acadêmicos associados à Universidade Nacional de Tecnologia de Defesa e pela Megvii, empresa de inteligência artificial que forneceu tecnologia de vigilância para monitorar os iugures, segundo relatou The New York Times anteriormente.

O conjunto de dados do Brainwash foi removido de seu site original no mês passado, depois que Adam Harvey, ativista na Alemanha que acompanha o uso desses repositórios por meio de um site chamado MegaPixels, chamou a atenção para isso.

Ligações entre o Brainwash e documentos que descrevem o trabalho de construção de sistemas de inteligência artificial na Universidade Nacional de Tecnologia de Defesa na China também foram excluídas, de acordo com a documentação de Harvey.

Pesquisadores de Stanford que supervisionaram o Brainwash não responderam a pedidos de comentários. "Como parte do processo de pesquisa, Stanford habitualmente disponibiliza ao público a documentação da pesquisa e materiais de apoio", disse um funcionário da universidade.

"Uma vez que os materiais de pesquisa são divulgados, a universidade não acompanha seu uso nem os funcionários da universidade."

Na Microsoft, pesquisadores afirmaram no site da empresa que criaram um dos maiores conjuntos de dados faciais. A coleção, chamada MS Celeb, abrangeu mais de 10 milhões de imagens de mais de 100 mil pessoas.

O MS Celeb era declaradamente um banco de dados de celebridades, cujas imagens são consideradas liberadas porque são figuras públicas. Mas o MS Celeb também trazia fotos de ativistas em prol da privacidade e da segurança, de acadêmicos e outros, como Shoshana Zuboff, autora do livro "The Age of Surveillance Capitalism" (A era do capitalismo de vigilância)", segundo a documentação de Harvey, do projeto MegaPixels. O MS Celeb foi distribuído internacionalmente antes de ser removido há poucos meses, depois que Harvey e outros o denunciaram.

Matt Zeiler, fundador e executivo-chefe da Clarifai, a startup de inteligência artificial, disse que sua empresa construiu um banco de dados facial com imagens do site de namoro OkCupid. Segundo ele, o Clarifai teve acesso às fotos do OkCupid porque alguns dos fundadores do site investiram em sua empresa.

Ele acrescentou que assinou um acordo com uma grande empresa de rede social —ele não quis divulgar qual— para usar suas imagens no treinamento de modelos de reconhecimento facial. Os termos de serviço da rede social permitem esse tipo de compartilhamento, segundo disse.

"Deve haver certo nível de confiança com empresas de tecnologia como a Clarifai para usar uma tecnologia poderosa e sentir-se à vontade com isso", afirmou ele.

Uma porta-voz da OkCupid declarou que a Clarifai entrou em contato com a empresa em 2014 "sobre colaborar para determinar se eles poderiam criar tecnologia de reconhecimento facial e IA não tendenciosas", e que o site de namoro "não entrou em nenhum acordo comercial nem tem relação com eles hoje". Ela não esclareceu se a Clarifai teve acesso às fotos da OkCupid sem o seu consentimento.

A Clarifai usou as imagens do OkCupid para criar um serviço capaz de identificar idade, sexo e raça dos rostos detectados, disse Zeiler. A startup também começou a trabalhar em uma ferramenta para coletar imagens de um site chamado Insecam —abreviação de "câmera insegura"—, que usa câmeras de vigilância de centros urbanos e espaços privados sem autorização.

O projeto da Clarifai foi encerrado no ano passado, depois que alguns funcionários protestaram e antes que as imagens fossem coletadas, segundo ele.

Zeiler afirmou que a Clarifai venderia sua tecnologia de reconhecimento facial a governos estrangeiros, operações militares e departamentos de polícia, desde que as circunstâncias fossem adequadas. Não fazia sentido impor restrições gerais à venda de tecnologia para países inteiros, acrescentou.

O’Sullivan, a ex-tecnóloga da Clarifai, entrou para um grupo de direitos civis e privacidade chamado Surveillance Technology Oversight Project. Ela agora faz parte de uma equipe de pesquisadores que constrói uma ferramenta que permitirá que as pessoas verifiquem se sua imagem faz parte dos bancos de dados faciais abertamente compartilhados.

"Você faz parte do que fez o sistema ser o que é", disse ela.