Diz-me por onde navegas, dir-te-ei quem és. Cientistas nos EUA analisaram o histórico de navegação online de utilizadores anónimos e, na maioria dos casos, foram capazes de perceber qual a conta de Twitter de cada um, de entre os mais de 300 milhões de contas desta rede social. Quando muitas empresas recolhem dados de navegação, frequentemente para mostrar publicidade direccionada, esta investigação vem somar-se a uma longa lista de preocupações sobre a possibilidade de real anonimato online.

O grupo de quatro investigadores, das universidades de Princeton e Stanford, divulgou um artigo científico com o método usado, que dizem ser eficaz para identificar o perfil nas redes sociais pertencente a quem visitou um determinado conjunto de páginas. O método assenta no facto de as pessoas terem mais tendência para clicar em links publicados por contas de pessoas que sigam – os “amigos” do Facebook, por exemplo – e, em menor grau, por “amigos de amigos”. É a comparação entre as páginas visitadas e as páginas partilhadas pelos contactos de cada pessoa que permite fazer a associação do histórico de navegação a um determinado perfil. O sistema criado funciona em tempo real e tipicamente, dizem os investigadores, demora menos de um minuto.

Um dos testes que a equipa fez implicou fazer o caminho contrário: começaram por seleccionar aleatoriamente 60 contas do Twitter (com não menos de 20 seguidores e não mais de 300, numa amostra que os investigadores notam não ser representativa) e criar um histórico de navegação possível a partir dos links que eram vistos por cada um aqueles utilizadores. Quando analisou históricos de navegação contendo 30 endereços de Internet, o sistema foi capaz de identificar a conta do Twitter correspondente em 52% dos casos.

O melhor do Público no email Subscreva gratuitamente as newsletters e receba o melhor da actualidade e os trabalhos mais profundos do Público. Subscrever ×

A segunda experiência usou históricos de navegação reais. Utilizadores voluntários submeteram anonimamente, através de uma extensão para o browser Chrome, as páginas que tinham visitado. Daqui, foram extraídos todos os links provenientes do Twitter e que tinham sido encurtados recorrendo a um endereço que começa por “t.co”, o qual abre depois a página pretendida. Ao todo, o sistema analisou 443 utilizadores, mas só 374 confirmaram os resultados. A cada um destes voluntários anónimos, a equipa de investigadores apresentou uma lista de 15 perfis de Twitter possíveis. A primeira opção foi a correcta em 72% dos casos e a lista de 15 continha o perfil certo em 81% dos casos. A precisão era maior quanto maior o número de páginas no histórico. Mas a equipa reconhece que o desempenho do modelo pode ser menor em condições reais, nas quais não seja, por exemplo, claro quais são os links provenientes do Twitter.

O histórico de navegação não é um tipo de informação difícil de obter. Várias empresas recolhem uma lista de páginas – ou, pelo menos, uma parte delas – por onde os utilizadores passam. O Google, por exemplo, é capaz de seguir o utilizador não apenas ao longo dos vários sites da empresa (o motor de busca, o Gmail, o YouTube), mas também nas navegações pelos muitos sites que usem a plataforma de publicidade do Google para mostrar anúncios. Muitas outra plataformas publicitárias funcionam de forma semelhante, embora normalmente afirmem não conhecer a identidade por trás das pessoas cuja navegação seguem.

“Os utilizadores podem presumir que são anónimos quando estão a navegar pelas notícias ou num site de saúde, mas o nosso trabalho junta-se à lista de maneiras pelas quais é possível a empresas que registam a navegação perceber quais são as suas identidades”, observou Arvind Narayanan, um dos investigadores.