O que a Facebook faz internamente com seus dados?

A Facebook faz algumas coisas com os dados coletados.

Primeiro, conduz simples buscas na informação para melhorar a performance do site ou faz análises de negócios (por exemplo, qual foi o tempo no ar do site, quantos usuários o Facebook possui, quanto de lucro teve hoje?). Isto é verdade para todas empresas em qualquer lugar.

Entretanto, com a Facebook, isso tem um twist. A empresa possui um time de engenheiros dedicado a construir ferramentas para tornar os dados mais fáceis de pesquisar com uma linguagem parecida com SQL construída em cima do Hadoop, com Hive, e, entretanto a Facebook clama que o acesso é estritamente controlado, outros dizem o contrário.

Paavo Siljamäki, diretor do selo Anjunabeats, chamou atenção para a questão quando ele publicou, no Facebook, que em uma visita à empresa no escritório de LA, um funcionário foi capaz de rapidamente acessar sua conta sem perguntar a ele sua senha.

Aqui estão mais alguns relatos de funcionários da Facebook acessando dados privados.

Em segundo lugar, a Facebook conduz pesquisa acadêmica ao utilizar seus usuários como cobaias, um fato não mencionado na Política de Dados, o que é interessante dado que, na página inicial da Facebook Research, um cabeçalho diz, "Na Facebook, pesquisa permea tudo o que fazemos".

Possui um time de ciência de dados bem grande (41 pessoas na última contagem). Para colocar em perspectiva, uma companhia de tamanho similar de 15.000 teria 5 cientistas de dados, se você estiver agressivamente conduzindo um programa de pesquisa de ciência de dados.

Entretanto, até o final de 2014, não havia nenhum processo mantido para verificar que tipo de dado era acessado, e para qual tipo de estudo. Como um antigo cientista de dados da Facebook escreveu,

Enquanto eu estava na Facebook, não havia conselho de revisão institucional que examinasse minuciosamente a decisão de conduzir um experimentos para propósitos internos. Uma vez que alguém tenha um resultado que eles decidem que querem submeter para publicação em um jornal, havia definitivamente um leva e trás com os times legais e de RP sobre o que poderia ser publicado. Se você quer rodar um teste e ver se as pessoas clicarão em um botão verde ao invés de um botão azul, você não precisa de aprovação. Da mesma forma, se você quer testar um novo sistema de rastreamento de anúncios para ver se clicarão em mais anúncios e os lucros aumentem, você não necessita de aprovação institucional.

Enquanto ele nota que isto é comum na maioria das empresas de software-as-a-service, muitas empresas SaaS também não coletam granularmente os detalhes mais íntimos das vidas das pessoas no curso de uma década.

Ele continua e observa,

O propósito fundamental da maioria das pessoas na Facebook trabalhando com dados é influenciar e alterar os humores e comportamentos. Eles estão fazendo isso todo o tempo para fazê-lo curtir mais histórias, clicar em mais anúncios, e gastar mais tempo no site.

Enquanto isso é compreensivelmente o objetivo da maioria dos websites, você pode querer pensar duas vezes antes de gastar mais do que 40 minutos por dia em um site que visa explorá-lo emocionalmente.

Em adição à mineiração de texto da Facebook e estudar suas emoções, também as manipula.

O feed de notícias é primordial para manipulação, especialmente porque a Facebook o desenvolveu para ser tão engajador quanto possível: é açucar sináptico para nossos sistemas nervosos. A Facebook quer ter certeza de que você gaste tanto tempo no Feed quanto possível, e para esse fim irá gastar mais tempo exibindo fotos de bebês e outras coisas felizes, assim como notícias que geram controvérsia e ultraje, em detrimento de status normais como "eu tomei café da manhã hoje" que não trazem tantas reações.

É assim que a hoje chamada bolha-filtro começou. Porque as pessoas clicam em coisas que as interessam, o Facebook exibe apenas coisas que engajam as pessoas, significando que outros pontos de vista, amigos e imagens, são omitidos da dieta do Feed de uma pessoa. Para um excelente exemplo de como isso funciona, veja Red Feed, Blue Feed, que exibe como diferentes feeds liberais e conservadores no Facebook aparentam.

O que mais eles estão estudando? A taxa na qual pessoas gays revelam sua orientação, para começar. Como eles sabem isso? "No ano passado, aproximadamente 800.000 americanos atualizaram seu perfil para expressar uma atração pelo mesmo gênero ou um gênero personalizado".

Muito dos estudos da Facebook centram-se na teoria dos grafos: isto é, como nós nos relacionamos com nossos amigos; em outras palavras, está realizando pesquisas antropológicas em sujeitos que nunca deram consentido para isso.

Por exemplo, recentemente, o time de ciência de dados publicou um estudo sobre os laços sociais de comunidades de imigrantes nos Estados Unidos, onde os pesquisadores utilizam os seguintes dados:

Nós limitamos nossa análise à medidas agregadas baseadas em dados anonimozados da rede social de pessoas nos EUA que usaram o Facebook pelo menos uma vez nos 30 dias anteriores às análises. Nós usamos a cidade natal da pessoa em seu perfil para determinar o país de origem. Além disso, nós também restringimos nossa análise às pessoas com ao menos dois amigos atualmente vivendo em seu país de origem e outros dois amigos atualmente vivendo nos EUA. Nossos resultados são baseados em um recorte de mais de 10 milhões de pessoas que satisfazem esse critério. Ao longo do estudo, todas as referencias às pessoas no Facebook irão implicitamente assumir essas condições.

Estes são os estudos que nós sabemos serem públicos. O que mais eles estariam fazendo por debaixo dos panos?

Outra coisa que a Facebook gosta de estudar são, compreensivelmente, faces. Toda vez que você marca a si mesmo em uma foto, o Facebook te reconhece e irá se ajustar de acordo.

Facebook encoraja seus usuários a "marcar" pessoas em fotografias que eles carregaram em suas publicações pessoais e a rede social armazena a informação coletada. A empresa usa um programa que chama de DeepFace para parear outras fotos de uma pessoa.

Este programa, chamado DeepFace, é uma fantástica forma de conseguir marcações mais acuradas. Isto é também uma ótima forma de violar a privacidade de alguém. Por exemplo, e se você for marcado em algo que não gostar? Como, por exemplo, em um protesto contra o governo? Ou, até mesmo, simplesmente, se você foi em um evento com um amigo ao invés de outro e não quer que este saiba?

Infelizmente, a privacidade do movimento logo não sera mais uma opção. A Facebook está trabalhando em formas de identificar pessoas escondidas em fotos. O estudo da Facebook sobre o DeepFace nota que, "As implicações sociais e culturais das tecnologias de reconhecimento de faces está longe de serem alcançadas" e ainda assim não fala nada sobre os perigos potenciais de ter sua face marcada, por exemplo,

"Em breve podemos ter câmeras de segurança nas lojas que identificam as pessoas enquanto compram", ela diz.

Como eles sabem disso tudo?

Por causa de todos os dados que nós demos a eles voluntariamente, com cada vez em que publicamos uma atualização no status, cada vez que carregamos uma foto e marcamos, cada mensagem com um amigo, check in em uma localização, com cada vez que entramos no Facebook e o sistema gera uma mensagem para ser salva no banco de dados, "Hey, esta pessoas está agora no universo do Facebook", o que agora inclui Whatsapp e Instagram.