Data Selfie è un’estensione di Chrome che permette di capire come Facebook acquisisce informazioni su di noi

La società DataX ha sviluppato un’estensione Chrome chiamata Data Selfie, un’applicazione che monitora le azioni degli utenti su Facebook ed il cui scopo è quello di rendere ognuno di noi consapevole di quali e quante informazioni regaliamo ogni giorno al social network più utilizzato al mondo.

Il progetto vede come fondatore e co-fondatore Hang Do Thi Duc e Regina Flores Mir ed è stato finanziato da alcune società ed enti basate a New York.

L’add-on per Chrome

L’estensione è facilmente scaricabile dal Chrome Web Store e una volta installata sul browser, traccerà ogni movimento fatto durante la nostra sessione Facebook. Ovviamente più questa sarà attiva più gli algoritmi avranno dati da processare con la conseguenza logica di un’analisi predittiva più accurata. È possibile però leggere da subito, tramite la dashboard dell’applicazione, alcuni dati. In generale questo tool si focalizza su quattro tipi di azione:

looked ( il tempo trascorso su un post ) liked, link clicked typed.

Dopo un certo periodo di tempo (la frequenza di utilizzo dell’applicazione e di Facebook è determinante) è possibile guardare sul grafico elaborato da Data Selfie le informazioni predette dagli algoritmi.

Tra queste vi sono:

Le Top 10: tempo trascorso sui post di amici, sui post delle pagine che ci piacciono e like a post, foto o video. Orientamento religioso e politico (machine learning): in base alle pagine visitate gli algoritmi di Machine Learning generano un grafico che mostra l’apprezzamento in percentuale di sei diverse religioni e altrettanti partiti politici. Preferenze sullo shopping (machine learning): Predizione di prodotti e preferenze, cosa ci piace e cosa non ci piace dello shopping. Parole chiave e entità (natural language processing ): importanza e sentimento verso persone, organizzazioni, posti o parole chiave basato sui contenuti che abbiamo guardato e letto.

Gli ideatori hanno confermato che non collezionano questi dati. Passano sui loro server solamente quelli necessari all’utilizzo delle API con l’assoluta esclusione di informazioni come nome, cognome, sesso, compleanno e posizione. Hanno più volte sottolineano sulle loro policy che i dati non vengono in alcun modo archiviati da Data Selfie, ma che società di terze parti potrebbero utilizzarli in modalità anonima per migliorare costantemente il servizio.

Come funziona

La prima cosa da dire è che Data Selfie non utilizza le API di Facebook ma si limita alla sola ispezione del front-end della pagina Facebook. Il funzionamento di questa applicazione è strettamente legato ad algoritmi di intelligenza artificiale (AI) in particolare al Natural Language Processing (NLP) e Machine Learning (ML). Come descrive DataX sul proprio sito web, per il processamento e la predizione dei dati vengono utilizzate due API: Apply Magic Sauce e IBM Watson

Apply Magic Sauce

Apply Magic Sauce è un software/servizio sviluppato dalla Cambridge University in grado di generare un profilo psicologico dettagliato basandosi sulle attività dell’utente su Facebook. Utilizzando le API di AMS si può accedere ad informazioni come: personalità, soddisfazione per la vita, intelligenza, età, genere, preferenza sessuale, relazioni e orientamento politico e religioso.

IL ruolo di IBM Watson

Sviluppato da un team IBM con la collaborazione di moltissime università tra cui anche l’Università di Trento. È un sistema di intelligenza artificiale in grado di capire e rispondere a domande espresse in linguaggio naturale, cioè umano, pieno di sfumature, toni e abbreviazioni.

In particolare Data Selfie usufruisce dei seguenti servizi IBM: Personality Insights identifica tratti psicologici che determinano le decisioni di acquisto. Alchemy Language & Data, servizi per la comprensione del contenuto e del contesto del testo nelle pagine web. Tone Analyzer, analisi linguistica per l’identificazione dei toni tra cui emozioni, propensioni sociali e stili del linguaggio dal testo. Riguardo quest’ultimo ecco una tabella riassuntiva del piano base per l’utilizzo delle API.

Andrea D’Ubaldo