La trinità è lì: Úrsula, Amaranta e Remedios sono inevitabilmente collegate fra loro in modo forte, soprattutto le prime due. I maschi importanti della famiglia Buendía sono tutti lì, presenti, impassibili, eterni.

Si evince facilmente come questo modello metta in relazione il tempo di introduzione dei personaggi stessi: un personaggio introdotto alla fine del libro avrà sicuramente una importanza minore nel grafo. Questa affermazione diventa parzialmente vera nel caso in cui si considerino le interazioni tra i personaggi stessi.

Di personaggi e statistiche

Facciamo alcune considerazioni (abbastanza banali) statistiche:

ci sono 62 personaggi che hanno almeno una interazione , mentre in totale abbiamo 71 personaggi che appaiono in tutto il libro ;

, mentre in totale abbiamo ; un personaggio ha almeno 1 interazione e al massimo 33 (chissà chi è!) e la media delle interazioni tra i personaggi è 6.6451, ovvero ogni personaggio è in relazione in media con sei personaggi e mezzo.

Vediamo di chiederci qualcosa di più interessante, va!

Del diametro e del fatto che non stiamo parlando di geometria

Il diametro di un grafo è definito come il cammino minimo più lungo nel grafo stesso. Con cammino tra due nodi, si intende un modo di percorrere gli archi partendo dal primo nodo ad arrivare al secondo; un cammino minimo è semplicemente il cammino che tocca meno archi. Intuitivamente, pensiamo al diametro come al cammino più piccolo che ci permette di andare da una parte all’altra del grafo.

Il diametro del nostro grafo è pari a 6; un esempio di cammino che definisce il diametro è il seguente

Bruno Crespi, Pietro Crespi, Remedios, Aureliano Segundo, Mr. Herbert, Mr. Jack Brown, Dagoberto Fonseca.

In questo caso, il percorso più breve per andare da Bruno Crespi a Dagoberto Fonseca è rappresentato da tutti i personaggi qui enumerati. Da notare che i passi da fare sono sei mentre i personaggi sono sette.

Centralità

C’è un modo di capire l’importanza di un personaggio in un libro? Certo, analizzando il libro stesso, le relazioni con gli altri personaggi, la trama, il finale, etc. C’è un modo, invece, di capirlo tramite questo enorme grafo qui sopra? Beh, sì. Si può calcolare la centralità di un nodo all’interno della rete.

Una misura di centralità per un nodo identifica l’importanza del nodo nella rete stessa. Cerchiamo di fare la stessa cosa sul grafo che abbiamo ottenuto, utilizzando due delle più semplici e famose misure di centralità, quali degree centrality e betweenness centrality.

La degree centrality è una misura di centralità che basa l’importanza di un nodo sul numero di connessioni (ricordate, gli archi, ovvero le relazioni) che il nodo stesso ha nella rete. Vediamo quali sono i primi dieci nodi più importanti della nostra rete, utilizzando questa misura. Una visualizzazione di tutti i personaggi è disponibile qui.

Úrsula (Iguarán): 33

Amaranta: 27

Remedios: 26

Colonel Aureliano Buendía: 25

Aureliano Segundo: 23

Rebeca: 19

José Arcadio Buendía: 18

José Arcadio Segundo: 15

Gerineldo (Márquez): 15

Melquíades: 13

La betweenness centrality per un dato nodo, invece, è rappresentata dal numero di cammini minimi tra due nodi nella rete che “toccano” il nodo in questione, ovvero passo attraverso questo nodo X se devo andare da un nodo A ad un nodo B nella rete? Di seguito i primi dieci, mentre la visualizzazione per tutti i personaggi è disponibile qui.

Úrsula (Iguarán): 0.26675225258687174

Colonel Aureliano Buendía: 0.24285723082589036

Aureliano Segundo: 0.1333021576177314

José Arcadio Segundo: 0.12999823188347778

Remedios,Meme: 0.12191073285263257

Amaranta: 0.09939612889878079

Gabriel: 0.09508196721311475

Mr. Herbert: 0.06448087431693988

Amparo (Moscote): 0.043136425398238344

Melquíades: 0.04185479524582708

Notiamo come Úrsula resta il personaggio più importante del romanzo, dal punto di vista delle relazioni. Infatti, possiede il maggior numero di relazioni e tutte le interazioni passano attraverso di lei. È interessante però analizzare gli altri casi: per la degree centrality il secondo e il terzo posto va rispettivamente ad Amaranta e Remedios, le quali sono protagoniste importanti ma non veicolano della informazione, ovvero gli altri personaggi possono avere o meno relazioni tra loro senza passar per forza tra le due; per la betweenness centrality i rispettivi posti spettano al Colonnello Aureliano Buendía e Aureliano Segundo, entrambi personaggi principali del libro e fili conduttori dell’intera trama.

Ci si confonde sempre.

Conclusioni

Le due modalità di analisi ci hanno permesso di scoprire alcune proprietà del racconto in due contesti differenti: quello testuale, meno semantico e più sintattico, e quello semantico, tramite le relazioni fra i personaggi. È ovvio che la seconda tipologia si basa fortemente sul concetto di relazione, che in questo caso è definita in modo empirico dal sottoscritto.

Sarebbe interessante aggiungere della semantica e costruire le relazioni in un modo diverso, per esempio due personaggi sono in relazione se sono fisicamente vicini nel contesto in cui vengono individuati. Come puoi immaginare, caro lettore, questo approccio è più complicato poiché bisognerebbe poter capire in modo automatico quando due personaggi sono fisicamente vicini.

Le informazioni estrapolate da queste analisi, più che dei risultati rappresentano delle curiosità interessanti, che potrebbero essere raffinate utilizzando delle tecniche più specifiche. Inoltre, l’approccio utilizzato per Cent’anni di Solitudine può essere applicato (virtualmente) a qualsiasi altro libro. Bisogna sottolineare l’importanza della lingua: il tagging è il processo di suddividere le parole di un testo in parti del discorso; i criteri di questa suddivisione sono specifiche per le singole lingue e quindi non universali.

Segnalatemi nei commenti, per email o tramite piccioni viaggiatori le vostre idee al riguardo e, soprattutto, fatemi notare le probabili cantonate che ho preso analizzando questo splendido romanzo.