Como foi feito?

A análise foi feita com base em 15.654 posts publicados no Twitter entre 28 de setembro de 2017 e 23 de abril de 2018 por 14 políticos que se colocam como possíveis pré-candidatos à Presidência da República:

Jair Bolsonaro (PSL)

Marina Silva (REDE)

Geraldo Alckmin (PSDB)

Ciro Gomes (PDT)

Manuela D’Ávila (PCdoB)

Álvaro Dias (PODE)

Lula (PT)

Guilherme Boulos (PSOL)

Henrique Meirelles (MDB)

Michel Temer (MDB)

Rodrigo Maia (DEM)

Fernando Collor (PTC)

João Amoedo (NOVO)

Joaquim Barbosa (PSB)

A estes, se somaram as publicações de Fernando Haddad e Jaques Wagner, do PT, que são considerados o “plano B” do partido caso a justiça decida impedir a candidatura do ex-presidente Lula.

Não foi elaborado um gráfico para Joaquim Barbosa porque ele fez apenas uma publicação no período de coleta dos dados. Duas semanas depois, publicou novamente para anunciar sua desistência de candidatura à Presidência.

Para descobrir quais as palavras estatisticamente características de cada político, foram comparados os termos usados por determinado pré-candidato e os termos usados por todos os demais.

Por exemplo, a cada dez mil palavras ditas por Marina Silva, o vocábulo “sustentável” apareceu aproximadamente 42 vezes. Nos outros candidatos, essa taxa foi menor que 1. Isso significa, portanto, que o termo é típico dela.

O cálculo ignora palavras que foram usadas exclusivamente por um candidato. Isso impede que termos sem sentido, como erros de digitação ou vícios de linguagem muito particulares, poluam a análise.