O raciocínio por trás é quase sempre o mesmo: grupos políticos usam suas fazendas de perfis automatizados para replicar posts que puxam a sardinha para o próprio lado. Nessa guerra, como salientamos, vale tudo: mentir, aumentar e até usar discursos de ódio

Ainda assim, no meio dessas faíscas, tem uns robozinhos querendo botar ordem na casa. Um caso famoso é a Rosie, da operação Serenata de Amor. Já falamos sobre esse projeto há algum tempo, quando estava em sua fase inicial. O funcionamento era quase simples: eles captavam os valores das notas de políticos via portal transparência da Câmara dos Deputados e, a partir daí, analisavam manualmente se o papel era ilegal ou não.

Agora, dois anos e milhares de notas fiscais de parlamentares denunciadas depois, a robô ganhou um upgrade: analisará contas que não passaram por licitações e foram publicadas nos Diários Oficiais dos municípios. O objetivo, dizem seus criadores, é vasculhar os cem maiores municípios do país, o que representaria 40% da população.

Para um dos líderes do projeto e cientista de dados, Irio Musskopf, será um desafio de complexidade bem maior do que a fase anterior. “Queremos testar formas de interagir com os moradores do município sem necessariamente jogar suspeitas de Florianópolis para um recifense, por exemplo, pois esse recifense pode não estar interessado em ver essa informação de outra cidade”, comentou ao Motherboard.

Uma dificuldade, diz Musskopf, é a captação dos dados. Diferentemente da Cota para Exercício da Atividade Parlamentar (Ceap), usada na fase anterior do projeto e que tem padrão único de divulgação, os Diários Oficiais dos municípios não são padronizados e, para piorar, saem no formato PDF, que não ajuda na hora da coleta.

A solução? Fazer Rosie aprender a fazer esse serviço de formiga. “Se um ser humano consegue entrar num site de prefeitura, baixar o PDF e investigar manualmente, a Rosie consegue, com tempo, aprender”, explicou Musskopf.

Ele explica que, para tornar a análise viável, é necessário trabalhar com Processamento de Linguagem Natural ou NLP(na sigla em inglês). Esse tipo de tecnologia têm ganhado bastante espaço no nosso cotidiano com os assistentes de voz como a Siri, da Apple, ou a Cortana, da Microsoft. Conforme explicou o cientista de dados, ela “permite que a Rosie saiba que um valor número depois de um ‘R$’ é um preço, independente se é precedido por ‘preço’, ‘preço total’ ou ‘valor da compra’”. E por aí vai.

Por enquanto, a nova fase da Operação Serenata de Amor têm apenas o município de Porto Alegre com todas as dispensas de licitações listadas. O prazo que Musskopf coloca para ter o acesso fácil a todos os 100 municípios que serão contemplados pelo projeto é de um ano. Tudo estará pronto em abril de 2019. “Conseguir isso em tão pouco tempo é desafiador, mas a ideia de criar um banco de dados aberto com toda essa informação é animadora”, completa.

Os prefeitos, vereadores e seus asseclas que se cuidem: tem robô bom na jogada.