Lo que los políticos dicen en Twitter (parte 1)

Sin duda alguna, el internet ha revolucionado la forma en que las personas nos informamos hoy en día. Por una parte, los contenidos, que tradicionalmente eran generados por los mismos medios encargados de su transmisión, ahora son también generados por los usuarios de internet en blogs, wikis y posts en redes sociales. Por otra parte, al prescindir de los medios tradicionales para su transmisión, la comunicación entre la fuente y el receptor se puede hacer de manera directa, e incluso en ambos sentidos.

No ajenos a la revolución de la información se encuentran gobiernos y figuras políticas, que han encontrado en las redes sociales, por su costo y alcance, la plataforma ideal para informar sobre sus acciones, propuestas y, evidentemente, para hacer campañas electorales. De entre las redes sociales, quizá sea Twitter la red de su preferencia. Pero, ¿qué es lo que dicen los políticos mexicanos en Twitter?, ¿qué palabras usan?, ¿qué temas son los que tratan?, ¿qué tan diferentes son?

La gran cantidad de contenido generado diariamente en Twitter hace difícil, sino imposible, el análisis de toda la información para un ser humano. En realidad, generalmente leemos (o seguimos) únicamente a los usuarios que nos parecen interesantes, o dicho de otra forma, a los usuarios que van más acordes a nuestros valores, intereses y principios, que al final de cuentas, suelen ser subjetivos y basados en información parcial. Sin embargo, no todo está perdido. La buena noticia es que contamos con el poder y la imparcialidad de las computadoras para analizar grandes cantidades de información. La mala noticia es que la información más importante contenida en twitter es texto, es decir, es información hecha por humanos y para humanos, no para que la entienda una computadora. A este tipo de información, que es la forma en como nos comunicamos los humanos, ya sea de forma hablada o escrita, se le conoce como lenguaje natural.

En este artículo analizaremos los tweets de algunas de las figuras políticas más importantes en la actualidad mexicana mediante el uso de modelos probabilísticos y técnicas computacionales para el análisis de lenguaje natural, con la esperanza de poder contestar las preguntas que planteamos más arriba. Por su extensión, el análisis será separado en varias partes.

Análisis de las palabras que los políticos usan en twitter

En esta primera parte hablaremos de las palabras que cada uno de los políticos analizados utilizan en sus tweets. En especial, nos interesa saber qué palabras utilizan en común y cuáles los diferencian del resto.

Los datos utilizados aquí fueron descargados directamente de twitter, sin embargo, cabe destacar que de esta forma no es posible descargar la historia completa de cada uno de los usuarios, pudiendo descargar aproximadamente los últimos 3,200 tweets de cada uno de nuestros políticos en cuestión. Sin embargo, como no todos los personajes publican en la misma magnitud, para algunos tendremos tweets con fecha en el 2012, mientras que para otros únicamente desde el 2016, sin que este desfase en la fecha impacte nuestro análisis.

En total, analizamos 47,010 tweets de 15 usuarios pertenecientes a Morena, Movimiento Ciudadano, PAN, PRD, PRI y sin afiliación (SA). Los políticos seleccionados (y sus cuentas de twitter) son: Agustín Basave (@abasave), Dante Delgado (@DanteDelgado), Enrique Peña (@EPN), Ivonne Ortega (@IvonneOP), Jaime Rodríguez (@JaimeRdzNL), Jose A. Meade (@JoseAMeadeK), Andrés M. Lopez (@lopezobrador_), Miguel A. Mancera (@ManceraMiguelMX), Martí Batres (@martibatres), Manlio F. Beltrones (@MFBeltrones), Margarita Zavala (@Mzavalagc), Carlos Navarrete (@Navarretecarlos), Miguel A. Osorio (@osoriochong), Ricardo Anaya (@RicardoAnayaC) y Gerardo Fernández (@fernandeznorona). El número total de tweets para cada uno de los políticos se puede ver en la siguiente gráfica interactiva (puedes seleccionar los datos que se muestran).

Esta primera gráfica nos permite ver algunos de los patrones de uso de la red de cada uno de los políticos. Por ejemplo, mientras la proporción de replies (tweets que son respuesta directa a los de otros usuarios) de algunos políticos como @JaimeRdzNL, @abasave, @fernandeznorona y @Mzavalagc supera el 20% del total de sus publicaciones; los de @lopezobrador_, @ManceraMiguelMX, @osoriochong y @JoseAMeadeK no llegan al 1%. ¿Será esto una muestra de la proximidad de algunos de los políticos con sus gobernados / representados?

Como mencionamos más arriba, no todos los personajes aquí analizados publican con la misma intensidad. Para entender mejor los tweets que aquí analizamos, mostramos la siguiente gráfica del número de publicaciones semanales por cada uno de los políticos.

Antes de comenzar el análisis de las palabras más utilizadas por los políticos en twitter, es necesario separar el texto de otros elementos como los hipervínculos. También, es necesario filtrar todo tweet que parezca que fue escrito en otro idioma, las palabras que aparecen una sola vez y las palabras cuyo significado no aportan mucho al análisis, como «sí», «México», «gracias», «hoy», «va», etc. Sin embargo, para este análisis decidimos conservar las @menciones y los #hashtags como palabras en sí. Después de todas estas consideraciones nos quedamos con 44,906 tweets (de los 47,010 que teníamos en un principio), con un total de 367,646 palabras, de las cuales 22,584 son distintas. En la siguiente gráfica interactiva se muestran las 50 palabras más utilizadas.

Entre las 50 palabras más mencionadas por todos los políticos aquí analizados podemos encontrar los nombres de los partidos políticos, las menciones a algunos usuarios y palabras muy generales como país, gobierno y presidente. Pareciera que gran cantidad de tweets están dedicados a la promoción de sus partidos y a saludos y felicitaciones nacionales. Llama la atención que estas palabras no se encuentre ninguna con connotación negativa como inseguridad, corrupción, crimen, etc.

Ahora veamos las 50 palabras más utilizadas por cada uno de los usuarios.

En estas gráficas podemos observar que el lenguaje de cada uno de los políticos en cuestión está altamente relacionado con el cargo que desempeñan. Por ejemplo, en el caso de gobernantes podemos ver que @ManceraMiguelMX utiliza frecuentemente las palabras cdmx, programa, ciudad y capitalinos y @EPN las palabras país, gran, nacional y compromiso. También podemos ver claramente que las palabras usadas por @MFBeltrones están relacionadas con temas legislativos: reforma, diputados y ley y que mujeres es una de las palabras más escriben @Mzavalagc, @IvonneOP y @DanteDelgado. Curioso es que epn es la palabra más mencionada por @lopezobrador_, quien no hace ni una mención ni hashtag; @epn sólo hace mención a @gobrep y tampoco tiene un sólo hashtag.

Pero eso no es todo, las palabras que los políticos usan en sus redes también nos hablan de su estilo de gobernar: compradre, raza y fregón son de las palabras más utilizadas por el gobernador de Nuevo león @JaimeRdzNL. Así mismo podemos entrever algunos de sus intereses y pasiones, podemos encontrar las palabras #tertuliamundialista, brasil y holanda entre las más usadas por @abasave, entre las más usadas de @fernandeznorona encontramos libro.

Si bien este primer análisis de las palabras utilizadas en twitter nos deja entrever ver parte de la ideología e intereses de algunos de los personajes de la política mexicana, es evidente que no es suficiente. Al analizar palabra por palabra estamos prescindiendo del contexto en el que fueron utilizadas, es decir, no estamos tomando en cuenta las demás palabras que la acompañan en el mismo tweet y, por lo tanto, no es posible generalizar. Por ejemplo, cuando @abasave dice partido, ¿está hablando de política o de fútbol? En las próximas publicaciones intentaremos ajustar un modelo probabilístico con la intención de detectar los temas que se hablan en twitter.

Si te interesa, puedes leer esta nota de El Universal sobre las campaña electoral de este año en las redes sociales.