Tal como indica el título, el propósito de este trabajo ha sido estudiar el problema de los seguidores falsos en profundidad, si bien se ha procurado tratar el tema “desde cero” para facilitar su lectura.

El número de seguidores de una cuenta de Twitter ha sido generalmente percibido como una medida de la influencia o popularidad de su propietario. Por ello quienes tienen interés en mejorar su prestigio han recurrido con frecuencia al incremento artificial de sus seguidores, y para satisfacer esa demanda existen ofertas de diferentes calidades.

Dado que la compra de seguidores es algo que puede hacer cualquiera a precios asequibles, en general su presencia en una cuenta no implica que hayan sido necesariamente adquiridos por su propietario. A lo largo de este trabajo se irán viendo diferentes ejemplos y el lector tendrá ocasión de juzgar por sí mismo.

El tema de los seguidores falsos suele ser una caja negra. Sabemos que hay muchos, que a veces se compran y que existen unas herramientas online que de alguna manera calculan su porcentaje en una cuenta. Una parte del presente trabajo tratará de mostrar cómo detectar falsos seguidores mediante técnicas de visualización de datos, explicando de manera sencilla cómo interpretar diagramas de dispersión para reconocer las inyecciones de seguidores. El lector podrá visualizar los seguidores falsos en el sentido literal de la palabra, ya que en ocasiones después de la detección se proporcionará un enlace a un fichero con las cuentas.

Veremos qué políticos y partidos han recibido estas inyecciones y en qué momentos, y cómo en ocasiones la compra de seguidores se ha utilizado como arma para desprestigiar a rivales políticos. Buscaremos qué parámetros de las cuentas de Twitter pueden utilizarse para caracterizarlas como seguidores falsos y trataremos de aplicarlo a un método con el que poder comparar grupos de usuarios en función de la mayor o menor presencia de seguidores falsos entre sus seguidores.

Durante la realización de este trabajo hemos encontrado preocupantes indicios de que durante los últimos dos años el número de cuentas de perfil falso creadas en España ha experimentado un altísimo incremento al tiempo que las altas de usuarios reales parecen estar en niveles muy bajos constituyendo actualmente una pequeña fracción del total de cuentas de Twitter de nueva creación. En ese sentido, hemos analizado diversas cuentas, entre ellas la de @TwitterEspana, con el fin de tantear en qué medida se habían visto afectadas por la reciente eclosión de seguidores falsos.

El contenido de este trabajo está dividido en cinco partes, siendo recomendable comenzar por la primera de ellas para una mejor comprensión de las restantes. No obstante quien lo prefiera puede saltar a alguno de los apartados o directamente a las conclusiones.

PARTE 1: CONCEPTOS BASICOS

1. Introducción

Los seguidores falsos no son por lo general bots que lanzan spam político ni trolls que molestan a los usuarios de Twitter. En su inmensa mayoría son cuentas de perfil falso prácticamente inactivas muchas de las cuales ni siquiera han llegado a emitir un solo tweet, ya que su función principal es pasar desapercibidas mientras siguen a los usuarios asignados.

Los de mejor calidad tienen imagen de perfil, pretenden ser de un determinado país, llegan a emitir algunos tweets y pueden incluir un enlace a Facebook u otra red social. A veces dejan el perfil protegido. Hay millones de cuentas destinadas a efectuar falsos seguimientos y siguen creándose de manera continua.

La carga en el usuario seguido se produce con frecuencia a través de inyecciones de seguidores que podríamos clasificar en puntuales (duran minutos, horas o días) y extendidas (se prolongan durante semanas o incluso meses para no llamar la atención).

En los siguientes apartados aprenderemos a detectar esas inyecciones mediante un tipo de gráfico llamado diagrama de dispersión.

2. Visualización de los datos

Los datos proporcionados por la API de Twitter incluyen el objeto user de cada seguidor, que no es más que un contenedor donde figuran los parámetros más relevantes de una cuenta. Sin embargo entre ellos no está disponible la fecha en que se produce cada seguimiento, condicionando ello la representación gráfica de los datos.

La manera más efectiva de representar los seguidores de una cuenta es a través de los diagramas de dispersión (scatter), donde cada punto representa un seguidor. Vamos a visualizar los seguidores de una misma cuenta mediante tres diagramas diferentes con el fin de elegir el más apropiado para la búsqueda de seguidores falsos.

Diagrama 1: eje x: tiempo , eje y: nº acumulado de seguidores

La representación más común es la que relaciona el tiempo (eje horizontal) con el número de seguidores alcanzado en cada momento (eje vertical).

Es el tipo de gráfico más intuitivo para hacerse una idea de la evolución del número de seguidores a lo largo del tiempo y permite detectar incrementos bruscos que sugieran compra de seguidores, pero en este caso tiene varios inconvenientes:

Todos los seguidores se encuentran representados a lo largo de la línea dificultando la búsqueda de falsos seguidores debido a la pérdida de dispersión.

A no ser que se guarde un histórico del número de seguidores de la cuenta en diferentes momentos, el tiempo debe ser inferido por métodos indirectos, perdiéndose los picos locales (no queda memoria de las cuentas que han dejado de seguir) y disminuyendo la exactitud para cuentas con pocos seguidores (recuérdese que no se dispone del dato del momento del seguimiento).

Diagrama 2: eje x: fecha de seguimiento , eje y: fecha de creación de la cuenta

Muestra en el eje horizontal la fecha de seguimiento (inferida) y en el vertical la fecha en que fue creada esa cuenta. Si bien es poco intuitivo (siempre una misma pendiente con independencia de la velocidad a que aumentan los seguidores), permite la dispersión de los seguidores conservando el tiempo en el eje horizontal. La intensidad del color está relacionada con la velocidad con que se adquieren nuevos seguidores. Los periodos de grandes incrementos se muestran como líneas verticales de color más fuerte, y las zonas claras son épocas de pocos seguimientos. Tiene el inconveniente de que en momentos de muchos seguimientos los puntos están demasiado comprimidos.

Diagrama 3: eje x: nº acumulado de seguidores , eje y: fecha de creación de la cuenta

Tampoco es demasiado intuitivo, incluso puede llevar a engaño al principio ya que al estar acostumbrados a que el tiempo ocupe el eje horizontal tenderemos a interpretar dicho eje como tal. Otro posible motivo de confusión es que contrariamente a nuestra intuición, las pendientes pronunciadas significan períodos de baja afluencia de seguidores, y cuanto más horizontales lo contrario. Sin embargo tiene la ventaja de no constreñir los puntos, lo que sí ocurre cuando se impone la limitación de representar el tiempo en el eje horizontal. Es muy recomendable el trabajo de José María Mateos Bots en Twitter, el musical acerca de este tipo de diagrama, donde comparte más de 180 imágenes de seguidores de otras tantas cuentas y pone de manifiesto la presencia de estructuras sospechosas en algunas de ellas.

La cuenta tomada para los diagramas de ejemplo previos ha sido la del anterior Ministro de Interior Juan Ignacio Zoido (@zoidoji), ya que presenta un brusco aumento de seguidores el día que se conoció que iba a ser nombrado ministro, evento que facilita la comparación entre los diferentes diagramas. Dicho momento está señalado con un asterisco rojo.

Se aprecia que el último diagrama es el que presenta los seguidores (puntos azules) ocupando mayor superficie (mayor dispersión) lo cual es muy deseable cuando se pretende hacer una inspección visual. Este será por tanto el tipo de diagrama elegido.

3. Diagrama de compactación de seguidores

El más apropiado para nuestro propósito, aún con sus limitaciones, es el tercero de los diagramas anteriores al que hemos añadido las referencias temporales en el eje x (abajo, en color rojo) para facilitar su comprensión. Al permitir una mayor dispersión de los puntos se compensa la carencia de un eje temporal proporcional.

Hay que señalar que la coordenada horizontal de cada seguidor no es más que el número que le toca en orden de seguimiento. En teoría deberían representarse uno a continuación de otro en el eje x, pero al tratarse un número tan grande de puntos no caben en las dimensiones del gráfico, y en la práctica se ven compactados muchos de ellos en la misma línea vertical produciendo ese efecto temporal que puede llevar a confusión pero que al mismo tiempo le da tanta potencia. Por esa característica nos referiremos a este tipo de diagrama de dispersión como diagrama de compactación de seguidores.

3.1 Algunas características

Antes de ponernos a buscar seguidores falsos conviene familiarizarse con este diagrama y aprender a identificar las formas y estructuras que pueden aparecer de manera natural para no confundirlas con falsos seguidores.

borde e interior: en las cuentas con un número suficiente de seguidores se puede distinguir un borde donde se acumulan los seguidores que efectúan el seguimiento en el momento de ser creados. Los puntos del interior muestran los seguimientos que han tenido lugar tiempo después de ser creadas las respectivas cuentas, más tarde cuanto más abajo en el gráfico. Por ejemplo, el seguidor “S”, representado por un punto rojo, fue creado a comienzos de 2011 (eje y), pero no fue hasta comenzado 2017 (eje x) cuando se produjo el seguimiento. Si ese mismo seguidor hubiese sido creado al tiempo que efectuaba el seguimiento, se vería como un punto del borde, justo en la vertical de donde se encuentra.

pendiente anti intuitiva: un borde con pendiente empinada significa un lento incremento de seguidores en un período de tiempo largo, y de la misma manera la pendiente cercana a la horizontal es signo de gran cantidad de seguidores en poco tiempo. el eje horizontal no es el tiempo: aunque moverse hacia la derecha significa paso del tiempo, este no transcurre de forma lineal sino con velocidad cambiante en función de la pendiente del borde del diagrama. Según la zona del eje horizontal en que estemos, el tiempo se va expandiendo o contrayendo en función de la cantidad de nuevos seguimientos. Las marcas rojas que hemos añadido al diagrama de compactación indicando el comienzo de cada año no son equidistantes, sino que están más separadas cuantos más seguidores haya habido en el año.

3.2 Distribuciones naturales (esperables)

Aunque en algunas ocasiones el diagrama de compactación de seguidores de una cuenta resulta bastante homogéneo, con frecuencia los puntos se distribuyen formando determinadas estructuras que conviene reconocer para no confundirlas con falsos seguidores. Estas son las más importantes.

Bandas horizontales naturales



Normalmente se notan bandas horizontales más o menos difusas extendiéndose a lo largo de todo el diagrama que indican una mayor densidad de seguidores cuyo “nacimiento” se sitúa en torno a determinadas épocas.

Son características de cada país o zona donde Twitter está implantado dependiendo de los momentos en los que la creación de cuentas se intensificó más. En España el “baby boom” de Twitter tuvo lugar en 2011-2012, aunque encontramos otras bandas de menor entidad en diversos momentos. La interrupción de estas bandas suele significar un aluvión temporal de seguimientos de cuentas no españolas, que en ocasiones pueden ser seguidores de otro país, pero que con frecuencia es un síntoma de una inyección de seguidores falsos.

Franjas verticales con borde horizontal (conservando las bandas horizontales)



La aparición de franjas verticales poco diferenciadas de su entorno, con borde superior horizontal (muchos seguimientos en poco tiempo) y conservando las bandas hiorizontales naturales (no están compuestas por bots) indican un gran crecimiento de seguidores compatible con un aumento repentino de la popularidad de la cuenta, que pasa a ser más conocida y seguida. Tomando como ejemplo la cuenta del experto en ciberseguridad @chemaalonso, se observan dos franjas verticales de este tipo en noviembre de 2013 y mayo de 2017.

Obsérvese que debajo de ambas flechas rojas el borde es horizontal (muchos seguidores en poco tiempo). En noviembre de 2017 el propietario de la cuenta fue entrevistado en televisión por Jordi Evole y el 12 de mayo de 2017 tuvo lugar el ataque del virus ransomware incrementándose en ambas ocasiones su popularidad. En este ejemplo las dos franjas verticales son bastante sutiles apreciándose pequeños cambios en la intensidad del color. Las bandas horizontales no se ven interrumpidas, síntoma de que son seguimientos reales.

En el diagrama de evolución temporal de @chemaalonso se distinguen perfectamente esos dos momentos de crecimiento súbito de seguidores.

Por último y por poder prestarse a confusiones hay que hablar de una forma rápida de obtener seguidores cuyos rastros en los diagramas pueden confundirse con inyecciones de falsos seguidores.

Práctica del follow-unfollow

Te sigo, no te sigo. Una cuenta comienza a seguir a muchas otras esperando que hagan lo propio devolviéndo el seguimiento (follow back). Un tiempo después deja de seguirlas. El proceso está automatizado y se consigue aumentar el número de seguidores dejando más baja la cifra de seguidos. Esta técnica, ya obsoleta, deja estructuras características en el diagrama de dispersión. En general no son falsos seguidores, sino cuentas elegidas bien al azar o bien en base a algún perfil. Este es el diagrama de compactación de seguidores de una cuenta señalada en el pasado como practicante del método de seguir y dejar de seguir (@rabanales21): Entre 2013 y mediados de 2015 aparecen extrañas formas distinguiéndose partes más densas de otras casi vacías. Pensamos que tiene que ver con un criterio de selección de cuentas a seguir que fija un límite superior para la fecha de creación de dichas cuentas. De esta forma las zonas densas serían seguimientos fruto del follow back. Los huecos corresponderían a fechas de creación no “barridas”, y los pocos seguidores que aparecen en ellos estarían reflejando seguimientos que no forman parte del follow back. Dicho límite iría variando con el tiempo, de ahí las formas descendentes. Se observa que justamente al comenzar el año 2015 el límite cambia de manera brusca hacia la fecha actual de ese momento.

3.3 Estructuras que delatan seguidores falsos

La inyección de falsos seguidores puede deducirse con mayor o menor facilidad en función del tiempo empleado en dicha maniobra y de la antiguedad de las cuentas seguidoras. Pueden distinguirse varias formas características que delatan su presencia:

Linea horizontal en franja vertical vacía

La presencia únicamente de una línea horizontal significa que las cuentas seguidoras han sido creadas en un corto espacio de tiempo, a veces en una fecha concreta. Dado que la operación de seguimiento (inyección) fue rápida no ha dado tiempo a que seguidores reales con diferentes antigüedades hayan llenado el resto de la franja, que aparece vacía. Al ampliar se percibe que ni siquiera el borde ha tenido tiempo de formarse. Lo que se ve como una línea son con cientos o miles de seguidores falsos. A veces para no llamar la atención, los seguimientos se van haciendo en varias fases (línea horizontal troceada) entre las cuales el gráfico se sigue llenando normalmente con seguimientos reales que toman la forma de franjas verticales de baja densidad. La inyección de seguidores del ejemplo tuvo lugar durante gran parte del año 2014. En la actualidad este tipo de inyecciones ha caido en desuso.

Bloque vertical

El bloque es el resultado de mezclar seguidores falsos de diferentes edades simulando aleatoriedad en los seguimientos. Sin embargo la presencia de un rango de edades más abundante que el resto induce a la sospecha.

Este otro ejemplo está formado por cuentas de todo el espectro de edades lo que dificulta el diagnóstico al confundirse con franjas verticales como las que se forman por un repentino aumento de popularidad. Si las bandas horizontales naturales se ven interrumpidas en esta franja aumentan las probabilidades de falsos seguimientos.

Hemos hablado de varias estructuras visibles a simple vista que delatan la presencia de seguidores falsos. En los últimos años algunas de ellas parecen estar cayendo en desuso para dar paso a cargas de seguidores más discretas y prolongadas en el tiempo que dificultan su detección.

Franjas verticales poco densas con borde marcado

Algunas cuentas presentan franjas verticales más o menos anchas con poca densidad de seguidores pero mostrando en la parte superior un borde horizontal muy marcado. La pendiente horizontal del borde indica muchos seguidores en poco tiempo y el color más claro (baja densidad) de toda la franja unido al borde muy marcado, se puede interpretar como períodos de tiempo (por ejemplo varios días o semanas) en los que la mayor parte de los seguidores nuevos que aparecen son cuentas de nueva creación. Es una situación que se produce típicamente cuando la cuenta de un usuario es recomendada por la propia red social a las nuevas cuentas que se van creando.

Hay que tener en cuenta, sin embargo que gran parte de las cuentas que se crean en Twitter son falsas por lo que, como veremos en el apartado 5, cuando un usuario es recomendado por Twitter puede ocurrir que se comience a llenar de seguidores falsos.

En el siguiente apartado veremos casos reales de cuentas en las que se han inyectado seguidores, y que servirán para familiarizarse con las distintas estructuras que se acaban de enumerar.

4. Casos prácticos con falsos seguidores “existentes”

Los gurus del social media y el marketing digital parecen ser bastante propensos a recibir falsos seguimientos, y lo mismo ocurre con algunos políticos. Revisaremos a continuación con fines didácticos algunas de las cuentas que presentan inyecciones de falsos seguidores si bien la existencia de las mismas en una cuenta no implica que hayan sido necesariamente propiciadas por su propietario.

Los diagramas de compactación que utilizaremos son óptimos para descubrir seguidores falsos en los cuales el seguimiento ha tenido lugar tiempo después de haber sido creada la cuenta de perfil falso. Los llamamos seguidores falsos existentes en contraposición a los nuevos, es decir, aquellos en los que el seguimiento ocurre en el momento en que son creados.

CASO 1: @juanfraescudero (Juan Francisco Escudero Pérez)

Esta cuenta pertenece al conocido”comunity manager de los famosos” y concejal de Ciudadanos en el ayuntamiento de Alicante, Juan Francisco Escudero. Aparecen múltiples indicios de seguidores falsos inyectados en diferentes épocas. A simple vista se aprecian dos de las estructuras anteriormente mencionadas: líneas horizontales y bloques verticales. Haciendo zoom en una cualquiera de esas líneas aparece un enjambre de seguidores falsos. Sólo hay que efectuar una prospección para confirmar el tipo de seguidores: en este caso cuentas creadas en la misma fecha, casi sin followers y con localidades (declaradas, no reales) de EE.UU. Estas son algunas de ellas: La cuenta @juanfraescudero es muy apropiada para practicar con diagramas de dispersión. Escogiendo otra cualquiera de las formaciones sospechosas que aparecen se llega esta vez a otra inyección de unos 20.000 seguidores (se pueden descargar aquí). Además hay estructuras invisibles a simple vista que aparecen cuando se resaltan en otro color determinados parámetros como el lenguaje declarado de la cuenta (parámetro ‘lang‘ del objeto ‘user’). Obsérvese ahora el mismo diagrama de @juanfraescudero al resaltar las cuentas configuradas en los lenguajes más comuntes de los bots (inglés, ruso y árabe). La parte derecha del gráfico, que a simple vista no llamaba la atención, está ahora surcada por franjas amarillas verticales (cuentas árabes) y encontramos a las cuentas rusas (verde) en bloques muy localizados. Pero la mayoría de los seguidores falsos están configurados en el idioma ingĺes, circunstancia que hemos encontrado también en otras cuentas. Considerando sólo los seguimientos de 2013 y utilizando criterios bastante restrictivos, hemos detectado unos 130.000 seguidores falsos en la cuenta @jaunfraescudero disponibles aquí.

A partir de 2014 las inyecciones de seguidores han ido evolucionando con el fin de mimetizarlos, pasando de expresarse a través de líneas horizontales (fáciles de detectar) a hacerlo como bloques verticales que cubren todo el espectro de edades.

CASO 2: @joseantoniojun (José Antonio Rodriguez Salas)



La cuenta del alcalde socialista del municipio granadino de Jun, Jose Antonio Rodríguez Salas, es otra de las que presenta formaciones características de inyecciones de seguidores. Durante los primeros años abundan las líneas horizontales que indican seguimientos masivos por parte de cuentas con fechas de creación similares, y a partir de 2015 se aprecian formaciones extrañas cerca del borde. Al aplicar el resalte del parámetro ‘lang’ para diferenciar distintos idiomas declarados encontramos abundantes seguidores en idioma inglés y árabe, si bien no se detecta la presencia relevante de cuentas en ruso. Coincidiendo con las formas extrañas que se veían cerca de los bordes a partir de 2015 aparecen ahora numerosas cuentas en ingles y árabe. Merece la pena ampliar la parte izquierda del diagrama de compactación para ver con más detalle las inyecciones de seguidores que tuvieron lugar en 2012 y 2013. Las partes rojas se corresponden con decenas de miles de seguidores falsos configurados en idioma inglés. Haciendo zoom sobre las dos franjas rojas de la derecha aparece el enjambre de las aproximadamente 14.000 cuentas que las forman. Al hacer una prospección nos encontramos con cuentas que llevan sin tuitear desde 2013, en las que se ha dejado la imagen azul de fondo por defecto y con unas cifras muy similares de mensajes enviados, seguidores y seguidos. Nótese también que el hecho de que todas estén configuradas en idioma inglés no tiene que ver con el idioma en que tuiteaban realmente, en este caso el español.

En marzo de 2016 el periodista Pablo Herreros publicó un artículo sobre seguidores falsos donde se refería a la cuenta @joseantoniojun. Como consecuencia el alcalde Jose Antonio Rodríguez Salas amenazó con demandar al periodista, lo cual no sabemos si finalmente sucedió (actualización: nos indica el propio Herreros que la demanda no llegó a realizarse). Según el alcalde de Jun, “no puedes acusar a alguien de comprar seguidores. Es como cuando dicen que un deportista se dopa”.

Hemos encontrado en la cuenta @joseantoniojun diversas inyecciones de seguidores, sobretodo durante 2012 y 2013. Las más evidentes por tomar la forma de múltiples líneas horizontales (cuentas con mismas fechas de creación) contienen aproximadamente 28.000 seguidores falsos que se pueden descargar aquí. En el apartado 18 se hablará algo más respecto a esta cuenta.

CASO 3: @frankstrada (Frank Estrada)



Frank Estrada es “asesor y productor de estrategias de márketing digital”. En esta cuenta encontramos varias inyecciones de seguidores antes de 2015, apareciendo cuentas configuradas en inglés, ruso y árabe. Como en el caso anterior, al resaltar con diferentes colores según el lenguaje declarado en cada cuenta, se visibilizan mejor algunos bloques verticales difíciles de distinguir a simple vista. Una muestra de los seguidores falsos aquí.

CASO 4: @marcvidal (Marc Vidal)



Marc Vidal figura en su perfil de Twitter como “host of tv, business consultant on digital transformation, investor in Startups, international speaker & economic writer”. Da conferencias.

En su diagrama de compactación aparecen formas de todo tipo: líneas horizontales (seguidores con similares fechas de creación), bloques verticales (fechas de creación en unos rangos concretos), y formaciones posiblemente debidas a la práctica del te sigo-no te sigo. La mayoría de los seguidores falsos están configurados en lenguaje inglés. A partir de 2016 aparecen bastantes seguidores rusos (verde) y en 2017 proliferan también los árabes (color amarillo). En este fichero hay una muestra. En la cuenta @marcvidal también encontramos líneas horizontales troceadas como las vistas en la sección 3.5. Las líneas horizontales están formadas por miles de seguidores que fueron creados en fechas muy similares y fueron inyectados en varias fases a lo largo de varios meses de 2014.

CASO 5: @octavioregalado (Octavio Regalado)



Octavio Regalado da conferencias sobre redes sociales. En 2015 y 2016 se aprecian formaciones asociadas a grandes cargas de seguidores creados en rangos de fechas concretos. Ampliando el año 2014 se pueden ver con más claridad las líneas horizontales formadas por falsos seguidores con similares fechas de creación.

Aquí una muestra de los seguidores falsos.

CASO 6: @xaviertrias (Xavier Trias)



Xavier Trias fue alcalde de Barcelona entre 2011 y 2015 y pertenece al PDeCat. Su cuenta de Twitter presenta una inyección de unos 15.000 seguidores falsos entre los días 1 y 2 de junio de 2014, mientras todavía era alcalde. Se han resaltado en rojo los seguidores comfigurados en inglés. Aquí se puede descargar una muestra. Obsérvense los marcados bordes coloreados de rojo a ambos lados de la inyección, característicos de seguidores falsos “nuevos”, de los que se hablará a continuación.

Para concluir este apartado veamos cómo se ven las cuentas de los cuatro principales partidos políticos de España (@ppopular, @psoe, @ahorapodemos y @ciudadanoscs)bajo el diagrama de compactación, tanto en su versión normal como coloreando según el lenguaje configurado:

Cuando resaltamos con color diferente los seguidores configurados en inglés (rojo), ruso (verde) y árabe (amarillo), en dos de los diagramas aparecen formaciones sospechosas dignas de analizar y de las que se hablará más adelante, en la parte 2. Como se verá más adelante, las cuatro cuentas presentan gran cantidad de seguidores falsos aunque aquí sólo se aprecien inyecciones de seguidoes en @ppopular y @ciudadanoscs.

En el presente apartado hemos visto varios ejemplos de cuentas que presentan cargas de falsos seguidores ya existentes (creados con anterioridad al seguimiento). También hemos comprobado la utilidad de resaltar ciertos parámetros en diferente color para sacar del mimetismo determinadas formaciones sospechosas.

5. Casos prácticos con falsos seguidores “nuevos”

En los casos vistos hasta ahora, los falsos seguidores ya estaban creados con anterioridad a producirse el seguimiento dando lugar en los diagramas a estructuras sospechosas (líneas, bloques) que llaman la atención y permiten identificar las inyecciones.

Pero los seguidores falsos que llamamos nuevos porque efectúan el seguimiento en el momento de ser creados, siempre van a parar al borde superior superpuestos unos encima de otros.

Obsérvese el borde a ambos lados de la inyección. Se han resaltado en rojo las cuentas que actualmente tienen cero seguidores. Son los seguidores falsos “nuevos”. Como están apelotonados en el borde, no es posible verlos correctamente ni hacernos idea de su cantidad. De hecho la mayor parte de las veces hay muchos más seguidores falsos de los que muestran los diagramas de compactación que hemos visto hasta ahora. Si queremos ver las cuentas que se “esconden” en el borde, es decir los seguidores falsos que efectúan el seguimiento en el momento de ser creados, será necesario variar un poco el diagrama de compactación modificando la variable representada en el eje vertical como veremos a continuación.

CASO 9: @patxilopez (Patxi López)



El diputado socialista Patxi Lopez creó su cuenta de Twitter en septiembre 2008. Durante los primeros 14 meses experimentó un crecimiento de seguidores muy lento. Siendo ya lehendakari, en noviembre de 2009 su cuenta se incrementó en aproximadamente 50.000 seguidores durante un período de algo más de dos meses, hasta mediados de enero de 2010.

Veamos con detenimiento los diagramas que siguen a continuación, ambos similares. El de arriba es un diagrama de compactación de seguidores como los vistos hasta ahora donde en principio no se aprecian estructuras sospechosas. El primero de ellos presenta una amplia pendiente casi horizontal sobre una zona de baja densidad de seguidores, lo que indica gran cantidad de seguimientos desde cuentas de nueva creación. Aún así, no se confirma que son falsos seguidores hasta que miramos el gráfico de abajo donde se representa el ratio seguidos/seguidores.

El diagrama inferior representa en su eje vertical el ratio seguidos/seguidores evidenciando los seguidores falsos, que son proyectados hacia arriba al contrario que el resto. Dicho ratio suele tener valores bajos en los usuarios reales, pero los falsos seguidores devuelven valores elevados ya que con frecuencia siguen a muchas más cuentas de las que les siguen a ellos. Cabe destacar la perfecta coincidencia en la vertical entre ambos gráficos.

Dado el valor elevado del ratio y las líneas perfectamente horizontales que aparecen, no cabe duda de que la inmensa mayoría de ellos son falsos. En este enlace se puede descargar una muestra de más de 11.000 de ellos, todas cuentas con cero seguidores. Sin embargo, pese a las apariencias, todo parece indicar que la responsable de esta invasión de seguidores falsos en la cuenta @patxilopez fue la propia red social a través de sus recomendaciones a los nuevos usuarios.

Recomendaciones de Twitter en Nov-2009: ¿experimento fallido?

El 3 de noviembre de 2009 después de finalizada la traducción, se lanzó Twitter en español, que incluía un listado fijo de usuarios recomendados que duró hasta el 22 de enero de 2010, cuando al parecer se decidió discontinuarlo y preparar un algoritmo que efectuase las sugerencias de manera dinámica. El aluvión de seguidores falsos de @patxilopez coincide exáctamente con ese periodo experimental. Por lo que se evidencia que ya en esa época se creaban perfiles falsos de forma masiva, parte de los cuales (unos 50.000) siguieron la sugerencia de Twitter. Existe la posibilidad de que la inclusión de @patxilopez en el listado de sugeridos fuese negociada, extremo que no es posible conocer mediante este tipo de análisis.

Sobre ese período contamos con el testimonio que dio en su día del influencer Enrique Dans (@edans), que habló en su blog acerca de su inclusión en el listado de sugeridos de Twitter y del notable incremento de seguidores que le supuso, al que llamó “efecto recomendación”. En esta reciente entrada vuelve a comentar sobre el mismo tema. Al analizar su cuenta se aprecia que las formaciones que aparecen en ese período son idénticas a las de @patxilopez (compárense las formaciones en rojo), con lo que aparentemente figurar entre los sugeridos de Twitter les supuso a ambos (@edans y @patxilopez) acabar inundados de seguidores falsos. Dice Dans que su inclusión en la lista de sugeridos tuvo lugar el 4 de noviembre de 2009. Efectivamente los primeros falsos seguidores tienen fechas de creación del día 3 de noviembre a partir de las 22h (hora de Twitter, a la que hay que añadir dos horas de corrección en esa época del año) y la situación se prolongó hasta el día 12 de Enero. Son interesantes las reflexiones sobre la experiencia que hace Dans a posteriori, donde analiza el hecho de que tantos miles de seguidores no le han supuesto más retweets ni respuestas en Twitter ni más clics en enlaces. En este fichero está disponible una muestra de 20.000 de las cuentas de perfil falso que siguieron a @edans entre noviembre de 2009 y enero de 2010.

También se aprecia en la cuenta de @edans otra fase de falsos seguimientos masivos a partir de 2014 que parecen estar relacionados con la prolifereción generalizada de falsos seguidores que se tratará en la Parte 3.

CASO 8: @mdcospedal (Maria Dolores de Cospedal)



El siguiente ejemplo corresponde a un incremento de seguidores falsos en la cuenta de la anterior ministra de Defensa, Dolores de Cospedal (@mdcospedal). Tuvo lugar durante las Elecciones Autonómicas de 2015 en las que perdió la presidencia de Castilla- La Mancha. Desde el comienzo de la campaña electoral y durante casi tres meses su cuenta obtuvo alrededor de 30.000 seguidores falsos. Comparemos ahora los dos tipos de diagramas de compactación que ya conocemos. Nuevamente tenemos abajo el diagrama de compactación que representa el ratio seguidos/seguidores. Cabe destacar la perfecta coincidencia en la vertical entre ambos gráficos. Una muestra de varios miles de esos seguidores de @mdcospedal que aparecieron durante la campaña electoral de 2015 puede descargarse aquí.

Hemos calculado el porcentaje de segudores falsos antes, durante y después de la campaña electoral. Durante la misma un (93%) son falsos, contrastando con el período anterior en que aparecen un 55%. ¿Puede decirse que en el caso de @mdcospedal esos 30.000 seguidores falsos también son debidos a que dicha cuenta apareció como cuenta recomendada para seguir para las nuevas altas? En 2015 las sugerencias de cuentas a seguir ya se hacían de manera personalizada en base a un algoritmo, por lo que no hay constancia de que así haya sido. En cualquier caso el porcentaje de seguidores falsos permaneció muy elevado después de ese período.

Vale la pena insistir en la potencia del ratio seguidos/seguidores como herramienta para la detección de seguidores falsos. Al comparar los diagramas de compactación de una cuenta que tiene pocos seguidores falsos (hemos tomado la ya mencionada @chiquitocalzada) y la cuenta de un político conocido cualquiera con presencia en redes sociales, la diferencia salta a la vista.

El valor medio del ratio para usuarios reales es inferior a los 5 seguidos/seguidores, tal como se ve en @chiquitocalzada. En el diagrama de la derecha decenas de miles de seguidores falsos toman valores seguidos/seguidores inverosímiles para usuarios reales.

PARTE 2: REPASO HISTÓRICO

6. El adelantamiento a Rajoy y la crisis de los seguidores

Las circunstancias que tuvieron lugar en septiembre de 2014 marcaron un antes y un después en el Twitter español, poniendo el foco en el problema de los seguimientos falsos y comenzando un período en el que las inyecciones de seguidores pudieron ser empleadas como arma de desprestigio hacia el adversario político. En esa época aparece @tuitocracia, una cuenta que monitoreaba los cambios bruscos en los seguidores de las principales cuentas políticas detectando tanto inyecciones de seguidores como la eliminación de los mismos por parte de Twitter. Lamentablemente lleva inactiva desde febrero de 2016.

La denuncia y la posterior eliminación de las cuentas que seguían a Rajoy

En Septiembre de 2014 el liderazgo de Mariano Rajoy como el político con más seguidores en Twitter estaba amenazado. Desde las Elecciones Europeas (25 de Mayo de 2014), la figura de Pablo Iglesias se había popularizado y su cuenta de twitter aumentaba en seguidores a un ritmo mayor que la de Rajoy, por lo que era inminente el adelantamiento. Pero el 5 de septiembre se denunció desde Podemos el repentino aumento de seguidores en la cuenta @marianorajoy, muchos de ellos de estética árabe.

Las cifras de evolución de seguidores indican que en unas horas, durante la madrugada del día 5 de septiembre, los seguidores de @marianorajoy aumentaron en unos 60.000.

Durante ese día fueron eliminados por la red social, y desde el Partido Popular se atribuyó el incidente a “causas ajenas”. Una vez borrados, en los siguientes días se produjo el esperado adelantamiento de @pablo_iglesias_, cuya cuenta se sitúa desde entonces por delante en número de seguidores.

Inyecciones indiscriminadas. La crisis de los seguidores

Este episodio del descubrimiento y posterior eliminación de falsos seguidores de @marianorajoy provocó un revuelo mediático. Era la primera vez que un tema así saltaba a los medios y el gran público comenzó a familiarizarse con el fenómeno de bots y seguidores falsos. La consecuencia de tanta atención fue un período de varios meses que se podría denominar como “la crisis de los seguidores“, durante el cual las cuentas de los principales líderes comenzaron a sufrir incrementos anómalos de seguidores, seguidos de su posterior eliminación.

El día 6 de septiembre Pedro Sánchez tuiteó que había detectado falsos seguidores en su cuenta. Europa Press habla de un incremento de 20.000 seguidores en la cuenta de @sanchezcastejon en los días previos que debieron también ser borrados ya que actualmente no se detectan. El día 14 se vuelven a reportar aumentos anómalos en los seguidores de @marianorajoy y @sanchezcastejon, que son eliminados ese mismo día.

A partir del 21 de septiembre le toca a la cuenta de @pablo_iglesias_, que 10 días después del adelantamiento a Rajoy experimenta también un crecimiento anómalo de seguidores. No se encuentra reporte de que hayan sido borrados, y la imagen actual del diagrama de compactación muestra que durante cinco días, del 21 al 26 de septiembre aparecen unas 700 de estas cuentas como nuevos seguidores, y otras tantas un mes después. Al no haber sido borradas por Twitter aún pueden verse en el gráfico si se amplía lo suficiente. Pueden consultarse aquí.

¿Qué explicación tiene la “crisis de seguidores” desatada a raiz del incidente de los falsos seguidores de Rajoy? En un ambiente de atención mediática hacia el número de seguidores de los políticos, que estaban siendo examinados con lupa, y justo cuando más sensibilizada esta la sociedad sobre ese tema, llaman la atención las inyecciones de seguidores que se fueron sucediendo. No parece que en esas circunstancias socialistas y podemistas efectuasen una compra de seguidores para sus respectivos líderes. En ese momento muchos plantearon que desde el Partido Popular se intentó evitar el adelantamiento a @marianorajoy mediante una inyección de seguidores falsos y que una vez descubierto el engaño se empleó la táctica del caos mediante compra de seguidores a los otros dos líderes dando la apariencia de que todos estaban sufriendo el mismo tipo de vandalismo.

Inyección a @obloque

El partido gallego BNG (Bloque Nacionalista Gallego) tuvo al mes siguiente, el 22 de octubre de 2014, una inyección de unos 10.500 seguidores falsos, de los que actualmente quedan alrededor de 5.300. En el diagrama de compactación aparece una línea horizontal compuesta por cuentas creadas unos días antes de la carga masiva, entre entre el 27-09-2014 y el 05-10-2014. Durante la inyección, que duró sólo unas horas, no dio tiempo a que se produjesen seguimientos de usuarios reales. Por esa razón aparece una zona totalmente en blanco en el diagrama. Queda constancia de la conversación que tuvo lugar cuando el partido nacionalista gallego @obloque fue avisado por @tuitocracia del anómalo incremento de seguidores. ¿Compra de seguidores o ataque a @obloque? La misma pregunta podría plantearse para el caso siguiente, otro partido nacionalista, varias semanas después.

Inyección a @ehbildu

Todavía bajo los efectos de la mediática “crisis de los seguidores” tiene lugar en la cuenta del partido vasco EH BILDU (@ehbildu) una inyección de aproximadamente 15.000 falsos seguidores durante la primera quincena de diciembre de 2014. Como hemos visto anteriormente, el borde horizontal significa en este tipo de diagrama un gran incremento de seguidores en poco tiempo. En dos semanas @ehbildu obtiene más del doble de seguidores que durante el resto del año. Al resaltar las cuentas configuradas en inglés (rojo) y en ruso (verde) se hacen visibles estos miles de seguidores, muchos de ellos con localización declarada en paises asiáticos. Se pueden descargar aquí. Semanas después de esta inyección, desde @tuitocracia se le comunica a @ehbildu una pérdida de unos 2.500 seguidores, cuya respuesta fue la siguente: A día de hoy estos 15.000 seguidores continúan sin ser eliminados.

7. Misterioso seguimiento simultáneo de Junio de 2015

Se trata de inyecciones de decenas de miles de seguidores falsos que tuvieron lugar al mismo tiempo en varias cuentas políticas. Jose María Mateos se dió cuenta de ello dejando constancia en su trabajo.

Desde mediados del mes de Junio y hasta comienzos de Julio se sucedieron varias inyecciones de seguidores sobre cuatro cuentas de relevancia política en España. Tres del Partido Popular y una de Podemos: @marianorajoy, @pablo_iglesias_, @esperanzaguirre y @ppopular. Cada bloque representa miles de seguidores falsos. Los bloques más cortos están formados por cuentas creadas antes de 2013. Y como en el caso anterior, la mayoría configurados en inglés, pero también en otros varios idiomas. Son mayoritariamente cuentas sin imagen de perfil, con muy pocos seguidores, y pocas o nulas emisiones de tweets. El primero en ser inyectado de falsos seguidores fue @marianorajoy el día 16 de junio. En paralelo se inyectan al día siguiente las cuentas de @pablo_iglesias_ y @esperanzaguirre y el día 18 la de @ppopular. Se da la circunstancia de que la primera de las inyecciones tuvo lugar cinco días después de que la cuenta @pablo_iglesias_ hubiese alcanzado el millón de seguidores, cifra emblemática que era alcanzada por primera vez por un político español.

Una misma autoría

En estas inyecciones, generalmente los mismos seguidores siguen al mismo tiempo a varias de las cuatro cuentas mencionadas. Como ejemplo el mismo falso seguidor @ashraf_zaid86 siguió a un tiempo a las cuatro. Desde @tuitocracia se informaba puntualmente de la evolución de seguidores. En varios de sus tweets confirman que el ritmo de seguimientos era común para las cuatro cuentas, documentando patrones coincidentes en las velocidades de seguidores/hora. Se hace evidente que los cuatro casos tienen una misma autoría, pero es difícil averiguar más allá.

Varios aspectos a tener en cuenta

Hacía más de seis meses que no se detectaban crecimientos anómalos de seguidores en cuentas políticas

Cinco días antes de la primera inyección, la cuenta de Pablo Iglesias alcanza el millón de seguidores. Al ser una cifra emblemática y ser el primer político español en alcanzarla el hecho tuvo bastante repercusión. En segundo lugar iba Mariano Rajoy con 800.000 seguidores.

Tres de las cuentas inyectadas son del Partido Popular frente a una de Podemos.

La primera inyección de seguidores, el 16 de junio, afecta a la cuenta de @marianorajoy que esa misma mañana informa a @TwitterSpain

El mismo día en que se produjo la primera inyección de seguidores, @esperanzaaguirre se retiraba de la presidencia del PP madrileño y pedía un congreso urgente para elegir a su sucesor después del fracaso de las elecciones municipales del 24 de mayo.

Se produjeron varios borrados de seguidores, pero insuficientes comparados con lo que estaba entrando. Las decenas de miles que se pueden visualizar actualmente en los diagramas de compactación son los que no han sido borrados.

Estos seguimientos simultáneos de 2015 son desconcertantes. Quizá alguien pueda aportar información que ayude a aclararlos.

8. Los nuevos partidos

Se han incluido en este apartado las inyecciones relacionadas con los “nuevos partidos” que comenzaban a despuntar en esa época: PODEMOS y Ciudadanos.

Inyección en la cuenta @pablo_iglesias_ durante al campaña de las Elecciones Europeas de 2014

La cuenta @pablo_iglesias_ con más de 2,3 millones de seguidores es la más voluminosa de las analizadas en este estudio. Al hacer el análisis en profundidad de esta cuenta encontramos una inyección de aproximadamente 1.000 seguidores el 11 de mayo de 2014, durante la campaña de las Elecciones Europeas del 25 de mayo de 2014. Son cuentas configuradas en varios idiomas, con pocos seguidores y que comenzaron a seguir a @pablo_iglesias_ el mismo día. Esta inyección pasó en su día inadvertida y tuvo lugar cuando la cuenta tenía todavía menos de 40.000 seguidores, semanas antes de la explosión de popularidad de PODEMOS posterior a las Elecciones Europeas.

Inyecciones en la cuenta de @ciudadanoscs en junio de 2014 y noviembre de 2015

En la cuenta de Ciudadanos (@ciudadanoscs) se observan dos estructuras sospechosas. La primera el 10 de junio de 2014, unos días después de las Elecciones Europeas del 25 de mayo compuesta por unos 300 seguidores. La segunda a principios de noviembre de 2015, en la precampaña de las Elecciones Generales de diciembre de 2015, compuesta por unos 2.000 seguidores configurados en inglés, ruso y árabe sobretodo. En el gráfico que viene a continuación se aprecia la diferente naturaleza de estos dos grupos de seguidores inyectados respecto al grueso de los seguidores de @ciudadanoscs. Como vimos en el apartado 5, ambos diagramas son similares, pero el de abajo representa en el eje vertical el ratio seguidos/seguidores, evidenciando los seguidores inyectados en esas dos ocasiones que son proyectados hacia arriba al contrario que el resto. Dicho ratio suele tener valores bajos en los usuarios reales, pero los falsos seguidores devuelven valores muy elevados ya que con frecuencia siguen a muchas más cuentas de las que les siguen a ellos. Cabe destacar la perfecta coincidencia entre ambos gráficos. La inyección de noviembre de 2015 fue en su día mencionada en los medios, y desde @CiudadanosCs se habló de juego sucio.

9. Inyección simultánea a @sanchezcastejon y @marianorajoy

Tuvo lugar el 1 de noviembre de 2016 entre las 14:30 y 19:30 aproximadamente, hora de Twitter. Durante esas cinco horas los seguidores de Pedro Sánchez y Mariano Rajoy se incrementaron en más de 10.000. Coincide con un momento relevante en la política española, días después de que Pedro Sánchez renunciase a su acta de diputado para no tener que desobedecer al Comité Federal y se emitiese su entrevista en el programa “Salvados” de Jordi Evole (30-10-2016) donde denunció la operación orquestada en su contra.

Por otra parte, Mariano Rajoy acababa de ser elegido por segunda vez Presidente del Gobierno. Al resaltar en color rojo las cuentas configuradas con el idioma ingles (lang:’en’) se puede comprobar que la mayoría de esos nuevos seguidores quedan coloreados. Al comparar las cuentas de ambos líderes el aspecto es idéntico.

Se mezclan cuentas seguidoras de diferentes “edades” con el fin de llamar menos la atención. Sin embargo el bloque se ve demasiado homogéneo. La tipología más común de estos falsos seguidores es la siguiente: no tienen imagen de perfil, se ha dejado el fondo azul que viene por defecto, no se ha rellenado el campo de la descripción ni la zona horaria, tienen muy pocos seguidores y sin embargo siguen a muchos. Además muchas de ellas ni siquiera han comenzado a emitir tweets. Hay que tener en cuenta que el hecho de que tengan configurado el idioma a “en” (inglés) no quiere decir que hayan sido creadas en paises de habla inglesa, encontrando también que parte de las cuentas están configuradas en otros idiomas: árabe, ruso, frances, italiano, japones, alemán, etc. Por último, las que sí tienen imagen de perfil siguen teniendo pocos seguidores y casi ningún tweet emitido. Las cuentas @sanchezcastejon y @marianorajoy parecen formar parte de un listado de cuentas a seguir, ya que sea cual sea el seguidor elegido, en el listado de seguidos aparecen siempre juntos y en compañía de las mismas cuentas. Meses después tuvieron lugar las primarias del PSOE en las que Pedro Sánchez se proclamó ganador frente a Susana Díaz y Patxi López.

10. Algunos líderes políticos

Para finalizar con esta parte dedicada al repaso histórico incluimos los diagramas de seguidores de los cuatro principales líderes con algunos comentarios.

Mariano Rajoy (@marianorajoy)

Marca 1: En septiembre de 2014 fue noticia la aparición de decenas de miles de seguidores falsos en la cuenta de Mariano Rajoy, siendo eliminados 30.000 por la red social. Estaba a punto de ser sobrepasada en número de seguidores. El 4 de septiembre tuvo lugar una carga de decenas de miles de seguidores que postpuso el previsible adelantamiento pero no pasó desapercibida y fueron eliminados por Twitter. Cuatro días después (el 8 de septiembre) se produjo el adelantamiento y Rajoy perdió la primera posición en favor de Iglesias. Al observar el diagrama de seguidores no parece haber quedado rastro de dicho episodio. Marca 2: inyección simultánea de seguidores falsos de junio de 2015 (ver apartado 7). Marca 3: Las Elecciones Generales de diciembre de 2015 sirvieron para dar un impulso de seguidores. Marca 4: inyección simultánea de seguidores falsos de 1 de noviembre de 2016 (ver apartado 9). Marca 5: el 27 de octubre de 2017 Rajoy anuncia el cese de Puigdemont y de su gobierno y convoca Elecciones Autonómicas en Cataluña. La popularidad de esta medida en algunos sectores se tradujo en un aumento notable de seguidores.

Pedro Sánchez (@sanchezcastejon)

Marca 1: su cuenta adquiere relevancia en número de seguidores a partir de julio de 2014, cuando es elegido Secretario General del PSOE. Marca 2: su candidatura para las Elecciones Generales de 2015 aumenta sus seguidores. Marca 3: inyección simultánea de falsos seguidores junto a @marianorajoy (ver apartado 9) en noviembre de 2016. Marca 4: el 21-05-2017 tienen lugar las primarias del PSOE después del golpe interno. A partir de ese momento aumenta la pendiente del gráfico.

Pablo Iglesias (@pablo_iglesias_)

Marca 1: Tras las Elecciones Europeas de 2015 la cuenta de Pablo Iglesias cuenta experimenta un drástico aumento de seguidores dada la popularidad alcanzada al conseguir su poartido cuatro diputados. Marca 2: Meses después (septiembre de 2014) tiene lugar el famoso episodio de los seguidores falsos de Rajoy, a raiz del cual aparecen unos 1.500 falsos seguidores en la cuenta de @pablo_iglesias_ (posiblemente parte de una campaña de desprestigio) que no alteran el ritmo de crecimiento de la cuenta (ver apartado 6). Marca 3: inyección simultánea de seguidores falsos de junio de 2015 (ver apartado 7) Marca 4: A partir de las Elecciones Generales de diciembre de 2015 aumenta la velocidad de adquisición de nuevos seguidores. Marca 5: El 1 de Octubre de 2017 tiene lugar el referendum en Cataluña. En varios tweets Iglesias acusa al PP de “defemder a palos la democracia y traicionar a la policía”. Su cuenta vuelve a experimentar un nuevo aumento en la pendiente del gráfico.

Albert Rivera (@albert_rivera)

Marca 1: en Enero de 2015 se publica el primer sondeo cara a las generales de 2015, donde el partido de Albert Rivera aparece por delante de UPyD. A partir de ese momento las apariciones en los medios se multiplican y el número de seguidores de la cuenta @albert_rivera se incrementa al ritmo de su popularidad. Marca 2: Las Elecciones Generales de diciembre de 2015 suponen un nuevo impulso. Marca 3 Un incremento brusco de seguidores acompañado de una forma inusual en el diagrama de compactación. La explicación es el viaje a Venezuela de Albert Rivera durante la precampaña para las Elecciones Generales de Junio de 2016. El masivo apoyo de las cuentas opositoras de Venezuela quedó reflejado sobretodo como coloración más intensa en bandas horizontales asociadas a fechas de creación de 2009 y 2010, características de dicho país. Marca 4: a partir del referendum del 1 de octubre de 2017 tiene lugar un aumento importante de nuevos seguidores en sintonía con el éxito en las encuestas alcanzado últimamente por Ciudadanos.

PARTE 3: ECLOSIÓN DE SEGUIDORES FALSOS “MADE IN SPAIN”

11. Demografía de Twitter en España: usuarios reales vs perfiles falsos

Demografía de los usuarios reales

En el año 2011 se dió la mayor tasa de creación de usuarios reales de Twitter en España, y a partir de 2012 dicha tasa parece haber ido disminuyendo poco a poco. El siguiente gráfico es un histograma y sirve para ver cómo se distribuye una determinada característica en una población, en este caso la fecha de creación de las cuentas de Twitter en España. No pretende ser totalmente exacto, sino mostrar de manera bastante aproximada la proporción relativa de cuentas de usuarios reales en España. Presenta un crecimiento rápido hasta 2011, año en que hubo un pico máximo de creación de cuentas, con otro repunte en 2012 y luego un descenso continuado que indica la madurez de la red social. Los picos de 2011 y 2012 son los que provocan las pronunciadas bandas horizontales de las que se habló en el apartado 2.2, y que son características de España.

Si al ya conocido diagrama de compactación le adosamos un histograma de la fecha de creación de los seguidores, entonces se puede ver de manera más intuitiva como en los períodos donde es más abundante la creación de usuarios reales se forman esas bandas horizontales. Para este ejemplo hemos tomado la cuenta @chemaalonso antes mencionada.

Eclosión de seguidores falsos

Si en Twitter no existiesen cuentas de perfil falso, al calcular el histograma de las fechas de creación de los seguidores de un político en España debería salir un histograma muy similar a los anteriores. Sin embargo al realizarlo para las principales cuentas políticas el resultado obtenido suele tener esta otra forma: Hasta el año 2015 se mantiene por lo general la distribución esperada sin demasiados cambios (la forma se mantiene, aunque disminuye el tamaño relativo). Pero a partir de 2015 se incrementa la cantidad de cuentas de perfil falso que siguen a muchos de los líderes politicos.

Siguen sobretodo a cuentas verificadas: personajes conocidos del espectáculo, medios de comunicación y políticos de distintas orientaciones en España. El mayor pico de segumientos se produjo a en la segunda mitad de 2017 y como son cientos de miles (posiblemente más de un millón), han hecho que el porcentaje de falsos seguidores de muchos políticos se haya disparado. Siguen sólo cuentas españolas desde su creación por lo que posiblemente sus creadores también lo son.

12. Los histogramas de los políticos

Hemos hecho el ejercicio de calcular dos versiones del histograma de fechas de creación sobre las cuentas de una serie de políticos: una con los seguidores reales y otra con los seguidores falsos. Obviamente la clasificación se ha realizado en base a criterios estadísticos por lo que algunas cuentas estarán en el grupo que no les corresponde aunque en porcentaje poco significativo. De estos criterios de clasificación se hablará en el siguiente apartado. La mayoría de los seguidores falsos siguen casi exclusivamente a cuentas influyentes españolas, incluidos politicos de distintos partidos, artistas, medios de comunicación etc.

La cuenta utilizada para el primer ejemplo es la de Oriol Junqueras, aunque podría haber sido cualquier otra de las estudiadas. Observemos ambos histogramas, que expresan la fecha en que han sido creadas las cuentas que lo siguen.

El histograma de la parte izquierda (cuentas de usuarios clasificados como reales) coincide bastante con los valores esperados para usuarios reales: un pico en 2011 y paulatina disminución en adelante. En el de la derecha (posibles cuentas de perfil falso) destaca el gran aluvión de seguimientos falsos en la segunda mitad de 2017. Muchas cuentas de perfil falso se crearon para apoyar tanto la postura catalanista como españolista. De hecho, el mayor pico de creación de cuentas falsas que hemos detectado tuvo lugar precisamente el 1 de octubre de 2017. Sin embargo hemos visto que las cuentas de políticos de diferentes ideologías producen histogramas similares. Obsérvese como todos las cuentas de políticos catalanes que se muestran presentan el mismo pico de seguidores falsos a finales de 2017:

Con muchas de las cuentas de políticos del resto de España ocurre lo mismo: una repentina avalancha de seguimientos por parte de cuentas de perfil falso coincidiendo con los últimos meses de 2017.

La conclusión que se puede extraer de los anteriores histogramas de clase es que a partir de 2015, pero especialmente desde mediados de 2017 comienza a haber seguimientos masivos por parte de cuentas de perfil falso, que afecta a políticos de todos los signos políticos. Pensamos que hay dos componentes principales en estos seguimientos:

una componente política, sobretodo debida a la polarización por el referendum del 1-O en Cataluña con miles de perfiles falsos creados para posicionarse a favor o en contra,

una componente no política formada por cuentas que siguen sobretodo a cuentas verificadas de artistas, politicos, medios de comunicación, etc.

Estamos hablando de cientos de miles de cuentas de perfil falso que siguen a cuentas españolas relevantes y en particular a políticos españoles. A modo de ejemplo se puede descargar el siguiente listado en el que figuran más de 750.000 de estos seguidores falsos. Ha sido elaborado con criterios muy restrictivos para evitar que se cuelen cuentas legítimas (ninguna de ellas tiene imagen de perfil ni ha emitido más de 1 tweet, etc). Por ello el número real de seguidores falsos made in spain de los últimos años seguramente sea bastante mayor.

13. El caso de Beatriz Talegón

Le hemos prestado especial atención a la cuenta de Beatriz Talegón (@beatriztalegon) periodista en Diario 16 y anteriormente política del Partido Socialista. En febrero de 2018 denunció con este tweet que se le estaban “cambiando los seguidores reales por bots”. Al margen de la denuncia de que sus seguidores reales dejaban de seguir su cuenta sin dar consentimiento, la cual no tenemos manera de contrastar, está la percepción de Beatriz de que últimamente era seguida por muchas cuentas de perfil falso. En el histograma de fechas de creación aparece efectivamente ese pico de seguimientos masivos con cuentas creadas desde finales de 2017, también en la parte izquierda (cuentas clasificadas como usuarios reales). Se observa que los seguimientos comienzan de manera abrupta. Con el diagrama de compactación confirmamos que empezaron a partir del 1-O, fecha en que tuvo lugar el referendum de Cataluña. En color rojo se han coloreado los seguidores configurados en idioma catalán. De manera clara se aprecia que muchos catalanes centraron su atención en Beatriz Talegón a partir del 1-O, debido a su posicionamiento a favor del referendum y sus denuncias de la violencia de Policía Nacional y Guardia Civil. Llama la atención la línea horizontal roja formada por miles de seguidores falsos creados en los meses de septiembre, octubre y noviembre de 2017. Hacia abajo de esa gruesa línea roja, ocupando la mayor parte del diagrama están los seguimientos procedentes en su mayor parte de usuarios reales (obsérvese que hay continuidad en las bandas horizontales naturales, apreciándose sobretodo en la de 2011).

En la cuenta de @beatriztalegon aparecieron efectivamente muchos seguidores del ámbito catalán a partir del 1-O, la mayoría de ellos falsos tal como le ha ocurrido a otras cuentas de políticos en España aunque en su caso de manera bastante acusada.

Preguntado Twitter España por este tema su respuesta (febrero de 2018) fue la siguiente:

“Cuando una persona abre una cuenta en Twitter, intentamos mejorar su experiencia sugiriéndole perfiles a los que seguir en función de las preferencias que señale. Algunas personas tardan en poner una foto de perfil, o simplemente tuitean poco”.

En esta respuesta de Twitter España no se hace referencia alguna a la alarmante cantidad de cuentas de perfil falso que se están creando (algo que sin duda conocen), despachando el problema del alarmante crecimiento de falsos seguidores con una explicación sobre “usuarios que tuitean poco” y “tardan en poner foto de perfil”.

14. ¿Tiene @TwitterEspana seguidores falsos?

Llegados a este punto es lógico preguntarse qué resultados se obtendrán al examinar la cuenta oficial de la red social Twitter en España. ¿Tiene seguidores falsos? ¿Se verá también afectada por la eclosión de seguidores falsos de 2017?

La idea a priori es que @TwitterEspana no debería tener apenas falsos seguidores pues disponen de todos los medios para detectarlos y eliminarlos. Sin embargo los histogramas de las fechas de creación de sus seguidores indican lo contrario. Llama la atención (histograma derecho) la existencia de decenas de miles de cuentas con características de falsos seguidores creadas a partir de 2014 pero sobretodo en 2015 y 2016. Pero también lo hace el hecho de que desde finales de 2016 los nuevos seguimientos de este tipo de cuentas se redujesen drásticamente (zona plana). Sólo se aprecian dos leves picos puntuales (enero y mayo de 2017) anteriores a la eclosión de 2017, como si a partir de un determinado momento se hubiese puesto filtro a los nuevos seguidores.

Hay otro camino por el que se puede llegar a las mismas conclusiones. Es a través del diagrama de dispersión que relaciona la fecha de creación de los seguidores con el ratio seguidos/seguidores ya visto en el apartado 5. Los usuarios reales tienen generalmente valores bajos de este ratio por lo que es un buen indicador de la presencia de seguidores falsos. Precisamente donde el histograma apuntaba la presencia de falsos seguimientos masivos se obtienen ahora valores muy elevados del ratio seguidos/seguidores, incluyendo los dos pequeños picos de 2017 Comparando ambos gráficos se aprecia una perfecta coincidencia. En el de arriba las cuentas seguidoras se han coloreado en función del número de seguidores que tienen ellas a su vez, como muestra la escala situada a la derecha. Los seguidores reales (color azul oscuro) se encuentran en la parte de abajo, y a medida que ascendemos aumenta la probabilidad de que sean falsos seguidores, muchos de los cuales no son seguidos por nadie.

En el diagrama de compactación de seguidores de @TwitterEspana se distingue una de las estructuras tratadas en el apartado 3.3 como sospechosas de seguimientos falsos. Consiste en una franja menos densa que el resto pero con un borde muy marcado, síntoma de seguimientos masivos por parte de cuentas de reciente creación. Durante ese período @TwitterEspana gana unos 185.000 seguidores, de los cuales unos 150.000 se acumulan en el borde por ser de nueva creación. Como se vió anteriormente este tipo de diagrama no es el apropiado en casos como este donde la mayoría de los seguidores son nuevos.

En este enlace se puede descargar una muestra de varios miles de los falsos seguidores de @TwitterEspana. Hemos incluido solamente el caso más extremo: cuentas sin imagen de perfil, que no han enviado tweets, no han dado likes, ni son seguidas por nadie y aún así han salido 8.500. Como estas, creadas todas ellas el mismo día.

Analizaremos ahora las cuentas que siguieron masivamente a @TwitterEspana entre abr-2014 y sep-2016 y que dan lugar a los grandes picos del histograma. Si tomamos aquellos que presentan valores superiores a 10 en el ratio seguidos/seguidores nos salen unos 127.000. Hemos encontrado que el 96% de ellos han dejado sin configurar la zona horaria, algo común en las cuentas de perfil falso. Por otra parte el 85% han dejado vacío el campo dedicado a la descripción del usuario, algo poco normal en los usuarios reales. Añadiendo a lo anterior el dato de que la media de seguidores que presentan es sumamente baja (en torno a 5 seguidores) extraemos la conclusión de que un porcentaje significativo de esos 127.000 seguidores de @TwitterEspana podrían ser falsos. Este fichero contiene más de 75.000 de estas cuentas altamente sospechosas que siguen a @TwitterEspana, muchas de las cuales envíaron varios tweets al ser creadas pasando a continuación a un estado inactivo en el que llevan ya varios años.

15. Analizamos nuestra propia cuenta, @BotsPoliticosNo

No estaría bien que después de estudiar tantas cuentas no incluyésemos el análisis de la nuestra. En el momento de escribir estas líneas la cuenta @BotsPoliticosNo tiene 1.649 seguidores.

Estos son el diagrama de compactación y el histograma de fechas de creación de seguidores de la cuenta @BotsPoliticosNo. La poca densidad de los puntos en el diagrama y el aspecto pixelado del histograma son normales en las cuentas con este rango numérico de seguidores. En el histograma (derecha) el pico máximo en la fecha de creación de los seguidores está como era de esperar en 2011, seña de identidad de la mayoría de cuentas españolas. Su traducción en el diagrama de compactación es la banda horizontal más densa que aparece en torno a ese año. Se observa que la eclosión de seguidores falsos de 2017 no parece haber afectado de forma significativa a @BotsPoliticosNo. Volviendo al histograma, observando la pendiente descendente desde 2011 tenemos una nueva ocasión para percibir la disminución contínua de altas de nuevos seguidores reales en Twitter.

La distribución del lenguaje declarado por nuestros seguidores se muestra en el diagrama circular: 79,6% de nuestros seguidores configuran su cuenta en español, 9,6% en catalán, etc. El gráfico de la derecha es un diagrama de caja (boxplot) que muestra el número medio de seguidores que tienen a su vez nuestros seguidores si los agrupamos según el lenguaje que tienen configurado. Están todos por debajo de los 500, excepto en el caso de los seguidores en gallego, que es algo mayor.

Los siguientes diagramas circulares muestran la categorización de nuestros seguidores en función de sus propios seguidores y el número de tweets que han enviado. Actualmente la mayoría de nuestros seguidores presentan actividad y son seguidos por un número consistente de cuentas. Al observar el ratio seguidos/seguidores de las cuentas que siguen a @BotsPoliticosNo, en la mayoría de los casos el ratio se mantiene por debajo de 10 siendo la media inferior a cinco tal como cabe esperar cuando hay poca presencia de seguidores falsos. Sin embargo nuestra cuenta tampoco está libre de ellos (obsérvense las cuentas dispersas con valores altos del ratio).

PARTE 4: ¿QUÉ CUENTAS PRESENTAN MÁS SEGUIMIENTOS FALSOS?

En esta última parte se aborda la construcción de rankings que sirvan para poder ordenar de forma rápida una serie de cuentas en función de su contenido en seguidores falsos.

16. Comparación de cuentas en función de los falsos seguimientos

Hemos visto cómo con los diagramas de compactación es posible detectar falsos seguidores. Sin embargo para poder comparar o clasificar grupos de cuentas en función del número de falsos seguimientos que presentan es necesario recurrir a la estadística.

Existen ciertas configuraciones de los parámetros proporcionados por la API de Twitter que son más probables de encontrar en cuentas de perfil falso, como tener pocos seguidores, carecer de imagen de perfil, poca o nula activiadad emisora, etc. Como ejemplo compárense una cuenta con pocos seguidores falsos (@chiquitocalzada) con la de un político de primera línea (el presidente @sanchezcastejon). Sin nos fijamos en el porcentaje de seguidores que a su vez no son seguidos por ninguna cuenta veremos que es mucho mayor en el caso del político. Y lo mismo ocurre si al mirar el número de tweets emitidos por los seguidres de cada uno. El nº de cuentas con cero seguidores y con cero tweets emitidos se multiplica aproximadamente por 10 en el caso de @sanchezcastejon, pero lo mismo ocurre con cualquier otro político de primera línea debido a que este tipo de cuentas tienen muchos seguidores falsos.

Los siguientes ratios pueden servir de ayuda para comparar la posición relativa de un grupo de cuentas en relación a falsos seguimientos, aunque no deben ser tomados como una medida absoluta de estos. Los grupos de cuentas que hemos comparado son tres: las de los principales partidos políticos, las de algunos de los políticos más influyentes en redes sociales y las cuentas de empresas del Ibex 35.

16.1 Comparativa de cuentas oficiales de partido

Porcentaje de seguidores con cero (o pocos) seguidores

Los seguidores falsos son por lo general cuentas que siguen a muchas, pero son seguidas por muy pocas. Este ratio se calcula dividiéndo el número de seguidores de una cuenta que a su vez no son seguidos por ninguna, y dividiéndolo entre el número total de seguidores de dicha cuenta. Una variación consiste en considerar los seguidores con menos de un número determinado de seguidores. Estos son los resultados para las cuentas de los principales partidos políticos en España al calcular el porcentaje de seguidores que son a su vez seguidos por menos de cinco cuentas. Los partidos que según este ratio cuentan con menos seguidores falsos son los de la parte de abajo de la tabla. Los cinco partidos con mayor porcentaje de seguidores con menos de cinco seguidores son: PNV, PP, PSOE, COMPROMIS y PDeCAT (sucesor de Convergencia).

Porcentaje de seguidores sin imagen de perfil

Es normal entre los falsos seguidores de peor calidad que tengan sin modificar la imagen de perfil que viene por defecto. Este ratio refleja el peso de este tipo de seguidores sobre el total. Para el grupo de los partidos políticos tenemos Las cinco cuentas oficiales con más seguidores de este tipo son las de PNV, COMPROMIS, PDeCat, PSOE y BILDU. En general los resultados son parecidos a los del ratio anterior.

Porcentaje de seguidores con cero (o pocos) tweets emitidos

Recoge el porcentaje de seguidores con nula actividad emisora. Una variación de este ratio consiste en considerar los seguidores con menos de un número determinado tweets emitidos. Las cuentas oficiales de los partidos en España quedan así: Los peores lugares en este caso son para: PARTIDO POPULAR, PDeCAT, PNV, PSOE y PODEMOS

Porcentaje de seguidores con un alto ratio seguidos/seguidores

Por lo general el ratio que se obtiene al dividir el número de cuentas seguidas entre el número de seguidores no suele tener valores altos. En este caso se ha calculado el porcentaje de seguidores cuyo ratio resulta ser mayor que 10, es decir, 10 veces más seguidos que seguidores. En los falsos seguidores los valores de este ratio se disparan, por lo que es un buen indicador de seguimientos falsos. Los resultados para las cuentas oficiales de los partidos son: Los mayores porcentajes se seguidos / seguidores se obtienen para BILDU, Partido Popular, PNV, PDeCat y PSOE.

De la misma forma también es posible comparar un grupo de cuentas en función de la “calidad” de los seguidores medida a través de ciertos indicadores:

Porcentaje de cuentas verificadas

Una cuenta se marca como verificada cuando desde Twitter se estima que su propietario es una persona de interés público. Son relativamente muy pocas, por lo que los porcentajes de seguidores verificados son siempre muy bajos. Esta es la comparativa para las cuentas oficiales de partido. Los partidos que aparecen mejor situados (mayor % de cuentas verificadas) son precisamente algunos de los que anteriormente daban valores medios o bajos de seguimientos falsos: UPN, Coalición Canaria, Nueva Canarias, Iniciativa y En Marea.

Porcentaje de seguidores con más de 1000 seguidores

El porcentaje de seguidores que son a su vez seguidos por más de 1000 cuentas. Este ratio en general baja cuantos más falsos seguidores tiene una cuenta. Las primeras posiciones siguen ocupadas por partidos de ámbito autonómico, y los últimos puestos para partidos de ámbito nacional más cargados de falsos seguidores.

Resultados por partido político

Todos los resultados anteriores se pueden resumir en el siguiente diagrama donde cada cuenta oficial aparece situada en relación a su contenido en seguidores falsos. Insistimos en que estos resultados no deben interpretarse en términos absolutos sino únicamente como forma de comparar cuentas en términos relativos. Cada eje muestra la suma de los ratios que acabanos de ver: en el eje horizontal los ratios que crecen cuando aumenta el número de seguidores falsos y en el eje vertical los que disminuyen. Somos conscientes de que este método no es perfecto pero debido a su simplicidad y para el propósito que tiene pensamos que es válido pues diferencia de manera clara las cuentas cargadas de falsos seguidores de las que no lo están. Cuanto más hacia la derecha más seguidores falsos tienen las cuentas. Los valores del eje x sirven para establecer posiciones relativas pero no para cuantificar el % de seguidores falsos. El tamaño de cada círculo viene dado por el número de seguidores de las cuentas, que aparecen divididas en dos grupos diferenciados.

El primero, en la parte izquierda y color cercano al verde, está formado por cuentas de partido con menos presencia de falsos seguidores. Corresponden a partidos del ámbito autonómico mayoritariamente, aunque también encontramos pequeños partidos a nivel estatal. Cuanto más arriba mayor porcentaje de seguidores de “calidad”, entendiendo por esta los seguidores con cuenta verificada o con más de 1.000 seguidores. Está formado por las cuentas de Nueva Canarias, UPN, Democrates de Catalunya, Iniciativa per Catalunya, Coalición Canaria, Anova, Foro Asturias, Equo, Vox, España 2000, PACMA y En Marea.

El segundo, abajo a la derecha y en color cercano al rojo, está formado por las cuentas de partido con más presencia de falsos seguidores. Encontramos a todos los grandes partidos nacionales, pero también a algunos autonómicos. Son PNV, Partido Popular, PdeCat, PSOE, Compromis, Bildu, PODEMOS, Izquierda Unida, UPyD, ERC, CUP y Ciudadanos.

16.2 Comparativa de cuentas de personajes políticos

Se han calculado los mismos ratios que en el caso anterior para comparar las cuentas de personas de la política con presencia relevante en redes sociales. Para seleccionarlos se ha consultado la lista de influencers de los principales partidos, eligiendo aquellos con mayor número de seguidores en Twitter. Por simplicidad, en esta ocasión mostraremos únicamente el ranking de número de seguidores que a su vez son seguidos por menos de cinco cuentas, y seguidamente la comparativa.

El 44% de los seguidores de @manuelacarmena y @ximopuig tienen menos de cinco seguidores. También con porcentajes altos aparecen @adacolau, @sanchezcastejon, @marianorajoy, @krls, etc. Al igual que con las cuentas de partido si tenemos en cuenta el resto de los criterios es posible representar las posiciones relativas de los principales políticos en cuanto a falsos seguimientos.

Abajo a la derecha está el grupo de los políticos que tienen más peso de seguidores falsos. Ampliamos para ver con mayor claridad las cuentas (el tamaño es proporcional al número de seguidores totales):

Son las cuentas de Ximo Puig, Manuela Carmena, Pedro Sánchez, Xavier Trias, Esperanza Aguirre, Ada Colau, Carles Puigdemont, Pablo Iglesias, Cristina Cifuentes, Mariano Rajoy, Mónica Oltra, Inés Arrimadas, Albert Rivera, Juan Ignacio Zoido, Oriol Junqueras, Patxi López, Soraya Saenz de Santamaría, Pablo Echenique, Xavier García Albiol, Iñígo Errejón, Alberto Garzón y Susana Díaz.

16.3 Comparativa de las cuentas del Ibex 35

De la misma forma y con el mismo método se han comparado las cuentas de las empresas del Ibex 35. El resultado muestra que casi todas ellas se mueven en valores bastante similares, muy inferiores a los de las cuentas políticas.

Como comparación con los grupos anteriores (partidos y personajes políticos), mientras que los partidos con más seguidores falsos se movían en valores del eje X entre 90 y 130, y los personajes políticos entre 100 y 160, las empresas del Ibex 35 mayoritariamente no llegan a 50. Sólo sobresalen con valores mayores MEDIASET seguda de REPSOL.

PARTE 5: UTILIZANDO LO APRENDIDO

Esta parte está dedicada a quienes han llegado hasta aquí y todavía no tienen prisa por saltar a las conclusiones. Se pretende aplicar lo aprendido y profundizar algo más utilizando algunas de las cuentas estudiadas en el apartado anterior.

17. La matriz combinada y otras cosas

Hasta ahora hemos trabajado con dos clases de diagramas de compactación de seguidores y también con histogramas. El diagrama de compactación son un tipo de diagrama de dispersión en el cual los seguidores se van acumulando en el eje x por falta de espacio. Según la variable mostrada en el eje y podemos visualizar de manera óptma los falsos seguidores “nuevos” (efectúan el seguimiento al ser creados) o “existentes” (siguen dias, meses o años después de ser creados).

Matriz combinada

Si a cada clase de diagrama de compactación le asociamos un histograma cuya variable sea precisamente la representada en el eje y del diagrama de compactación obtenemos una estructura de este tipo: En el histograma está representada la densidad de la “fecha de creación” de los seguidores. Los máximos indican que en esas fechas se crearon más cuentas seguidoras que en el resto. Las bandas horizontales más oscuras de 2011 y 2012 (1 en rojo) aparecen en el histograma como dos picos (2). Esos dos máximos son superados en 2017 (3) por el pico formado por la eclosión de seguidores falsos de la que se ha hablado en la parte 3, y que se muestran en el diagrama de dispersión como un borde más oscuro a partir de (4).

Como acabamos de ver, la asociación diagrama de compactación-histograma ligados a la variable “fecha de creación” funciona como una única estructura. Lo mismo ocurre si ahora representamos en el eje y la variable “ratio seguidos/seguidores”. Este ratio expresa cuantas veces es mayor el número de cuentas seguidas que el de seguidores. Por lo general los usuarios reales no suelen reportar valores elevados de este ratio, tomando un valor medio cercano a 2. En el histograma, marcado como (5), tenemos un máximo que expresa el valor más frecuente para el ratio seguidos/seguidores por parte de los seguidores reales. En el diagrama de compactación se han coloreado de azul los seguidores que tienen a su vez más seguidores y de rojo los que tienen menos. Se puede asimilar el color azul para los seguidores reales (6) y el rojo para los falsos, con una zona de indefinición entre ambos. Los seguidores falsos presentan valores altos del ratio y en ocasiones dan lugar a estructuras artificiosas (7) como esas líneas horizontales. En este caso muchos de los seguidores falsos tienen un ratio cercano a 20, dando lugar a el máximo absoluto del histograma: una artificial línea horizontal (8) que denota miles de seguidores falsos presentando el mismo ratio seguiodos/seguidores. También aparecen en el histograma otras líneas horizontales más pequeñas, todas ellas indicadores de seguidores falsos.

Pero aquí no acaba todo. Podemos ensamblar las dos estructuras que acabamos de ver formadas casa una de ellas por un diagrama de compactación y su histograma asociado formando una matriz combinada en la cual se puede encontrar también una asociación vertical entre ambos diagramas de compactación. El resultado de combinar los cuatro gráficos es esta matriz combinada, en la que además de las relaciones horizontales comentadas también es posible establecer conexiones en vertical. El punto marcado antes como (4) indica el comienzo de la eclosión de seguidores falsos que tuvo lugar en España en 2017. La zona marcada con un círculo naranja muestra cómo se acumulan en el borde todos esos seguidores falsos “nuevos”, dando lugar a una franja vertical menos densa por debajo. Si ahora miramos la parte de abajo vemos que esa misma zona es ahí más densa mostrando ahora todos esos seguidores falsos ya que tienen un elevado ratio seguidos/seguidores. Esa misma lógica se puede apreciar en las dos delgadas franjas señaladas por (9). Son dos momentos de alta tasa de seguimientos reales. En este caso en la parte de arriba están más densas y por contra en el gráfico inferior aparecen dos menos densas. En (10) es el caso contrario: más seguidores falsos provocan mayor densidad abajo y menor densidad arriba.

Diagrama de dispersión fecha de creación x ratio seguidos/seguidores

La matriz combinada es una herramienta potente que proporciona mucha información visual. Aún así su uso puede complementarse con este diagrama de dispersión al que puede asociársele el histograma de la variable seguidos/seguidores. Es una variación del gráfico anterior. En este caso el eje x representa la fecha de creación de las cuentas seguidoras, independientemente de en qué momento se haya producido el seguimiento. En el eje y continúa mostrándose el ratio seguidos/seguidores. La cuenta estudiada, al igual que en el caso anteiror, pertenece a Cristina Cifuentes @ccifuentes. Se puede constatar en primer lugar que los seguidores reales (color azul) son más escasos a medida que aumenta la fecha de creación de las cuentas. Desde 2011 aparecen bastantes seguidores falsos, pero es a partir de 2015 donde se aprecia la presencia tremendamente masificada de seguidores falsos.

Histograma por fases

Otra camino que nos lleva a afirmar que a partir de 2015 tuvo lugar la creación masiva de seguidores falsos en España es a través del histograma por fases. Consiste sencillamente en calcular el histograma de la variable seguidos/seguidores para diferentes períodos. Hemos dividido el tiempo de vida de la cuenta @ccifuentes en cuatro fases, para cada una de las cuales hay un histograma. El primero de ellos toma la forma que se puede esperar cuando la mayoría de los seguidores son reales. Son los seguidores de @ccifuentes cuyas cuentas han sido creadas entre 2009 y 2011. Vemos como a medida que se suceden las fases se va desdibujando la forma primitiva, aumentando el número de seguidores con valores altos del ratio seguidos/seguidores. En el último histograma la forma está totalmente irreconocible, ya que a partir de 2015 la inmensa mayoría de los seguidores son falsos.

18. Análisis de algunas cuentas

Como práctica en la que utilizar las herramientas mostradas en el apartado anterior se analizarán varias cuentas. Conviene recalcar nuevamente que las cuentas de personajes conocidos suelen ser un imán para los seguidores falsos por lo que la presencia de estos podría ser no deseada o incluso desconocida por sus propietarios.

CUENTAS NO POLÍTICAS

Jon Kortajarena (@jonkortajarena): modelo y actor español Las marcas 1 y 2 reflejan momentos de elevado incremento de seguidores reales que en el gráfico de arriba aparecen como franjas verticales densas y en el de abajo justo lo contrario. Las marcas 3 y 4 (en el borde) son períodos de gran afluencia de miles de seguidores falsos “nuevos” (siguen en el momento de ser creados), que dan lugar a los abultados registros del histograma asociado, con un máximo absoluto en 4. Dicho máximo indica la gran cantidad de seguidores falsos creados en 2017 que siguen a esta cuenta. Hasta 2015 el crecimiento es normal para la cuenta de un famoso. A paritr de esa fecha desciende bruscamente la pendiente del diagrama de compactación y comienza la llegada masiva de seguidores falsos, en rojo en el diagrama de abajo. La marca 5 muestra las artificiales líneas horizontales que aparecen en el histograma asociado.

Esa aparición súbita de seguidores falsos queda perfectamente reflejada en los histogramas por clase:

Aida Domenech (@aidadomenech) “Dulceida”: bloguera e influencer

Otro caso más de masificación de seguidores falsos a partir de 2015 tal como muestra el diagrama de dispersión: También lo reflejan los histogramas por clase de seguidor. Al observar el de la derecha destaca la gran cantidad de seguidores falsos de 2017-2018.

Antonio Marínez Ron (@aberron): periodista y divulgador científico

Este caso es interesante porque muestra nuevamente cómo se incrementa el número de seguidores falsos al figurar entre los sugeridos de Twitter. En el histograma derecho se aprecia claramente que en el mismo período (marzo a junio de 2010) la cuenta @aberron fue afectada por varios miles de seguimientos falsos.

Natalia de Molina (@nataliademolina): actriz de cine, teatro y televisión.

En su cuenta aparece un pico puntual de seguidores falsos a comienzos de 2014. En la matriz combinada encontramos el característico borde horizontal que aparece cuando una cuenta es recomendada por Twitter (marca 1) y que coincide con la aparición subita de seguimientos falsos (marcas 2). Por lo que podríamos estar ante otro caso de invasión de seguidores falsos consecuencia de las sugerencias de la red social.

POLÍTICOS

Una vez más, en este caso a través de diagramas de dispersión que enfrentan la fecha de creación de las cuentas con el ratio seguidos/seguidores, se pone de manifiesto la presencia generalizada de seguidores falsos en el Twitter politico español sin distinción de ideologías.

En condiciones normales sólo debería verse una delgada nube de puntos de color azul pegada al eje x, con valores bajos del ratio seguidos/seguidores. Sin embargo aparecen decenas de miles de seguidores falsos que superan en mucho al número de seguidores reales.

Por último, volveremos a examinar la cuenta @joseantoniojun vista en el apartado 4, esta vez desde un punto de vista global. Los histogramas de clase muestran dos picos de falsos seguimientos en 2012 y 2013 que coinciden con las inyecciones de seguidores de las que se habló anteriormente. En el diagrama de dispersión vuelven a ser visibles como líneas verticales en rojo los perfiles falsos asociados a dichas inyecciones, aunque también se hace patente que la mayoría de usuarios de esta cuenta presentan características de usuarios reales (en azul).

CONCLUSIONES

Con este trabajo hemos intentado abordar en profundidad el problema de los seguidores falsos de Twitter en España. Estas son las principales conclusiones, divididas en varios bloques.

ÁMBITO GENERAL

1. Durante los últimos años el número de nuevas cuentas correspondientes a usuarios reales parece ser sólo una pequeña parte del total de cuentas de nueva creación. Dicho número habría ido descendiendo progresivamente desde su máximo en 2011-2012. 2. La mayoría de las cuentas analizadas están contaminadas con seguidores falsos, mucho más en el caso de las cuentas de personajes e instituciones relevantes. Hemos encontrado indicios de que en no pocas ocasiones los falsos seguimientos son no buscados. Un caso que llama la atención es la cantidad de cuentas de perfil falso que siguen a la propia cuenta de @TwitterEspana.

3. Hemos encontrado varios casos de usuarios en los que cuando sus cuentas fueron recomendadas por Twitter a las cuentas de nueva creación, comenzaron a ser seguidos por decenas de miles de falsos seguidores.

4. A partir de 2015 tuvo lugar en el Twitter español la creación masiva de cuentas de perfil falso. Especialmente preocupante ha sido el hallazgo de una auténtica eclosión de falsos seguidores sobretodo desde 2017. Cientos de miles de cuentas en el mejor de los casos pero posiblemente más de un millon (en este listado bajo criterios mínimos hay 750.000), que inundan actualmente las cuentas de políticos de todos los partidos, medios de comunicación y muchas cuentas relevantes en España.

ÁMBITO POLÍTICO

5. Hemos encontrado numerosos ejemplos de inyecciones se seguidores falsos sobre cuentas de líderes y partidos políticos. En ocasiones ante una campaña electoral la cuenta del candidato es aparentemente fortalecida mediante una carga de falsos seguidores. La “crisis de los seguidores” de 2014 parece haber marcado un punto de inflexión a partir del cual han tenido lugar compras de seguidores falsos como operaciones de desprestigio sobre rivales políticos.

ÁMBITO ACADÉMICO

6. Utilizando técnicas de visualizacón de datos es factible la detección y aislamiento de gran parte de los seguidores falsos de una cuenta, facilitando la extracción de listados con las cuentas sospechosas.

7. La representación gráfica de los seguidores de una cuenta con el diagrama de compactación (un tipo de diagrama de dispersión) en sus dos versiones, ha resultado la forma más efectiva de visualizar falsos seguidores. 8. El ensamblado de diagramas de dispersión e histogramas que hemos denominado matriz combinada se ha perfilado como una potente herramienta en el estudio de seguidores falsos.

Estrategia de Twitter ante el problema de las cuentas de perfil falso

En el presente trabajo se ha dejado constancia de la presencia generalizada y muy abundante de seguidores falsos en las cuentas españolas. En un escenario en el que aparentemente cada vez se producen menos altas de usuarios reales, circunstancias como la presencia de decenas de miles de seguidores falsos en la cuenta de @TwitterEspaña y el hecho de que ante las quejas de una usuaria se responda únicamente que hay “usuarios que tuitean poco” y “tardan en poner una foto de perfil”, sugieren que la estrategia de la red social Twitter no pasa de momento por tratar este problema con el rigor y compromiso que requiere.

Twitter tiene capacidad sobrada para detectarlos. ¿Por qué entonces no los elimina? El periodista Nick Bilton ha escrito varios libros acerca de esta red social. Opina (feb-2018) que cada vez que salta un escándalo con bots “Twitter actúa como si acabara de descubrir que este fenómeno sucedía en su plataforma por primera vez”.

Twitter debe proporcionar periódicamente el número de usuarios activos a los inversores, y cuantos más perfiles falsos haya menos fiable es ese dato. Bilton lo expresa de esta manera:

“Twitter sabe acerca de todos sus seguidores falsos, y siempre lo ha hecho, eliminando suficientes bots para que parezca que les importa, pero no lo suficiente como para afectar la cantidad percibida de usuarios activos en la plataforma “.

Impresiones finales

Más allá de la curiosidad por saber si tal o cual persona pudo comprar seguidores, finalmente nos hemos encontrado con un fenómeno alarmante: desde hace tiempo se están creando centenares de miles de cuentas de perfil falso dedicadas a seguir a cuentas españolas lo que supone un cambio de escala drástico respecto a la situación anterior. En el ámbito político encontramos con frecuencia que las mismas cuentas siguen indiscriminadamente a políticos de todo el espectro de ideologías. Es evidente que la polarización generada por la cuestion catalana tiene que ver con una parte de estos seguidores falsos pero no parece que por sí sola explique la cantidad de perfiles falsos “made in spain” detectados, una parte de los cuales parece ocupar en la práctica las posiciones que deberían corresponder a nuevos usuarios reales. De momento los interesados podremos seguir practicando técnicas de visualización de datos con el estudio de los millones de cuentas de perfil falso disponibles que Twitter no acaba de eliminar. Con este código (python o R) facilitado por José María Mateos o con este otro (python) de Elaine Ou, cualquiera puede trazar el diagrama de dispersión de una cuenta y comenzar a entretenerse buscando las estructuras que se han tratado aquí.

Esperamos que el presente trabajo haya contribuido a aportar una visión de conjunto sobre este problema cuya solución ha de pasar en nuestra opinión por un drástico cambio en las políticas de la red social.

TWITTER BOTS (@BotsPoliticosNo)



Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.