A pocos días de la elección presidencial en México, la ventaja de Andrés Manuel López Obrador en las encuestas no deja de crecer y, al menos sobre el papel, se antoja definitiva. El tres veces candidato roza el 50% de los votos, según el último promedio de sondeos; ha aumentado su ventaja hasta los 23 puntos sobre Ricardo Anaya, que rondaría el 27%. José Antonio Meade se quedaría alrededor del 20%. Las miras se centran ahora en ver si el apoyo a López Obrador se traduce también en un respaldo a su partido, Morena y a su coalición con el ultraconservador Encuentro Social y el Partido del Trabajo, en el Congreso.

En la medida en que López Obrador se ha ido consolidando como el puntero en las encuestas, su discurso ha virado hacia la necesidad de tener también el máximo apoyo en las dos cámaras –diputados y senadores-, para recabar todo el poder posible. De lograrlo, el golpe en el tablero político mexicano sería absoluto. De mantenerse la coalición firme después de la elección –hay dudas de que el conservador PES se sume a todas las decisiones de Morena-, López Obrador podría sacar adelante todas sus iniciativas.

Los datos de los sondeos indican que el Movimiento de Regeneración Nacional (Morena) podría ser el más votado en los dos casos y que su coalición con Encuentro Social (PES) y el Partido del Trabajo (PT) podría conseguir la mayoría en las dos cámaras. El triunfo no solo sería para el partido de López Obrador; la formación ultraconservadora obtendría un apoyo sin precedentes en el Congreso mexicano, una irrupción que preocupa a los defensores de los derechos civiles ante un eventual retroceso en los mismos. López Obrador ha insistido en que el PES ha asumido el programa de Morena, pero no hay garantías de que, una vez en el poder, la alanza se mantenga.

Las encuestas del voto para diputados colocan a Morena como el partido más votado, con cerca del 40% de votos, y la suma con PES y PT eleva sus apoyos hasta el 45% o 46%. ¿Cuántos diputados lograría la coalición con esos votos? Nuestra estimación, tomando en cuenta las particularidades del sistema electoral mexicano, dice que Morena, PT y PES rondarían los 260 escaños y podrían lograr una mayoría en la cámara (que consta de 500 miembros).

Esta estimación, no obstante, es una aproximación y el resultado real podría desviarse. Por un lado tenemos que contar con la imprecisión típica de los sondeos, pero además se suman los efectos del sistema electoral, que no son fácilmente predecibles. La ley mexicana determina que 300 diputados se eligen en distritos uninominales por mayoría relativa. Eso suele dar ventaja al partido más votado porque introduce un sesgo mayoritario (el partido puntero puede ganar muchos distritos con un margen estrecho de votos). Conscientes de esto, las coaliciones se coordinan y en muchos distritos presentan un único candidato que aglutine todas sus fuerzas.

Este sesgo mayoritario complica las predicciones de diputados porque es difícil anticipar su magnitud. No es ni constante ni lineal. En el cálculo anterior hemos asumido un efecto pequeño en favor de Morena y sus socios de coalición, pero si el efecto fuese mayor —como ha ocurrido en el pasado con las victorias del PRI—, la suma de Morena, PES y PT podría superar los 280 diputados.

Los 200 diputados restantes se eligen con repartos proporcionales y son más fáciles de predecir, aunque el sistema electoral también introduce incertidumbres, como el mecanismo contra la sobrerrepresentación. Según lo establecido en el artículo 54 de la Constitución del país, ningún partido podrá tener más de 300 diputados ni un porcentaje de diputados mayor en ocho puntos a su porcentaje de votos. En 2012 y 2015, por ejemplo, el PRI superó el umbral de sobrerrepresentación y fue necesario restarle diputados y recalcular el reparto siguiendo la ley. Nuestros cálculos indican que Morena podría no superar ese límite, lo que de nuevo beneficia sus expectativas de escaños.

La situación en el senado es similar. La suma de Morena, PT y PES ronda el 46% de votos en las encuestas, mientras que las coaliciones alrededor del PAN y del PRI suman el 33% y el 21% de los votos, respectivamente. En este caso el efecto mayoritario del sistema es menor —porque de los tres senadores que elige cada estado, hay uno que se reserva a la primera minoría. Aún así, la coalición alrededor de López Obrador tiene opciones para conseguir la mitad de los senadores y controlar la cámara.

En definitiva, la coalición alrededor de López Obrador no tiene asegurado el control de las dos cámaras —porque las encuestas pueden estar sobrestimando sus fuerzas y porque podrían no ser competitivos en distritos uninominales—, pero tiene opciones reales de lograrlo.

La elección presidencial

A 10 días de que México celebre la mayor votación de su historia –más de 3.000 cargos públicos en juego-, todas las miras se centran en López Obrador. De acuerdo al modelo electoral de EL PAÍS, el líder de Morena tendría ahora un 95% de probabilidades de ser elegido presidente. Ricardo Anaya ganaría un 4% de las veces y José Antonio Meade menos del 1%.

Para calcular esta predicción hacemos un promedio de encuestas y tenemos en cuenta su precisión histórica. La metodología que seguimos es la misma que usamos con elecciones en Francia, Reino Unido, España, o hace apenas dos semanas, Colombia. Nuestros análisis indican que el margen de error de los sondeos ronda ahora los 12 o 13 puntos. Por eso López Obrador es un favorito claro: porque sería raro —o infrecuente— ver un vuelco electoral que haga perder 20 puntos al candidato puntero.

Estimación de diputados y senadores. Para la estimación de diputados hemos tomado un promedio de seis encuestas recientes (de Berumen/Ipsos, Parametria, El Financiero, Gii360, Consulta Mitofsky y Reforma). A partir de esas encuestas estimamos los diputados por mayoría relativa y representación proporcional, tomando en cuenta los límites que marca la Constitución. Para la estimación de senadores seguimos un proceso análogo a partir de tres encuestas de (de Berumen/Ipsos, Parametria y Gii360). Estos cálculos son una aproximación y están sujetos a márgenes de error elevados.

Metodología del modelo de la elección presidencial. Las predicciones las produce un modelo estadístico basado en sondeos y en su precisión histórica. El modelo es similar al que usamos en Francia, Reino Unido o Cataluña. Funciona en tres pasos: 1) agregar y promediar las encuestas en México, 2) incorporar la incertidumbre esperada, y 3) simular 20.000 elecciones presidenciales para calcular probabilidades.

Paso 1. Promediar las encuestas. Nuestro promedio tienen en cuenta docenas de sondeos para mejorar su precisión. Los datos han sido recopilados en su mayoría por la web Oraculus.mx. El promedio está ponderado para dar distinto peso a cada encuesta según tres factores: el tamaño de la muestra, la casa encuestadora y la fecha.

Peso por muestra. Las encuestas con más entrevistas reciben más peso, según una ley decreciente (pasado cierto umbral, hacer más entrevistas aporta poco).

Efecto de la casa encuestadora. La mayoría de encuestadoras tienden a dar mejores resultados a un candidato de forma sistemática. Es algo razonable: si usan métodos e hipótesis diferentes, es normal que sus desviaciones sean constantes. El problema es que estos efectos mueven el promedio artificialmente a corto plazo. Una opción para evitarlo es calcular los «efectos casa», la desviación sistemática de cada encuestadora con cada candidato. Después, al promediar las encuestas, sustraemos (parte de) esa desviación del dato de la encuestadora.

Encuestas repetidas. Ponderamos a la baja las encuestas repetidas de un mismo encuestador. La idea es sencilla: no queremos que una empresa que haga muchas encuestas domine el promedio. Al calcular el promedio en una fecha, la encuesta más cercana de cada encuestador tiene peso 1, y el resto un peso reducido.

Peso por fecha. El último factor es el más importante: queremos dar más peso a las encuestas recientes al calcular el promedio. Para conseguir eso asignamos pesos a los sondeos según una ley decreciente exponencial (por ejemplo, en este promedio una encuesta de hace 15 días recibe la mitad de peso que una encuesta de hoy). También definimos una franja de exclusión y eliminamos completamente las encuestas con más de 60 días de antigüedad.

Paso 2. Incorporar la incertidumbre de las encuestas. Este es el paso más complicado y más importante. Necesitamos estimar la precisión esperada de los sondeos en México. ¿De qué magnitud son los errores habituales? ¿Cómo de probable es que se produzcan errores de 2, 3 o 5 puntos? Para responder esas preguntas hemos estudiado cientos de encuestas en México y miles internacionales.

Calibrar los errores esperados. Primero he estimado el error de las encuestas en México. He construido una base de datos con encuestas de cinco elecciones desde 2000 —incluyendo las tres presidenciales. El error absoluto medio (MAE) de los promedios de encuestas en México ha rondado los 3 puntos por partido o candidato. Eso significa que fueron habituales desviaciones de 3 o 4 puntos y que el margen de error se acerca a los 8 puntos. Pero tres elecciones son pocas para extraer conclusiones fuertes, especialmente si miramos el acierto de los sondeos en la región. Nuestro análisis de 24 votaciones en Latinoamérica eleva el error MAE a 4 puntos. Por eso, queriendo ser cautos, nuestro modelo asume un MAE de 3,5 puntos para México.

Esos errores dependen al menos de dos cosas: del tamaño del candidato/partido y de la cercanía de las elecciones. Para tener en cuenta esos dos factores hemos recurrido a la base de datos de Jennings y Wlezien, recientemente publicada en Nature. Hemos analizado los errores de más de 4.100 encuestas en 241 elecciones de 19 países occidentales. Así hemos construido un modelo sencillo que estima el error MAE del promedio de votos estimado por las encuestas para cada partido, teniendo en cuenta: i) su tamaño (es más fácil estimar un partido que ronda el 5% en votos que uno que supera el 30%), y ii) los días que faltan hasta las elecciones (porque las encuestas mejoran al final).

Distribución. Para incorporar la incertidumbre al voto de cada partido en cada simulación utilizo uno distribución multivariable. Uso distribuciones t-student en lugar de normales para que tengan colas más largas (curtosis): eso hace más probable que sucedan eventos muy extremos. Las ventajas de esa hipótesis la explica Nate Silver. El nivel de curtosis lo he estimado con la base de datos. Luego defino la matriz de covarianzas de estas distribuciones para que i) la suma de los votos no sobrepase el 100% (una idea de Chris Hanretty), y ii) consideren correlaciones entre candidatos cercanos (tomando datos de duelos cara a cara y de segundas opciones). Por último, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la amplitud esperados según la calibración.

Paso 3. Simular. El último paso consiste en ejecutar el modelo 20.000 veces. Cada iteración es una simulación de las elecciones con porcentajes de voto que varían según la distribución definida en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidad que tiene cada candidato de ganar.

Por qué encuestas. El modelo se basa por entero en encuestas. Existe la percepción de que los sondeos no son fiables, pero a nivel nacional fallaron por pocos puntos incluso con Trump y con el Brexit. En otras elecciones recientes dieron menos que hablar porque estuvieron acertados (Francia, Países Bajos, País Vasco, Galicia, Cataluña). Pese a la creencia popular, lo cierto es que las encuestas no lo han hecho mal últimamente. Las encuestas raramente son perfectas, pero no existe una alternativa que haya demostrado mejor capacidad de predicción.