El domingo pasado se eligió presidente de Chile, por ende muchos opinólogos intentaron explicar como se repartieron los votos de la primera vuelta a la segunda vuelta. Como el voto es secreto, nadie puede estar mal.

Por eso decidí dar un aproach distinto al standard, recurriendo a un modelo matemático hecho muy rápido el mismo día domingo, publicando así el día lunes el articulo: Estimación repartija de votos segunda vuelta presidenciales Chile 2017 del cual recibí mucho feedback que incorporé en esta versión «mejorada».

Primero partamos entendiendo el problema, en primera vuelta se votó por 8 candidatos, donde los votos se repartieron del siguiente modo:

Mientras que en la segunda vuelta entre Piñera y Guiller los votos se repartieron del siguiente modo:

Sabemos de que región vienen los votos, comuna, punto de votación, todo disponible en el sitio del servel, pero lo que a todos nos intriga es: ¿ como se repartieron los votos de la primera vuelta en la segunda ?

Para ello hice un modelo matemático con el que llegue al siguiente resultado: (donde total_pv representa los nuevos votantes)

Ahora explicaré como llegué a ese resultado:

Metodología

Crear Dataset:

En el sitio del SERVEL (http://pv.servelelecciones.cl/ y http://www.servelelecciones.cl/), se publican los votos por mesa electoral, por lo que construí un web-scrapper para descargar las los votos por mesa construyendo así un dataset (disponible aqui) con las siguientes columnas:

region: Región

circ_sen: Circunscripción Senatorial

distrito: Distrito

comuna: Comuna

circ_elec: Circunscripción Electoral

local_vot: Local de Votación

mesa: Mesa de Votación

goic_pv: Numero de votos recibidos por Goic en primera vuelta

kast_pv: Numero de votos recibidos por Kast en primera vuelta

pinera_pv: Numero de votos recibidos por Piñera en primera vuelta

guillier_pv: Numero de votos recibidos por Guillier en primera vuelta

sanchez_pv: Numero de votos recibidos por Sanchez en primera vuelta

meo_pv: Numero de votos recibidos por MEO en primera vuelta

artes_pv: Numero de votos recibidos por Artes en primera vuelta

navarro_pv: Numero de votos recibidos por Navarro en primera vuelta

nulos_pv: Numero de votos Nulos en primera vuelta

blanco_pv: Numero de votos Blancos en primera vuelta

noVoto_pv: Numero de personas que no votaron en primera vuelta

pinera_sv: Numero de votos recibidos por Piñera en segunda vuelta

guillier_sv: Numero de votos recibidos por Guillier en segunda vuelta

nulos_sv: Numero de votos Nulos en segunda vuelta

blancos_sv : Numero de votos Blancos en segunda vuelta

noVoto_sv: Numero de personas que no votaron en segunda vuelta

Metodología

En cada Región, usaremos los resultados de cada mesa electoral para realizar una regresión que nos permitirá estimar los porcentajes de votos que se fueron a cada candidato en la segunda vuelta, los modelos quedarían del siguiente modo:

pinera_sv = %votos_goic_pinera*goic_pv + %votos_kast_pinera*kast_pv + … + %noVoto_pinera*noVoto_pv

guillier_sv = %votos_goic_guillier*goic_pv + %votos_kast_guillier*kast_pv + … + %noNoto_guillier*noVoto_pv

nulos_sv = %votos_goic_guillier*goic_pv + %votos_kast_guillier*kast_pv + … + %noNoto_nulos*noVoto_pv

blancos_sv = %votos_goic_guillier*goic_pv + %votos_kast_guillier*kast_pv + … + %noNoto_blancos*noVoto_pv

noVoto_sv = %votos_goic_guillier*goic_pv + %votos_kast_guillier*kast_pv + … + %noNoto_noVoto*noVoto_pv

Pero para que el modelo tenga sentido, debemos restringir los porcentajes estimados, las restricciones son las siguientes:

Todos los porcentajes son positivos (mayores a 0).

la suma de los porcentajes cedidos debe sumar 100%

Calibramos el Modelo utilizando R con el paquete CVXR (Código adjunto al final).

Resultados

Se corrió la regresión por región y se obtuvo un % por región, pero a nivel nacional, los votos de cada candidato en primera vuelta se distribuyeron del siguiente modo (total_pv representa el porcentaje de personas nuevas que votaron en 2nda vuelta):

Las conclusiones son varias:

Los que votaron por Piñera y Guiller, repitieron su voto.

Piñera no logró captar el 100% de os votos de Kast, seguramente por su cambio al centro.

Poco menos de la mitad de lo votos de Sanchez, no votaron en segunda vuelta, esto se puede deber a que el Frente Amplio llamó a no votar por Piñera, pero no a votar por Guiller. Otra forma de verlo es que el Frente Amplio es la Izquierda cansada de la Nueva Mayoría.

Artes y Navarro donaron todos sus votos a Guiller.

Los votantes de Goic y Meo, votaron menos en segunda vuelta, pero mostraron una preferencia por Guillier.

Piñera logró captar mas nuevos votantes que Guiller.

Este mismo gráfico visto en número de votos en vez de porcentaje se ve del siguiente modo (total_pv representa número de personas nuevas que votaron en 2nda vuelta):

Se puede apreciar que el grueso de los votos de Piñera vino primero de sus votos en primera vuelta, luego de nuevos votantes y por ultimo de los votos de Kast.

Ahora si vemos los votos superpuestos según su origen (total_pv representa el número de personas nuevas que votaron en 2nda vuelta):

Se aprecia que si el Frente Amplio (Sanchez) hubiese votado por Guiller (duplicar el ancho del morado), posiblemente hubiesen alcanzado a Piñera. Por otro lado, Piñera podría haber ganado sin los votos de Kast, pero hubiese sido muy estrecho.

Al final el resultado de las elecciones se debió a los nuevos votantes (noVoto_pv) y a que el Frente Amplio no votó en segunda vuelta.

Saludos!

PD: Los archivos del análisis resultados están en Presidenciales, Necesitaran descargar chromedriver o phantomjs para ejecutar el webscraping.