sábado, 19 de diciembre de 2015

Sobre el Voto Nulo como Protesta

A raíz de la inspección preliminar que hice de los micro-datos del 6D, de la cual Eugenio Martínez (@puzkas) y otros medios nacionales se hicieron eco, se ha generado una especie de sana polémica en torno al tema de los votos nulos el 6D.

El hecho fundamental es que la tasa de voto nulo del 6D (aprox. 5,0% en el voto lista), es inusualmente alta relativa a la historia reciente de eventos electorales (aunque no la más alta históricamente). Esto ha motivado la destemplada reacción, mitad teoría de la conspiración, mitad conveniencia política, de los que todavía no se enteran de qué fue los que les pasó por encima el 6D.

Pero vamos al punto. En mi post anterior sobre el tema dije que, a simple vista, los datos del 6D son consistentes con la tesis de que una parte de los electores oficialistas utilizaron deliberadamente el voto nulo (en blanco) como expresión de descontento. Mi afirmación se basaba, por un lado, en un análisis muy preliminar de las proporciones de voto nulo entre los centros del 20% más oficialista, con respecto al 20% más opositor, la diferencia resultaba más del doble entre una y otra y estadísticamente significativa; por el otro lado, en el conocimiento de la data electoral más reciente, pues no recordaba  haber visto una diferencia tan sustancial en cuanto a votos nulos entre centros más pro-CH y más pro-OPO.

Aun así, mi afirmación la hice en condicional, pues es un punto que requiere de más análisis para sacar conclusiones más robustas. Esa es la intención de este post.

¿Utilizó el chavismo el voto nulo como protesta?


El debate  sigue vivo.

Iñaki en el blog YVPolis, correctamente demuestra que existe una alta correlación entre los centros con alta incidencia de voto nulo en 2010 y en 2015, lo cual es correcto, y refleja el hecho que existen centros que por razones observables (o no) son sistemáticamente más propensas a cometer errores que nulifiquen el voto, y que esos centros son más o menos los mismos entre 2010 y 2015. Más sobre este punto más adelante.

Caracas Chronicles, también se unió al debate. Ahí, Quico sostiene la tesis de que la responsable es la horrible interfaz del elector que ofrece Smartmatic y sus máquinas. En su historia, la interfaz complica innecesariamente el acto de votación, lo cual afecta desproporcionadamente más a los electores relativamente con menor educación (lo cual en teoría los hace cometer más errores que nulifican el voto). Quico sugiere, sin decirlo expresamente, que detrás de las diferencias significativas en la tasas de voto nulo entre unos centros y otros, observadas por Iñaki, está el nivel de sofisticación promedio de los electores de dichos centros.

El problema es que aunque la afirmación sea parcialmente cierta, esta historia no es consistente con los datos y no explica lo que pasó entre 2010 y 2015.

¿Por qué? Pues porque las elecciones parlamentarias de 2015 fueron casi una réplica idéntica de las elecciones parlamentarias de 2010. De hecho en ambas elecciones se utilizaron los mismos circuitos, se emitieron la misma cantidad de votos, se utilizaron las mismas máquinas y la misma interfaz del usuario, se eligieron los mismos cargos, para la misma institución, votó más o menos la misma población, más o menos en los mismos centros de votación. Ambas elecciones tuvieron más o menos la misma motivación, organizaciones de campaña, movilización y base territorial. Ambas elecciones fueron ampliamente polarizadas. Aparte de cambios demográficos y pequeñas modificaciones en la organización de la recepción de votantes en los centros, ambas elecciones son casi idénticas.

Sin embargo la tasa de voto nulo de 2015 (aprox. 5,0%), duplica la tasa de voto nulo observada en 2010 (aprox. 2,5%) en el voto lista. Entonces, a menos que se piense que hubo un factor que hizo caer el nivel general de sofisticación/educación de todo el electorado en promedio, o peor aún, de una parte del electorado en particular (el oficialista), esa historia no tiene ningún asidero.

Un viejo mentor en el Banco Central me enseño un adagio: Una constante, no puede explicar una variable. La “educación promedio” de los centros de votación, no puede explicar las duplicación del voto nulo entre 2010 y 2015.

Luego Rodrigo, abunda en la tesis de lo malo que es la interfaz del votante del mejor sistema electoral del mundo. Y tiene razón, la interfaz es terrible, puede ser ampliamente mejorada, y el sistema se beneficiaría de las propuestas como tener un botón de voto en blanco/nulo para capturar la voluntad expresa de los electores que quieran elegir esa opción. El argumento es irrebatible, pero no pone luz sobre las diferencias entre 2010 y 2015, o entre centros más pro-OPO y más pro-CH. Rodrigo sentencia: “Es imposible demostrar que ciertos votantes, con ciertas preferencias, fueron más propensos a votar nulo. Imposible.”

Challenge Accepted.

Nicmer, Marea, Nicmer Marea 


El experimento: Sabemos que algunos factores políticos de la disidencia chavista hicieron llamados expresos a votar nulo, incluyendo al mediático Nicmer Evans, quien admite que Marea Socialista se vio obligada a votar nulo frente a la polarización y la ilegalización de su tarjeta en varios estados.  Supongamos que una parte del electorado estuvo expuesto o era más propenso a seguir el lineamiento de Nicmer, es decir, una parte de la población estuvo más expuesto a lo que llamaremos el Tratamiento Nicmer Marea. El tratamiento Nicmer Marea consistía en ponerle una voz interna a los chavistas en su cabeza que les decía: “Castígalos, ¡Vota Nulo!”  (Obvio: lo de Nicmer/Marea es un recurso retórico para ilustrar un punto).

La pregunta: ¿Será cierto que parte del electorado chavista –siguiendo a Nicmer o no- expresó su descontento a través del uso deliberado del voto nulo?

La prueba: Supongamos –por simplicidad– que solo existen centros de votación muy chavistas o muy opositores. Para operacionalizar esta noción decimos que “muy chavista” significa aquellos centros donde el oficialismo sacó 70% o más en las elecciones de 2010 (los llamaremos Centros +CH). Los “muy opositores” son aquellos centros donde la MUD sacó más de 60% en dicha elección (los llamaremos +OPO).

Evidencia #1: Los centros +CH tienden a tener tasas de voto nulo/blanco relativamente más altas que los centros +OPO. Esto es una constante en todas las elecciones del pasado reciente. Veamos que pasó en las elecciones parlamentarias de 2010:


La diferencia entre centros +CH y centros +OPO es de menos de medio punto porcentual (0,48%). Esta cifra es importante recordar, pues ese medio punto porcentual incluye todas las diferencias posibles, observables o no observables, entre el votante promedio de los centros +CH y el votante promedio de los centros +OPO. Es decir, todas las diferencias sistemáticas entre nivel educativo, ingreso, ocupación, aptitudes, actitudes, gustos musicales o culinarios, entre chavistas y opositores, se pueden estimar para una elección como la de 2010 en medio punto porcentual adicional de votos nulos –cero punto cuarenta y ocho por ciento-.

Evidencia #2: En 2015, el patrón se repite con centros +CH mostrando tasas de voto nulo/blanco relativamente más altas que los centros +OPO. Sin embargo esta diferencia se profundiza con respecto a lo observado en las elecciones parlamentarias de 2010.



La diferencia entre centros +CH y centros +OPO en 2015 fue de 1,78 puntos porcentuales, esto es casi cuatro veces la diferencia observada en 2010. Aquí es importante recordar que este análisis se hace basado en un universo de 2100+ centros de votación +OPO y 3120+ centros de votación +CH, y que son los mismos centros para 2010 y 2015, por lo tanto estamos comparando en promedio la misma población. No es plausible pensar en cambios sistemáticos en nivel educativo, ingreso, ocupación, aptitudes, actitudes, gustos musicales o culinarios, entre chavistas y opositores, en los 5 años que transcurrieron entre 2010 y 2015, que ayuden a explicar el salto en la diferencia entre las dos poblaciones.

Aun así, todavía no se puede afirmar con certeza que esta diferencia entre las dos poblaciones es atribuible a una intencionalidad deliberada de la población +CH de expresar descontento a través del voto nulo/blanco.

¿Pero se puede decir algo a partir de la data?


Afortunadamente, no necesitamos un lector de mentes oficialistas para saber si existe evidencia de que algo pasó en los centros +CH, algo que podría sugerir Tratamiento Nicmer Marea funcionó. No necesitamos un lector de mentes, porque tenemos a David Card & Alan Krueger (1994), que son como Chino & Nacho, pero de la evaluación de políticas.

Lo que hemos dicho hasta ahora sobre las diferencias entre dos poblaciones en dos puntos del tiempo distinto, tiene la estructura perfecta para aplicar una técnica que es estándar en la evaluación de políticas y de efectividad de tratamientos médicos: El estimador DID (diferencias-en-diferencias).

No es la idea abundar en aspectos técnicos aquí, pero sépase que el DID es una forma sencilla, elegante y robusta de inferir, a partir de los datos, una relación causal o de atribución entre un resultado observado (tasa de voto nulo) y una intervención o “tratamiento” (Nicmer Marea). La estimación permite controlar los típicos sesgos que uno podría encontrar en una estimación de este tipo. Toma en cuenta, además, las características no observables de las poblaciones involucradas que no varíen en el tiempo.

Resultados: Los resultados sugieren que existe fuerte evidencia de que algo pasó el 6D en los centros +CH. Ese algo no puede ser explicado por los cambios en el sistema de votación entre 2010 y 2015 (que no fueron muchos), ni por cambios atribuibles a las características observables o no observables de los votantes promedio de cada grupo (i.e. educación, habilidad). Entonces, lo encontrado es evidencia de que ese algo fue que una parte de la población de los centros +CH tuvo intención deliberada de votar nulo: el tratamiento Nicmer Marea.


            


La estimación en Diff-in-Diff del efecto Nicmer es que 1,32 puntos porcentuales de la tasa de voto nulo observada en los centro +CH es atribuible a la intención de votar nulo como protesta. Esto es, casi la mitad (47%) del incremento de la tasa de votos nulos entre 2010 y 2015 en los centros más oficialistas, puede ser explicada por este efecto. Casi ¾ partes (74%) de la diferencia observada entre las tasa de voto nulo entre centros +OPO y centros +CH en 2015, puede ser explicada por el Tratamiento Nicmer Marea.

Cierro diciendo que creo que el estimador DID es evidencia sólida, robusta y no circunstancial de que el Efecto Nicmer Marea existió y fue importante el 6D. También diré, que creo que el estimador puede incluso estar subestimando el peso que tuvo el voto nulo deliberado como protesta, pues una parte de la población de los centros +OPO también estuvo sometida al mismo tratamiento. 

Pero como diría Juan Vené…la prueba de eso la dejamos para el próximo programa (o post).


Nota al lector: Lo de Nicmer es una metáfora, no creo que lo que diga haya dicho o dejado de decir Nicmer, haya tenido importancia o trascendencia alguna el 6D. 

martes, 15 de diciembre de 2015

Tres Gráficos sobre el 6D

Un análisis preliminar de los datos parciales del primer boletín del CNE: (hat tip Eugenio Martínez @puzkas por los datos del primer boletín del CNE)

El voto nulo como voto protesta: A simple vista, pareciera que el descontento oficialista se expresó también en forma de voto nulo. La incidencia de voto nulo es más del doble en los centros electorales del 20% más oficialista, con respecto al 20% más opositor.


 

Avance uniforme: El resultado de la Unidad es excepcional en muchos sentidos, pero estas dos métricas dan cuenta de la proporción de lo ocurrido: La Unidad avanzó su votación en TODOS los circuitos del país, con un promedio de +12 puntos porcentuales (pp), un mínimo de +5pp un máximo de +18pp. Más impresionante aún: la Unidad logró ganar 34 circuitos por primera vez en 16 años.



Ganancias rurales: pese a sacar una ventaja menor a la esperada por las encuestas (15,4pp), la oposición logró la mayoría calificada gracias a avances sin precedentes en las áreas rurales. Personalmente yo estaba on-record con una predicción puntual de 111 diputados, sin embargo siempre advertí que el determinante más importante del resultados no era la brecha del voto nacional, sino que las ganancias de la oposición estuvieran “adecuadamente distribuidas”entre circuitos rurales Vs. urbanos. La simulación que utilicé para ilustrar este punto resultó buena explicando el resultado final de 112 diputados, ya que el llamado “coeficiente de ganancias rurales/urbanas” resultó de 1,26, es decir, la oposición logró movilizar 126 nuevos votantes "rurales"*, por cada 100 votantes "urbanos"*. Lo que dibujado en el gráfico la Cota 15,4 arroja:


*La definición de circuitos rurales y urbanos es propia y necesariamente un tanto arbitraria.

sábado, 12 de diciembre de 2015

Vuelta Olímpica



Muérete de la envidia Profeta Reinaldo Dos Santos
Luego de decantados los resultados del 6D, donde la coalición de la MUD obtuvo una trascendental victoria, llega el momento de auto-evaluarse. Y como hay que liderar con el ejemplo, ya que uno tiene esa mala manía de estar echando números y haciéndolos públicos, me sale un poco transparencia y rendición de cuentas, que nunca cae mal.

El pasado 18 de Agosto publiqué en este mismo espacio lo que llame la Plataforma de Simulación de Resultados Electorales para el 6Dque no era más que un modelo que, partiendo del principio de que cada circuito es distinto, calculaba la sensibilidad de la votación circuital a las tendencias de “la opinión pública nacional”. El modelo era basado en el cálculo de la elasticidad del voto por circuito a la variable “Opinión sobre la Situación del País” de la empresa Datanalisis.
Más tarde, mi modelo, con algunos cambios menores, salió publicado en Caracas Chronicles, quienes gentilmente pusieron el coding para transformar mi modelo en una aplicación web que se volvió un tanto viral en los días previos al 6D.
Entonces, la pregunta es cómo quedó nuestra predicción con respecto a los resultados del 6D. Para adelantarnos un poco, si tuviera que resumir en dos palabras diría: Home Run.

Pero vamos por partes. ¿Cómo medimos el desempeño predictivo de la herramienta? Para darle respuesta a esto, creo que hay que evaluar tres dimensiones distintas: 
  1. La predicción del número de diputados totales
  2. La predicción del porcentaje de voto total que obtendría la oposición
  3. La correcta asignación de circuitos a una opción u otra
Número de Diputados
Aquí, recuérdese que el modelo de predicción dependía de un único insumo: El porcentaje de personas que valoraba positivamente la situación del país de acuerdo a Datanalisis. En la última encuesta de Datanalisis, filtrada pocos días antes del 6D, el valor de esta variable era 10,2%, lo cual arrojaba como resultado…..*repique de redoblantes*:

111 diputados para la MUD y 56 diputados para el GPP. 
Captura de la aplicación web en Caracas Chronicles
Dado que el resultado final fue 112-55, creo que me me voy mereciendo por lo menos una birra.
Porcentaje de voto de la oposición
Lo primero que hay que decir es que la herramienta se basaba en un modelo muy sencillo, que asumía escenarios completamente polarizados (sin terceras opciones). Esto no fue completamente así el 6D. De hecho casi 3% de los votos válidos apoyaron a listas distintas a la de la MUD y el GPP.
También debo confesar que no tuve demasiada confianza en la capacidad de esta herramienta predictiva para proyectar, de manera muy precisa, el porcentaje que obtendría la oposición el 6D. Es un tema bastante técnico, pero basta con decir que lo que me preocupaba es que esta era una herramienta orientada a proyectar resultados individuales por circuito, y cuyo estimado de voto nacional resultaba de la simple agregación de los anteriores. Entonces si había –como de hecho lo hay- un grado de error en la estimación de cada circuito, la agregación de todos los circuitos podía “magnificarse”. De hecho, esa fue la razón principal por la cual decidí no publicar el estimado de voto nacional para la oposición en la aplicación de Caracas Chronicles. Eso y que por aquellos días, todos los sondeos de opinión ponían a la oposición a liderar el voto nacional por un margen no menor a 30 puntos, y mi estimado me daba en el rango entre 15% y 17%.
Pero, Oh! Sorpresa!, los equivocados eran nuestros reputados encuestadores. De acuerdo al boletín oficial del CNE, haciendo una agregación del voto lista, la oposición obtuvo un 56,2% de los votos válidos, mientras que el GPP obtuvo un 41,0% de los votos válidos, lo cual implica una brecha de 15,4%.
¿Y que decía mi herramienta de predicción de resultados? En su versión más actualizada, con los resultados de la última encuesta Datanalisis, la predicción de Distortioland era….56,1% *KABOOM!!!*

Captura de la plataforma original en excel


Bonus track: Correcta asignación de circuitos 
En su momento este blog dijo que nuestro modelo estaba exclusivamente diseñado para proyectar en AGREGADO el número de diputados de la oposición. Fuimos muy claros al decir que había –hay- razones para pensar que podíamos equivocarnos en la predicción de cada circuito, pero que estas equivocaciones tenderían a ser insesgadas, es decir, no favorecerían a ningún bando y tenderían a cancelarse entre sí. 
De hecho, esta era la base para decir que la predicción global era, necesariamente, mucho más precisa que la predicción individual de cada circuito.
La plataforma de predicción del 6D fue capaz de predecir acertadamente 98 de los 112 diputados de la oposición, eso es una tasa 87,5% de precisión, nada mal si consideramos que la herramienta no estaba diseñada para esto. Otra resultado interesante es que los errores cometidos, tal y como se esperaba, fueron insesgados. La herramienta cometió un total de 11 falsos negativos (circuitos erróneamente asignados al GPP, pero finalmente ganados por la MUD), mientras que cometió un total de 10 falsos positivos (circuitos erróneamente asignados a la MUD, pero finalmente ganados por el GPP). Un total de 66 aciertos sobre un universo de 87 circuitos.
Voy por mi birra.
Salud!

miércoles, 2 de diciembre de 2015

Update: Dónde nos jugamos el resultado del 6D (y II)

Luego de observar el resultado de los últimos estudios de opinión, y para complacer a vario lectores que lo solicitaron, parecería prudente replicar el ejercicio de la Cota 30 para modelar un potencial triunfo de la oposición por un margen menor.
En el gráfico subsiguiente se observa la Cota 30 anteriormente mostrada, y una estimación de los resultados modelando una ventaja de 20 puntos (Cota 20) y de 10 puntos (Cota 10).

Tres comentarios saltan a la vista en este análisis:
  1. A medida que se modelan brechas más modestas, disminuyen el valor relativo de tener proporcionalmente más votos rurales (la relación se hace más plana). Esto se debe a que, en general, la brecha promedio de ventaja del oficialismo en estos circuitos solo puede ser superada con grandes márgenes a favor de la oposición.
  2. En la Cota 20 (simulando un margen de victoria de 20 puntos a favor de la oposición) la mayoría calificada de 2/3 todavía sería alcanzable. Este resultado requeriría una casi perfecta proporcionalidad entre las ganancias rurales y urbanas del voto opositor (cerca del "1").
  3. En la Cota 10, la oposición puede obtener una mayoría simple, pero las mayorías de 3/5 y 2/3 quedarían fuera de su alcance.