sábado, 19 de diciembre de 2015

Sobre el Voto Nulo como Protesta

A raíz de la inspección preliminar que hice de los micro-datos del 6D, de la cual Eugenio Martínez (@puzkas) y otros medios nacionales se hicieron eco, se ha generado una especie de sana polémica en torno al tema de los votos nulos el 6D.

El hecho fundamental es que la tasa de voto nulo del 6D (aprox. 5,0% en el voto lista), es inusualmente alta relativa a la historia reciente de eventos electorales (aunque no la más alta históricamente). Esto ha motivado la destemplada reacción, mitad teoría de la conspiración, mitad conveniencia política, de los que todavía no se enteran de qué fue los que les pasó por encima el 6D.

Pero vamos al punto. En mi post anterior sobre el tema dije que, a simple vista, los datos del 6D son consistentes con la tesis de que una parte de los electores oficialistas utilizaron deliberadamente el voto nulo (en blanco) como expresión de descontento. Mi afirmación se basaba, por un lado, en un análisis muy preliminar de las proporciones de voto nulo entre los centros del 20% más oficialista, con respecto al 20% más opositor, la diferencia resultaba más del doble entre una y otra y estadísticamente significativa; por el otro lado, en el conocimiento de la data electoral más reciente, pues no recordaba  haber visto una diferencia tan sustancial en cuanto a votos nulos entre centros más pro-CH y más pro-OPO.

Aun así, mi afirmación la hice en condicional, pues es un punto que requiere de más análisis para sacar conclusiones más robustas. Esa es la intención de este post.

¿Utilizó el chavismo el voto nulo como protesta?


El debate  sigue vivo.

Iñaki en el blog YVPolis, correctamente demuestra que existe una alta correlación entre los centros con alta incidencia de voto nulo en 2010 y en 2015, lo cual es correcto, y refleja el hecho que existen centros que por razones observables (o no) son sistemáticamente más propensas a cometer errores que nulifiquen el voto, y que esos centros son más o menos los mismos entre 2010 y 2015. Más sobre este punto más adelante.

Caracas Chronicles, también se unió al debate. Ahí, Quico sostiene la tesis de que la responsable es la horrible interfaz del elector que ofrece Smartmatic y sus máquinas. En su historia, la interfaz complica innecesariamente el acto de votación, lo cual afecta desproporcionadamente más a los electores relativamente con menor educación (lo cual en teoría los hace cometer más errores que nulifican el voto). Quico sugiere, sin decirlo expresamente, que detrás de las diferencias significativas en la tasas de voto nulo entre unos centros y otros, observadas por Iñaki, está el nivel de sofisticación promedio de los electores de dichos centros.

El problema es que aunque la afirmación sea parcialmente cierta, esta historia no es consistente con los datos y no explica lo que pasó entre 2010 y 2015.

¿Por qué? Pues porque las elecciones parlamentarias de 2015 fueron casi una réplica idéntica de las elecciones parlamentarias de 2010. De hecho en ambas elecciones se utilizaron los mismos circuitos, se emitieron la misma cantidad de votos, se utilizaron las mismas máquinas y la misma interfaz del usuario, se eligieron los mismos cargos, para la misma institución, votó más o menos la misma población, más o menos en los mismos centros de votación. Ambas elecciones tuvieron más o menos la misma motivación, organizaciones de campaña, movilización y base territorial. Ambas elecciones fueron ampliamente polarizadas. Aparte de cambios demográficos y pequeñas modificaciones en la organización de la recepción de votantes en los centros, ambas elecciones son casi idénticas.

Sin embargo la tasa de voto nulo de 2015 (aprox. 5,0%), duplica la tasa de voto nulo observada en 2010 (aprox. 2,5%) en el voto lista. Entonces, a menos que se piense que hubo un factor que hizo caer el nivel general de sofisticación/educación de todo el electorado en promedio, o peor aún, de una parte del electorado en particular (el oficialista), esa historia no tiene ningún asidero.

Un viejo mentor en el Banco Central me enseño un adagio: Una constante, no puede explicar una variable. La “educación promedio” de los centros de votación, no puede explicar las duplicación del voto nulo entre 2010 y 2015.

Luego Rodrigo, abunda en la tesis de lo malo que es la interfaz del votante del mejor sistema electoral del mundo. Y tiene razón, la interfaz es terrible, puede ser ampliamente mejorada, y el sistema se beneficiaría de las propuestas como tener un botón de voto en blanco/nulo para capturar la voluntad expresa de los electores que quieran elegir esa opción. El argumento es irrebatible, pero no pone luz sobre las diferencias entre 2010 y 2015, o entre centros más pro-OPO y más pro-CH. Rodrigo sentencia: “Es imposible demostrar que ciertos votantes, con ciertas preferencias, fueron más propensos a votar nulo. Imposible.”

Challenge Accepted.

Nicmer, Marea, Nicmer Marea 


El experimento: Sabemos que algunos factores políticos de la disidencia chavista hicieron llamados expresos a votar nulo, incluyendo al mediático Nicmer Evans, quien admite que Marea Socialista se vio obligada a votar nulo frente a la polarización y la ilegalización de su tarjeta en varios estados.  Supongamos que una parte del electorado estuvo expuesto o era más propenso a seguir el lineamiento de Nicmer, es decir, una parte de la población estuvo más expuesto a lo que llamaremos el Tratamiento Nicmer Marea. El tratamiento Nicmer Marea consistía en ponerle una voz interna a los chavistas en su cabeza que les decía: “Castígalos, ¡Vota Nulo!”  (Obvio: lo de Nicmer/Marea es un recurso retórico para ilustrar un punto).

La pregunta: ¿Será cierto que parte del electorado chavista –siguiendo a Nicmer o no- expresó su descontento a través del uso deliberado del voto nulo?

La prueba: Supongamos –por simplicidad– que solo existen centros de votación muy chavistas o muy opositores. Para operacionalizar esta noción decimos que “muy chavista” significa aquellos centros donde el oficialismo sacó 70% o más en las elecciones de 2010 (los llamaremos Centros +CH). Los “muy opositores” son aquellos centros donde la MUD sacó más de 60% en dicha elección (los llamaremos +OPO).

Evidencia #1: Los centros +CH tienden a tener tasas de voto nulo/blanco relativamente más altas que los centros +OPO. Esto es una constante en todas las elecciones del pasado reciente. Veamos que pasó en las elecciones parlamentarias de 2010:


La diferencia entre centros +CH y centros +OPO es de menos de medio punto porcentual (0,48%). Esta cifra es importante recordar, pues ese medio punto porcentual incluye todas las diferencias posibles, observables o no observables, entre el votante promedio de los centros +CH y el votante promedio de los centros +OPO. Es decir, todas las diferencias sistemáticas entre nivel educativo, ingreso, ocupación, aptitudes, actitudes, gustos musicales o culinarios, entre chavistas y opositores, se pueden estimar para una elección como la de 2010 en medio punto porcentual adicional de votos nulos –cero punto cuarenta y ocho por ciento-.

Evidencia #2: En 2015, el patrón se repite con centros +CH mostrando tasas de voto nulo/blanco relativamente más altas que los centros +OPO. Sin embargo esta diferencia se profundiza con respecto a lo observado en las elecciones parlamentarias de 2010.



La diferencia entre centros +CH y centros +OPO en 2015 fue de 1,78 puntos porcentuales, esto es casi cuatro veces la diferencia observada en 2010. Aquí es importante recordar que este análisis se hace basado en un universo de 2100+ centros de votación +OPO y 3120+ centros de votación +CH, y que son los mismos centros para 2010 y 2015, por lo tanto estamos comparando en promedio la misma población. No es plausible pensar en cambios sistemáticos en nivel educativo, ingreso, ocupación, aptitudes, actitudes, gustos musicales o culinarios, entre chavistas y opositores, en los 5 años que transcurrieron entre 2010 y 2015, que ayuden a explicar el salto en la diferencia entre las dos poblaciones.

Aun así, todavía no se puede afirmar con certeza que esta diferencia entre las dos poblaciones es atribuible a una intencionalidad deliberada de la población +CH de expresar descontento a través del voto nulo/blanco.

¿Pero se puede decir algo a partir de la data?


Afortunadamente, no necesitamos un lector de mentes oficialistas para saber si existe evidencia de que algo pasó en los centros +CH, algo que podría sugerir Tratamiento Nicmer Marea funcionó. No necesitamos un lector de mentes, porque tenemos a David Card & Alan Krueger (1994), que son como Chino & Nacho, pero de la evaluación de políticas.

Lo que hemos dicho hasta ahora sobre las diferencias entre dos poblaciones en dos puntos del tiempo distinto, tiene la estructura perfecta para aplicar una técnica que es estándar en la evaluación de políticas y de efectividad de tratamientos médicos: El estimador DID (diferencias-en-diferencias).

No es la idea abundar en aspectos técnicos aquí, pero sépase que el DID es una forma sencilla, elegante y robusta de inferir, a partir de los datos, una relación causal o de atribución entre un resultado observado (tasa de voto nulo) y una intervención o “tratamiento” (Nicmer Marea). La estimación permite controlar los típicos sesgos que uno podría encontrar en una estimación de este tipo. Toma en cuenta, además, las características no observables de las poblaciones involucradas que no varíen en el tiempo.

Resultados: Los resultados sugieren que existe fuerte evidencia de que algo pasó el 6D en los centros +CH. Ese algo no puede ser explicado por los cambios en el sistema de votación entre 2010 y 2015 (que no fueron muchos), ni por cambios atribuibles a las características observables o no observables de los votantes promedio de cada grupo (i.e. educación, habilidad). Entonces, lo encontrado es evidencia de que ese algo fue que una parte de la población de los centros +CH tuvo intención deliberada de votar nulo: el tratamiento Nicmer Marea.


            


La estimación en Diff-in-Diff del efecto Nicmer es que 1,32 puntos porcentuales de la tasa de voto nulo observada en los centro +CH es atribuible a la intención de votar nulo como protesta. Esto es, casi la mitad (47%) del incremento de la tasa de votos nulos entre 2010 y 2015 en los centros más oficialistas, puede ser explicada por este efecto. Casi ¾ partes (74%) de la diferencia observada entre las tasa de voto nulo entre centros +OPO y centros +CH en 2015, puede ser explicada por el Tratamiento Nicmer Marea.

Cierro diciendo que creo que el estimador DID es evidencia sólida, robusta y no circunstancial de que el Efecto Nicmer Marea existió y fue importante el 6D. También diré, que creo que el estimador puede incluso estar subestimando el peso que tuvo el voto nulo deliberado como protesta, pues una parte de la población de los centros +OPO también estuvo sometida al mismo tratamiento. 

Pero como diría Juan Vené…la prueba de eso la dejamos para el próximo programa (o post).


Nota al lector: Lo de Nicmer es una metáfora, no creo que lo que diga haya dicho o dejado de decir Nicmer, haya tenido importancia o trascendencia alguna el 6D. 

martes, 15 de diciembre de 2015

Tres Gráficos sobre el 6D

Un análisis preliminar de los datos parciales del primer boletín del CNE: (hat tip Eugenio Martínez @puzkas por los datos del primer boletín del CNE)

El voto nulo como voto protesta: A simple vista, pareciera que el descontento oficialista se expresó también en forma de voto nulo. La incidencia de voto nulo es más del doble en los centros electorales del 20% más oficialista, con respecto al 20% más opositor.


 

Avance uniforme: El resultado de la Unidad es excepcional en muchos sentidos, pero estas dos métricas dan cuenta de la proporción de lo ocurrido: La Unidad avanzó su votación en TODOS los circuitos del país, con un promedio de +12 puntos porcentuales (pp), un mínimo de +5pp un máximo de +18pp. Más impresionante aún: la Unidad logró ganar 34 circuitos por primera vez en 16 años.



Ganancias rurales: pese a sacar una ventaja menor a la esperada por las encuestas (15,4pp), la oposición logró la mayoría calificada gracias a avances sin precedentes en las áreas rurales. Personalmente yo estaba on-record con una predicción puntual de 111 diputados, sin embargo siempre advertí que el determinante más importante del resultados no era la brecha del voto nacional, sino que las ganancias de la oposición estuvieran “adecuadamente distribuidas”entre circuitos rurales Vs. urbanos. La simulación que utilicé para ilustrar este punto resultó buena explicando el resultado final de 112 diputados, ya que el llamado “coeficiente de ganancias rurales/urbanas” resultó de 1,26, es decir, la oposición logró movilizar 126 nuevos votantes "rurales"*, por cada 100 votantes "urbanos"*. Lo que dibujado en el gráfico la Cota 15,4 arroja:


*La definición de circuitos rurales y urbanos es propia y necesariamente un tanto arbitraria.

sábado, 12 de diciembre de 2015

Vuelta Olímpica



Muérete de la envidia Profeta Reinaldo Dos Santos
Luego de decantados los resultados del 6D, donde la coalición de la MUD obtuvo una trascendental victoria, llega el momento de auto-evaluarse. Y como hay que liderar con el ejemplo, ya que uno tiene esa mala manía de estar echando números y haciéndolos públicos, me sale un poco transparencia y rendición de cuentas, que nunca cae mal.

El pasado 18 de Agosto publiqué en este mismo espacio lo que llame la Plataforma de Simulación de Resultados Electorales para el 6Dque no era más que un modelo que, partiendo del principio de que cada circuito es distinto, calculaba la sensibilidad de la votación circuital a las tendencias de “la opinión pública nacional”. El modelo era basado en el cálculo de la elasticidad del voto por circuito a la variable “Opinión sobre la Situación del País” de la empresa Datanalisis.
Más tarde, mi modelo, con algunos cambios menores, salió publicado en Caracas Chronicles, quienes gentilmente pusieron el coding para transformar mi modelo en una aplicación web que se volvió un tanto viral en los días previos al 6D.
Entonces, la pregunta es cómo quedó nuestra predicción con respecto a los resultados del 6D. Para adelantarnos un poco, si tuviera que resumir en dos palabras diría: Home Run.

Pero vamos por partes. ¿Cómo medimos el desempeño predictivo de la herramienta? Para darle respuesta a esto, creo que hay que evaluar tres dimensiones distintas: 
  1. La predicción del número de diputados totales
  2. La predicción del porcentaje de voto total que obtendría la oposición
  3. La correcta asignación de circuitos a una opción u otra
Número de Diputados
Aquí, recuérdese que el modelo de predicción dependía de un único insumo: El porcentaje de personas que valoraba positivamente la situación del país de acuerdo a Datanalisis. En la última encuesta de Datanalisis, filtrada pocos días antes del 6D, el valor de esta variable era 10,2%, lo cual arrojaba como resultado…..*repique de redoblantes*:

111 diputados para la MUD y 56 diputados para el GPP. 
Captura de la aplicación web en Caracas Chronicles
Dado que el resultado final fue 112-55, creo que me me voy mereciendo por lo menos una birra.
Porcentaje de voto de la oposición
Lo primero que hay que decir es que la herramienta se basaba en un modelo muy sencillo, que asumía escenarios completamente polarizados (sin terceras opciones). Esto no fue completamente así el 6D. De hecho casi 3% de los votos válidos apoyaron a listas distintas a la de la MUD y el GPP.
También debo confesar que no tuve demasiada confianza en la capacidad de esta herramienta predictiva para proyectar, de manera muy precisa, el porcentaje que obtendría la oposición el 6D. Es un tema bastante técnico, pero basta con decir que lo que me preocupaba es que esta era una herramienta orientada a proyectar resultados individuales por circuito, y cuyo estimado de voto nacional resultaba de la simple agregación de los anteriores. Entonces si había –como de hecho lo hay- un grado de error en la estimación de cada circuito, la agregación de todos los circuitos podía “magnificarse”. De hecho, esa fue la razón principal por la cual decidí no publicar el estimado de voto nacional para la oposición en la aplicación de Caracas Chronicles. Eso y que por aquellos días, todos los sondeos de opinión ponían a la oposición a liderar el voto nacional por un margen no menor a 30 puntos, y mi estimado me daba en el rango entre 15% y 17%.
Pero, Oh! Sorpresa!, los equivocados eran nuestros reputados encuestadores. De acuerdo al boletín oficial del CNE, haciendo una agregación del voto lista, la oposición obtuvo un 56,2% de los votos válidos, mientras que el GPP obtuvo un 41,0% de los votos válidos, lo cual implica una brecha de 15,4%.
¿Y que decía mi herramienta de predicción de resultados? En su versión más actualizada, con los resultados de la última encuesta Datanalisis, la predicción de Distortioland era….56,1% *KABOOM!!!*

Captura de la plataforma original en excel


Bonus track: Correcta asignación de circuitos 
En su momento este blog dijo que nuestro modelo estaba exclusivamente diseñado para proyectar en AGREGADO el número de diputados de la oposición. Fuimos muy claros al decir que había –hay- razones para pensar que podíamos equivocarnos en la predicción de cada circuito, pero que estas equivocaciones tenderían a ser insesgadas, es decir, no favorecerían a ningún bando y tenderían a cancelarse entre sí. 
De hecho, esta era la base para decir que la predicción global era, necesariamente, mucho más precisa que la predicción individual de cada circuito.
La plataforma de predicción del 6D fue capaz de predecir acertadamente 98 de los 112 diputados de la oposición, eso es una tasa 87,5% de precisión, nada mal si consideramos que la herramienta no estaba diseñada para esto. Otra resultado interesante es que los errores cometidos, tal y como se esperaba, fueron insesgados. La herramienta cometió un total de 11 falsos negativos (circuitos erróneamente asignados al GPP, pero finalmente ganados por la MUD), mientras que cometió un total de 10 falsos positivos (circuitos erróneamente asignados a la MUD, pero finalmente ganados por el GPP). Un total de 66 aciertos sobre un universo de 87 circuitos.
Voy por mi birra.
Salud!

miércoles, 2 de diciembre de 2015

Update: Dónde nos jugamos el resultado del 6D (y II)

Luego de observar el resultado de los últimos estudios de opinión, y para complacer a vario lectores que lo solicitaron, parecería prudente replicar el ejercicio de la Cota 30 para modelar un potencial triunfo de la oposición por un margen menor.
En el gráfico subsiguiente se observa la Cota 30 anteriormente mostrada, y una estimación de los resultados modelando una ventaja de 20 puntos (Cota 20) y de 10 puntos (Cota 10).

Tres comentarios saltan a la vista en este análisis:
  1. A medida que se modelan brechas más modestas, disminuyen el valor relativo de tener proporcionalmente más votos rurales (la relación se hace más plana). Esto se debe a que, en general, la brecha promedio de ventaja del oficialismo en estos circuitos solo puede ser superada con grandes márgenes a favor de la oposición.
  2. En la Cota 20 (simulando un margen de victoria de 20 puntos a favor de la oposición) la mayoría calificada de 2/3 todavía sería alcanzable. Este resultado requeriría una casi perfecta proporcionalidad entre las ganancias rurales y urbanas del voto opositor (cerca del "1").
  3. En la Cota 10, la oposición puede obtener una mayoría simple, pero las mayorías de 3/5 y 2/3 quedarían fuera de su alcance.  



lunes, 30 de noviembre de 2015

Distortioland Electoral: Dónde nos jugamos el resultado del 6D

A estas alturas del partido, en el análisis sobre las elecciones legislativas pareciera que existe solo una verdad incontrovertible: la oposición ha logrado sacar una sustancial ventaja sobre el oficialismo en el voto nacional. 
Y es cierto. Las encuestas de mejor reputación le dan a la oposición una ventaja de entre 20 y 35 puntos en el voto genérico nacional MUD-PSUV. La matriz de opinión nacional ha evolucionado hacia una donde ya casi nadie discute la posibilidad de un triunfo de la oposición, lo cual no es de extrañar dado el contexto
Sin embargo, mucho menos consenso encontramos en el único tema que importa, en el único resultado fundamental de la elección del 6D: Cuántos diputados puede sacar la oposición.
El tema resulta árido y abundan las opiniones insustanciales. En ausencia de estudios de opinión confiables a nivel circuital, la mayoría de los analistas y encuestadores se sale por la tangente con el cuento de que “esta no es una elección, son 87 elecciones distintas”, por lo cual no hay forma de predecir el número de diputados partiendo de las encuestas nacionales. Otros, los más arriesgados, han (hemos) tratado de analizar empíricamente los datos electorales para hacer una proyección informada del número de diputados por circuito electoral.
Sin embargo, el rango de las proyecciones que han salido a la luz pública es demasiado amplio. Hay de todo: desde los que predicen una mayoría simple de 86 diputados para la oposición, hasta los que predicen que la oposición podría obtener hasta 143 diputados, pasando por mi predicción que la oposición estaría cerca de la mayoría calificada con 111 diputados.

Quién tiene la razón

Todos y nadie. La verdad es que el problema de fondo es que existe una gran incertidumbre sobre una variable que nadie ha mencionado y que resulta crucial: Cómo se distribuyen territorialmente las ganancias electorales de la oposición.
Supongamos que es cierto que la oposición gana la elección con 30 puntos de ventaja. Supongamos además, para hacerlo aún más dramático, que la oposición avanza su votación en todos y cada uno de los 87 circuitos del país. Aun así – AUN ASÍ  - el rango de resultados plausibles es muy (demasiado) amplio.
Para ilustrar este punto aquí presento la Cota 30, uno de los gráficos más bonitos que he cosechado:


Lo primero que hay que decir sobre este gráfico es que cada punto representa el número de diputados que obtendría la MUD en un escenario polarizado bajo diferentes circunstancias.  Lo segundo es que es una curva de nivel, es decir, todos los puntos –TODOS– son consistentes con una diferencia de 30 puntos en el voto nacional.
Las circunstancias que se ven reflejadas en este gráfico son mas o menos obvias para la mayoría de gente que sigue estas cosas: No todos los circuitos fueron creados iguales. Por diferentes razones que no voy a explicar aquí, el circuito típico donde domina la oposición es, en promedio, mucho más urbano y mucho más denso en población, que el circuito típico dominado por el chavismo.
Con lo anterior en mente, vale la pena precisar algunos detalles sobre el gráfico de arriba. En él se modela, partiendo de los resultados de Abril de 2013, cuál sería la distribución de curules de la AN en distintos escenarios dónde la oposición saca 30 puntos de ventaja en el voto nacional. 
En el eje horizontal se presenta la relación de proporción de las ganancias electorales de la oposición entre zonas rurales y urbanas. Por ejemplo, el número “1” en el eje horizontal representa un punto en que las ganancias de la oposición son perfectamente proporcionales en todos los circuitos (un crecimiento uniforme de X% en todas las circunscripciones). Del lado derecho del “1”, las ganancias son relativamente más grandes en los circuitos rurales, es decir, por cada voto adicional que obtiene la oposición en un circuito rural, la oposición obtiene menos de 1 voto adicional en un circuito urbano. Por último, del lado izquierdo del “1”, la oposición saca proporcionalmente mejores ganancias en circuitos urbanos que en los rurales, es decir, por cada voto urbano, saca menos de un voto rural. 
La conclusión mas evidente es casi trivial, una mayoría calificada para la oposición necesita transformar esa ventaja de 30 puntos en una “mezcla adecuada” de votos adicionales entre zonas urbanas y rurales. La segunda conclusión es que la relación encontrada tiende a ser altamente no-lineal, lo cual no es sorprendente dada los problemas de representatividad en la estructura de esta elección, donde los sesgos del malapportionment (principalmente), implican una sub-representación de los votantes en zonas más urbanas. Por último, habría que ratificar la idea original de este post: el gráfico ilustra de manera sencilla que una brecha de 30 puntos es una ventaja formidable para la oposición, pero hay otros factores importantes que decidirán el tipo de mayoría a la cual podría acceder la oposición.
En esta simulación, para alcanzar la mayoría calificada de 2/3, la oposición requiere movilizar aproximadamente 1 voto rural por cada 2 votos urbanos adicionales. Claro está, la relación no tiene que ser exactamente igual a la mostrada en el gráfico, pues tanto las definiciones de circuito “rural" y "urbano”, como los parámetros utilizados, han sido elegidos arbitrariamente con la finalidad de ilustrar una conclusión que es generalizable. 

Para la noche del 6D

Para sacar algo interesante de este análisis se debe pasar revista a cuáles son las fuerzas en juego la noche del 6D. En primer lugar, la oposición, montada sobre la ola de descontento nacional, se enfila a obtener ganancias en TODOS los circuitos con respecto a su mejor resultados anterior. Sin embargo, es de esperar que concentre sus recursos de movilización y defensa del voto principalmente en circuitos donde tradicionalmente ha sido más fuerte -circuitos más urbanos-. Correspondientemente, el oficialismo tratará de detener el avance de la oposición en todos los circuitos y tratará, además, de hacerlo “como sea”, pero es probable que sea relativamente más exitoso deteniendo el avance de la oposición en aquellos circuitos donde el aparato del estado en más determinante en la vida económica y social de la población -circuitos más rurales-.
Por último, para volver al título de este post: dónde nos jugamos el resultado del 6D. La mayoría calificada pasa por consolidar la supremacía electoral de la oposición en las grandes ciudades, pero deberá tener avances notables en zonas rurales y menos densas. En mi opinión, si la noche del 6D empezamos a observar triunfos de la oposición en circuitos mixtos, que incluyen zonas rurales y pequeñas ciudades, como Turmero (C2 Aragua), Puerto Cabello (C1 Carabobo), Guanare (C1 Portuguesa), La Victoria (C3 Aragua), Barinas (C1 Barinas), Carora (C2 Lara), Altagracias Orituco (C1 Guarico), Villa de Cura (C4 Aragua), San Fernando (C3 Apure) o Carúpano (C1 Sucre), entonces sabremos que la oposición va enrumbada a obtener la mayoría de 2/3 de la Asamblea Nacional. 

Esos son los circuitos que yo estaré siguiendo.

Update: Varios lectores hicieron el comentario sobre el tipo de tendencia del gráfico original. Esta versión modifica el gráfico para reflejar una tendencia exponencial en vez de una cuadrática.

martes, 18 de agosto de 2015

Distortioland Electoral: ¿Quién ganará las elecciones parlamentarias del 6D?





Nos encontramos de nuevo ad portas de un evento electoral, quizá el más trascendental de los últimos 16 años.En este punto, una vez decantado el debate sobre las candidaturas en ambos lados del espectro político, la atención empieza a centrarse en los posibles resultados de la elección del 6D. 
Como es usual en este tipo de eventos, la dificultad principal que encontramos a la hora de decir algo sobre los posibles resultados del 6D es la de siempre: No existen encuestas de opinión que permitan inferir el comportamiento de los votantes a nivel del circuito, que es la unidad electoral relevante para esta elección. Hasta ahora solo se dispone de varios estudios nacionales, que parecen revelar que, por primera vez en 16 años, la oposición acude a un evento electoral con un claro favoritismo y una amplia ventaja con respecto al oficialismo.
Es cierto que el sistema electoral venezolano tiene sesgos intrínsecos que favorecen al oficialismo en estas elecciones, es muy cierto que hay serios problemas de malapportionmenty ha habido intentos firmes de gerrymandering, pero sin ninguna duda, lo que realmente define al sistema electoral que regirá la elección de representantes a la Asamblea Nacional es su sesgo mayoritario: El ganador se lleva más de lo que le toca. Esta característica  producto del mayor peso que tiene el número de diputados electos nominalmente y la legalización del truco de las morochas, que anula en la práctica el principio de representación proporcional, favorece circunstancialmente a la oposición.  
El problema es que esta elección no es una elección, sino 87 elecciones distintas, por lo tanto, es bastante limitado lo que uno puede decir acerca del resultado circuital a partir de estudios de opinión nacional. Algunos medios hacen una proyección lineal de las encuestas sobre cada uno de los circuitos, pero este método no solo es incorrecto, sino bastante holgazán. Iñaki Sagarzazu en su excelente blog YVPolis (recomendado), analiza las tendencias históricas de la votación de cada centro electoral, para concluir que la oposición parte con desventaja en la elección del 6D. Sin embargo, el método no incorpora la debacle que está experimentando el oficialismo en todas las encuestas. Por su parte, Bank of America proyecta los efectos de la intención de voto nacional sobre el resultado de los circuitos, prediciendo un amplio triunfo para la oposición. El método es muy informativo, pero el carácter ad-hoc del modelo lo hace algo arbitrario. 

¿Qué hacer entonces? 

Como mencionamos, la elección del 6D será la agregación de 87 elecciones  distintas. Serán esas 87 elecciones por circuitos -y su agregación posterior a nivel estadal- dónde se elegirán 113 diputados nominales, 51 diputados por lista, y 3 diputados indígenas, para un gran total de 167 diputados.
Lo primero es reconocer que cada uno de los 87 circuitos tiene características locales, demográficas y económicas distintas. Ese es el punto de partida para tratar de inferir lo que pasará a nivel de los circuitos. Entonces, en ausencia de datos de opinión que sean representativos a nivel de circuito, no queda otra sino modelarlos basado en supuestos. 

¿Cómo?

Nuestro modelo parte del principio de que cada circuito es influenciado por el debate político a nivel nacional, pero que esa influencia es diferente en cada circuito. Modelar esto es una tarea que pudiera ser tan compleja cómo la disponibilidad de datos y tiempo lo permita. Sin demasiado tiempo ni datos entre manos, la estrategia propuesta es simple: Calcular, basado en los resultados históricos de cada circuito, la sensibilidad de la votación oficialista, a una variable medida nacionalmente que resuma las tendencias de “la opinión pública”. 
Técnicamente hablando, se trata de estimar, para cada circuito, la elasticidad de la tasa de votación oficialista a una variable de “opinión de situación del país”. La estimación de elasticidades individuales de cada circuito, se basa en 87 regresiones univariadas log-log, utilizando como insumos los resultados históricos de las elecciones en cada circuito y la serie larga de opinión positiva sobre la situación del país de la empresa Datanalisis. 

A tener en cuenta: 

  1. Cada elasticidad se debe leer como la variación porcentual del voto oficialista en el circuito, por cada punto porcentual de variación de la opinión positiva sobre la situación del país. Esta medida toma en cuenta el resultado histórico de cada circuito, y lo relaciona con la opinión pública nacional de una manera que es específica a cada circuito.Un elasticidad cercana a cero es indicio de un circuito insensible a las tendencias nacionales, una elasticidad más cercana a uno revela un circuito más sensible a cambios en las tendencias nacionales.
  2. El modelo es extremadamente simple. Hay, por supuesto, otros muchos factores que pudieran incidir en el resultado por circuito. Por ejemplo, tener un buen/mal candidato de la oposición frente a un buen/mal candidato del gobierno, el efecto de tener un alcalde/gobernador aliado, y otros muchos factores idiosincráticos.
  3. El modelo asume un escenario totalmente polarizado. No se consideran candidatos "independientes", "terceras vías" o afines. 
  4. A pesar de lo anterior, hay razones para pensar que la predicción puede tener errores, pero estos errores serán insesgados, es decir, no favorecerán a ningún bando y tenderán a cancelarse entre si. Es por ello que la predicción global puede ser más precisa que la predicción individual de cada circuito.
  5. Como el modelo subyacente es de una sola variable, lo único que se necesita para "predecir" el resultado global de la elección es proyectar el nivel de la opinión "positiva" sobre la situación del país (Datanalisis), antes de las elecciones del 6D. En la encuesta de Julio, solo el 12,8% de la gente consideraba positiva la situación del país.
  6. Una versión más rudimentaria de esta herramienta demostró ser muy efectiva prediciendo el resultado de las elecciones parlamentarias del 26S de 2010.

Resultados:


Los resultados de las 87 simulaciones de voto por circuito, más su agregación, nos permitió construír un "simulador de resultados del 6D", que utiliza cómo insumo único la variable de "% de encuestados que piensa que la situación del país es positiva" medida por Datanalisis.

La última encuesta Omnibus de Datanalisis de Julio 2015 indica que solo el 12,8% de los encuestados considera como "positiva" la situación del país. Esto es una caída de 77% con respecto al nivel que tenía este indicador en abril de 2013.

De acuerdo al modelo de inferencia, en un escenario como este la MUD obtendría aproximadamente 56% de los votos, que se transformaría en una mayoría parlamentaria de 105 diputados, desglosados en 74 diputados nominales, 30 diputados por lista y un diputado indígena.

Para información y entretenimiento, se puede bajar AQUÍ la versión en excel con la plataforma de simulación de resultados electorales del 6D. 


¿Cuál cree Ud. que será la evaluación positiva de la situación del país al cierre de noviembre de 2015?