
En la madrugada del lunes 8 de septiembre próximo sabremos “con exactitud” el resultado de las elecciones legislativas de la provincia de Buenos Aires. Pero existen las personas ansiosas, que quieren saber “ya mismo” los apellidos de los ganadores y los de los perdedores. No confiando en los pálpitos, consultan a encuestadores, que basan sus afirmaciones en muestras. Quizás por ignorancia, muy probablemente por la presión de sus clientes y los periodistas, publican estimaciones puntuales (¡y encima con decimales!), cuando deberían publicar rangos, para reflejar el inevitable error implícito en cualquier muestra. ¿Cómo debemos interpretar los hallazgos de los encuestadores?
Al respecto me asesoré con el francés Augustin Louis Cauchy (1789-1857), quien fue persuadido por Pierre Simon Laplace y Joseph Louis Lagrange, amigos de su padre, para dedicarse a las matemáticas. Estudió en la Escuela Politécnica de París y en la Escuela de Puentes y Canales. En 1830 se exilió en Turín y en Praga, trabajando como tutor. Regresó a París ocho años después y desde entonces enseñó en La Sorbona. Su obra completa fue publicada en 27 volúmenes. Existen la condición, la conjetura, la desigualdad, la ley, el problema, la sucesión y el teorema de Cauchy.
–Una distribución de probabilidades está asociada con su apellido.
–Así es. Una distribución de probabilidades es una función que asocia cada valor posible de determinada variable, con su correspondiente probabilidad. Es tal la popularidad de la curva normal inventada por Carl Friedrich Gauss, también conocida como de campana, que muchísima gente asocia el producto con una marca. Es el ideal de los publicistas, que los consumidores digan Geniol en vez de analgésico, o Xerox en vez de fotocopia. También existen las distribuciones de probabilidades binomial, uniforme, de Simeon Denis Poisson o de Laplace, entre otras.
–¿Qué caracteriza a la suya?
–Tiene una forma parecida a la de la distribución normal, pero con extremos más largos y más gruesos. Se utiliza principalmente para ejemplificar situaciones patológicas, como las ilustradas por Nassim Nicholas Taleb en El cisne negro.
–A lo nuestro. ¿Qué tiene para decirle a quienes viven comiéndose las uñas porque no pueden esperar al resultado de las urnas?
–Distingamos entre universo y muestras. Universo es una totalidad: ejemplo, todos los hinchas de Vélez Sarsfield. Muestra es una porción del universo: ejemplo, todos los socios del referido club. Hablo en plural porque pueden existir muchas muestras de un mismo universo. En el caso de la provincia de Buenos Aires, el resultado del universo recién se conocerá cuando se cuenten todos los votos.
–¿Qué pueden hacer los ansiosos?
–Una encuesta que interrogue a todos los votantes, y rezando para que al encuestador le digan la verdad y no cambien su intención de voto entre el momento en que responden la encuesta y el momento de emitir un voto.
–Esto es claramente costosísimo.
–Precisamente por eso se inventaron las muestras, materia sobre la cual hay mucha teoría y también mucha experiencia. En el caso de la votación, consultar al universo es costosísimo. En otros casos, es totalmente contraproducente. Imagínese que, para estar seguro de cómo está su sangre, el médico no le extrajera una pequeña muestra sino toda la que tiene en su cuerpo. El diagnóstico carecería de error muestral, pero usted se moriría.
–Error muestral, ¿de qué habla?
–Me refiero a que, por más que la encuesta sea realizada al azar y estratificada, no hay absoluta certeza de que el valor obtenido en la muestra coincida con el respectivo valor en el universo.
–¿Y entonces?
–Que los valores obtenidos en las muestras no tienen que ser publicados como números únicos, y menos con decimales, sino como rangos. Ejemplo: el encuestador no debe decir que la intención de voto del candidato X es de 32,8%, sino que está entre, por ejemplo, 30% y 34%, con Y% de error muestral.
–¿Cómo se estima el error muestral?
–Por el tamaño de la muestra, y también por la distribución de probabilidades que se cree que existe en el universo. Esta forma de presentación de los resultados puede resultar menos impactante, pero es más apropiada. A propósito: cuando, luego de una elección, los medios de prensa felicitan al encuestador que acertó, éste –para sí, aunque no lo diga públicamente– sabe que esto tuvo un importante componente de azar.
–El error muestral es inevitable.
–Sí, lo importante es entender el conflicto que existe entre la precisión que se le exige a la estimación de la muestra y el correspondiente error muestral. Quien exige que la estimación sea puntual, y encima con decimales (como el referido 32,8%), tiene que saber que el error muestral será altísimo. Por el contrario, el encuestador que diga que la intención de voto de determinado candidato está entre 0% y 100% seguramente que no va a fallar, pero este resultado no sirve para nada.
–En el caso electoral el problema es peor, porque se quiere saber qué candidato le va a ganar a cuál otro.
–Efectivamente. El encuestador profesionalmente responsable tiene que decir que la intención de voto del candidato J se ubica en el rango entre 40% y 44%, mientras que el del candidato K se ubica entre 39% y 43%; todo con un error muestral de X%. Y por consiguiente, en función de la encuesta, no hay cómo anticipar de manera plausible, el resultado del comicio.
–Distinto sería si en el universo la intención de voto estuviera muy separada, ejemplo, si un candidato tuviera el 85% de los votos y el otro, el 15% restante.
–Claro, porque en este caso aún una encuesta técnicamente defectuosa muy probablemente anticipara el resultado que finalmente surgiría de las urnas. No parece ser el caso, en la provincia de Buenos Aires, entre los candidatos de Frente La Libertad Avanza y Fuerza Patria.
–Estamos para el suicidio.
–De ninguna manera. Lo que hay que hacer es entender, para no comprar buzones. El universo no se puede falsificar, es ése (más allá de que, en el caso de las elecciones, la intención de voto puede modificarse). Y cuando en el universo la intención de voto es muy parecida, es muy difícil que sepamos algo antes del 7 de septiembre próximo.
–A pesar de lo cual, hasta el día de las elecciones, algunas radios y estaciones de TV dedicarán el grueso de la programación a anticipar los resultados y conjeturar sobre las posibles consecuencias.
–Bueno, con algo hay que entretenerse, a la espera de que las urnas “hablen”. Pero no les pidamos ni a la teoría de las encuestas ni a quienes la utilizan profesionalmente lo que no están en condiciones de dar. Porque la dificultad está en el universo, no en las muestras.
–Don Augustin, muchas gracias.
En la madrugada del lunes 8 de septiembre próximo sabremos “con exactitud” el resultado de las elecciones legislativas de la provincia de Buenos Aires. Pero existen las personas ansiosas, que quieren saber “ya mismo” los apellidos de los ganadores y los de los perdedores. No confiando en los pálpitos, consultan a encuestadores, que basan sus afirmaciones en muestras. Quizás por ignorancia, muy probablemente por la presión de sus clientes y los periodistas, publican estimaciones puntuales (¡y encima con decimales!), cuando deberían publicar rangos, para reflejar el inevitable error implícito en cualquier muestra. ¿Cómo debemos interpretar los hallazgos de los encuestadores?
Al respecto me asesoré con el francés Augustin Louis Cauchy (1789-1857), quien fue persuadido por Pierre Simon Laplace y Joseph Louis Lagrange, amigos de su padre, para dedicarse a las matemáticas. Estudió en la Escuela Politécnica de París y en la Escuela de Puentes y Canales. En 1830 se exilió en Turín y en Praga, trabajando como tutor. Regresó a París ocho años después y desde entonces enseñó en La Sorbona. Su obra completa fue publicada en 27 volúmenes. Existen la condición, la conjetura, la desigualdad, la ley, el problema, la sucesión y el teorema de Cauchy.
–Una distribución de probabilidades está asociada con su apellido.
–Así es. Una distribución de probabilidades es una función que asocia cada valor posible de determinada variable, con su correspondiente probabilidad. Es tal la popularidad de la curva normal inventada por Carl Friedrich Gauss, también conocida como de campana, que muchísima gente asocia el producto con una marca. Es el ideal de los publicistas, que los consumidores digan Geniol en vez de analgésico, o Xerox en vez de fotocopia. También existen las distribuciones de probabilidades binomial, uniforme, de Simeon Denis Poisson o de Laplace, entre otras.
–¿Qué caracteriza a la suya?
–Tiene una forma parecida a la de la distribución normal, pero con extremos más largos y más gruesos. Se utiliza principalmente para ejemplificar situaciones patológicas, como las ilustradas por Nassim Nicholas Taleb en El cisne negro.
–A lo nuestro. ¿Qué tiene para decirle a quienes viven comiéndose las uñas porque no pueden esperar al resultado de las urnas?
–Distingamos entre universo y muestras. Universo es una totalidad: ejemplo, todos los hinchas de Vélez Sarsfield. Muestra es una porción del universo: ejemplo, todos los socios del referido club. Hablo en plural porque pueden existir muchas muestras de un mismo universo. En el caso de la provincia de Buenos Aires, el resultado del universo recién se conocerá cuando se cuenten todos los votos.
–¿Qué pueden hacer los ansiosos?
–Una encuesta que interrogue a todos los votantes, y rezando para que al encuestador le digan la verdad y no cambien su intención de voto entre el momento en que responden la encuesta y el momento de emitir un voto.
–Esto es claramente costosísimo.
–Precisamente por eso se inventaron las muestras, materia sobre la cual hay mucha teoría y también mucha experiencia. En el caso de la votación, consultar al universo es costosísimo. En otros casos, es totalmente contraproducente. Imagínese que, para estar seguro de cómo está su sangre, el médico no le extrajera una pequeña muestra sino toda la que tiene en su cuerpo. El diagnóstico carecería de error muestral, pero usted se moriría.
–Error muestral, ¿de qué habla?
–Me refiero a que, por más que la encuesta sea realizada al azar y estratificada, no hay absoluta certeza de que el valor obtenido en la muestra coincida con el respectivo valor en el universo.
–¿Y entonces?
–Que los valores obtenidos en las muestras no tienen que ser publicados como números únicos, y menos con decimales, sino como rangos. Ejemplo: el encuestador no debe decir que la intención de voto del candidato X es de 32,8%, sino que está entre, por ejemplo, 30% y 34%, con Y% de error muestral.
–¿Cómo se estima el error muestral?
–Por el tamaño de la muestra, y también por la distribución de probabilidades que se cree que existe en el universo. Esta forma de presentación de los resultados puede resultar menos impactante, pero es más apropiada. A propósito: cuando, luego de una elección, los medios de prensa felicitan al encuestador que acertó, éste –para sí, aunque no lo diga públicamente– sabe que esto tuvo un importante componente de azar.
–El error muestral es inevitable.
–Sí, lo importante es entender el conflicto que existe entre la precisión que se le exige a la estimación de la muestra y el correspondiente error muestral. Quien exige que la estimación sea puntual, y encima con decimales (como el referido 32,8%), tiene que saber que el error muestral será altísimo. Por el contrario, el encuestador que diga que la intención de voto de determinado candidato está entre 0% y 100% seguramente que no va a fallar, pero este resultado no sirve para nada.
–En el caso electoral el problema es peor, porque se quiere saber qué candidato le va a ganar a cuál otro.
–Efectivamente. El encuestador profesionalmente responsable tiene que decir que la intención de voto del candidato J se ubica en el rango entre 40% y 44%, mientras que el del candidato K se ubica entre 39% y 43%; todo con un error muestral de X%. Y por consiguiente, en función de la encuesta, no hay cómo anticipar de manera plausible, el resultado del comicio.
–Distinto sería si en el universo la intención de voto estuviera muy separada, ejemplo, si un candidato tuviera el 85% de los votos y el otro, el 15% restante.
–Claro, porque en este caso aún una encuesta técnicamente defectuosa muy probablemente anticipara el resultado que finalmente surgiría de las urnas. No parece ser el caso, en la provincia de Buenos Aires, entre los candidatos de Frente La Libertad Avanza y Fuerza Patria.
–Estamos para el suicidio.
–De ninguna manera. Lo que hay que hacer es entender, para no comprar buzones. El universo no se puede falsificar, es ése (más allá de que, en el caso de las elecciones, la intención de voto puede modificarse). Y cuando en el universo la intención de voto es muy parecida, es muy difícil que sepamos algo antes del 7 de septiembre próximo.
–A pesar de lo cual, hasta el día de las elecciones, algunas radios y estaciones de TV dedicarán el grueso de la programación a anticipar los resultados y conjeturar sobre las posibles consecuencias.
–Bueno, con algo hay que entretenerse, a la espera de que las urnas “hablen”. Pero no les pidamos ni a la teoría de las encuestas ni a quienes la utilizan profesionalmente lo que no están en condiciones de dar. Porque la dificultad está en el universo, no en las muestras.
–Don Augustin, muchas gracias.
El resultado de una encuesta debe publicarse como rango, no como número, y menos con decimales LA NACION