sábado, 30 de agosto de 2014

Estadísticas y predicción: arte, ciencia y manipulación




SACATE EL ANTIFAZ QUE TE QUIERO CONOCER
Predicción y encuestas: ¿arte, ciencia y en algunos casos manipulación?

Fernando Britos V.
En la Grecia clásica las leyendas incluían invariablemente a los adivinos, oráculos y pitonisas. Sus historias son tan divertidas como variadas en cuanto al papel que jugaba la predicción en un mundo sin medios electrónicos de comunicación, sin grandes negocios pero cruzados por fuertes pasiones, por el ansia de conocer el futuro, por el deseo de imponerse y por las picardías y designios de unos dioses extraordinariamente humanos.
Tiresias, un adivino de Tebas, fue según la leyenda el único mortal que vivió parte de su vida como hombre y parte como mujer. Siendo joven vio a dos serpientes copulando y mató a la hembra, acción por la cual inmediatamente quedó convertido en mujer. Siete años más tarde, paseando por el mismo sitio, vio a otras dos serpientes acopladas y repitió su acción merced a lo cual recuperó su sexo original.
Su aventura lo hizo célebre de modo que cuando Zeus y Hera, la pareja de dioses supremos del Olimpo, disputaban acerca de cual de los sexos experimentaba mayor placer en el amor consultaron a Tiresias[1] lo que tuvo serias consecuencias. Tiresias, el longevo adivino ciego, que obtuvo su capacidad adivinatoria a causa de su experiencia transexual, también inauguró una familia de adivinos, cosa que también suele suceder hoy en día.
Otro gran adivino fue Calcante, un especialista en la interpretación del vuelo de las aves y el autor intelectual del caballo de Troya y de otras importantes decisiones políticas de los tiempos homéricos. La leyenda de este personaje demuestra que fue en realidad un operador político que utilizó sus poderes proféticos para legitimar  las orientaciones que dio.
Calcante había recibido tempranamente una profecía sobre su propio destino: él moriría el día en que otro adivino le superase. El día llegó en Colofón, donde vivía Mopso (un nieto de Tiresias) junto a cuya casa había una higuera. Calcante desafió al joven adivino pidiéndole que le dijese cuantos higos cargaba el árbol. La respuesta fue “diez mil y un celemín y un higo de más” lo cual fue comprobado por los testigos. A su vez Mopso, señalando una cerda preñada le preguntó a Calcante cuantos lechones llevaba y este contestó que eran ocho. El joven le rebatió diciendo que eran nueve y que la equivocación se vería a las seis de la mañana siguiente momento en que se produciría el parto. La cosa resultó como Mopso lo predijo y Calcante se suicidó.
El caso más interesante acerca del destino de los adivinos es el de Casandra y con él abandonaremos la mitología para acercarnos a nuestra época. Casandra era hija de Príamo y Hécuba, los reyes de Troya y por ende hermana de Héctor y melliza de Héleno. El dios Apolo, patrono de todos los profetas y adivinos, se enamoró de la joven y le prometió enseñarle a profetizar si se entregaba a él. Casandra aceptó y recibió la enseñanza pero cuando llegó el momento de cumplir su parte se echó atrás. Apolo enfurecido le escupió en la boca y, en esa forma, la privó del don de la persuasión aunque no del de la profecía. De este modo Casandra era capaz de avizorar el futuro pero estaba condenada a que nadie le creyera.
De hecho en la gesta homérica, Casandra hizo predicciones de todos los acontecimientos importantes de la Guerra de Troya y se desesperó al ser sistemáticamente ignorada. Después de la caída de Troya, Casandra formó parte del botín del jefe de los aqueos, Agamenón, quien se enamoró violentamente de ella. Una vez de regreso en Micenas, la esposa de Agamenón, los mató a ambos en un ataque de celos. Se supone que la desventurada Casandra también había presagiado su muerte.
En el siglo XIX, el escritor estadounidense Mark Twain dijo que existían mentiras, malditas mentiras y estadísticas. La verdad es que en el tiempo transcurrido desde ese sarcasmo las cosas no han cambiado mucho. Sin embargo, en la patria de las encuestas de opinión, y a partir del potencial manipulador y tramposo que entraña el mal uso de la estadística, existen exigencias más estrictas y las empresas encuestadoras están obligadas a someter a escrutinio público sus métodos y a mostrar cómo llegan a las conclusiones que publican (la ficha técnica).
La predicción como intento de desvelar lo que va a suceder en el futuro incluye una gama muy amplia de acciones humanas, desde la astrología y “artes adivinatorias” hasta ciertas técnicas que podríamos a considerar científicas.  En cuanto a los astrólogos, grafólogos, adivinos y videntes, suelen aprovechar la situación de quienes se encuentran en una situación psicológica de vulnerabilidad como para dejar de lado su sentido común y su espíritu crítico en su afán de obtener determinadas respuestas. En esos casos, quienes abusan de la "fe pública" consiguen que les paguen por sus predicciones y este es un gran negocio. Un juego de salón, un truco o un simple entretenimiento puede emplearse para manipular a los crédulos.
La predicción ha sido, desde los filósofos jónicos de hace unos 2.600 años, una intención del conocimiento humano siempre provisorio y creciente y una de "las madres de la ciencia" (junto con la necesidad, al decir arábigo). La inferencia estadística es una importante disciplina auxiliar de la ciencia, vinculada con las matemáticas y la lógica, que aspira a obtener un conocimiento de los más diversos fenómenos a través de métodos predictivos.

La pseudociencia mete la mano - Para prevenir los errores de juicio es preciso precaverse de la pseudociencia. En vista de los avances de la ciencia una amplia gama de charlatanes, de incautos o de sujetos carentes de formación, de honestidad o de ambas cosas, aseguran que sus métodos son científicos, es decir que se apoyan en procedimientos válidos y confiables, reproducibles y basados en hechos y evidencias comprobables que excluyen lo sobrenatural.
Lo sobrenatural, aquello que no puede ser probado, no es despreciable o rechazable pero pertenece a otros dominios de la acción humana como son el arte o la religión. Las concepciones religiosas son cuestión de fe y las artísticas de inspiración. Todos esos dominios son respetables pero no son intercambiables, verbigracia la inspiración artística no es científica ni religiosa; la creencia religiosa no es materia científica y en sentido estricto no es una experiencia artística.
La pseudociencia o falsa ciencia es engañosa y peligrosa porque asegura que sus afirmaciones son comprobables por medios científicos y reproducibles aunque nunca someten a escrutinio sus procedimientos o se desintegran en el aire cuando son sometidos a comprobación experimental. Utilizan el prestigio de la ciencia pero no practican la transparencia y no cumplen las exigencias éticas del método científico.
Las disciplinas predictivas son especialmente vulnerables a los engaños de la pseudociencia. La publicidad suele utilizar números, porcentajes o nombres de sustancias en forma vaga para llevar agua a su molino. Frecuentemente se ve avisos de champúes para el pelo que ofrecen 70% más brillo (¿más brillo en comparación con qué?), detergentes que matan el 99,5% de las bacterias (sin perjuicio que el 0,5% restante puedan las más prevalentes y mortales) o productos que incluyen ceramidas, quinolonas u otros sonoros compuestos presunta e inexplicadamente benéficos.
La estadística y el destino – Sucede que la estadística, es siempre tendencial, es decir marca tendencias o probabilidades pero, por definición, no es absoluta. Probable no es seguro especialmente en la conocida falacia del jugador [2].
Ejemplos abundan pero citaremos solamente el del famoso científico Stephen Jay Gould (consultar su texto "La mediana no es el mensaje") a quien se le diagnosticó a los cuarenta años un tipo de cáncer que según las estadísticas de morbimortalidad provocaba la muerte de más del 80% de los pacientes dentro de los seis meses a partir del diagnóstico.
Gould, en lugar de considerar ese dato como una condena a muerte en plazo breve resolvió luchar para incluirse en el porcentaje de quienes sobrevivían para lo cual hizo un análisis de la información estadística que sigue siendo ejemplar y luchó contra la enfermedad de modo que consiguió prolongar su vida por veinte años más. En esos años produjo la mayoría de sus obras más destacadas, vivió con calidad y no murió a causa del cáncer primario o metástasis del mismo.
A pesar de las diferencias que todos conocemos entre lo posible, lo probable y lo que efectivamente sucede, muchas personas llegan a "creer" en la certeza de los pronósticos estadísticos o a relegar cualquier curiosidad acerca de las alternativas, los procedimientos en que se basan esas estadísticas, el verdadero alcance de la predicción y los verdaderos antecedentes e idoneidad de los augures.
Las predicciones suelen acusar un grado de imprecisión, incluso elevado, cuando se coteja el pronóstico con lo que efectivamente sucedió. En el caso de las encuestas de opinión se sabe, hace mucho tiempo, que los errores pueden ser garrafales y además que los resultados pronosticados pueden ser utilizados para "producir" determinados resultados.
El espíritu gregario de los seres humanos, que tan buenos resultados evolutivos ha dado a nuestra especie, el Homo Sapiens Sapiens, tiende a hacernos pizarreros y propensos a creer en ciertas mayorías sin beneficio de inventario.
Un caso histórico de predicción errónea se remonta a las aplicaciones masivas de encuestas de opinión electoral, precisamente en los Estados Unidos, en 1936. En aquel entonces, una encuesta nacional pronosticó una derrota total del Partido Demócrata y su candidato presidencial Franklin Roosevelt.
Culminado el escrutinio los resultados fueron exactamente opuestos a lo pronosticado por esa encuesta: Roosevelt arrasó. Entonces se conocieron las razones del vergonzoso fracaso: había sido hecha telefónicamente y mediante tarjetas postales enviadas a más de dos millones de votantes. En aquel entonces, aún en los Estados Unidos, los pobres y la clase media, mayoritariamente votantes de Roosevelt, no tenía teléfono en su domicilio mientras que los pudientes que apoyaban al candidato del Partido Republicano los tenían invariablemente y contestaban las tarjetas postales[3].
La soberbia de algunos pronosticadores suele ser tan grande como su falibilidad. Los empresarios que han hecho su fama y fortuna con las encuestas (de opinión, de mercado, etc.) corren el peligro de desarrollar "el síndrome del Titanic", un comportamiento omnipotente y narcisista que provoca la negación del error y el desarrollo de ideas grandiosas de infalibilidad con la consiguiente desaparición de la humildad y la capacidad autocrítica.
Este síndrome funciona a veces como un argumento de negocios porque algunos encuestadores, algunos psicólogos seleccionadores de personal y otros peritos infatuados con sus diagnósticos sobre las personas, pertenecen al género de "los mercaderes de la certeza".
Estos personajes, que en esta época se transforman en estrellas mediáticas, relegando a un segundo plano a los más convencionales o extravagantes competidores del pronóstico meteorológico, reaccionan airadamente cuando alguien les recuerda que no son infalibles y que sus interpretaciones pueden derivar en una manipulación de los resultados. Esto es lo que sucedió cuando el Dr. Tabaré Vázquez tocó el punto y el dueño de una de estas empresas le replica arrogándose ser el dueño de la realidad y recomendándole que “si no le gusta haga por cambiarla”.
Pretensión de veracidad y manipulación política - Mucho se ha escrito sobre la diferencia entre opinión pública y ciudadanía. Si esta última requiere información y participación es claro que las estadísticas y en particular las encuestas apenas brindan un sustituto, netamente insuficiente y engañoso, de dichas características. En efecto, cualquier medio de comunicación está lleno, hoy en día, de cifras, cuadros y gráficas, las llamadas infografías, que pretenden dar cuenta o mostrar el “estado” de la realidad (de ahí estadística [4])
Hay encuestadores que  defienden su negocio presentándose como fieles reflectores de la realidad, técnicos neutrales que dicen lo que sucede o lo que va a suceder como observadores imparciales. El presunto experto puede creerse investido de esas condiciones pero en las ciencias el punto de vista del observador incide sobre los resultados independientemente de otras intervenciones que tienen que ver con la forma en que se presentan los mismos y se recogen, agrupan o tabulan las cifras.
De  últimas, el viejo dicho que sostiene que “todo depende del color del cristal con que se mira” contiene un átomo de verdad, en tanto no de pie al relativismo que es otra forma de disfrazar la realidad. Desde el momento en que esa objetividad reclamada no existe, lo importante es precisar qué tipo de cristales se han usado, es decir cuáles son los parámetros de interpretación de los datos sensibles. La pedante pretensión de quien sostiene “nosotros solamente reflejamos la realidad” marca dos posibilidades: ignorancia ingenua de los requisitos del método científico o intención de hacer pasar su interpretación como verdadera a sabiendas, precisamente, de los propósitos que se persiguen.
Sacate el antifaz que te quiero conocer – Como se ha visto los números pueden ser manipulados para “demostrar” distintas cosas. Es frecuente la publicación de listas o indicadores ideologizados, producidos por instituciones que establecen rankings que buscan promover determinados conceptos o valores y maquillar a su acomodo la realidad.
Un ejemplo es el llamado “Barómetro latinoamericano del talento” producido por una universidad empresarial privada de la Argentina (Universidad Austral) en su paqueta “Business School”. En una escala del talento que se extiende del 0 al 100 ubica a nuestro país a media tabla (50,3 pts.). Por encima están Chile (56,8) y Brasil (54) y por debajo el pelotón. En el fondo Venezuela y Paraguay con menos de 40 puntos.
Los criterios de evaluación se componen de cinco áreas que los creadores consideran como “propulsoras del talento”, a saber “el Área demográfica” donde Uruguay está en la lona con 1,3 pts.(¡! ) debido a “su fuerza de trabajo escasa” y “su bajo crecimiento poblacional” (es una interpretación, arbitraria y refutada, de los fenómenos demográficos mundiales que asimila la disminución de la natalidad y de la mortalidad, el aumento de la expectativa de vida y otros indicadores, como un signo catastrófico de extinción).
Otra área es “Educación” (donde se mide la proporción del PBI dedicado a educación y en la que nuestro país hace buen papel según ellos). Una tercera refiere a “Apertura económica y atracción de inversión extranjera directa” (donde Uruguay es superado por Perú y Chile). Una cuarta área alude a “Entorno político y calidad de las instituciones” (siempre con Chile a la cabeza <que dicho sea de paso es considerada por la CEPAL una de las sociedades más desiguales del continente>  y habría que ver cómo, a la luz de eso, “componen” los indicadores en un membrete tan complejo).
En un área denominada “Entorno económico y bienestar humano” Uruguay se ubica entre los peores solo por encima de Venezuela y Bolivia (se dice que, a pesar del elevado Índice de Desarrollo Humano de Naciones Unidas, nuestro país se ha sumergido por el “incremento en el costo de vida” y “la caída en la tasa de crecimiento”. Cualquier distorsión de la realidad y similitud con argumentos de campaña política contra el gobierno son, obviamente, deliberados).
Finalmente, en el área “Entorno laboral” Uruguay aparece con 52 pts., segundo por detrás de Chile, porque “posee uno de los índices más altos en protección de los derechos de propiedad y en innovación” (está clarito que los derechos de los trabajadores y los empresarios no es lo que les importa a estos manipuladores; para ellos los derechos de la propiedad privada priman siempre sobre el bien colectivo).
Índices y escalas como estos son prueba palmaria que se puede dotar de una apariencia numérica a ciertos presupuestos ideológicos. Es decir que se puede mostrar y representar lo que se quiere mostrar y ocultar o amenguar lo que resulta inconveniente. Esta actitud, que afortunadamente es minoritaria entre los investigadores, reúne la condición de ser una violación a la ética y una falla técnica, al mismo tiempo.
Un vistazo a la técnica - Los fraudes en las encuestas de opinión para “impulsar” la imagen de algún candidato, para animar a los indecisos o para galvanizar a las propias fuerzas tienen antecedentes. Los modernos medios electrónicos de comunicación lejos de haber disuadido las prácticas fraudulentas las han favorecido. Es sabido que por unos pocos dólares es posible comprar unos cuantos cientos, miles o cientos de miles de “me gusta”, comentarios elogiosos o visitas interminables en el tembladeral del ciberespacio.
Para evitar que la aplicación de estudios de opinión (encuestas, censos, entrevistas y paneles, etc.) pierda prestigio y credibilidad, se han establecido en muchos países determinados requisitos o exigencias que los encuestadores deben cumplir. En otros como el nuestro los profesionales intentan auto regularse adoptando un código deontológico que les requiere transparentar como llegaron a las cifras y porcentajes que presentan.
El censo o padrón de personas y haciendas que sistematizaron los romanos hace unos de 2.200 años siempre ha tenido pretensiones de abarcar la totalidad de la población en un territorio vasto pero delimitado. Las elecciones nacionales, cuando el voto es obligatorio y salvadas las excepciones, tienen una pretensión censal. Sin embargo, un censo es un gran operativo que requiere la movilización y organización de enormes recursos humanos y financieros.
De este modo surgen las encuestas, que son averiguaciones,  pesquisas  u observaciones destinadas a obtener respuestas de una muestra de la población que represente, con un margen de error tan pequeño o conocido como sea posible, el universo poblacional total.
Por lo general las encuestas se clasifican en descriptivas (las que buscan documentar las actitudes o condiciones de determinada población en el momento de la encuesta) y analíticas (que pretenden explicar lo que sucede o lo que sucederá examinando por lo menos un par de variables). Las encuestas de opinión que buscan determinar el resultado electoral corresponden a este último tipo.
Por razones de economía y celeridad en la obtención de resultados (para seguir los “efectos” de una campaña, de una pieza de campaña, de un discurso o de unas declaraciones, se apela siempre a encuestas de respuesta cerrada lo que entraña ciertos riesgos porque simplifica al máximo la respuesta dado que la persona que responde debe optar por una serie no muy grande de alternativas pre establecidas. Este hecho puede conducir, por ejemplo, a encasillar como “en blanco”, “indeciso”, “otros”, “no sabe/no contesta” a un encuestado que ante un cuestionario abierto y menos apremiante podría dar una respuesta más precisa.
Asimismo, quienes elaboraron el cuestionario pueden tener un conocimiento incompleto de las variables existentes o también la intención, consciente o inconsciente, de sub representar o sobre representar ciertas alternativas. Las encuestas de respuesta cerrada sacrifican la sutileza en aras de una cuantificación que después piensan poder enjugar señalando que existe un “margen de error” más elevado (por ejemplo u 4 o 5%) pero en ellas es clave la “consigna” esto es la formulación de la pregunta que puede llegar a sesgar la respuesta.
            Para obtener datos se apela a distintos “medios de captura”: papel y lápiz (en un cuestionario auto administrado o comúnmente llenado, cara a cara por un encuestador, que es el método más común, más barato y con la menor tasa de rechazo por parte de los encuestados); el teléfono fijo y los celulares (ahorran esfuerzos y aceleran la obtención de resultados en las encuestas de opinión política con una tasa de rechazo no muy elevada pero con cierto grado de ceguera y posibilidad de indefinición y aún de engaño que debería aumentar el margen de error) y los cuestionarios por Internet (que se usan poco por su baja tasa de respuesta y porque los cuestionarios autoadministrados son poco compatibles con las encuestas de opinión política).
La clave para la precisión y rentabilidad de una encuesta radica en la conformación de una muestra. Dado que realizar un censo no es viable y tiene un costo astronómico, los encuestadores construyen una muestra, es decir que identifican a un conjunto de personas para que sean representativas de toda la población, de modo que una variable que se registre en la muestra (por ejemplo preferencia o rechazo hacia un candidato) refleje con la mayor precisión el resultado de un censo que abarque a la totalidad de la población.
            Construir una muestra es muy trabajoso y delicado. Ninguna empresa encuestadora puede ofrecer sus servicios sin tener una o varias muestras debidamente estratificadas de modo que reflejen la composición demográfica de la población (edades, sexos, ubicación geográfica, etc.), su situación socioeconómica (ingresos, ocupación, nivel educativo, vivienda, etc.), sus antecedentes.
Además las muestras deben ser continuamente sometidas a mantenimiento y reemplazo porque inevitablemente van cambiando los integrantes o sus condiciones de modo que mantener la representatividad es un trabajo permanente de “diseño del experimento”.
            Los errores en la selección de los sujetos que integran la muestra afectan en forma a veces previsible y a veces imprevisible su representatividad. Los errores en la selección y correlación de variables (por ejemplo las correlaciones que puedan establecerse n relación con las edades, sexo y nivel educativo de los encuestados pueden afectar seriamente las conclusiones.
El número de integrantes de una muestra tiene cierta relación con la representatividad de modo que si ese número es demasiado pequeño tal vez no incluya suficientes representantes de las categorías con predominancia de variables fundamentales. Sin embargo, empíricamente es posible determinar el tamaño ideal de una muestra, a partir del cual el aumento en el número de sus integrantes no se refleja en un aumento de la confiabilidad.
Se considera que la encuesta por muestreo es exacta que porque los encuestadores están mejor capacitados pero eso es cierto siempre que la muestra esté bien construida y mantenida y dichos encuestadores estén muy bien entrenados, aspectos que cuando lo que se impone es la economía de esfuerzos y la rapidez para entregar resultados no siempre se compaginan.
La idoneidad de los encuestadores es todavía más importante en las encuestas telefónicas porque estos deben tener una gran capacidad para captar y mantener la atención del encuestado de modo de obtener la cantidad y calidad de las respuestas que se necesitan.
Las encuestadoras no mantienen un equipo permanente de encuestadores y para las zafras electorales, por ejemplo, suelen contratar eventuales que muchas veces, en aras de la economía, son mal pagos y poco experimentados. De este modo. Los márgenes de error y los sesgos muestrales debidos al trabajo de campo suelen ser mucho más volubles y mayores que lo que los dueños de las empresas conocen o están dispuestos a reconocer.
De todas maneras, las empresas encuestadoras no solamente cuentan con una muestra y encuestadores para llevar adelante su trabajo sino que apelan a las técnicas estadísticas que permiten la estandarización de los datos obtenidos y su procesamiento informático.
Esto también supone un equipo de técnicos con sólida formación para determinar la medida del llamado “error estadístico” a través de lo que se llaman intervalos de confianza, medidas de desviación estándar, coeficiente de variación y varianza para los que no basta con un buen programa informático ni con la adopción de aires de suficiencia.



[1] Tiresias contestó que si el goce del amor era diez, la mujer obtenía nueve y el hombre uno. La respuesta desató la furia de Hera por haber expuesto el secreto de su sexo y lo dejó ciego. Zeus, como compensación, le otorgó el don de la profecía y una larga vida (siete generaciones).
[2] Es una falacia lógica por la que se cree erróneamente que los sucesos pasados afectan a los futuros en lo relativo a actividades aleatorias, como en los juegos de azar. Se manifiesta en las siguientes creencias: a) un suceso aleatorio tiene más probabilidad de ocurrir porque no ha ocurrido durante cierto período; b) un suceso aleatorio tiene menos probabilidad de ocurrir porque ha ocurrido durante cierto período; c) un suceso aleatorio tiene más probabilidad de ocurrir si no ocurrió recientemente y d) un suceso aleatorio tiene menos probabilidad de ocurrir si ocurrió recientemente. Todas son ideas equivocadas sobre probabilidades que han llevado a la ruina a muchos jugadores y a muchos crédulos en otros terrenos.

[3] Por otra parte hubo encuestas, más cuidadosamente concebidas que pronosticaron el triunfo de Roosevelt.
[4] Definiciones añosas pero vigentes provienen del diccionario R.A.E.  y muestran la relación existente entre la estadística y la política, relación muchas veces ocultada. En efecto, “estadística” proviene de “estadista” y este término, que a su vez surge de “estado”, significa “descriptor de la población, riqueza y civilización de un pueblo, provincia o nación” y en segunda acepción “persona versada en los negocios concernientes a la dirección de los Estados, o instruida en materia de política”.

No hay comentarios:

Publicar un comentario