Archivo de la categoría: estadística

Gráficos poco gráficos, episodio 2

Hace un tiempo comentaba unas cuantas cosas sobre los gráficos de barras y la afición a las escalas truncadas que tienen los periodistas y políticos. Una escala truncada es la que no empieza en cero, si no en número más altos. Esto hace que, para el 99% de nosotros, los gráficos resultantes sean muy difíciles de entender correctamente. Suele hacerse, por decirlo llanamente, con afán manipulatorio y para engañar a la opinión pública.

Hoy veo este ejemplo en el ABC (me lo enviaron; yo no uso el ABC ni para limpiar los pinceles):

grafico 1

En primer lugar, hay que decir que la línea del gráfico NO representa las cantidades que aparecen sobre ella. En 2013 hay mil empresas más que en 2012, y sin embargo la línea está a la misma altura (debo admitir que no me percaté de esto al principio; mi cerebro leyó “catorce mil” en vez de “quince mil”, en un intento de darle sentido a este gráfico… gracias a Alfonso por indicármelo).

En segundo lugar, y aparentemente, ha habido un aumento brutal del número de empresas creadas en Andalucía entre 2013 y 2014. Si uno se fía de lo que ve en el gráfico, parece que la cantidad de sociedades mercantiles se ha multiplicado por tres.

Esto es mentira. No sabemos en qué número empieza la escala vertical del gráfico, pero desde luego empieza en un número muy cercano a 12.000. Esto es lo que se conoce como escala truncada. No es que esté mal hecho, pero puede dar lugar a errores y engaños. He hecho un gráfico con esos mismos datos, empezando la escala en cero:

grafico 2La cosa cambia, ¿verdad? Se percibe un cierto aumento de las empresas creadas, pero desde luego no es ni de lejos tan espectacular como pretende hacernos creer el gráfico del ABC.

Por eso os doy dos consejos:

a) no leáis el ABC

b) ojo con este tipo de gráficos manipulados por ignorancia o por mala intención.


Gráficos mortales: ¿cuánta gente murió en…?

A raíz del éxito cosechado por la infografía que publiqué sobre el mundo del dinero (véase aquí), se me ocurrió elaborar un gráfico semejante sobre algún otro tema. El otro día, leyendo el periódico, me di cuenta de la tendencia que tienen los medios de comunicación de tratar los fallecidos en atentados, guerras y accidentes, como si fuesen un mero número. Inmediatamente me vino a la cabeza la frase de Stalin “un muerto es una tragedia, un millón, una estadística” y decidí hacer un nuevo gráfico… sobre muertes.

Empleo el mismo sistema que utilicé con el dinero: la última columna de cada gráfico es la primera del siguiente.

La lista empieza con un animal, la Tigresa de Champawat, que durante años asesinó y devoró a más de cuatrocientas personas en la India antes de que Jim Corbett la matase en 1906. Se trata del mayor número de muertes confirmadas provocadas por un único animal. En lo alto de la lista comienzan a dominar los humanos. En lo más alto de mi siniestro gráfico se alza Mao Zedong. Las muertes ocurridas bajo su mandato en China (1949-1976) ensombrecen los “logros” de otros grandes asesinos de masas. Tan solo el total de muertos debido a la Peste Negra en todo el mundo a mediados del siglo XIV podría superar los terroríficos efectos que tuvieron las políticas del maoísmo, o tal vez el centenar de millones de muertes que se estima provocó el dominio europeo del Nuevo Mundo desde el siglo XV.

Es muy difícil cuantificar los muertos debidos a guerras y desastres de gran calibre. Incluso en los eventos de este tipo más recientes hay un amplio margen para la especulación y la estimación. En ocasiones las diferentes fuentes daban cifras tan dispares que resultaba imposible utilizar ninguna de ellas; y hacer una simple media habría sido ridículo. Es por ello que muchos eventos se han quedado fuera del gráfico, e incluso algunos de los que sí están son, en gran medida, una estimación.

Muertes 1 Muertes 2 Muertes 3 Muertes 4 Muertes 5 Muertes 6 Muertes 7 Muertes 8

Gráfico completo:

Image Hosted by ImageShack.us


Gráficos de área y circulitos

Hace un tiempo comentaba las bondades y las limitaciones de los gráficos de barras que suelen encontrarse en prensa e informativos. Otro tipo de gráfico bastante frecuente en medios informativos es el gráfico de área o circular. Y hay un tipo particular de gráfico de área, que afortunadamente no se encuentra con frecuencia e intenta representar cifras o cantidades traduciéndolas a un círculo de mayor o menor tamaño. Cuanto mayor sea la cantidad, mayor será el circulito que la represente. Recientemente aparecieron en Malaprensa un par de ejemplos, como éste que representa monedas:

Photobucket

O este otro que representa la cantidad de despidos en ciertos países:

 

 

Photobucket

 

Este tipo de gráficos tienen dos serias limitaciones:

– Resulta muy difícil comparar de un vistazo dos áreas circulares, y es absurdo intentar convertir en un área cierto tipo de informaciones cuando podrían representarse de forma mucho más visual con otro tipo de gráficos (barras, líneas…).

– La persona que elabora el gráfico tiene que saber lo que está haciendo. Como habitualmente no es así, se producen gráficos espantosos que no representan ni por asomo lo que intentan representar.

Hablaré brevemente del segundo factor, mediante un ejemplo. Imaginemos que queremos representar la cantidad de dinero que ganan en el País A con lo que ganan en el País B. En País A ganan una media de 80 € al día; en País B el sueldo es de 50 € diarios. Como no queremos hacer lo mismo que otros periódicos usando gráficos de barras, nos da por elaborar un par de círculos proporcionales a los sueldos en cada país. Entro en mi programa de diseño gráfico preferido y dibujo dos círculos, uno con un área de 80 y otro con un área de 50. Pueden ser centímetros, metros o milímetros cuadrados, ya que lo que nos importa es comparar ambos círculos y la proporción entre ellos será la misma. Yo usaré, en lo sucesivo, centímetros. Aparece esto:

 

Photobucket

 

No parece que haya una gran diferencia, aunque 80 es 1,6 veces más que 50. Repito: la información representada en áreas resulta muy poco informativa y difícil de comparar.

Ahora imaginemos que quiero meter la pata. Hago la misma operación, pero en lugar de usar los valores de 80 y 50 para las áreas de los círculos, los uso como medida de su radio. El gráfico quedaría así:

 

Photobucket

 

La diferencia es mucho más notoria. Recordemos que el área de un círculo equivale a Pi (3,1416…) multiplicada por el cuadrado de su radio: A=πr^2

Si calculamos el área de ambos círculos (con radios de 80 y 50 cm. respectivamente, recordemos), descubriremos que uno es más de dos veces y media mayor que el otro. Según este segundo gráfico, los de País A ganan cada día más de 2,5 veces lo que ganan en País B, cuando sabemos que en realidad ganan 1,6 veces más.

Confundir área y radio puede llevar a desastres gráficos de este estilo. Un gráfico debe hacer comprensible y comparable las informaciones, no ayudar a confundirlas.


Dinero, dinero y más dinero: un gráfico inquietante

Hace un tiempo vi un gráfico donde se comparaban los tamaños relativos de unas cuantas estrellas diferentes, desde nuestro sol a Sirio, Aldebarán, etc. La diferencia entre la más pequeña y la más grande de la lista era tan descomunal que habían hecho varios gráficos en el que las ordenaban de menos a mayor. La última y mayor estrella de cada gráfico era la primera y más pequeña del siguiente; al ver el conjunto de todos los gráficos uno se hacía una idea aproximada de la enorme diferencia de magnitud entre las distintas estrellas que pueblan nuestro universo.

Por algún motivo tuve la ocurrencia de hacer algo similar, pero representando cantidades de dinero. Pensé que podría ser curioso comparar gráficamente lo que habían costado algunas construcciones o proyectos emblemáticos, los enormes costes de una guerra, las fortunas de los más ricos del mundo… Pronto me di cuenta de que tendría que recurrir al mismo sistema que había visto usar para comparar estrellas. La diferencia entre las cantidades que iba introduciendo era tan inmensa que, si las hubiese representado todas en un mismo gráfico, las primeras serían virtualmente invisibles.

El resultado es curioso. Nuestro cerebro no puede representar cantidades de miles de millones de nada, sean personas, euros o dólares. Incluso si nos presentan las cantidades como barras de altura variable, resulta difícil hacerse una idea de las cantidades que se manejan en el mundo. He introducido todo tipo de datos económicos, desde la fortuna de Bill Gates hasta el coste de las guerras mundiales, pasando por lo que cuesta un portaaviones. Resulta inevitable hacer algunas comparaciones.

La primera barra de cada gráfico es la última del anterior:

Image Hosted by ImageShack.us
Image Hosted by ImageShack.us
Image Hosted by ImageShack.us
Image Hosted by ImageShack.us
Image Hosted by ImageShack.us
Image Hosted by ImageShack.us

El gráfico completo es este, y puede verse a tamaño real pinchando sobre él:

 

Image Hosted by ImageShack.us


Ateos en prisión

En 1997 el Departamento Federal de Prisiones de EE.UU. realizó un estudio sobre las creencias religiosas de más de noventa mil presos del país. Obtuvieron así datos sobre la orientación religiosa de algo más de 74.000 presidiarios.

 

Photobucket

 

El porcentaje de gente que se declara “sin religión” entre la población general de EE.UU. está entre el 6 y el 14 %, dependiendo del estudio. Los que se declaran abiertamente “ateos” son menos, como de un 2 %. Uno puede pensar que cabría encontrar en la cárcel estos mismos porcentajes. Sin embargo, entre la población carcelaria hay un mísero 0,209 % de ateos. Es decir, el porcentaje de ateos en la cárcel es diez veces menor que el porcentaje de ateos fuera de la cárcel.

 

¿Qué significa esto? ¿Hay alguna conclusión que sacar de estos datos? ¿Acaso la religión favorece el crimen y el ateísmo lo disminuye?

 

Simplemente he encontrado estos datos por casualidad y me han parecido entre curiosos y simpáticos. Sacad las conclusiones que mejor os parezcan, pero no olvidéis una de las máximas guías del pensamiento racional: correlación no implica causalidad.


Gripe A, el virus del miedo

Llego un poco tarde, lo sé. Ya se han acallado las voces histéricas de alarma y las sirenas que anunciaban el fin de la humanidad a manos de la más humilde criatura de Dios ya no nos ensordecen a todas horas.

He hecho un pequeño gráfico donde comparo el número total de muertes causado por tres tipos distintos de un mismo virus, el de la gripe. Tenemos, por un lado, la gripe estacional, que es la que nos ataca cada año más o menos en invierno. Como en el hemisferio sur es verano cuando aquí es invierno y viceversa, en cada hemisferio la gripe estacional alcanza su punto álgido en meses diferentes. La gripe estacional, la de siempre, mata entre un cuarto de millón de personas y un millón completo al año. Me acojo a la cifra de medio millón sencillamente por estar más alejada de ambos extremos. Por otra parte tenemos el virus de la gripe aviar, de la que se habló largo y tendido hace unos años. Reconozco que es poco serio comparar siete años de gripe aviar con uno solo de las otras dos, pero tuve que hacerlo así porque de otra forma hubiera sido invisible en el gráfico… Por último está la archifamosa gripe A o gripe porcina. Miles de toneladas de vacunas se vendieron indiscriminadamente hasta hace bien poco. La OMS, en un espectaculo vergonzante, fue incapaz de informar adecuadamente al gran público, haciendo que cundiese el pánico cada vez que alguno de sus representantes abría la boca. Los medios de comunicación, irresponsables e ignorantes, junto a los interesas económicos de varios sectores, acabaron de completar un panorama de miedo irracional a una pandemia letal. No hubo tal pandemia. La OMS acabó por admitir una “gestión confusa” de la cuestión. Ejem.

He aquí el gráfico. Que cada uno llegue a sus propias conclusiones:

Photobucket


La falacia del jugador

Jugador 1: He tirado esta moneda al aire diez veces, y las diez ha salido cara. ¿Qué crees que saldrá cuando la tire al aire por onceava vez? ¿Saldrá cara o cruz?

Jugador 2: Si ha caído ya diez veces de cara, es muy difícil que vuelva a hacerlo. Creo que saldrá cruz. De hecho, las probabilidades de obtener 11 caras seguidas son de 0,511 = 0,0004882… Ya ves, una posibilidad entre 2500.

La moneda vuela, describe una parábola y cae de cara una vez más. El jugador 1 sonríe maliciosamente; el jugador 2 hace un gesto de sorpresa…

¿Quién no ha oído alguna vez un razonamiento parecido? Los juegos de azar son un excelente caldo de cultivo para la proliferación de todo tipo de supersticiones, falacias y falsas creencias. Una de las más extendidas es la llamada falacia del jugador, que presupone que los sucesos pasados afectan a los sucesos presentes en actividades aleatorias como los juegos de azar. Muchas personas creen que un suceso tiene más o menos probabilidadde ocurrir por el hecho de que hayan o no hayan ocurrido recientemente. Esto, que puede ser cierto cuando hablamos de sucesos dependientes o relacionados (y más relacionados causalmente), es totalmente erróneo al referirse a sucesos independientes como lanzar una moneda al aire, acertar un número de lotería o tener un hijo varón.Centrémonos en el caso de una moneda lanzada al aire. La probabilidad de que salga cara es del 0,50 (50 %), igual que la probabilidad de que salga cruz. Es cierto que la probabilidad de obtener 11 caras (o cruces, o una combinación determinada de caras y cruces) seguidas es de 0,0004882. Pero la probabilidad de que salga una cara en el lanzamiento número 11, o en cualquier otro, es completamente independiente del número de veces que haya salido antes. En cualquier lanzamiento hay un 50 % de probabilidades de obtener cara o cruz, independientemente de que antes hayamos obtenido una cara, diez, o cien. También es igualmente probable ganar el primer premio de una lotería aunque lo hayas ganado la semana pasada, e igualmente probable ganar apostando siempre al mismo número que a uno diferente cada semana.

Cuando hablamos de probabilidad en sucesos independientes, la historia, sencillamente, no importa.


A %d blogueros les gusta esto: