20 de febrero de 2012

Cuidado con la estadística

A veces es posible obtener conclusiones opuestas a partir de un mismo conjunto de datos. Esto es especialmente fácil que suceda cuando se trabaja con datos que están muy débilmente relacionados entre sí, pudiendo variar entre resultados opuestos simplemente variando ligeramente algunas categorías establecidas para clasificar los datos.


Una muestra de ello es el ejemplo que nos cuenta el matemático John Allen Paulos (Paulos 2012). Trata de un estudio cuyo objetivo es intentar establecer una relación entre el tamaño de los platos y cuánta comida ingiere el comensal. Tres personas al azar recibieron platos de 20 cm de diámetro, a los que se calificó como "Pequeños". Cuatro personas, también al azar, recibieron platos "Medianos" de diámetro entre 20 y 28 cm. Por último tres personas recibieron platos "Grandes", considerando tales los que superaban los 28 cm de diámetro. Las tres personas que utilizaron platos pequeños ingirieron 270, 300 y 330 gramos respectivamente, resultando una media de 300 g. Los que comieron en platos medianos, engulleron 540, 210, 450 y 120 gramos de comida, es decir, una media de 330 gramos. Por último, los que comieron en platos grandes, se sirvieron 390, 330 y 360 gramos por persona. Una media de 360 gramos.

Tomando este ejemplo, estableciendo arbitrariamente las medidas de los platos como pequeño, mediano o grande para los valores antes descritos, concluimos que al aumentar el tamaño de los platos, la cantidad de comida ingerida aumenta: 300, 330 y 360 gramos.

Sin embargo, podemos concluir fácilmente lo opuesto, sí, ¡lo opuesto!, variando ligeramente la categoría de pequeño, mediano y grande. Si establecemos que los platos medianos son aquellos entre 21 y 27 centímetros, tenemos que variar el resto de categorías: ahora los pequeños serían los platos con un diámetro inferior a 21 cm y los grandes con uno superior a 27 cm. Si el comensal que había tomado 540 gramos de comida lo hubiese hecho en un plato de, por ejemplo, 20,5 cm, antes ese plato era considerado mediano (los medianos eran entre 20 y 28 cm) pero ahora, al revalorar las categorías pasa a pertenecer a los pequeños. Algo similar ocurre si el que degustó 120 g lo hiciese en un plato de unos 27,5 cm: ahora ese plato es considerado grande y no mediano.

La media de comida ingerida por cada comensal en el segundo ejemplo es de 360 gramos los que lo hicieron en platos pequeños, 330 g en los platos medianos y 300 gramos en los grandes. Ahora el tamaño de los platos es inversamente proporcional a la comida ingerida. ¡Justamente lo contrario al primer ejemplo!

Podríamos pensar que el problema reside en el tamaño de la muestra, puesto que sólo cogimos a 10 personas para el estudio y tres tipos de platos, pero ahí no lo encontraremos. Un gran número de datos puede incluso facilitar la obtención de éstos resultados opuestos, ya que nos ofrece más oportunidades para modificar las categorías. Es en las categorías donde reside el problema.

Esto es peligroso, pues muchos estudios a priori plausibles pueden haber sido realizados de esta manera. Y muchos pseudocientíficos, tamabién conocidos como estafadores, pueden usarlo a su conveniencia. ¡Cuántos estudios no hay afirmando que la homeopatía, o cualquier otra pseudomedicina, cura un 40, un 60, 70 o incluso más de un 80% de los pacientes que utilizan ese tratamiento! ¿Qué establecemos dentro de la categoría de pacientes en esos estudios? ¿Los pacientes con un ligero malestar? ¿Con una gripe? ¿Con un catarro? ¿Con un problemita de ansiedad? (O cualquier otro problema que generalmente se cura solo).  Apuesto a que no se incluye por ejemplo a los pacientes que desgraciadamente padecen cáncer anaplásico de tiroides o una lipodistrofia, u otras tantas enfermedades a las que la Medicina está, con cada vez menos recursos, intentando dar cura.

Esta entrada participa en El Carnaval de las Matemáticas de Febrero de 2012, que se celebra en el blog Scientia potentia est.

BIBLIOGRAFÍA:
  • Paulos, John Allen (2012). Cuanto mayor es el plato más comida... ¿o al revés? Investigación y Ciencia Enero 2012. 424.
ENLACES:

2 comentarios:

  1. Me ha gustado esta entrada. Otro estudio engañoso es el que se da como verdad universal de que el avión es estadísticamente el método de transporte más seguro, cuando verdaderamente hay muchos más sistemas en la aeronáutica cuyo fallo significa muerte segura, que en cualquier otro medio de transporte. La estadística es la única ciencia de la que cada cual puede sacar el resultado que desee.

    ResponderEliminar
  2. La estadística es imprescindible en Ciencia, importantísima, pero hay que saberla interpretar correctamente. ¡Un saludo!

    ResponderEliminar