Los errores de las barras de error

Ya he comentado alguna vez por aquí que una de las cosas que más me gusta de Mendeley – gestor de bibliografía – es que crea una base de datos propia con los artículos de todos los usuarios. Esto sirve, por ejemplo, para que te recomiende artículos basándose en los que ya tienes y en lo que leen los usuarios que se parecen a tí. Bueno, en realidad no se exactamente cómo funciona la cosa, pero funciona.
Fue así como llegó a mí un artículo – uno de los más leídos en ciencias biológicas – que me llamó la atención por lo sencillo del título: “Error bars in experimental biology“. Y leyendo el abstract, el planteamiento era también sencillo: todos usamos y vemos un montón de figuras con sus puntos, sus columnas y sus barras de error. Pero…¿sabemos usar realmente esas barras de error? ¿Sabemos lo que significan? Pues se ve que muchas veces no, así que los amigos Cumming, Fidler y Vaux nos regalan un breve tratado de “barra-de-error-logía”. Os cuento:
Lo primero en que insisten los autores es en dejar claro que hay dos tipos de barras de error: las de estadística descriptiva y las de estadística inferencial. Las primeras sirven para describir nuestros datos, para darnos una idea de la dispersión que tenemos en la muestra. En este caso las barras suelen representar la desviación típica, que se define:
X es cada uno de los valores, M la media muestral y n el tamaño muestral. Las barras de error descriptivas nos pueden dar una pista sobre si un valor es muy anómalo o no.
Las barras de error en inferencia estadística
Las barras de error en inferencia estadística sirven para algo más que las anteriores. Nos dicen si lo que estudiamos (tratamientos, especies, lo que sea) es realmente diferente entre sí. Vamos, que nos permiten detectar y representar diferencias significativas. Ya sabéis: la significación nos dice la probabilidad de que las diferencias que hemos observado sean debidas al azar. Si es suficientemente baja, la descartamos y concluimos que sí hay diferencias (otro día ya hablaremos sobre la obsesión por los p-values, la significantitis). Pero la gran ventaja de las barras de error inferenciales es que su longitud nos dice, de manera gráfica, la cantidad de incertidumbre que hay en nuestros datos: unas barras muy grandes indican mucho error, pero si son pequeñitas podemos empezar a dar saltos de alegría…
sorry we just cant trust you bar graph
A veces las barras de error no son de fiar…
Pero las barras de error inferenciales pueden ser de dos tipos:
      – Error estándard (SE): es la SD partido la raíz de n, y n es el número de muestras o tratamientos independientes que tenemos.
       – Intervalo de confianza del 95%, son barras que contienen el 95% de nuestros datos, y si n>10, se calculan como la media más (o menos) 2 veces SE.
Podemos usar cualquiera de las dos, y según cuál usemos el solapamiento entre las barras de dos tratamientos nos dirá, de manera aproximada, la significación de la diferencia entre ellos. Por eso es muy importante, cuando usamos barras de error, que dejemos claro de cuáles se trata. Si usamos SE, una separación entre los extremos de las barras igual a SE indica que la significación es aproximadamente del 5%, mientras que si la separación es de 2·SE, p = 0.01. En el caso de usar intervalos de confianza, basta con que las barras se solapen una longitud igual a 0.5 SE para que podamos inferir diferencias significativas para p < 0.5.  Esto, siempre que tengamos una muestra suficientemente grande, de al menos 10 elementos independientes.
Si las barras de error representan el SE, una separación entre ellas de 1SE nos indica una p de 0.05. Si las barras son de IC, pueden solaparse hasta la mitad y p seguira siendo 0.05. Esto sólo es válido para n>10.
Y puesto que los elementos analizados (n) deben ser independientes, las barras tampoco nos sirven para inferir diferencias en medidas correlacionadas entre sí, como las medidas repetidas en el tiempo.
Las barras nos indican las diferencias entre tratamientos
para cada día, pero no nos dicen nada de las diferencias
entre días dentro de cada tratamiento.

 

En definitiva, que las barras de error son muy interesantes para mostra gráficamente nuestros resultados, pero un malñ uso puede tirar por tierra unos resultados prometedores. Por eso, acabaremos con los errores más comúnmente cometidos, para estar seguros de que ninguno de nosotros vuelve a caer en ellos:
  • Usar barras de SD para inferir diferencias entre tratamientos (en vez de usar SE o CI)
  • Determinar erróneamente n, considerando como muestras independientes repeticiones que no lo son
  • No indicar en la figura qué representan las barras de error y/o omitir el valor de n
  • Usar las barras para inferir diferencias dentro de cada grupo o tratamiento a lo largo del tiempo


Referencias
ResearchBlogging.orgCumming, G., Fidler, F., & Vaux, D. (2007). Error bars in experimental biology The Journal of Cell Biology, 177 (1), 7-11 DOI: 10.1083/jcb.200611141

 

 

2 Comments

  • Omar Ortega

    4 abril, 2016 at 04:59 Responder

    gracias por este artículo!
    me ayudaste bastante!

  • Anónimo

    6 mayo, 2016 at 18:43 Responder

    qué útil!
    gracias!!

Deja un comentario