Media(na)
Analizamos por qu¨¦ la media no es siempre el mejor indicador para sacar conclusiones de unos datos
Es muy habitual ver en medios de comunicaci¨®n de todo tipo y condici¨®n noticias que hablan de salario medio. En ellas, se suele dar la media como ¨²nico dato a resaltar en relaci¨®n con los salarios de los trabajadores. Por no irme fuera de aqu¨ª, voy a citar una noticia de este mismo medio de hace una semana: El sueldo medio bruto en Espa?a baj¨® un 0,8% en 2016, hasta los 1.878,1 euros.
En alguno de los comentarios de esa misma noticia hay lectores que apuntan que la media no es la medida m¨¢s indicada para sacar conclusiones en estos asuntos. Hoy vamos a explicar por qu¨¦ y cu¨¢l podr¨ªa ser una medida mejor en el caso de que s¨®lo queramos dar un ¨²nico indicador.
Estamos tan acostumbrados a utilizar la media como dato significativo que no nos paramos a pensar en que, en muchas ocasiones, el resultado de la misma no es un buen dato para analizar lo que ocurre en realidad. Se toma la media como un valor que cumple que la mitad de los datos est¨¢ por debajo y la otra mitad est¨¢ por encima de ella, y eso no tiene por qu¨¦ ser cierto.
Veamos un ejemplo. Supongamos que en un parque hay diez personas cuyas edades son las siguientes:
4, 6, 6, 7, 8, 10, 11, 12, 31, 55
Si calculamos la media de esas edades, obtendr¨ªamos lo siguiente:
Media = (4 + 6 + 6 + 7 + 8 + 10 + 11 + 12 + 31 + 55)/10 = 150/10 = 15 a?os
Tenemos que la media de edades es 15 a?os. Teniendo en cuenta que ocho de las diez personas est¨¢n por debajo de esa edad media, ?de verdad consideramos que ese dato es representativo de este conjunto de personas? Si nos dan como dato esa edad media de 15 a?os, ?tendr¨ªa sentido pensar que la mitad de esas diez personas est¨¢ por debajo de 15 y la otra mitad est¨¢ por encima? Est¨¢ claro que no.
Pongamos ahora un ejemplo con sueldos, para que se vea mejor la cosa. Imaginad una empresa donde trabajan nueve personas. Tenemos al due?o de la empresa, que tiene asignado un sueldo de 6000€; despu¨¦s tenemos dos jefes de secci¨®n, cada uno de ellos con un sueldo de 1500€; dos encargados, cada uno de ellos con un sueldo de 1250€; y cuatro trabajadores de menor rango, que cobran 950€ cada uno. La media de estos sueldos es 1700€, pero en realidad solamente uno de los integrantes de la plantilla de esta empresa est¨¢ por encima de 1700€. ?De verdad alguien piensa que este dato puede ser representativo de los sueldos de la empresa?
El problema de la media es que es muy sensible a valores extremos. Es decir, si tenemos alg¨²n valor (o valores) que se aleje mucho del resto (ya sea porque sean mucho m¨¢s grandes que los dem¨¢s o muchos m¨¢s peque?os) el resultado de la media ser¨¢ un valor que no representar¨¢ fielmente la realidad que estamos intentando analizar.
Habitualmente, lo que uno quiere obtener de datos relacionados con, por ejemplo, salarios, es un valor intermedio entre todos esos salarios, un valor que, como coment¨¢bamos antes, nos sirva de verdad para saber que la mitad de los salarios est¨¢ por debajo de ¨¦l y la otra mitad est¨¢ por encima. En estad¨ªstica existe una medida que calcula exactamente eso: la mediana.
La mediana es, precisamente, el par¨¢metro estad¨ªstico que nos dice el valor que divide los datos en dos partes iguales si los ordenamos de menor a mayor. Es decir, la mediana nos da un valor que cumple que la mitad de los datos est¨¢ por debajo de ¨¦l y la otra mitad est¨¢ por encima, que es lo que queremos.
Para un conjunto de datos como los que aparecen en los ejemplos anteriores, la mediana es muy f¨¢cil de calcular (si tenemos los datos agrupados en intervalos, la cosa se complica un pel¨ªn, pero tampoco demasiado). Lo primero que hay que hacer es ordenar los datos de menor a mayor, y despu¨¦s nos fijamos en si tenemos un n¨²mero par o un n¨²mero impar de datos. Si el n¨²mero de datos es impar, la mediana es el dato que haya quedado justo en el centro; y si el n¨²mero de datos es par, para calcular la mediana tomamos los dos datos centrales, los sumamos y dividimos el resultado entre 2.
Vamos a calcular la mediana en el ejemplo de los sueldos. Tenemos nueve datos, y ordenados de menor a mayor quedan as¨ª:
950, 950, 950, 950, 1250, 1250, 1500, 1500, 6000
Como el n¨²mero de datos es impar, la mediana es el dato central: 1250.
Si vas a usan un solo indicador para sacar conclusiones a partir de un conjunto de datos tipo los salarios, utiliza la mediana.
La media era 1700, por lo que podr¨ªamos pensar que la mitad de los trabajadores cobran una cantidad mayor o igual que ¨¦sta, lo que hemos visto que no es cierto. En realidad, lo que sabemos es que la mitad de los trabajadores cobran 1250€ o m¨¢s, cantidad sensiblemente menor que la media. ?A que la mediana es m¨¢s representativa de la situaci¨®n real que la media?
Seguro que muchos de vosotros pensar¨¦is que lo ideal ser¨ªa usar las dos medidas, e incluso alguna m¨¢s, como por ejemplo alguna que nos indique la variabilidad de los datos (c¨®mo de cercanos o lejanos est¨¢n dichos datos respecto de la media). Podr¨ªamos usar la desviaci¨®n t¨ªpica, que mide justo eso. Y tambi¨¦n podr¨ªamos hacer un estudio estad¨ªstico m¨¢s profundo con los datos que tenemos a nuestra disposici¨®n.
Se entiende que los organismos encargados de realizar estos estudios s¨ª realizan un an¨¢lisis estad¨ªstico con mayor profundidad, pero en medios de comunicaci¨®n quiz¨¢s no es demasiado conveniente dar una noticia de este tipo con una gran cantidad de valores y medidas, ya que el lector puede perderse entre tanto n¨²mero y, en consecuencia, no llegar a asimilar lo que significan esos datos.
Por ello, comprendo que en noticias as¨ª se tienda a dar un ¨²nico indicador. Pero, si es as¨ª, recuerda: si vas a usar una sola medida, utiliza la mediana.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.