Estadística descriptiva
Tendencia central
Cuando hablamos de medidas de tendencia central, estamos intentando ver o comprender dónde se sitúa el centro de nuestros datos. Para ello tenemos la "media", la "mediana" y la "moda".
Por otro lado, tenemos también medidas de posición, en la que estaremos intentando calcular posiciones, en este caso están los cuantiles (como por ejemplo los cuartiles, deciles...).
Media aritmética: Es el valor resultante de la suma de todos los datos entre el número de elementos. Se denota como: x.
Si hay frecuencias, es la suma de los valores por su frecuencia absoluta entre el total de casos o la suma de los valores por su frecuencia relativa.
Sin frecuencias:
Frecuencia absoluta:
Frecuencia relativa:
Ejemplo: Dadas las siguientes alturas de los estudiantes de una clase: 165, 163, 172, 170, 182, 175, 177, 185, 174 y 169. Calcular su media.
Tenemos que realizar la suma: 165 + 163 + 172 + 170 + 182 + 175 + 177 + 185 + 174 + 169 = 1732. Y ahora dividimos entre 10 (porque tenemos 10 valores) --> 1732/ 10 = 173.2
Nota: Para los datos agrupados en intervalos, se utilizará la marca de clase.
Si utilizamos como ejemplo el de la tabla que hay más abajo, la media será:
(2,5 * 3 + 7,5 * 5 + 12,5 * 4 + 17,5 * 2)/14 = 130/14 = 9,28.
Mediana: Es el valor que, una vez ordenados los datos de menor a mayor, deja al 50% de los casos por la izquierda y otro 50% por la derecha, es decir, es el valor que está en el medio.
De nuevo hay que diferenciar 2 casos:
Datos no agrupados, hay que ordenar los datos de menor a mayor y utilizar el que esté en medio (en la posición (n+1)/2), si n (número total de casos) es par, (n+1)/2 es impar y se toma el medio de los dos valores centrales. Si n es impar (n+1)/2 es par y es un valor concreto de los datos.
Ejemplos:
Calcular la mediana de los datos 163, 165, 169, 170, 172, 174, 175, 177, 182 y 185.
Tenemos 10 observaciones (y están ya ordenadas), por lo que la mediana es el valor que está en la posición 5,5 (10+1/2), es decir, el valor que está en el medio entre el que ocupa la posición 5 y el que ocupa la posición 6: Me = (172+174)/2; Me = 173.
Calcular la mediana de los datos 163, 165, 169, 170, 172, 174, 175, 177 y 182.
En este caso, tenemos 9 observaciones (también ordenadas), por lo que la mediana es el valor que ocupa la posición 5 ((9+1)/2): Me = 172.
Datos agrupados, en este caso hay que tomar el intervalo de la mediana (que es donde se encuentra el valor n/2) y la mediana se calcula mediante la fórmula:
Li es el límite inferior del intervalo donde está la mediana, F es la frecuencia absoluta acumulada (al ser de i-1 es del intervalo anterior al medianil), f es la frecuencia absoluta del intervalo medianil, a es la amplitud del intervalo.
Ejemplos: Dados los siguientes datos, calcular la mediana.
Lo primero que tenemos que ver es que n = 14, luego n/2 = 7. Para ver dónde está la mediana (el intervalo medianil) tenemos que ver dónde está el que ocupa la posición 7, que está en el intervalo [5-10), ya que la frecuencia absoluta acumulada (8) es mayor que 7 (es decir, está en el primer intervalo cuya frecuencia absoluta acumulada sea mayor que la posición que buscamos).
Ahora vemos el resto de datos que necesitamos:
Li = 5 (límite inferior del intervalo).
Fi-1 = 3 (frecuencia absoluta acumulada del intervalo anterior).
fi = 5 (frecuencia del intervalo).
ai = 5 (amplitud del intervalo).
Me = 5 + ((7-3)/5) * 5 = 5 + (0,8)*5 = 5 + 4 = 9.
Nota: Es muy importante comprobar que el valor de la mediana está en el intervalo medianil.
En este caso, Me = 9 y el intervalo es [5-10), efectivamente está dentro.
Moda: Es el valor que más se repite. El que mayor frecuencia absoluta tiene. Puede haber varios valores. En caso de datos agrupados además del valor de la moda se tiene el intervalo modal, que es el que mayor frecuencia tiene.
Para los datos agrupados, también se pude obtener un valor obtenido mediante la expresión:
Ejemplos: Dadas las siguientes alturas de los estudiantes de una clase: 165, 163, 169, 170, 182, 175, 177, 185, 174 y 169. Calcular su moda.
En este ejemplo, vemos que el 169 está 2 veces, por lo que Mo = 169.
Para los datos de la tabla, el intervalo modal es el [5-10), ya que es el que mayor frecuencia absoluta tiene.
Si aplicamos la fórmula al ejemplo:
Li = 5;
fi-1 = 3
fi = 5
fi+1 = 4
a = 5
Mo = 5 + [(5-3)/((5-3)+(5-4)) ]* 5 = 5 + [2/(2+1)]*5 = 5 + (0.66)*5 = 8,33
Nota: De nuevo es importante comprobar que el valor de la moda está en el intervalo modal.
En este caso, Mo = 8,33 y el intervalo es [5-10), efectivamente está dentro.