top of page

Estadística descriptiva bidimensional

Presentación y organización de datos, Tablas de doble entrada

En este tema se van a estudiar dos variables simultáneamente y las relaciones que existen entre ellas.

Para ello, necesitaremos dos variables X e Y, y los datos conjuntos de los sujetos que han realizado el estudio.

Lo primero que veremos es cómo se pueden explicar esos datos, ya que nos los pueden dar directamente o agrupados en una "tabla de doble entrada".

 

Directamente: podemos organizarlos en una tabla donde pondremos en la primera columna los valores de la variable X y en la segunda los valores de la variable Y, siempre emparejados (según nos los dan los ponemos). Podremos además añadir una tercera columna para indicar la frecuencia en caso de que haya repetidos y queramos indicarlo para reducir el tamaño de la tabla.

Tabla de doble entrada: Se utiliza para mostrar los datos y sus frecuencias.

Se dibuja una tabla en la que por fuera están los posibles valores de las variables (en la columna los de X y en la fila los de Y) y por dentro de la tabla está la frecuencia con la que aparece ese valor de (x,y).

Además en la parte de la derecha y de abajo se puede realizar la suma de las frecuencias de las filas/columnas, y en el recuadro de abajo a la derecha la suma de todos que tiene que coincidir con el número de datos que tenemos (n):

Veamos un ejemplo:

Al estudiar las ausencias en clase (X) que toma valores entre 0 y 4 y la nota final (Y) que toma valores entre 5 y 9 de los 20 alumnos de una clase, tenemos los siguientes valores (dados directamente): 

(0,9), (0,9), (0,8), (0,8), (0,7), (1,9), (1,8), (1,8), (1,8), (1,7), (1,7), (2,7), (2,6), (2,6),(2,6),(3,6), (3,6), (3,5), (4,6), (4,5).

Veamos cómo quedan los datos en tabla:

Y si añadimos la frecuencia (por lo que quitamos las líneas repetidas):

Veamos cómo queda la tabla de doble entrada:

Como vemos, aparecen las frecuencias de cada pareja, pero además en el lado de la derecha tenemos las frecuencias de los valores de la variable X y abajo las frecuencias de la variable Y. Pudiendo en este momento realizar las tablas de X e Y para hacer su estudio estadístico independiente del conjunto:

A estas distribuciones de cada una de las variables por separado se las denomina "distribuciones marginales" y se pueden calcular sobre ellas todos los estadísticos ya conocidos para una variable (media, desviación típica, coeficiente de variación...).

bottom of page