ESTADÍSTICA
Tema 2: Distribuciones  Estadísticas  Bidimensionales

6.- TABLAS   DE  FRECUENCIAS  BIDIMENSIONALES. TABLAS  DE   DOBLE  ENTRADA

Es difícil que en una muestra pequeña de individuos coincidan varios con el mismo peso y talla simultáneamente, pero si la muestra es grande sí es posible que esto ocurra. En ese caso los puntos de la nube correspondiente aparecerían superpuestos y no se distinguirían. Para el caso de distribuciones bidimensionales con frecuencias suelen utilizarse gráficos tridimensionales o bien aumentar el tamaño de los puntos de la nube de forma proporcional a su frecuencia.

Por ejemplo: considera la siguiente distribución bidimensional donde se incluyen en la última fila las frecuencias de cada pareja.

 

A

B

C

D

E

F

G

H

I

J

X

2

3

4

5

6

6

7

7

8

10

Y

1

3

2

4

4

6

4

6

7

9

Fi

1

1

3

4

4

2

3

1

1

1

La nube de puntos asociada sería la que aparece inicialmente en la escena:

 

Modifica los puntos arrastrándolos o variando los valores en la parte inferior y modifica sus frecuencia para observar lo que ocurre.

Para simplificar más los cálculos, se utilizan las tablas de doble entrada:

Tabla de doble entrada. Está formada por tantas filas y columnas como valores tengamos de cada una de las variables, más una fila y una columna más para indicar los totales. Está indicada para casos con bastantes datos, en los que para cada valor de una variable, existen varios valores de la otra.

 
  x1 x2 ... xi ... xm Frecuencia absoluta de la variable Y
y1 f11 f21 ... fi1 ... fm1 Σfi1
y2 f12 f22 ... fi2 ... fm2 Σfi2
... ... ... ... ... ... ... ...
yj f1j f2j ... fij ... fmj Σfij
... ... ... ... ... ... ... ...
yn f1n f2n ... fin ... fmn Σfin
Frecuencia absoluta de la variable X Σf1j Σf2j ... Σfij ... Σf1n N
 

          Escogiendo la primera y la última fila, tenemos la tabla estadística correspondiente a la primera variable unidimensional. Con la primera y última columnas construimos la tabla correspondiente a la segunda variable unidimensional. Estas dos distribuciones reciben el nombre de distribuciones marginales. En la última celda aparecerá el total de la última fila y de la última columna, es decir, el número total de elementos estudiados (N).

         Además, en esta tabla puede resultar de interés estudiar distribuciones unidimensionales correspondientes a un valor determinado de alguna de las variables, llamadas distribuciones condicionadas.

 

Veamos un ejemplo: En una clase de 30 alumnos y alumnas se ha realizado un estudio sobre el número de horas diarias de estudio X y el número de asignaturas suspensas al final de curso Y, obteniendo los siguientes datos:

(2,0) , (2,2) , (0,5) , (2,1) , (1,2) , (2,1) , (3,1) , (4,0) , (0,4) , (2,2) , (2,1) , (2,1) , (4,0) , (3,1) , (2,4)

(2,1) , (1,2) , (2,1) , (2,0) , (3,0) , (3,1) , (2,2) , (2,2) , (2,1) , (0,5) , (1,3) , (2,2) , (2,1) , (1,3) , (1,4)

Construir la tabla de doble entrada y calcular la media y desviación típica de cada una de las variables.

 

          Tabla de doble entrada

 Y \ X 0 1 2 3 4 Frec abs Y
0     2 1 2 5
1     8 3   11
2   2 5     7
3   2       2
4 1 1 1     3
5 2         2
Frec abs  X 3 5 16 4 2 30=n

Distribución  Marginal  de X

xi fi
0 3
1 5
2 16
3 4
4 2
  30

Distribución  Marginal de Y

yi fi
0 5
1 11
2 7
3 2
4 3
5 2
  30
En la tabla de doble entrada, para cada pareja ponemos en el cuadro correspondiente su frecuencia (si la pareja no aparece, ponemos 0 o dejamos en blanco la casilla). La principal ventaja es que fácilmente sacamos las distribuciones marginales de X e Y, pues simplemente sumamos por fila o por columnas.

Esto resulta ventajoso pues así ya tenemos las variables X e Y por separado como en el tema anterior y podemos calcularles las medias, varianzas, percentiles,..., y todo lo que nos haga falta.

Si queremos calcular la covarianza, al multiplicar los valores de cada pareja, también multiplicaremos por su frecuencia, quedando la fórmula así:

y si hacemos el cálculo, saldrá:

   que da  -1,124

Actividad: La variable X indica si a la persona encuestada le gusta escuchar la radio o no y toma únicamente valores 0 y 1 donde 0 representa que no y 1 que sí, y la variable Y, el número de CD que ha comprado este año. Los datos de la encuesta realizada son los siguientes:

{(1 , 3) ; (1 , 2 ) ; (0 , 0 ) ; (1 ,  4 ) ; ( 0 , 2 ) ; (1 , 3 ) ; (0 , 1 ) ; ( 1 , 3 ) ; ( 0 , 0 ) ; ( 1 , 2 ) ;
( 1 , 2 ) ; ( 1 , 4) ; (0 , 1 ) ; ( 0 , 2 ) ; (1 , 3 ) ; (1 , 0 ) ; (1 , 3) ; (0 , 1 ) ; (0 , 0) ; ( 1 , 3) }

a) Realiza la tabla de doble entrada de la variable estadística bidimensional  así como las distribuciones marginales de ambas variables

b) Calcula la covarianza, el coeficiente de correlación lineal e interpreta el resultado.


Indice Actividades.