ESTADÍSTICA |
Tema 2: Distribuciones Estadísticas Bidimensionales |
6.- TABLAS DE FRECUENCIAS BIDIMENSIONALES. TABLAS DE DOBLE ENTRADA |
Es difícil que en una muestra pequeña de individuos coincidan varios con el mismo peso y talla simultáneamente, pero si la muestra es grande sí es posible que esto ocurra. En ese caso los puntos de la nube correspondiente aparecerían superpuestos y no se distinguirían. Para el caso de distribuciones bidimensionales con frecuencias suelen utilizarse gráficos tridimensionales o bien aumentar el tamaño de los puntos de la nube de forma proporcional a su frecuencia.
Por ejemplo: considera la siguiente distribución bidimensional donde se incluyen en la última fila las frecuencias de cada pareja.
|
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
X
|
2 |
3 |
4 |
5 |
6 |
6 |
7 |
7 |
8 |
10 |
Y
|
1 |
3 |
2 |
4 |
4 |
6 |
4 |
6 |
7 |
9 |
Fi |
1 |
1 |
3 |
4 |
4 |
2 |
3 |
1 |
1 |
1 |
La nube de puntos asociada sería la que aparece inicialmente en la escena:
|
Modifica los puntos arrastrándolos o variando los valores en la parte inferior y modifica sus frecuencia para observar lo que ocurre. |
Para simplificar más los cálculos, se utilizan las tablas de doble entrada:
Tabla de doble entrada. Está formada por tantas filas y columnas como valores tengamos de cada una de las variables, más una fila y una columna más para indicar los totales. Está indicada para casos con bastantes datos, en los que para cada valor de una variable, existen varios valores de la otra. |
x1 | x2 | ... | xi | ... | xm | Frecuencia absoluta de la variable Y | |
y1 | f11 | f21 | ... | fi1 | ... | fm1 | Σfi1 |
y2 | f12 | f22 | ... | fi2 | ... | fm2 | Σfi2 |
... | ... | ... | ... | ... | ... | ... | ... |
yj | f1j | f2j | ... | fij | ... | fmj | Σfij |
... | ... | ... | ... | ... | ... | ... | ... |
yn | f1n | f2n | ... | fin | ... | fmn | Σfin |
Frecuencia absoluta de la variable X | Σf1j | Σf2j | ... | Σfij | ... | Σf1n | N |
Escogiendo la primera y la última fila, tenemos la tabla estadística correspondiente a la primera variable unidimensional. Con la primera y última columnas construimos la tabla correspondiente a la segunda variable unidimensional. Estas dos distribuciones reciben el nombre de distribuciones marginales. En la última celda aparecerá el total de la última fila y de la última columna, es decir, el número total de elementos estudiados (N). Además, en esta tabla puede resultar de interés estudiar distribuciones unidimensionales correspondientes a un valor determinado de alguna de las variables, llamadas distribuciones condicionadas. |
Veamos un ejemplo: En una clase de 30 alumnos y alumnas se ha realizado un estudio sobre el número de horas diarias de estudio X y el número de asignaturas suspensas al final de curso Y, obteniendo los siguientes datos: (2,0) , (2,2) , (0,5) , (2,1) , (1,2) , (2,1) , (3,1) , (4,0) , (0,4) , (2,2) , (2,1) , (2,1) , (4,0) , (3,1) , (2,4) (2,1) , (1,2) , (2,1) , (2,0) , (3,0) , (3,1) , (2,2) , (2,2) , (2,1) , (0,5) , (1,3) , (2,2) , (2,1) , (1,3) , (1,4) Construir la tabla de doble entrada y calcular la media y desviación típica de cada una de las variables.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Tabla de doble entrada
|
Distribución Marginal de X
|
Distribución Marginal de Y
|
En la
tabla de doble entrada, para cada pareja ponemos en el cuadro
correspondiente su frecuencia (si la pareja no aparece, ponemos 0 o dejamos
en blanco la casilla). La principal ventaja es que fácilmente
sacamos las distribuciones marginales de X e Y, pues simplemente sumamos por fila o por
columnas. Esto resulta ventajoso pues así ya tenemos las variables X e Y por separado como en el tema anterior y podemos calcularles las medias, varianzas, percentiles,..., y todo lo que nos haga falta. |
Si queremos calcular la covarianza,
al multiplicar los valores de cada pareja, también multiplicaremos por su
frecuencia, quedando la fórmula así: y si hacemos el cálculo, saldrá: que da -1,124 |
Actividad:
La variable X indica si
a la persona encuestada le gusta escuchar la radio o no y toma únicamente
valores 0 y 1 donde 0 representa que no y 1 que sí, y la variable Y, el
número de CD que ha comprado este año. Los datos de la encuesta realizada
son los siguientes:
{(1 , 3) ; (1 , 2 ) ; (0 , 0 ) ;
(1 , 4 ) ; ( 0 , 2 ) ; (1 , 3 ) ; (0 , 1 ) ; ( 1 , 3 ) ; ( 0 , 0 ) ; (
1 , 2 ) ; a) Realiza la tabla de doble entrada de la variable estadística bidimensional así como las distribuciones marginales de ambas variables b) Calcula la covarianza, el coeficiente de correlación lineal e interpreta el resultado. |