Medida de la correlación

Es fácil encontrar ejemplos de pares de variables relacionadas entre sí, de modo que una de las variables determina, en mayor o menor medida, la otra. Si la determinación es exacta, se trata de una relación de dependencia funcional. Sin embargo, la realidad muestra con más frecuencia situaciones en las que una variable depende más o menos intensamente de la otra, pero sin que sea posible encontrar una expresión matemática que relacione ambas exactamente. Se trata entonces de una relación o dependencia estadística. Cuando ambas variables son cuantitativas, esa dependencia recibe el nombre de correlación.

 

El punto de partida de un estudio de correlación es la representación gráfica de los pares de valores relacionados en un sistema cartesiano: se obtiene así el diagrama de dispersión o nube de puntos. La observación de la nube de puntos nos da una idea de cuál puede ser el modelo funcional más apropiado para describir la relación entre las variables y también nos permite valorar si la relación es suficientemente intensa como para que tenga sentido tal ajuste.

 


Pulsa sobre esta imagen
para obtener más información

 

En esta aplicación vamos a manejar una distribución bidimensional formada por 6 pares de valores. Se trata de las calificaciones obtenidas por 6 estudiantes en dos exámenes de matemáticas, la variable x, representada en el rango B2:B7 de la hoja de cálculo, refleja las calificaciones de los estudiantes (A, B, C, D y E) en el primer examen y la variable y, representada en el rango C2:C7, describe las obtenidas por cada uno de ellos en el segundo. En la vista gráfica, cada uno de los seis puntos representa las calificaciones de uno de los estudiantes. Tratamos de estudiar la dependencia de las calificaciones obtenidas por los estudiantes en el segundo examen de las obtenidas en el primero.

 

Lo sentimos, el applet de GeoGebra no pudo iniciarse. Por favor, asegúrate que en tu navegador se encuentra instalada y activada la versión 1.4.2 o superior de Java. (Haz clic aquí para instalar Java ahora.)

 

Preguntas

Centro de gravedad de la distribución

  1. Vamos a analizar primero las dos calificaciones por separado. Haz un breve informe sobre las calificaciones del primer examen. Hazlo también sobre las calificaciones del segundo examen. Puedes ayudarte de los parámetros que ya están calculados en la hoja de cálculo. Compara los resultados.

  2. Haz clic en la casilla Centro de gravedad. Trata de situar el punto verde en el centro de gravedad de la nube de puntos. Observa las bandas rojas o azules que aparecen en la parte inferior y en la parte izquierda de la vista gráfica 1: te servirán de ayuda para localizar el centro de gravedad, dado que su longitud y color se modifican al alejarte o acercarte al punto que buscas. Cuando consideres que lo has localizado, haz clic en la casilla Comprobar y comprueba tu resultado. ¿Cuáles son las coordenadas del centro de gravedad? ¿Qué relación tienen esas coordenadas con los parámetros que has manejado en el ejercicio anterior? ¿Se corresponden las coordenadas con alguno de los valores que se muestran en la hoja de cálculo?

  3. Mueve los puntos de la distribución de modo que su centro de gravedad sea ahora el punto (5,6). ¿Puedes conseguirlo de más de una manera? En caso afirmativo, ¿qué tienen en común todas las soluciones que encuentras?

  4. El centro de gravedad no es, en general, un punto de la nube, pero, ¿puedes conseguir que sea uno de los puntos de la nube? En caso afirmativo mueve los puntos como consideres apropiado y busca algún ejemplo que lo confirme.

 

Covarianza

  1. Haz clic en el botón Reinicia. Activa la casilla Covarianza. Observa que cada punto es ahora el vértice de un rectángulo, del cual el centro de gravedad de la distribución ocupa el otro extremo de la diagonal que pasa por ese punto. Trata de buscar un significado a dichos rectángulos:

    1. ¿Cuáles son las medidas de los lados del rectángulo que tiene por vértice el punto B? Explica cómo las hallarías a partir de las coordenadas de B y de las del centro de gravedad. ¿Se corresponden esas medidas con el valor de alguna de las celdas de la hoja de cálculo?

    2. ¿Qué significado tiene el área del rectángulo de vértice B? ¿Se corresponde con el valor de alguna de las celdas de la hoja de cálculo?

    3. Observa que algunos rectángulos están coloreados en rojo y otros en azul. ¿Qué criterio crees que se ha seguido para colorearlos? Mueve alguno de los puntos para poner a prueba tu conjetura. ¿Encuentras alguna relación con los valores de las celdas F2:F7 de la hoja de cálculo?

    4. ¿Qué significado tiene el valor expresado en la celda F8 de la hoja de cálculo?

    5. ¿Podemos conseguir que todos los rectángulos sean de color azul? ¿Y todos de color rojo? Pon ejemplos aclaratorios y señala las características de tales distribuciones.

  2. La covarianza se define como:

Analiza la expresión: ¿encuentras alguna relación entre la covarianza y las áreas de los rectángulos dibujados?

  1. Mueve los puntos y observa cómo varía el valor de la covarianza. ¿Puedes conseguir que valga cero?

  2. Sitúa los puntos de modo que queden alineados horizontalmente. ¿Cuánto vale la covarianza? ¿Por qué?

  3. Sitúa ahora los puntos de modo que queden alineados verticalmente. ¿Cuánto vale la covarianza? ¿Por qué?

  4. Sitúa ahora los puntos de modo que queden alineados oblicuamente. ¿Qué signo tiene la covarianza si la pendiente de la recta que definen los puntos es positiva? ¿Y si es negativa?

Correlación

  1. Haz clic en el botón Reinicia. Activa la casilla Correlación. ¿Cuánto vale el coeficiente de correlación? ¿Cómo valorarías la correlación (muy fuerte, fuerte, débil...) entre las calificaciones de los dos exámenes de los seis estudiantes? Valora el grado de dependencia de las calificaciones obtenidas por los estudiantes en el segundo examen, de las obtenidas en el primero.

  2. ¿Qué relación hay entre la covarianza y el coeficiente de correlación? ¿Y entre las desviaciones típicas de las variables y el coeficiente de correlación? (Exprésalo en términos de proporcionalidad)

  3. Mueve ahora horizontalmente el punto D hasta conseguir que el coeficiente de correlación sea superior a 0.9? ¿De qué modo han variado la covarianza y las desviaciones típicas?

  4. ¿Puedes mover los puntos hasta conseguir que r = 1? ¿Cómo deben estar situados los puntos?

  5. Mueve ahora los puntos de modo que la correlación siga siendo positiva, pero débil.

  6. Sitúa ahora los puntos de modo que el coeficiente de correlación sea aproximadamente -0.8. ¿Qué tipo de correlación se establece, en ese caso, entre las variables?

  7. ¿Puedes mover los puntos hasta conseguir que r = -1? ¿Cómo deben estar situados los puntos?

  8. Sitúa los puntos de modo que la correlación sea muy débil. ¿A qué valor se acerca el coeficiente de correlación?

Regresión lineal

  1. Haz clic en el botón Reinicia. Activa la casilla Regresión lineal. Observa que en la vista gráfica se ha representado una recta que pasa por el centro de gravedad de la distribución. Podemos hacer variar la pendiente de dicha recta mediante el deslizador m situado en la ventana inferior izquierda. ¿Qué significado podemos dar a los segmentos rojos de trazo discontinuo que unen cada punto con la recta? (Puedes obtener aquí más información)

  2. Mueve el deslizador m para modificar la pendiente de la recta. Observa la suma de los cuadrados de las longitudes de los segmentos que unen cada punto con la recta. Trata de encontrar el valor de m que hace mínima dicha suma. ¿Cuál es la ecuación de la recta de mejor ajuste? Una vez que la hayas obtenido haz clic en la casilla Comprobar y comprueba tu resultado.

  3. Utilizando la recta de ajuste, ¿qué calificación cabría esperar en el segundo examen para un alumno que obtuvo una nota de 6.5 puntos en el primer examen? ¿Y si la nota obtenida en el primer examen hubiera sido de 4.5 puntos?

  4. Comprueba ahora tus resultados utilizando la herramienta de análisis estadístico bidimensional de GeoGebra. Para ello, primero selecciona el rango B2:C7. A continuación selecciona la herramienta Análisis Regresión Dos Variables. En la ventana emergente que se abre, selecciona Muestra Estadísticas en la lista desplegable de "Opciones" que está situada en la parte inferior derecha. Selecciona así mismo Lineal en la lista desplegable "Modelo de Regresión". Introduce ahora el valor de x en la casilla correspondiente, pulsa la tecla Intro y observa el valor que se asigna a la variable y.

 

 

 

 

 

 

 

 








 INICIO    Creative Commons License Ítem didáctico creado por José Luis Álvarez García.