ESTADÍSTICA |
Tema 2: Distribuciones Estadísticas Bidimensionales |
5.- RECTA DE REGRESIÓN. ESTIMACIÓN |
Con el diagrama de dispersión o nube de puntos, es posible frecuentemente representar una curva que se aproxime a los datos.
Tal curva se llama curva de aproximación.
En la mayor parte de las nubes de puntos obtenidas a partir de casos reales es difícil imaginarse cuál sería la mejor curva de aproximación y, generalmente, hay que optar por una determinada (usando algunos criterios específicos) que se suele denominar curva de ajuste.
Nosotros vamos a usar como criterio el de la simplicidad y dado que la curva mas sencilla es la recta, vamos a optar por buscar una recta de ajuste que se ajuste adecuadamente a nuestra nube de puntos. A esta recta se le llamará recta de regresión. |
Desde luego, la forma mas sencilla de obtener una recta de ajuste es dibujando una recta encima de la nube de puntos, tratando de que dicha recta se ajuste lo mejor posible a la nube de puntos.
Vamos a empezar viendo la relación entre nube de puntos, recta de regresión y correlación:
En la siguiente escena puedes manipular libremente los puntos rojos, observa lo que ocurre con la recta y con el coeficiente de correlación: |
Contesta a las siguientes cuestiones:
|
Recta de regresión por mínimos cuadrados.
Es fácilmente comprensible que los matemáticos hayan intentado encontrar un procedimiento común para seleccionar la misma recta de ajuste, de modo que todo el mundo esté de acuerdo y no haya que atenerse a opiniones subjetivas.
La recta de ajuste seleccionada por los matemáticos es la llamada Recta de regresión por mínimos cuadrados y se obtiene seleccionando de entre todas las rectas de ajuste posibles, aquélla que hace mínimo la suma de los cuadrados de las distancias verticales de los puntos a la recta (ahora te explicamos todo esto).
En la siguiente escena puedes comprender mejor el método de los mínimos cuadrados. Aparecen doce puntos que puedes mover libremente con el ratón y dos puntos, que determinan una recta verde, que también se pueden mover libremente por toda la escena. La recta representada en azul es la recta de regresión de Y sobre X. El valor de d en color azul es la suma de los cuadrados de las longitudes de los segmentos de color morado. El valor de dr en verde es el mismo cálculo para la recta verde. |
Realiza la siguiente actividad y observa lo que pasa con la
recta de regresión (azul): a) Mueve la recta de color verde, moviendo los puntos verdes y trata de conseguir una aproximación mejor que la recta de regresión. b) Mueve los puntos del diagrama de dispersión para plantear distintas situaciones y repite el apartado a). c) Coloca los puntos en línea recta y comprueba el valor de d. ¿Es lógico?
|