Si los griegos la hubiesen conocido, la habrían adorado como a un dios. Galton (1822-1911)
Aproximación de la binomial por la normal
|
Entre las distribuciones continuas la más importante es la llamada distribución normal. Fue introducida por Carl Friedrich Gauss a pricipios del siglo XIX en su estudio de los errores de medida. Desde entonces se ha utilizado como modelo en multitud de variables en cuya distribución los valores más usuales se agrupan en torno a uno central y los valores extremos son escasos. Una variable aleatoria continua sigue una distribución normal si su función de densidad es: donde m y s coinciden respectivamente con la media y la desviación típica de la variable aleatoria. Estos parámetros son los que determinan esta distribución que designaremos por N(m,s). La gráfica de esta función tiene forma de campana y se conoce con el nombre de campana de Gauss. |
Observa que la forma de la campana y la situación respecto a los ejes dependen de los parámetros m y s Cambia el valor de la media m y la desviación típica s en esta distribución normal y observa lo que ocurre. ¿Qué características tiene la normal de media 0 y desviación típica 1? |
Cálculo
de probabilidades Para una variable aleatoria continua X, la probabilidad de que X tome un valor menor o igual que x está determinada por el área comprendida entre la curva y el eje de abscisas desde -¥ a x, que en este caso coincide con Para facilitar el trabajo, existen tablas que dan directamente el valor de estas áreas para el caso m=0, s=1. |
Si X es una variable aleatoria con distribución normal N(µ,s) se cumple: P(µ-s £ X £ µ+s)=0,6826 P(µ-2s £ X £ µ+2s)=0,9544 P(µ-3s £ X £ µ+3s)=0,9974
|
Utilización de la tabla N(0,1)
En la tabla N(O,1) aparece directamente la P(z £ x) para valores de x entre 0 y 4. Observa que para valores mayores que 4 la probabilidad ya es prácticamente igual a 1.
Busca en la tabla:
Observa en la escena lo que hay que hacer cuando estamos en otros casos Calcula en la tabla:
|
Tipificación de variables
La tabla de la distribución normal N(0,1) también nos permite calcular probabilidades relativas a cualquier otra distribución N(m,s). Para ello basta tipificar la variable es decir calcular el valor z correspondiente a los valores x indicados mediante la operación:
Cambia los valores de m y s en la distribución de la figura y observa la forma de la misma. Comprueba también cómo varía el valor z para cada caso. Calcula:
|
Utilización de la tabla N(0,1)
Las estaturas de cierta población se distribuyen según una normal de media 168 y desviación típica 8. Calcula la probabilidad de que elegida una persona al azar su altura sea 170 cm. como máximo.
|
|
Las notas de cierto examen se distribuyen según una normal de media 5,4 y desviación típica 1,2. ¿Qué porcentaje de estudiantes se puede esperar que sacasen entre 5 y 7? (Utiliza la escena anterior cambiando los parámetros y la escala u) |
Aproximación de la distribución binomial por la normal
Una distribución binomial B(n,p) se parece a una normal tanto más cuanto mayor es el producto np (o nq si q<p, siendo q=1-p). Cuando np y nq superan 5, la aproximación es casi perfecta, como se puede apreciar en la figura.
En estas condiciones:
Podemos emplear la normal para calcular probabilidades en el caso de una distribución binomial, aunque hemos de tener en cuenta que la binomial es discreta y la normal continua, por lo que es necesario introducir un ajuste en el cálculo llamado corrección de Yates. Así:
P(X £ x) = P(X'£ x+0,5) | P(X < x) = P(X' £ x-0.5) | P(X=x) = P(x-0,5£X'£ x+0,5) |
El 35% de una población está afectado por la gripe. Se eligen 30 personas al azar. Se trata de una B(0,35;30) que aproximamos por N(10,5;2,61) Calcula la probabilidad de que:
P(X = 10) = P(9,5 £ X' £ 10,5)
P(5< X <12) = P(5,5£ X' £11,5) |
Utilización de la tabla N(0,1)
Ajuste de un conjunto de datos a una normal
Con frecuencia conviene saber si puede suponerse que una serie de datos obtenidos experimentalmente proceden de una distribución normal. Veamos un ejemplo.
La tabla adjunta muestra la altura en cm de 100 estudiantes. ¿Es razonable suponer que estos resultados proceden de una distribución normal?
a) Calculamos la media y la desviación típica de la distribución
|
xa |
xb |
xi | fi |
xi fi |
xi2 fi |
|
155 | 160 | 157,5 | 8 | 1260 | 198450 | ||
160 | 165 | 162,5 | 14 | 2275 | 369687,5 | ||
165 | 170 | 167,5 | 22 | 3685 | 617237,5 | ||
170 | 175 | 172,5 | 28 | 4830 | 833175 | ||
175 | 180 | 177,5 | 16 | 2840 | 504100 | ||
180 | 185 | 182,5 | 8 | 1460 | 266450 | ||
185 | 190 | 187,5 | 4 | 750 | 140625 | ||
100 | 17100 | 2929725 | |||||
media= |
171 |
||||||
desviación típica= |
7,50 |
b) Comparamos la distribución empírica con la normal N(m,s) en este caso con la N(171;7,5).
|
||||||||
xa |
xb |
fri |
za |
zb |
p(X<xa) |
p(X<xb) |
p(xa<X<xb) |
|
155 | 160 | 0,08 | -2,13 | -1,47 | 0,0164 | 0,0712 | 0,05 | |
160 | 165 | 0,14 | -1,47 | -0,80 | 0,0712 | 0,2119 | 0,14 | |
165 | 170 | 0,22 | -0,80 | -0,13 | 0,2119 | 0,4470 | 0,24 | |
170 | 175 | 0,28 | -0,13 | 0,53 | 0,4470 | 0,7031 | 0,26 | |
175 | 180 | 0,16 | 0,53 | 1,20 | 0,7031 | 0,8849 | 0,18 | |
180 | 185 | 0,08 | 1,20 | 1,87 | 0,8849 | 0,9690 | 0,08 | |
185 | 190 | 0,04 | 1,87 | 2,53 | 0,9690 | 0,9944 | 0,03 | |
media= | 171 | |||||||
desviación típica= | 7,50 | |||||||
Comprueba en la escena los valores tipificados y utiliza la tabla N(0,1) para calcular las probabilidades. |
Las diferencias, en este caso, parecen suficientemente pequeñas como para aceptar que los datos provienen efectivamente de una distribución normal. Fíjate que este último paso es totalmente subjetivo, aunque existen métodos estadísticos con los que tomar esta decisión de manera precisa.
Mª José García Cebrian
Ministerio de Educación, Cultura y Deporte. Año 2000 | ||