
Cuando en una población estudiamos dos características comunes, decimos que estamos analizando una variable estadística bidimensional. Se plantean dos problemas diferentes aunque relacionados entre sí:
Correlación: que estudia el grado de relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional.
Esta puede ser:
Nos centramos en el estudio de la correlación lineal. El grado de dependencia
lo mide el coeficiente de correlación lineal de Pearson
siendo sxy la
covarianza y sx y sy las desviaciones típicas de las variables.
Se pueden dar los siguientes casos:
r=1 |
0<r<1 |
0 |
-1<r<0 |
r=-1 |
función directa |
estadística directa |
correlación nula |
estadística inversa |
función inversa |
Rectas de regresión:
Buscamos la recta que mejor se ajusta a la nube de puntos y utilizarla para predecir el valor de una variable conocido el de la otra. Será aquella que haga que la suma de las desviaciones de los puntos de la nube respecto de las correspondientes de la recta sea la menor posible.
Para ello se utiliza el "método de los mínimos cuadrados" para obtener la pendiente y la ordenada en el origen de la recta buscada.
Si la recta es para predecir un valor de y conocido el de x, se utiliza la recta de regresión de y sobre x, en la que debe ser mínima la suma de las di2 (siendo di las distancias entre las ordenadas de los puntos de la nube y los correspondientes de la recta).
Su ecuación es:
siendo mx y my las medias de las variables.
Para obtener el valor esperado de x conocido el de y, se utiliza la recta de regresión de x sobre y, en la que debe ser mínima la suma de las di2 (siendo di las distancias entre las abscisas de los puntos de la nube y los correspondientes de la recta).
Su ecuación es:
siendo mx y my las medias de las variables.








