Matemáticas educativas
CORRELACIÓN LINEAL - Conceptos teóricos

Cuando en una población estudiamos dos características comunes, decimos que estamos analizando una variable estadística bidimensional. Se plantean dos problemas diferentes aunque relacionados entre sí:

Correlación: que estudia el grado de relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional.

Esta puede ser:

  • Lineal o curvilínea según la nube de puntos se condense entorno a una línea recta o a una curva.
  • Positiva o directa cuando al aumentar una variable aumenta la otra y viceversa.
  • Negativa o inversa cuando al crecer una variable la otra decrece y viceversa.
  • Nula cuando no existe ninguna relación y la nube de puntos están distribuidos al azar. Se dice que están incorreladas.
  • Funcional si existe una función tal que todos los valores de la nube de puntos la satisfacen.
  • Nos centramos en el estudio de la correlación lineal. El grado de dependencia lo mide el coeficiente de correlación lineal de Pearson siendo sxy la covarianza y sx y sy las desviaciones típicas de las variables. Se pueden dar los siguientes casos:

    r=1
    0<r<1
    0
    -1<r<0
    r=-1
    función directa
    estadística directa
    correlación nula
    estadística inversa
    función inversa

    Rectas de regresión:

    Buscamos la recta que mejor se ajusta a la nube de puntos y utilizarla para predecir el valor de una variable conocido el de la otra. Será aquella que haga que la suma de las desviaciones de los puntos de la nube respecto de las correspondientes de la recta sea la menor posible.

    Para ello se utiliza el "método de los mínimos cuadrados" para obtener la pendiente y la ordenada en el origen de la recta buscada.

    Si la recta es para predecir un valor de y conocido el de x, se utiliza la recta de regresión de y sobre x, en la que debe ser mínima la suma de las di2 (siendo di las distancias entre las ordenadas de los puntos de la nube y los correspondientes de la recta).

    Su ecuación es: siendo mx y my las medias de las variables.

    Para obtener el valor esperado de x conocido el de y, se utiliza la recta de regresión de x sobre y, en la que debe ser mínima la suma de las di2 (siendo di las distancias entre las abscisas de los puntos de la nube y los correspondientes de la recta).

    Su ecuación es: siendo mx y my las medias de las variables.