-->

sábado, 4 de marzo de 2017

Correlación Lineal


  1. Introducción al análisis de Correlación
  2. Correlaciones Bivariadas
    • Requisitos
    • Estadísticos
    • La r de Pearson
      • Interpretación
    • Ejemplo
  3. Correlaciones Parciales

Introducción al análisis de Correlación


La correlación es un tipo de análisis que mide la relación entre dos o más variables. Este análisis nos aporta información sobre si existe o no relación entre las variables, así como nos habla de la intensidad y dirección de dicha relación. Desde SPSS se nos presentan tres tipos de correlaciones según el tipo de variables que intervienen en el análisis.

Las correlaciones Bivariadas: exigen variables de tipo continuo, aunque podemos usar las acostumbradas variables de escala 1-10 tan versátiles para las CCSS.

Las correlaciones parciales: son como las bivariadas pero permiten eliminar de la relación una tercera variable para que no distorsione la relación entre otras dos.

Las correlaciones de distancia: Con estas correlaciones podemos usar otro tipo de variables que no tengan carácter cuantitativo, como variables ordinales y nominales.


Correlaciones bivariadas:


Requisitos

Tipo de variables: Dos o más variables de escala
Ruta desde SPSS: Analizar – Correlaciones - Bivariadas


Estadísticos


Dentro del menú encontramos 3 estadísticos de Correlación.

La r de Pearson: Prueba paramétrica. Para su uso se deben cumplir dos requisitos: Las variables han de ser cuantitativas y además deben tener una relación de tipo lineal. También es posible usar este estadístico para calcular la correlación biserial con variables dicotómicas 0,1.

La Tau b de Kendall: Es una prueba no paramétrica. Podemos usar variables de tipo ordinal. Como hemos visto en el artículo de tablas de contingencia este estadístico tiene en cuenta los empates. Para ver cómo se calcula pincha en el enlace.

Rho de Spearman: Es parecida a la Tau b de Kendall. Trabaja con variables ordinales mediante la ordenación de los casos. Su interpretación es similar a la de la R de Pearson que veremos más en detalle en este artículo.

Para saber más de los coefecientes de asociación cuando trabajamos con variables ordinales puedes consultar el apartado sobre medidas de asociación para variables ordinales integrado en el artículo de tablas de contingencia.

La r de Pearson


El principal estadístico es el coeficiente de Correlación de Pearson, que mide el grado de covariación entre variables. Debido a la importancia de este estadístico nos vamos a detener para comprenderlo en profundidad.

Para ver cómo se calcula puedes consultar el artículo Cálculo R de Pearson.

La manera en la que este estadístico estudia la relación entre variables es a través de una línea, por lo que las variables han de estar relacionadas linealmente, siendo este uno de los supuestos a cumplir para el correcto uso de esta técnica. El coeficiente oscila entre los valores menos 1 y 1, donde 0 indica que no existe relación y el 1 que la relación es perfecta, es decir que cuando aumenta una aumenta la otra en el mismo grado. El signo, como de costumbre, indica la dirección en la que se produce dicha relación.

Vamos a ilustrar algunos ejemplos llevados al extremo de los tipos de relaciones existentes:



En los ejemplos tenemos dos relaciones perfectas, una de signo positivo con un coeficiente de 1 y otra negativa con un coeficiente de menos 1.

Como hemos comentado, para que podamos usar el coeficiente de correlación de Pearson nuestras variables deben estar relacionadas linealmente. Para ilustrar este hecho veamos un ejemplo ficticio. Imaginemos por ejemplo dos variables relacionadas, cuya distribución no describa una recta sino una especie de “v”. En este caso, a pesar de contar con variables relacionadas este estadístico no daría cuenta de relación y arrojaría una valor cercano al 0.


Imaginemos por ejemplo una distribución entre las variables edad y horas de ocio. Si analizamos la relación entre ambas variables a través del Coeficiente de Correlación de Pearson, probablemente obtendríamos una inexistencia de relación, cuando ambas variables están muy relacionadas. El hecho de que las personas de más edad y las de menos sean las que más horas libres tienen a su disposición produciría una distribución similar a una curva en forma de U. Por tanto, el Coeficiente de Correlación nos advertiría de que no existe relación entre las variables. Por ello, antes de confiar en este estadístico debemos asegurarnos de que no dejemos descuidado un tipo de relación diferente a las tenidas en consideración por este estadístico. (+ /+) (+/-)(-/+)(-/-). Cuando contamos con variables continuas, la mejor manera de comprobar la linealidad es realizar un gráfico de dispersión. Sin embargo, con las variables de escala acostumbradas, 1- 10 que tratamos como continuas desde las Ciencias Sociales, no llegamos a conclusiones fehacientes con dicho gráfico, por lo que podemos obtener más información de una tabla de contingencia que nos ofrezca una primera idea de la linealidad o no de la relación entre ellas.

Interpretación:

A menudo se considera un relación moderada lo que se encuentra entre 0,4 y 0,7. Una correlación alta entre 0,7 y 0,89 y una muy alta entre 0,9 y 1.



Ejemplo


Vamos a explorar con un ejemplo lo visto hasta ahora. La base de datos como en otras ocasiones es la encuesta mundial de valores. Se han cogido dos variables de tolerancia medidas de 1 a 10. Aceptación Homosexualidad y divorcio. Para pedir el análisis entramos en el menú analizar y pinchamos en correlaciones bivariadas.


En este ejemplo hemos marcado la opción de Pearson. Si nuestras variables son ordinales es recomendable usar el estadístico de Spearman también accesible desde este menú.

Como se aprecia en la tabla de abajo, la correlación es significativa, de 0,000, lo cual nos avisa de que parece existir una relación entre las variables. Sin embargo, la significación en la r de pearson está altamente influida por el tamaño muestral, por lo que en muestras grandes es muy probable que encontremos correlaciones significativas entre variables que apenas guardan relación. Por otro lado, la significación no nos habla del grado y dirección en la que nuestras variables están relacionadas.

El Coeficiente de correlación es de 0,67. Como veíamos este coeficiente oscila entre -1 y 1. De aquí se puede inferir que existe una correlación entre ambas variables de tipo positivo. A más aceptación de la homosexualidad más aceptación del divorcio y viceversa. Normalmente se suele considerar una correlación alta a partir de 0,7, por lo que la relación entre ambas variables está cercana a ser considerada alta.


Correlaciones

Justifiable: homosexuality
Justifiable: divorce
Justifiable: homosexuality
Correlación de Pearson
1
,670**
Sig. (bilateral)

,000
N
2283
2267
Justifiable: divorce
Correlación de Pearson
,670**
1
Sig. (bilateral)
,000

N
2267
2346
**. La correlación es significativa al nivel 0,01 (bilateral).


Correlaciones Parciales

En ocasiones queremos mostrar la correlación existente entre dos o más variables sin tener en cuenta la relación con una tercera. En estos casos podemos calcular correlaciones parciales. Este tipo de análisis es ideal para identificar relaciones espúreas entre variables, es decir es capaz de identificar si la correlación observada entre dos variables es real o se produce como consecuencia de la correlación observada por una tercera variable por la cual se controla. Este análisis es similar al utilizado en la regresión (correlación semiparcial) a través de la cuál se estima si una nueva variable mejora la predicción de la variable dependiente.

Podemos realizar el análisis a través del menú "Analizar" + "Correlaciones" + "Parciales".


En este ejemplo queremos comprobar la relación entre las variables "x1" e "y" sin tener en cuenta la correlación con la variable x2. 




Como se aprecia la correlación entre las dos variables es de 0,421. La correlación bivariada original era de 0,456, por lo que la variable x2 no altera en exceso la relación entre las dos primeras variables "x1" e "y". 

Puedes ver cómo calcular la R de Pearson cuando tratamos con correlaciones parciales en el encale sobre cálculo de correlaciones parciales.  

No hay comentarios:

Publicar un comentario