-->

miércoles, 6 de noviembre de 2013

Cálculo de Chi cuadrado

Como hemos visto en el artículo sobre Tablas de contingencia , la chi cuadrado es un estadístico que avisa de la relación entre dos variables categóricas. Para calcularlo hay que poner en relación las frecuencias esperadas (las que se darían en situación de independencia de las variables) con las frecuencias observadas (las que nos ofrecen nuestros datos. Si nuestras variables están relacionadas entre sí las diferencias entre los valores observados y los esperados serán grandes y la chi será alta. El sumatorio de estas diferencias para cada casilla de nuestra tabla es la chi cuadrado.

Vamos a verlo con un ejemplo:



El primer paso es calcular las frecuencias absolutas esperadas, que se calculan como el producto de los marginales para cada celda:

E absoluta de celda = marginal de fila por marginal de columna dividido entre número de casos

E hombres y satisfechos = (181 * 201)/ 306 = 119
E mujeres satisfechas = (125 * 201) /306 = 82
E hombres e insatisfechos = (181 * 169)/306= 100
E mujeres e insatisfechas = (125 * 169) /306= 69

El siguiente paso es poner en relación para cada celda las frencuencias esperadas recién calculadas, con las frecuencias observadas en nuestra muestra. Para ello, se aplica el cuadrado de la resta entre el valor observado - el esperado y se divide el resultado por el valor esperado.

[(nij- eij) ^2]/ eij

celda 11. hombres satisfechos= `[(112-119)^2] /119 = 0,412
celda 12. mujeres satisfechas = [(89-82)^2] /82 = 0,598
celda 21. hombres insatisfechos= [(69-100)^2] /100 = 9,61
celda 22. mujeres insatisfechas= [(100-69)^2] /69 = 13,925

Solo queda sumar los cuatro valores obtenidos para hallar la chi cuadrado: (0,412+ 0,598 + 9,61 + 12,925)= 24,547

La chi cuadrado de nuestro ejemplo es de 24,547. Este valor de por sí solo no nos dice nada, por ello, paquetes estadísticos como SPSS nos calcula el coeficiente de significación cuya interpretación se explica en el artículo principal de tablas de contingencia.

Viendo la manera en la que se calcula la chi es fácil entender porque los valores de la chi crecen a medida que aumenta el número de casos. Es por ello que para evitar el efecto del tamaño de la muestra hayan surgido otros estadísticos basados en chi cuadrado que tratan de mitigar los efectos del tamaño muestral, como la la phi, la V de Cramer o el coeficiente de contingencia. Si quiere ver cómo se calculan estos estadísticos vaya al artículo principal sobre tablas de contingencia.

Artículos relacionados:


Artículo principal: Tablas de contingencia

No hay comentarios:

Publicar un comentario