lunes, 7 de octubre de 2019

Introducción a la regresión cuantílica para comparar medianas en SPSS 26


El modelado basado en la regresión cuantílica, caracterizado por describir un cuantil dada una serie de variables exógenas, donde la mediana es un caso particular del algoritmo  general, tiene cada vez mas aplicaciones en el campo de la Metodología de las Ciencias del Comportamiento. En esta breve entrada vamos a ver como puede ser usado de  forma complementaria a algunas de las técnicas no paramétricas clásicas.

Por ejemplo, a la hora de comparar dos grupos que tienen un tamaño muestral muy reducido o no se ajustan al modelo de una distribución normal, una prueba no parámetrica clásica para compararlas es el test de Mann–Whitney, contrastando que los valores estadísticos centrales (medianas) son iguales o muy parecidos. 

El problema con esta prueba, es que es útil a la hora de contrastar promedios, asumiendo que la forma de dispersión son semejantes, lo cual no siempre es así.

Como podemos comprobar en el siguiente ejemplo simulado, de diferencias en la inteligencia de acuerdo al sexo, el centro de la distribución es igual mientas los extremos difieren:

Si aplicamos ahora la prueba correspondiente no  paramétrica, obtendremos como resultado diferencias entre los dos grupos, que realmente se refieren a su distribución y no realmente al valor resumen de tendencia central (Mediana) que es el mismo valor en los dos grupos:

Cuando nos encontramos con una situación problemática, como el ejemplo anterior, donde las formas de distribuirse los datos son distintas, podemos usar como alternativa la regresión de cuantiles que nos permite comparar medianas (cuantil 0,5) sin necesidad de que se tenga que cumplir la condición de distribuciones semejantes. Este tipo de modelo de algoritmo (Koenker, 2005), intenta estimar la mediana condicional (percentil 50) así como otros cuantiles  en la variable criterio), cuando los presupuestos del modelo clásico no son aplicables a los datos (Powell, 1986).

Aplicado el procedimiento en SPSS 26 a nuestro caso anterior obtendremos:

...donde podemos comprobar que realmente no hay diferencias, ya que realmente las medianas tienen el mismo valor.

También, es posible afinar en estos casos donde se producen las diferencias que entran en contradicción con los valores de tendencia central, como puede ser buscando las soluciones para los cuantiles extremos, por ejemplo para el 0,20 y el 0,80, resultando:
...pudiendo ademas visualizarlo con objeto de interpretarlo de forma más intuitiva:

Tanto en la forma numérica como gráfica, podemos comprobar ahora que las diferencias se da en uno de los extremos (cuantil 0,80), y no  en el centro de la distribución.

Referencias.
*Koenker, Roger (2005). Quantile Regression. Cambridge University Press. ISBN 0-521-60827-9.
*Powell, James L. (1986). Censored Regression Quantiles. Journal of Econometrics. 32 (1), 143–155. doi:10.1016/0304-4076(86)90016-3.