jueves, 5 de mayo de 2016

Tamaño del efecto en la prueba U de Mann-Whitney

Una alternativa clásica a la prueba de la t de Student, es la prueba no paramétrica conocida como U de Mann-Whitney (Mann-Whitney-Wilcoxon, prueba de suma de rangos Wilcoxon, o prueba de Wilcoxon-Mann-Whitney), y aplicada a dos muestras independientes, con datos a nivel de escala ordinal o intervalo/razón pero donde no se puede asumir normalidad. 

Es un procedimiento que es fácil de programar en sistemas como el SPSS, como podemos comprobar en el siguiente caso:

En esta entrada nos vamos a ceñir a describir como podemos obtener el tamaño del efecto a posteriori, necesario en el análisis estadístico científico, de acuerdo a las últimas recomendaciones de la APA (2009) y ASA (Wasserstein & Lazar, 2016), y que no aparece recogido en el programa estadístico del SPSS.

Este estadístico, frecuentemente se describe por  (Tomczak & Tomcak, 2014):
...donde la Z se toma en valor absoluto.

Mirando en el ejemplo anterior encontraremos el elemento que debemos referenciar en los artículos señalado como a....

Ahora si deseamos obtener el tamaño del efecto, sustituiremos en la fórmula anteriore (r) por los datos ofrecidos por el SPSS (marcado por b)...
                       2,685/SQRT(10)= 0,849

Donde, a la hora de valorar el tamaño de los efectos obtenidos, se puede usar el criterio  descrito por Cohen (1988): r=0,10 (bajo)/r=0,30(medio)/r=0,50(grande)/r=0,70(muy grande)

Para una interpretación mas detallada puede servir la siguiente tabla recogida de la web Psychometrica (2016), que incluye las interpretaciones de Cohen (1968) y Hattie (2009) :
Por supuesto, en los casos de tener diversas pruebas estadísticas es mejor programar el procedimiento bien en la ventana de sintaxis del propio SPSS o en R. En nuestro caso hemos elegido usar R:


Una forma de referenciar los resultados anteriores en un artículo sería: 
"Encontrando un efecto significativo entre los grupos (la media de rangos del grupo 1 y 2 son 3 y 8 repectivamente; U = 25 (Z = -2.685), p = 0.007, r = 0.849)". 

Un procedimiento completo en R también es posible programarlo, como podemos ver a continuación:
############################
library("coin")
x1<-c(1,2,2,2,1,6,7,7,8,7)
g<-c(1,1,1,1,1,2,2,2,2,2)
g<-as.factor(g)
N            <- length(x1) # tamaño muestral
Test   <- wilcox_test( x1 ~ g, distribution = "exact" )
Test
tamaEfecto <- statistic( Test ) / sqrt( N )
tamaEfecto
############################

Por otra parte, el tamaño del efecto también puede ser obtenido directamente  a partir
                        eta2 = r2
...tomando los datos del ejemplo anterior tendríamos....
                           0,84920,72

....o también se puede resolver acudiendo a la expresión alternativa (sobreestimadora de resultados):

...tomando los datos del ejemplo anterior tendríamos....
                            2,6852/(10-1)= 0,80

Si la expresión anterior, cambiásemos el termino (N-1) por N el resultados sería semejante a r2....
                            2,6852/10= 0,72

Es muy útil (recomendable) cuando tenemos porcentajes que contrastar en dos situaciones independientes.


Referencias.
*APA. (2009). Publication Manual of the American Psychological Association (6th ed.). Washington, DC: American Psychological Association.
*Cohen, J. (1988), Statistical Power Analysis for the Behavioral Sciences, 2nd Edition. Hillsdale: Lawrence Erlbaum.
*Hattie, J. (2009). Visible Learning. London: Routledge.
*Psychometrica (2016). Computation of Effect Sizes. Recuperado de http://www.psychometrica.de/effect_size.html.
*Tomczak, M & Tomcak, E. (2014). The need to report effect size estimates revisited. An overview of some recommended measures of effect size. Trends Sport Scicences, 1(21), 19-25.
*Wasserstein,R.L. & Lazar,N.A. (2016): The ASA's statement on p-values: context, process, and purpose, The American Statistician, DOI: 10.1080/00031305.2016.1154108 , recuperado de  http://dx.doi.org/10.1080/00031305.2016.1154108)