sábado, 27 de octubre de 2018

SPSS: Un algoritmo alternativo a la prueba t-test para medidas repetidas

La prueba clásica de diferencias de medidas repetidas (t-test) frecuentemente no es sensible a ligeras diferencias que se pueden observar descriptivamente en los niveles contrastados. 
Dentro de las alternativas que podemos usar, veremos brevemente un procedimiento en SPSS descrito por  Hedberg & Stephanie (2015) basado en las puntuaciones diferenciales y el modelo de regresión. Y también la alternativa no paramétrica correspondiente. 

El objetivo de esta breve artículo es describir el uso de un modelo de regresión como una alternativa válida a la prueba clásica de diferencias de medias para observaciones repetidas, intentando aumentar la potencia estadística de la cual carece la herramienta estadística usada preferentemente por los investigadores.


Una vez introducidos los datos,  en nuestro caso de ejemplo usaremos los mismo ofrecidos como test por Hedberg & Stephanie (2015):
....comprobaremos inicialmente la solución clásica para estos datos, que una vez programados:
T-TEST PAIRS=obs2 WITH obs1 (PAIRED) 
  /CRITERIA=CI(.9500) 
  /MISSING=ANALYSIS.
....nos dará como resultado la siguiente tabla de resultados:

....donde se puede comprobar fácilmente que no podemos rechazar la Ho para una p<0,05.

En este punto es donde es aconsejable usar el nuevo algoritmo, que como veremos es bastante sencillo de programar. Para esto, procederemos a calcular dos nuevas variables, y para ello usaremos la ventana de sintaxis del SPSS procediendo a teclear:
*Obtener la distancia aritmética entre las dos observaciones.
compute diferencia=obs2-obs1.
EXECUTE.
*Obtener la variable inicial centrada (puntuaciones diferenciales de la variable obs1), 
*restando la media, en este caso es de 50,4.
compute obs1_centrada=obs1-50.4.
execute.

Una vez creadas las dos nuevas variables, procederemos a ejecutar el modelo de regresión clásico, donde la variable predictora será la variable en puntuaciones de diferenciales correspondientes a la primera observación, mientras la variable criterio será la diferencia entre las dos observaciones. Por tanto, en nuestro caso tendrá la siguiente forma:
REGRESSION 
  /MISSING LISTWISE 
  /STATISTICS COEFF OUTS R ANOVA 
  /CRITERIA=PIN(.05) POUT(.10) 
  /NOORIGIN 
  /DEPENDENT diferencia 
  /METHOD=ENTER obs1_centrada.
....resultando la siguiente tabla de resultados de los coeficientes:

....pudiendo comprobar como el coeficiente B no estandarizado para la constante equivale a la media de las diferencias, con una t=2,478, p=0,038 (significativo para una p<0,05).

Por último para completar los datos de este artículo, vamos a ofrecer la solución no paramétrica de medidas repetidas. Para ello procederemos a programar las instrucciones siguientes:
NPAR TESTS
  /WILCOXON=obs2 WITH obs1 (PAIRED)
  /STATISTICS DESCRIPTIVES QUARTILES
  /MISSING ANALYSIS.
....resultando la siguiente tabla de resultados:
....donde se puede comprobar que también podemos rechazar la Ho para una p<0,05. La solución del grado de significación como se puede comprobar está a medio camino entre el resultado clásico y el nuevo algoritmo basado en la regresión.

Referencia.
*Hedberg,E.C. and Stephanie,A. (2015). The power of a paired t-test with a covariate.
Soc Sci Res, March ; 50: 277–291. doi:10.1016/j.ssresearch.2014.12.004