Análisis de potencia para muestras independientes de dos grupos t-test | R Ejemplos de Análisis de datos

Ejemplos

Ejemplo 1. Un dietista clínico quiere comparar dos dietas diferentes, A y B, para pacientes diabéticos. Ella plantea la hipótesis de que la dieta A (Grupo 1) será mejor que la dieta B (Grupo 2), en términos de glucosa en sangre más baja. Planea obtener una muestra aleatoria de pacientes diabéticos y asignarlos aleatoriamente a una de las dos dietas. Al final del experimento, que dura 6 semanas, se realizará una prueba de glucosa en sangre en ayunas en cada paciente. También espera que la diferencia promedio en la medición de glucosa en sangre entre los dos grupos sea de aproximadamente 10 mg/dl. Además, también asume que la desviación estándar de la distribución de glucosa en sangre para la dieta A es de 15 y la desviación estándar para la dieta B es de 17. El dietista quiere saber el número de sujetos necesarios en cada grupo suponiendo grupos de igual tamaño.

Ejemplo 2. Un audiólogo quería estudiar el efecto del género en el tiempo de respuesta a una determinada frecuencia de sonido. Sospechaba que los hombres detectaban mejor este tipo de sonido que las mujeres. Tomó una muestra aleatoria de 20 sujetos masculinos y 20 femeninos para este experimento. A cada sujeto se le dio un botón para presionar cuando escuchó el sonido. A continuación, el audiólogo midió el tiempo de respuesta, es decir, el tiempo transcurrido entre la emisión del sonido y la pulsación del botón. Ahora, quiere saber cuál es el poder estadístico basado en su total de 40 sujetos para detectar la diferencia de género.

Preludio al Análisis de Potencia

Hay dos aspectos diferentes del análisis de potencia. Una es calcular el tamaño de muestra necesario para una potencia especificada como en el Ejemplo 1. El otro aspecto es calcular la potencia cuando se da un tamaño de muestra específico, como en el Ejemplo 2. Técnicamente, la potencia es la probabilidad de rechazar la hipótesis nula cuando la hipótesis alternativa específica es verdadera.

Para los análisis de potencia a continuación, nos centraremos en el Ejemplo 1, calculando el tamaño de la muestra para una potencia estadística dada de probar la diferencia en el efecto de la dieta A y la dieta B. Observe las suposiciones que el dietista ha hecho para realizar el análisis de potencia. Aquí está la información que tenemos que conocer o asumir para realizar el análisis de potencia:

  • La diferencia esperada en el promedio de glucosa en sangre; en este caso se establece en 10.
  • Las desviaciones estándar de la glucosa en sangre para el Grupo 1 y el Grupo 2; en este caso, se establecen en 15 y 17, respectivamente.
  • El nivel alfa, o la tasa de error de tipo I, que es la probabilidad de rechazar la hipótesis nula cuando es realmente verdadera. Una práctica común es establecerlo en el.nivel 05.
  • El nivel de potencia estadística predeterminado para calcular el tamaño de la muestra; se establecerá en .8.
  • El número predeterminado de sujetos para calcular la potencia estadística; esta es la situación, por ejemplo, 2.

Observe que en el primer ejemplo, la dietista no especificó la media para cada grupo, sino que solo especificó la diferencia de las dos medias. Esto se debe a que ella solo está interesada en la diferencia, y no importa cuáles sean los medios, siempre y cuando la diferencia sea la misma.

Análisis de potencia

En R, es bastante sencillo realizar análisis de potencia para comparar medias. Por ejemplo, podemos usar el paquete pwr en R para nuestro cálculo como se muestra a continuación. Primero especificamos las dos medias, la media para el Grupo 1 (dieta A) y la media para el Grupo 2 (dieta B). Dado que lo que realmente importa es la diferencia, en lugar de medias para cada grupo, podemos ingresar una media de cero para el Grupo 1 y 10 para la media del Grupo 2, de modo que la diferencia en medias será 10. A continuación, necesitamos especificar la desviación estándar agrupada, que es la raíz cuadrada del promedio de las dos desviaciones estándar. En este caso, es sqrt((15^2 + 17^2)/2) = 16.03. El nivel de significación predeterminado (nivel alfa) es .05. Para este ejemplo, estableceremos el poder para estar en .8.

Los resultados del cálculo indican que necesitamos 42 sujetos para la dieta A y otros 42 sujetos para la dieta B en nuestra muestra para ordenar el efecto. Ahora, usemos otro par de medias con la misma diferencia. Como hemos discutido anteriormente, los resultados deben ser los mismos, y lo son.

Ahora la dietista puede sentir que un tamaño total de muestra de 84 sujetos está más allá de su presupuesto. Una forma de reducir el tamaño de la muestra es aumentar la tasa de error de tipo I, o el nivel alfa. Digamos que en lugar de usar el nivel alfa de .05 lo usaremos .07. Luego, nuestro tamaño de muestra se reducirá en 4 para cada grupo, como se muestra a continuación.

Ahora supongamos que el dietista solo puede recopilar datos de 60 sujetos con 30 en cada grupo. Cuál será la potencia estadística de su prueba t con respecto al nivel alfa de .05?

Como hemos discutido antes, lo que realmente importa en el cálculo de la potencia o el tamaño de la muestra es la diferencia de las medias sobre la desviación estándar agrupada. Esta es una medida del tamaño del efecto. Veamos ahora cómo el tamaño del efecto afecta al tamaño de la muestra asumiendo una potencia de muestra dada. Simplemente podemos asumir la diferencia de medias y establecer la desviación estándar en 1 y crear una tabla con el tamaño del efecto, d, que varía de .2 a 1.2.

también podemos mostrar fácilmente esta información en un gráfico.

plot(ptab,ptab,type="b",xlab="effect size",ylab="sample size")

Se muestra que si el tamaño del efecto es pequeña, por ejemplo .2 luego necesitamos un tamaño de muestra muy grande y ese tamaño de muestra disminuye a medida que aumenta el tamaño del efecto. También podemos graficar fácilmente la potencia frente al tamaño de la muestra para un tamaño de efectos dado, por ejemplo, d = 0.7

pwrt

Discusión

Un supuesto técnico importante es el supuesto de normalidad. Si la distribución está sesgada, es posible que un tamaño de muestra pequeño no tenga la potencia que se muestra en los resultados, porque el valor de los resultados se calcula utilizando el método basado en el supuesto de normalidad. Hemos visto que para calcular la potencia o el tamaño de la muestra, tenemos que hacer una serie de suposiciones. Estos supuestos no solo se utilizan para el cálculo, sino que también se utilizan en el propio ensayo t real. Por lo tanto, un beneficio secundario importante de realizar análisis de potencia es ayudarnos a comprender mejor nuestros diseños y nuestras hipótesis.

Hemos visto en el proceso de cálculo de potencia que lo que importa en la prueba t de muestra de dos independientes es la diferencia en las medias y las desviaciones estándar para los dos grupos. Esto lleva al concepto de tamaño del efecto. En este caso, el tamaño del efecto será la diferencia de medias sobre la desviación estándar agrupada. Cuanto mayor sea el tamaño del efecto, mayor será la potencia para un tamaño de muestra dado. O bien, cuanto mayor sea el tamaño del efecto, menor será el tamaño de la muestra necesario para lograr la misma potencia. Por lo tanto, una buena estimación del tamaño del efecto es la clave para un buen análisis de potencia. Pero no siempre es una tarea fácil determinar el tamaño del efecto. Las buenas estimaciones del tamaño del efecto provienen de la literatura existente o de estudios piloto.

Véase También

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *