Exemples
Exemple 1. Un diététicien clinique veut comparer deux régimes différents, A et B, pour les patients diabétiques. Elle émet l’hypothèse que le régime A (groupe 1) sera meilleur que le régime B (groupe 2), en termes de glycémie inférieure. Elle prévoit d’obtenir un échantillon aléatoire de patients diabétiques et de les affecter au hasard à l’un des deux régimes. À la fin de l’expérience, qui dure 6 semaines, un test de glycémie à jeun sera effectué sur chaque patient. Elle s’attend également à ce que la différence moyenne de mesure de la glycémie entre les deux groupes soit d’environ 10 mg / dl. En outre, elle suppose également que l’écart-type de la distribution de la glycémie pour le régime A est de 15 et que l’écart-type pour le régime B est de 17. Le diététicien veut connaître le nombre de sujets nécessaires dans chaque groupe en supposant des groupes de taille égale.
Exemple 2. Un audiologiste a voulu étudier l’effet du sexe sur le temps de réponse à une certaine fréquence sonore. Il soupçonnait que les hommes étaient mieux à même de détecter ce type de son que les femmes. Il a pris un échantillon aléatoire de 20 sujets masculins et 20 sujets féminins pour cette expérience. Chaque sujet a reçu un bouton sur lequel appuyer lorsqu’il entendait le son. L’audiologiste a ensuite mesuré le temps de réponse – le temps entre l’émission du son et le moment où le bouton a été enfoncé. Maintenant, il veut savoir quelle est la puissance statistique basée sur son total de 40 sujets pour détecter la différence entre les sexes.
Prélude à l’Analyse de puissance
Il existe deux aspects différents de l’analyse de puissance. La première consiste à calculer la taille d’échantillon nécessaire pour une puissance spécifiée comme dans l’exemple 1. L’autre aspect consiste à calculer la puissance lorsquedonné une taille d’échantillon spécifique comme dans l’exemple 2. Techniquement, la puissance est la probabilité de rejeter l’hypothèse nulle lorsque l’hypothèse alternative spécifique est vraie.
Pour les analyses de puissance ci-dessous, nous allons nous concentrer sur l’exemple 1, en calculant la taille de l’échantillon pour une puissance statistique donnée de tester la différence d’effet du régime A et du régime B. Notez les hypothèses que le diététicien a faites pour effectuer l’analyse de puissance. Voici les informations que nous devons connaître ou assumer pour effectuer l’analyse de puissance:
- La différence attendue de la glycémie moyenne; dans ce cas, elle est fixée à 10.
- Les écarts types de glycémie pour le Groupe 1 et le groupe 2; dans ce cas, ils sont fixés à 15 et 17 respectivement.
- Le niveau alpha, ou le taux d’erreur de type I, qui est la probabilité de rejeter l’hypothèse nulle lorsqu’elle est réellement vraie. Une pratique courante consiste à le fixer au.niveau 05.
- Niveau de puissance statistique pré-spécifié pour le calcul de la taille de l’échantillon ; cette valeur sera définie sur .8.
- Le nombre de sujets pré-spécifié pour le calcul de la puissance statistique ; c’est la situation de l’exemple 2.
Notez que dans le premier exemple, la diététicienne n’a pas spécifié la moyenne pour chaque groupe, elle a seulement spécifié la différence des deux moyennes. C’est parce qu’elle ne s’intéresse qu’à la différence, et peu importe les moyens tant que la différence est la même.
Analyse de puissance
Dans R, il est assez simple d’effectuer une analyse de puissance pour comparer les moyennes. Par exemple, nous pouvons utiliser le package pwr en R pour notre calcul comme indiqué ci-dessous. Nous précisons d’abord les deux moyennes, la moyenne pour le groupe 1 (régime A) et la moyenne pour le groupe 2 (régime B). Puisque ce qui compte vraiment, c’est la différence, au lieu de la moyenne pour chaque groupe, nous pouvons entrer une moyenne de zéro pour le Groupe 1 et de 10 pour la moyenne du Groupe 2, de sorte que la différence de moyenne sera de 10. Ensuite, nous devons spécifier l’écart-type regroupé, qui est la racine carrée de la moyenne des deux écarts-types. Dans ce cas, c’est sqrt((15^2 + 17^2)/2) = 16.03. Le niveau de signification par défaut (niveau alpha) est .05. Pour cet exemple, nous allons définir la puissance à.8.
Les résultats du calcul indiquent que nous avons besoin de 42 sujets pour le régime A et de 42 autres sujets pour le régime B dans notre échantillon pour l’effet. Maintenant, utilisons une autre paire de moyens avec la même différence. Comme nous en avons discuté précédemment, les résultats devraient être les mêmes, et ils le sont.
Maintenant, la diététicienne peut penser qu’un échantillon total de 84 sujets dépasse son budget. Une façon de réduire la taille de l’échantillon consiste à augmenter le taux d’erreur de type I, ou le niveau alpha. Disons au lieu d’utiliser le niveau alpha de.05 nous utiliserons.07. Ensuite, la taille de notre échantillon diminuera de 4 pour chaque groupe, comme indiqué ci-dessous.
Supposons maintenant que le diététicien ne puisse collecter des données que sur 60 sujets avec 30 dans chaque groupe. Quelle sera la puissance statistique de son test t par rapport au niveau alpha de.05?
Comme nous l’avons déjà discuté, ce qui compte vraiment dans le calcul de la puissance ou de la taille de l’échantillon, c’est la différence des moyennes par rapport à l’écart-type regroupé. Il s’agit d’une mesure de la taille de l’effet. Voyons maintenant comment la taille de l’effet affecte la taille de l’échantillon en supposant une puissance d’échantillon donnée. Nous pouvons simplement supposer la différence de moyenne et définir l’écart type sur 1 et créer une table avec une taille d’effet, d, variant de.2 à 1.2.
Nous pouvons également facilement afficher ces informations dans un graphique.
plot(ptab,ptab,type="b",xlab="effect size",ylab="sample size")
Cela montre que si la taille de l’effet est petite, telle.2 ensuite, nous avons besoin d’une très grande taille d’échantillon et cette taille d’échantillon diminue à mesure que la taille de l’effet augmente. Nous pouvons également facilement tracer la puissance par rapport à la taille de l’échantillon pour une taille d’effets donnée, disons, d = 0.7
pwrt
Discussion
Une hypothèse technique importante est l’hypothèse de normalité. Si la distribution est biaisée, alors une petite taille d’échantillon peut ne pas avoir la puissance indiquée dans les résultats, car la valeur dans les résultats est calculée à l’aide de la méthode basée sur l’hypothèse de normalité. Nous avons vu que pour calculer la puissance ou la taille de l’échantillon, nous devons faire un certain nombre d’hypothèses. Ces hypothèses sont utilisées non seulement aux fins du calcul, mais sont également utilisées dans le test t lui-même. Ainsi, un avantage secondaire important de l’analyse de puissance est de nous aider à mieux comprendre nos conceptions et nos hypothèses.
Nous avons vu dans le processus de calcul de la puissance que ce qui compte dans le test t à deux échantillons indépendants est la différence des moyennes et des écarts types pour les deux groupes. Cela conduit au concept de taille d’effet. Dans ce cas, la taille de l’effet sera la différence de moyenne par rapport à l’écart-type regroupé. Plus la taille de l’effet est grande, plus la puissance pour une taille d’échantillon donnée est grande. Ou, plus la taille de l’effet est grande, plus la taille de l’échantillon est petite pour obtenir la même puissance. Ainsi, une bonne estimation de la taille de l’effet est la clé d’une bonne analyse de puissance. Mais il n’est pas toujours facile de déterminer la taille de l’effet. De bonnes estimations de la taille de l’effet proviennent de la littérature existante ou d’études pilotes.