Effektanalyse for to-Gruppe uafhængig prøve t-test | r dataanalyse eksempler

eksempler

eksempel 1. En klinisk diætist ønsker at sammenligne to forskellige diæter, A og B, for diabetespatienter. Hun antager, at diæt A (gruppe 1) vil være bedre end diæt B (gruppe 2) med hensyn til lavere blodsukker. Hun planlægger at få en tilfældig prøve af diabetespatienter og tilfældigt tildele dem til en af de to kostvaner. Ved afslutningen af eksperimentet, der varer 6 uger, udføres en fastende blodglukosetest på hver patient. Hun forventer også, at den gennemsnitlige forskel i blodglukosemåling mellem de to grupper vil være omkring 10 mg/dl. Desuden antager hun også, at standardafvigelsen for blodglukosefordeling for diæt A er 15, og standardafvigelsen for diæt B er 17. Diætisten ønsker at kende antallet af emner, der er nødvendige i hver gruppe, hvis man antager lige store grupper.

eksempel 2. En audiolog ønskede at undersøge effekten af køn på responstiden til en bestemt lydfrekvens. Han mistænkte, at mænd var bedre til at opdage denne type lyd, da var kvinder. Han tog en tilfældig prøve på 20 mandlige og 20 kvindelige forsøgspersoner til dette eksperiment. Hvert emne fik en knap til at trykke på, da han/hun hørte lyden. Audiologen målte derefter responstiden-tiden mellem lyden blev udsendt og den tid, knappen blev trykket på. Nu vil han vide, hvad den statistiske magt er baseret på hans i alt 40 forsøgspersoner for at opdage kønsforskellen.

optakt til Effektanalysen

der er to forskellige aspekter af effektanalyse. Den ene er at beregne den nødvendigeprøvestørrelse for en bestemt effekt som i Eksempel 1. Det andet aspekt er at beregne effekten, nårgivet en bestemt prøvestørrelse som i Eksempel 2. Teknisk set er magt sandsynligheden for at afvise nulhypotesen, når den specifikke alternative hypotese er sand.

for effektanalyserne nedenfor vil vi fokusere på Eksempel 1 og beregne stikprøvestørrelsen for en given statistisk styrke til at teste forskellen i effekten af diæt A og diæt B. Læg mærke til de antagelser, som diætisten har foretaget for at udføre effektanalysen. Her er de oplysninger, vi skal vide eller skal antage for at udføre strømanalysen:

  • den forventede forskel i den gennemsnitlige blodglukose; i dette tilfælde er den indstillet til 10.
  • standardafvigelserne for blodglukose for gruppe 1 og gruppe 2; i dette tilfælde er de sat til henholdsvis 15 og 17.
  • alfa-niveauet eller type i-fejlfrekvensen, hvilket er sandsynligheden for at afvise nulhypotesen, når den faktisk er sand. En almindelig praksis er at sætte den på .05 niveau.
  • det forud specificerede niveau for statistisk effekt til beregning af stikprøvestørrelsen; dette vil blive indstillet til .8.
  • det forud specificerede antal emner til beregning af den statistiske effekt; dette er situationen for eksempel 2.

Bemærk, at diætisten i det første eksempel ikke angav gennemsnittet for hver gruppe, men i stedet angav hun kun forskellen mellem de to midler. Dette skyldes, at hun kun er interesseret i forskellen, og det betyder ikke noget, hvad midlerne er, så længe forskellen er den samme.

effektanalyse

i R er det ret ligetil at udføre strømanalyse til sammenligning af midler. For eksempel kan vi bruge pakken i R til vores beregning som vist nedenfor. Vi specificerer først de to midler, middelværdien for gruppe 1 (diæt A) og middelværdien for gruppe 2 (diæt B). Da det, der virkelig betyder noget, er forskellen, i stedet for midler for hver gruppe, kan vi indtaste et gennemsnit på nul for gruppe 1 og 10 for gennemsnittet af gruppe 2, så forskellen i midler vil være 10. Dernæst skal vi angive den samlede standardafvigelse, som er kvadratroden af gennemsnittet af de to standardafvigelser. I dette tilfælde er det((15^2 + 17^2)/2) = 16.03. Standard signifikansniveauet (alfa-niveau) er .05. I dette eksempel vil vi indstille kraften til at være på .8.

beregningsresultaterne indikerer, at vi har brug for 42 emner til diæt A og et andet 42 emne til diæt B i vores prøve for effekten. Lad os nu bruge et andet par midler med samme forskel. Som vi har diskuteret tidligere, skal resultaterne være de samme, og de er.

nu kan diætisten føle, at en samlet stikprøvestørrelse på 84 fag er uden for hendes budget. En måde at reducere prøvestørrelsen på er at øge Type i-fejlfrekvensen eller alfa-niveauet. Lad os sige i stedet for at bruge alfa niveau af .05 vi vil bruge .07. Derefter reduceres vores prøvestørrelse med 4 for hver gruppe som vist nedenfor.

Antag nu, at diætisten kun kan indsamle data om 60 emner med 30 i hver gruppe. Hvad vil den statistiske effekt for hendes t-test være med hensyn til alfa-niveau af .05?

som vi har diskuteret før, er det, der virkelig betyder noget ved beregningen af effekt eller stikprøvestørrelse, forskellen mellem midlerne over den samlede standardafvigelse. Dette er et mål for effektstørrelse. Lad os nu se på, hvordan effektstørrelsen påvirker stikprøvestørrelsen under forudsætning af en given prøvekraft. Vi kan simpelthen antage forskellen i midler og indstille standardafvigelsen til at være 1 og oprette en tabel med effektstørrelse, d, varierende fra .2 til 1.2.

Vi kan også nemt vise disse oplysninger i et plot.

plot(ptab,ptab,type="b",xlab="effect size",ylab="sample size")

det viser, at hvis effektstørrelsen er lille, sådan .2 så har vi brug for en meget stor prøvestørrelse, og den prøvestørrelse falder, når effektstørrelsen øges. Vi kan også letplot strøm versus prøvestørrelse for en given effektstørrelse, siger d = 0.7

pwrt

Diskussion

en vigtig teknisk antagelse er normalitetsantagelsen. Hvis fordelingen er skæv, kan en lille stikprøvestørrelse muligvis ikke have den effekt, der er vist i resultaterne, fordi værdien i resultaterne beregnes ved hjælp af metoden baseret på normalitetsantagelsen. Vi har set, at for at beregne strømmen eller stikprøvestørrelsen, er vi nødt til at tage en række antagelser. Disse antagelser anvendes ikke kun med henblik på beregning, men anvendes også i selve t-testen selv. Så en vigtig sidefordel ved at udføre strømanalyse er at hjælpe os med bedre at forstå vores design og vores hypoteser.

Vi har set i strømberegningsprocessen, at det, der betyder noget i den to-uafhængige prøve t-test, er forskellen i midlerne og standardafvigelserne for de to grupper. Dette fører til begrebet effektstørrelse. I dette tilfælde vil effektstørrelsen være forskellen i midler over den samlede standardafvigelse. Jo større effektstørrelse, jo større er effekten for en given prøvestørrelse. Eller jo større effektstørrelse, jo mindre prøvestørrelse er nødvendig for at opnå den samme effekt. Så et godt skøn over effektstørrelse er nøglen til en god effektanalyse. Men det er ikke altid en nem opgave at bestemme effektstørrelsen. Gode skøn over effektstørrelse kommer fra den eksisterende litteratur eller fra pilotundersøgelser.

Se også

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *