Strømanalyse For to-gruppe Uavhengig prøve T-test | R Data Analyse Eksempler

Eksempler

Eksempel 1. En klinisk diettist ønsker å sammenligne to forskjellige dietter, A Og B, for diabetespasienter. Hun hypoteser at diett A (Gruppe 1) vil være bedre enn diett B (Gruppe 2), når det gjelder lavere blodsukker. Hun planlegger å få et tilfeldig utvalg av diabetespasienter og tilfeldig tildele dem til en av de to diettene. Ved slutten av forsøket, som varer 6 uker, vil en fastende blodglukosetest bli utført på hver pasient. Hun forventer også at gjennomsnittlig forskjell i blodsukkermåling mellom de to gruppene vil være ca 10 mg / dl. Videre antar hun også standardavviket for blodglukosefordeling for diett A til å være 15 og standardavviket for diett B til å være 17. Dietetikeren ønsker å vite antall fag som trengs i hver gruppe, forutsatt like store grupper.

Eksempel 2. En audiograf ønsket å studere effekten av kjønn på responstiden til en bestemt lydfrekvens. Han mistenkte at menn var flinkere til å oppdage denne typen lyd da var kvinner. Han tok et tilfeldig utvalg av 20 mannlige og 20 kvinnelige fag for dette eksperimentet. Hvert emne ble gitt en knapp for å trykke når han / hun hørte lyden. Audiologen målte deretter responstiden – tiden mellom lyden ble sendt ut og tiden knappen ble trykket på. Nå vil han vite hva den statistiske kraften er basert på hans totalt 40 fag for å oppdage kjønnsforskjellen.

Prelude Til Strømanalysen

det er to forskjellige aspekter av strømanalyse. Den ene er å beregne nødvendigprøvestørrelse for en spesifisert effekt som I Eksempel 1. Det andre aspektet er å beregne kraften nårgitt en bestemt prøvestørrelse som I Eksempel 2. Teknisk sett er makt sannsynligheten for å avvise nullhypotesen når den spesifikke alternative hypotesen er sant.

for kraftanalysene nedenfor skal Vi fokusere På Eksempel 1, beregne prøvestørrelsen for en gitt statistisk kraft for å teste forskjellen i effekten av diett A og diett B. Legg Merke til forutsetningene som diettisten har gjort for å utføre kraftanalysen. Her er informasjonen vi må vite eller må anta for å utføre strømanalysen: den forventede forskjellen i gjennomsnittlig blodsukker; i dette tilfellet er den satt til 10.

  • standardavvikene for blodsukker For Gruppe 1 Og Gruppe 2; i dette tilfellet er de satt til henholdsvis 15 og 17.
  • alfa-nivået, Eller Type i-feilfrekvensen, som er sannsynligheten for å avvise nullhypotesen når den faktisk er sann. En vanlig praksis er å sette den på .05 nivå.
  • det forhåndsdefinerte nivået av statistisk styrke for beregning av prøvestørrelsen; dette vil bli satt til .8.
  • det forhåndsdefinerte antall fag for beregning av statistisk styrke; dette er situasjonen for eksempel 2.
  • Legg Merke til at i det første eksemplet spesifiserte diettisten ikke gjennomsnittet for hver gruppe, i stedet angav hun bare forskjellen på de to midlene. Dette skyldes at hun bare er interessert i forskjellen, og det spiller ingen rolle hva midlene er så lenge forskjellen er den samme.

    Strømanalyse

    I R er det ganske enkelt å utføre strømanalyse for å sammenligne midler. For eksempel kan vi bruke pwr-pakken I R for vår beregning som vist nedenfor. Vi spesifiserer først de to midlene, gjennomsnittet For Gruppe 1 (diett A) og gjennomsnittet For Gruppe 2 (diett B). Siden det som virkelig betyr noe er forskjellen, i stedet for midler for hver gruppe, kan vi angi et gjennomsnitt på null For Gruppe 1 og 10 for gjennomsnittet Av Gruppe 2, slik at forskjellen i midler vil være 10. Deretter må vi spesifisere det samlede standardavviket, som er kvadratroten av gjennomsnittet av de to standardavvikene. I dette tilfellet er det sqrt((15^2 + 17^2)/2) = 16.03. Standard signifikansnivå (alfanivå) er.05. For dette eksemplet vil vi sette kraften til å være på .8.

    beregningsresultatene indikerer at vi trenger 42 fag for diett A og en annen 42 fag for diett B i vårt utvalg for effekten. La oss nå bruke et annet par midler med samme forskjell. Som vi har diskutert tidligere, bør resultatene være de samme, og de er.

    nå dietetiker kan føle at en total prøvestørrelse på 84 fag er utenfor hennes budsjett. En måte å redusere prøvestørrelsen på er å øke Type i-feilfrekvensen, eller alfa-nivået. La oss si i stedet for å bruke alfa nivå av .05 vi vil bruke .07. Da vil vår utvalgsstørrelse redusere med 4 for hver gruppe som vist nedenfor.

    anta nå at diettisten kun kan samle inn data på 60 fag med 30 i hver gruppe. Hva vil den statistiske kraften for hennes t-test være med hensyn til alfa nivå av .05?

    som vi har diskutert før, er det som virkelig betyr noe i beregningen av kraft eller prøvestørrelse forskjellen på midlene over det samlede standardavviket. Dette er et mål på effektstørrelse. La oss nå se på hvordan effektstørrelsen påvirker prøvestørrelsen forutsatt en gitt prøvekraft. Vi kan bare anta forskjellen i midler og sette standardavviket til å være 1 og opprette en tabell med effektstørrelse, d, varierende fra .2 til 1,2.

    vi kan også enkelt vise denne informasjonen i et plott.

    plot(ptab,ptab,type="b",xlab="effect size",ylab="sample size")

    det viser at hvis effektstørrelsen er liten, slik .2 da trenger vi en veldig stor prøvestørrelse og at prøvestørrelsen faller etter hvert som effektstørrelsen øker. Vi kan også enkeltplot strøm versus prøvestørrelse for en gitt effektstørrelse, si d = 0.7

    pwrt

    Diskusjon

    en viktig teknisk forutsetning er normalitetsforutsetningen. Hvis fordelingen er skjev, kan det hende at en liten prøvestørrelse ikke har effekten som vises i resultatene, fordi verdien i resultatene beregnes ved hjelp av metoden basert på normalitetsforutsetningen. Vi har sett at for å beregne kraften eller prøvestørrelsen, må vi gjøre en rekke forutsetninger. Disse forutsetningene brukes ikke bare med det formål å beregne, men brukes også i selve t-testen selv. Så en viktig sidefordel ved å utføre kraftanalyse er å hjelpe oss med å bedre forstå våre design og våre hypoteser.

    vi har sett i kraftberegningsprosessen at det som betyr noe i den to-uavhengige prøven t-test er forskjellen i midlene og standardavvikene for de to gruppene. Dette fører til begrepet effektstørrelse. I dette tilfellet vil effektstørrelsen være forskjellen i midler over det samlede standardavviket. Jo større effektstørrelsen er, desto større er effekten for en gitt prøvestørrelse. Eller jo større effektstørrelse, jo mindre prøvestørrelse som trengs for å oppnå samme effekt. Så et godt estimat av effektstørrelse er nøkkelen til en god effektanalyse. Men det er ikke alltid en lett oppgave å bestemme effektstørrelsen. Gode estimater av effektstørrelse kommer fra eksisterende litteratur eller fra pilotstudier.

    Se også

    Legg igjen en kommentar

    Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *