Teljesítményelemzés kétcsoportos független minta t-test / R adatelemzési példák

példák

1. példa. A klinikai dietetikus két különböző étrendet, az a-T és a B-t szeretne összehasonlítani a cukorbetegek számára. Azt feltételezi, hogy az a diéta (1.csoport) jobb lesz, mint a B étrend (2. csoport), az alacsonyabb vércukorszint szempontjából. Azt tervezi, hogy véletlenszerű mintát kap a diabéteszes betegekről, és véletlenszerűen hozzárendeli őket a két étrend egyikéhez. A kísérlet végén, amely 6 hétig tart, minden betegnél éhgyomri vércukorszint-tesztet végeznek. Azt is elvárja, hogy a vércukorszint mérésének átlagos különbsége a két csoport között körülbelül 10 mg / dl legyen. Továbbá azt is feltételezi, hogy a vércukorszint eloszlásának szórása az a diéta esetében 15, A B étrend standard eltérése pedig 17. A dietetikus azt akarja tudni, hogy az egyes csoportokban azonos méretű csoportokra van szükség.

2. példa. Egy audiológus meg akarta vizsgálni a nemek hatását egy bizonyos hangfrekvenciára adott válaszidőre. Azt gyanította, hogy a férfiak jobban észlelik ezt a fajta hangot, akkor nők voltak. A kísérlethez 20 férfi és 20 női alanyból vett egy véletlenszerű mintát. Minden alany kapott egy gombot, hogy nyomja meg, amikor ő / ő hallotta a hangot. Az audiológus ezután megmérte a válaszidőt – a hang kibocsátása és a gomb megnyomása közötti időt. Most, azt akarja tudni, hogy mi a statisztikai hatalom alapja az ő összesen 40 alanyok felismerni a nemek közötti különbség.

előjáték a Teljesítményelemzéshez

a teljesítményelemzésnek két különböző aspektusa van. Az egyik az, hogy kiszámítsuk a szükségeseketmintaméret egy meghatározott teljesítményhez, mint az 1.példában. A másik szempont a teljesítmény kiszámítása, amikoregy adott minta méretét adja meg, mint a 2. példában. Technikailag a hatalom a nullhipotézis elutasításának valószínűsége, ha a konkrét alternatív hipotézis igaz.

az alábbi teljesítményelemzéseknél az 1. példára fogunk összpontosítani, kiszámítva egy adott statisztikai teljesítmény mintaméretét az a étrend és a B étrend hatásának különbségének tesztelésére. Itt van az információ, amit tudnunk kell, vagy feltételeznünk kell a teljesítményelemzés elvégzéséhez:

  • Az átlagos vércukorszint várható különbsége; ebben az esetben 10-re van állítva.
  • a vércukorszint standard eltérései az 1.és a 2. csoport esetében; ebben az esetben 15-re, illetve 17-re vannak állítva.
  • az alfa szint, vagy az I. típusú hibaarány, amely a nullhipotézis elutasításának valószínűsége, ha valóban igaz. A bevett gyakorlat az, hogy állítsa be a .05 szint.
  • a statisztikai teljesítmény előre meghatározott szintje a minta méretének kiszámításához; ez lesz beállítva .8.
  • a statisztikai teljesítmény kiszámításához az előre meghatározott alanyok száma; ez a helyzet például 2.

vegye figyelembe, hogy az első példában a dietetikus nem határozta meg az egyes csoportok átlagát, hanem csak a két eszköz különbségét határozta meg. Ez azért van, mert csak a különbség érdekli, nem számít, milyen eszközök vannak, amíg a különbség ugyanaz.

teljesítményelemzés

R-ben meglehetősen egyszerű teljesítményelemzést végezni az eszközök összehasonlításához. Például, tudjuk használni a PWR csomag r a mi számítás az alábbiak szerint. Először meghatározzuk a két eszközt, az 1.csoport (a diéta) átlagát, a 2. csoport (B étrend) átlagát. Mivel ami igazán számít, az a különbség, az egyes csoportokra vonatkozó eszközök helyett az 1. és a 10. csoport átlagára nulla értéket adhatunk meg a 2. csoport átlagához, így az eszközök közötti különbség 10 lesz. Ezután meg kell adnunk az összevont szórást, amely a két szórás átlagának négyzetgyöke. Ebben az esetben sqrt((15^2 + 17^2)/2) = 16.03. Az alapértelmezett szignifikancia szint (alfa szint).05. Ebben a példában meg fogjuk állítani a hatalmat .8.

a számítási eredmények azt mutatják, hogy 42 alanyra van szükségünk az a étrendhez, és további 42 alanyra a B étrendhez a mintánkban a hatás érdekében. Most használjunk egy másik pár eszközt ugyanazzal a különbséggel. Amint azt korábban megbeszéltük, az eredményeknek azonosnak kell lenniük, és így is van.

most a dietetikus úgy érezheti, hogy a 84 alanyból álló teljes minta mérete meghaladja a költségvetését. A minta méretének csökkentésének egyik módja az I. típusú hibaarány vagy az alfa-szint növelése. Tegyük fel, ahelyett, hogy az alfa szintet használnánk .05 fogjuk használni .07. Ezután a minta mérete csökken 4 minden csoportban az alábbiak szerint.

most tegyük fel, hogy a dietetikus csak 60 alanyra gyűjthet adatokat, mindegyik csoportban 30. Mi lesz a statisztikai teljesítmény neki t-teszt tekintetében alfa szinten .05?

amint azt korábban tárgyaltuk, ami igazán számít a teljesítmény vagy a minta méretének kiszámításakor, az az eszköz különbsége az összevont szórás felett. Ez a hatásméret mértéke. Most nézzük meg, hogy a hatás mérete hogyan befolyásolja a minta méretét, feltételezve egy adott minta teljesítményét. Egyszerűen feltételezhetjük, hogy a különbség az eszközök és állítsa be a szórás, hogy 1 és createa táblázat hatása mérete, d, változó .2 hogy 1.2.

ezeket az információkat könnyen megjeleníthetjük egy telken is.

plot(ptab,ptab,type="b",xlab="effect size",ylab="sample size")

azt mutatja, hogy ha a hatás mérete kicsi, mint például .2 akkor szükségünk van egy nagyon nagy minta mérete, hogy a minta mérete csökken, mint hatás mérete növekszik. Azt is easilyplot teljesítmény versus minta mérete egy adott hatások mérete, mondjuk, d = 0.7

pwrt

fontos technikai feltételezés a normalitás feltételezése. Ha az eloszlás ferde, akkor előfordulhat, hogy egy kis mintaméretnek nincs az eredményekben feltüntetett teljesítménye, mivel az eredmények értékét a normalitás feltételezésén alapuló módszerrel számítják ki. Láttuk, hogy a teljesítmény vagy a minta méretének kiszámításához számos feltételezést kell tennünk. Ezeket a feltételezéseket nem csak a számítás céljára használják, hanem a tényleges t-tesztben is használják. Tehát a teljesítményelemzés egyik fontos előnye, hogy segít jobban megérteni terveinket és hipotéziseinket.

a teljesítményszámítási folyamat során láttuk, hogy a két független T-teszt mintában a különbség a két csoport eszközeinek és szórásainak különbsége. Ez a hatásméret fogalmához vezet. Ebben az esetben a hatás mérete a különbség az eszközökben az összevont szórás felett. Minél nagyobb a hatásméret, annál nagyobb a teljesítmény egy adott minta méretéhez. Vagy minél nagyobb a hatásméret, annál kisebb mintaméret szükséges ugyanazon teljesítmény eléréséhez. Tehát a hatásméret jó becslése a jó teljesítményelemzés kulcsa. De nem mindig könnyű feladat meghatározni a hatás méretét. A hatásméret jó becslései a meglévő szakirodalomból vagy kísérleti tanulmányokból származnak.

Lásd még:

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük