2群独立サンプルt検定|Rデータ解析のパワー解析例

例1. 臨床栄養士は、糖尿病患者のための二つの異なる食事、AとBを比較したいと考えています。 彼女は、低血糖の点で、食事A(グループ1)が食事B(グループ2)よりも優れていると仮定しています。 彼女は糖尿病患者のランダムなサンプルを取得し、ランダムに二つの食事のいずれかに割り当てることを計画しています。 6週間続く実験の終わりに、各患者に対して空腹時血糖検査が実施される。 彼女はまた、2つのグループ間の血糖測定の平均差が約10mg/dlになると予想しています。 さらに、彼女はまた、食事Aの血糖分布の標準偏差を15、食事Bの標準偏差を17と仮定しています。 栄養士は、同じサイズのグループを仮定して、各グループに必要な被験者の数を知りたいと考えています。

例2。 ある聴覚学者は、特定の音の周波数に対する応答時間に対する性別の影響を研究したいと考えていました。 彼は、男性がこのタイプの音を検出するのが優れていたと疑い、女性であった。 彼はこの実験のために20人の男性と20人の女性の被験者の無作為のサンプルを取った。 各被験者は、彼/彼女が音を聞いたときに押すためのボタンを与えられました。 その後、聴覚学者は応答時間を測定しました–音が放出されてからボタンが押された時間までの時間。 今、彼は性差を検出するために彼の合計40の被験者に基づいて統計的パワーが何であるかを知りたいと思っています。

パワー分析へのプレリュード

パワー分析には2つの異なる側面があります。 1つは、例1のように、指定された検出力のために必要なサンプルサイズを計算することです。 もう1つの側面は、実施例2のように特定のサンプルサイズを与えたときのパワーを計算することです。 技術的には、検出力は、特定の対立仮説が真である場合に帰無仮説を棄却する確率です。

以下の検出力分析では、例1に焦点を当て、食事Aと食事Bの効果の違いを検定する特定の統計的検出力のサンプルサイズを計算します。 ここでは、電力分析を実行するために知っておく必要がある情報、または想定する必要がある情報を示します:

  • 平均血糖値の予想される差;この場合は10に設定されます。
  • グループ1およびグループ2の血糖値の標準偏差;この場合、それぞれ15および17に設定されています。
  • アルファレベル、またはタイプIエラー率、これは、帰無仮説が実際に真である場合に棄却する確率です。 一般的な方法は、それを設定することです。05レベル。
  • サンプルサイズを計算するための統計的検出力の事前に指定されたレベル;これはに設定されます。8.
  • 統計的検出力を計算するための被験者の事前に指定された数;これは例2のような状況です。最初の例では、栄養士は各グループの平均を指定せず、代わりに2つの平均の差のみを指定したことに注意してください。 これは、彼女が違いにのみ興味があり、違いが同じである限り、手段が何であるかは問題ではないからです。 Rでは、平均を比較するためのパワー解析を実行するのはかなり簡単です。 たとえば、以下に示すように、rのpwrパッケージを計算に使用できます。 まず、グループ1の平均(食事A)とグループ2の平均(食事B)の2つの平均を指定します。 本当に重要なのは違いであるため、各グループの平均ではなく、グループ1にゼロの平均を入力し、グループ2の平均に10を入力すると、平均の差は10になり 次に、2つの標準偏差の平均の平方根であるプールされた標準偏差を指定する必要があります。 この場合、それはsqrtです((15^2 + 17^2)/2) = 16.03. デフォルトの有意水準(アルファ水準)は次のとおりです。05. この例では、パワーをatに設定します。8.

    計算結果は、効果を得るために、サンプル中の食事Aの42人の被験者と食事Bの別の42人の被験者が必要であることを示しています。 さて、同じ違いを持つ別の平均のペアを使用しましょう。 先に説明したように、結果は同じでなければならず、そうでなければなりません。

    今、栄養士は84人の被験者の合計サンプルサイズが彼女の予算を超えていると感じるかもしれません。 サンプルサイズを小さくする1つの方法は、タイプIの誤り率、つまりアルファレベルを上げることです。 のアルファレベルを使用する代わりに言ってみましょう。05私たちは使用します。07. 次に、サンプルサイズは、以下に示すように、各グループごとに4減少します。

    栄養士は、各グループに60人の被験者と30人のデータしか収集できないと仮定します。

    栄養士は、各グループに30人の被験者と60人の被験者のデータ 彼女のt検定の統計的検出力は、アルファレベルに関するものになります。05?前に説明したように、検出力またはサンプルサイズの計算で本当に重要なのは、プールされた標準偏差に対する平均の差です。

    前に説明したように、 これは効果の大きさの尺度です。 次に、与えられたサンプル検出力を仮定して、エフェクトサイズがサンプルサイズにどのように影響するかを見てみましょう。 単純に平均の差を仮定し、標準偏差を1に設定し、効果サイズdを持つテーブルを作成することができます。にする。

    この情報をプロットに簡単に表示することもできます。 p>

    plot(ptab,ptab,type="b",xlab="effect size",ylab="sample size")

    これは、効果のサイズが小さい場合、そのようなことを示しています。2その後、我々は非常に大きなサンプルサイズが必要であり、そのサンプルサイズは、効果のサイズが大きくなると低下します。 また、与えられた効果サイズ、例えばd=0に対して、パワー対サンプルサイズを簡単にプロットすることもできます。7

    pwrt

    ディスカッション

    重要な技術的仮定は、正規性の仮定です。 分布が歪んでいる場合、結果の値は正規性の仮定に基づいた方法を使用して計算されるため、小さなサンプルサイズでは結果に表示される検出力が 検出力またはサンプルサイズを計算するためには、いくつかの仮定を行う必要があることがわかりました。 これらの仮定は、計算の目的だけでなく、実際のt検定自体でも使用されます。 したがって、パワー解析を実行することの重要な側面の利点の1つは、設計と仮説をよりよく理解するのに役立つことです。検出力計算プロセスでは、2つの独立したサンプルt検定で重要なのは、2つのグループの平均値と標準偏差の差であることがわかりました。

    これは、効果サイズの概念につながります。 この場合、効果の大きさは、合算された標準偏差に対する平均の差になります。 効果サイズが大きいほど、特定のサンプルサイズの検出力が大きくなります。 または、効果サイズが大きいほど、同じパワーを達成するために必要なサンプルサイズが小さくなります。 したがって、効果サイズの適切な推定が、良好な検出力分析の鍵となります。 しかし、効果の大きさを決定するのは必ずしも簡単な作業ではありません。 効果の大きさの良い推定値は、既存の文献またはパイロット研究から来ています。

    も参照してください

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です