ほぼすべての助成機関が、研究で仮説された効果を検出するのに十分なサンプルサイズの見積もりを要求しています。 しかし、すべての研究は、サンプルサイズの推定によって、リソースを大幅に節約することができます。 サイズが小さい研究では、実際の結果を見つけることができませんし、サイズが大きい研究では、実質的ではないものさえ見つけることができます。 前者は結果が出ていないのにリソースを使うことで、後者は必要以上にリソースを使うことで、どちらも時間、エネルギー、お金を無駄にします。
コツは、科学的に重要な効果を検出するのに十分な大きさになるように研究のサイズを決めることです。 もし効果がより大きいことがわかったら、それに越したことはありません。
情報が集まったら、分析の複雑さに応じて、多くの教科書に載っている公式を使って手で計算したり、多くの専門的なソフトウェアパッケージを使ったり、統計学者に渡したりすることができます。 しかし、あなたや統計学者がどのように計算するにしても、まず、以下の5つのステップを行う必要があります:
Step 1. 仮説検定を指定する。
ほとんどの研究は多くの仮説を持っていますが、サンプルサイズの計算では、1つから3つの主要な仮説を選びます。 その際、帰無仮説と対立仮説を明示する。
ステップ2. 検定の有意水準を指定する。
通常はα=.05ですが、必ずしもそうである必要はありません。
ステップ3. 科学的に関心のある最小の効果量を指定します。
これは、しばしば最も難しいステップです。 ここでのポイントは、期待する効果量や他の人が見つけた効果量ではなく、科学的に関心のある最小の効果量を指定することです。
それはどういう意味でしょうか? 十分な数のサンプルがあれば、どのような効果サイズでも統計的に有意になります。 あなたの仕事は、あなたの同僚がどの時点で「それが有意であったとしても、何の影響もないじゃないか」と言うかを見極めることです。
結果変数の中には、正しい値が明らかなものもあれば、そうでないものもあります。
いくつかの例を挙げてみましょう。
- もしあなたのセラピーが不安を3%下げたとしたら、それは実際に患者の人生を改善するでしょうか?
- 実験条件の刺激に対する応答時間が対照条件よりも 40 ms 速かったとしたら、それは何か意味があるのでしょうか? 40msの差は意味がありますか? 20ですか?
- 対照条件よりも処理条件の方が植物あたりのカブトムシの数が4匹少なかった場合、それは本当に植物に影響を与えるでしょうか? 4 匹のカブトムシが増えれば、植物を破壊することも、成長を妨げることもできるでしょう。
ステップ4. 累乗関数の計算に必要な他のパラメータの値を推定します。
ほとんどの統計的検定は、効果/標準誤差の形式を持っています。 ステップ3では効果の値を選択しました。 標準誤差は一般に標準偏差/nです。 ここでのポイントであるnを解くためには、標準偏差の値が必要です。
1.標準偏差を得るには、2つの方法しかありません。 もう1つの方法は、過去のデータ (同じ従属変数を使用した別の研究) を使用することです。 もし複数の研究があれば、なおさらです。
両方の情報源を手に入れるのが難しい場合もありますが、少しでも正確なサンプルサイズを求めるのであれば、どちらかが必要です。
検定の検出力は、対立仮説が真である場合に有意性が認められる確率です。
検出力は0.8が最小です。
検出力は0.8が最低ラインですが、試験のやり直しや被験者の追加が困難な場合は0.9が良いでしょう。
さあ、計算してみましょう。