内容の妥当性は、テストが実際に何を測定しているかではなく、表面的に何を測定しているように見えるかを意味する表面の妥当性とは異なります。 表面的な妥当性とは、テストを受ける受験者、テストの使用を決定する管理者、その他の技術的な訓練を受けていない観察者にとって、そのテストが「有効に見える」かどうかを評価するものです。 内容の妥当性は、テスト項目が定義された内容を評価しているかどうかを評価するために、認識された主題の専門家を使用し、面の妥当性の評価よりもより厳密な統計的テストを行う必要があります。 内容の妥当性は、学力テストや職業テストで最もよく扱われます。テスト項目は、特定のトピック領域(例:歴史)や職務スキル(例:会計)に実際に必要な知識を反映する必要があります。
内容的妥当性の測定方法としては、C.H.Lawsheによって開発されたものが広く用いられています。
内容の妥当性を測定する方法として、C.H.ローシェが開発したものがあります。 Lawshe(1975)は、就職前のテストに関する論文の中で、審査員のSME(Subject Matter Expert Rater)が、各項目について次のような質問に答えることを提案しています。 “この項目で測定されたスキルや知識は、仕事の遂行に「必須」、「有用だが必須ではない」、「必要ない」のどれかですか?” Lawshe氏によると、パネリストの半数以上がある項目が必須であると回答した場合、その項目は少なくともある程度の内容的妥当性があるという。 より多くのパネリストが、ある項目が必須であると答えれば、より高いレベルの内容的妥当性がある。 これらの仮定をもとに、Lawsheは内容的妥当性の比率と呼ばれる公式を作成しました。 C V R = ( n e – N / 2 ) / ( N / 2 ) { %displaystyle CVR=(n_{e}-N/2)/(N/2)}。
ここで、C V R = {displaystyle CVR=}である。
内容有効率、n e = {displaystyle n_{e}=}。
「必須」と回答した中小企業診断士の数、N = {¥n_{e}}={¥n_{e}}}。
SMEパネリストの総数。 この式では、+1から-1の範囲の値が得られる。正の値は、少なくとも半数の中小企業がその項目を必須と評価したことを示す。 項目間のCVRの平均値は、テスト全体の内容的妥当性の指標として使用することができます。
Lawshe(1975)はCVRの臨界値の表を提供しており、テスト評価者が一定の規模の中小企業のプールに対して、偶然の期待値を超えるために必要な計算CVRの大きさを決定することができます。 この表は、ローシェの友人であるローウェル・シッパーがローシェのために計算したものでした。 この発表された表をよく見てみると、異変が起きていた。 シッパーの表では、CVRの臨界値が、中小企業40社の場合(最小値=0.29)から中小企業9社の場合(最小値=0.78)まで単調に増加し、中小企業8社の場合(最小値=0.75)で予想外に低下し、中小企業7社の場合(最小値=0.99)で上限値に達していた。 しかし、この式を8人の評価者に適用すると、7人のEssentialと1人の他の評価者の結果から、CVRは.75となる。 もし、0.75が臨界値でないとすると、エッセンシャルの評価者8人中8人がCVR1.00になる必要がある。 この場合、CVRの昇順と矛盾しないように、8人の評価者の値は1.00でなければなりません。 そうすると、8人の評価者に必要な「完璧な」値は得られますが、8人よりも高い評価者数や低い評価者数での評価は得られないため、同じ原則に反することになります。 このように表が単調に進行することから外れたのは、Schipper氏の計算ミスなのか、タイピングやタイプ設定のミスなのかは不明です。 Wilson, Pan, and Schumsky (2012) は、この誤りを正そうとしましたが、Lawsheの著作にも、Schipperの出版物にも、臨界値の表がどのように計算されたかについての説明はありませんでした。 Wilsonらは、Schipperの値が二項分布の正規近似に近い値であると判断しました。 また、Schipper氏の値と新たに計算された二項値を比較することで、Lawshe氏とSchipper氏は、実際には両側検定の二項値を反映しているにもかかわらず、発表された表を片側検定を表すものとして誤って表示していたことを発見しました。 Wilson 氏らは、複数のアルファ レベルにおける単位ステップでの臨界値を提供する、内容的妥当性比の臨界値の再計算を発表しました。 値
5 .99 6 .99 7 .99 8 .75 9 .78 10 .62 11 .59 12 .56 20 .42 30 .33 40 .29 From:http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.460.9380&rep=rep1&type=pdf