Articles

type I and type II errors

Posted on

医学

医学の実践において、スクリーニングと検査の用途の違いはかなり大きいものです。

検査には、はるかに高価で、多くの場合侵襲的な処置が必要となりますが、病気の兆候がある人にのみ行われ、ほとんどの場合、疑わしい診断を確認するために適用されます。

例えば、米国のほとんどの州では、先天性疾患の中でもフェニルケトン尿症と甲状腺機能低下症のスクリーニングが新生児に義務付けられています。

仮説:「新生児はフェニルケトン尿症と甲状腺機能低下症である」

帰無仮説(H0)。 “The newborns do not have phenylketonuria and hypothyroidism”

Type I error (false positive)。

タイプIエラー(偽陽性):真の事実はフェニルケトン尿症と甲状腺機能低下症ではないが、データによればこれらの疾患を持っていると考えられる。

偽陽性の割合が高いものの、これらの疾患をはるかに早い段階で発見できる可能性が大幅に高まるため、このスクリーニング検査は価値があると考えられています。

HIVや肝炎の献血者をスクリーニングするための簡単な血液検査には、かなりの確率で偽陽性が見られますが、実際にこれらのウイルスに感染しているかどうかを判断するためには、医師はより高価ではるかに精密な検査を行います。 米国ではマンモグラフィーの誤診率が15%にも達し、世界で最も高い数値となっています。 米国の誤診率の高さは、10年間で米国の検診受診者の半数がマンモグラフィの誤診を受けていることにつながります。 マンモグラフィの偽陽性にはコストがかかり、米国では毎年1億ドル以上の費用が経過観察や治療に費やされています。 また、女性に必要以上の不安を与えることにもなります。 米国では誤診率が高いため、マンモグラフィーで陽性と判定された女性のうち90〜95%がこの病気ではないとされています。 世界で最も低率なのはオランダで、1%です。

理想的な集団検診検査は、安価で実施しやすく、可能であれば偽陰性をゼロにするものです。

医学的テスト

偽陰性と偽陽性は医学的テストにおいて重要な問題です。

仮説: 「患者は特定の病気にかかっている」

帰無仮説 (H0): “

タイプIエラー(偽陽性)。 “

偽陽性は、スクリーニングのように、検査対象の疾患が稀な場合にも、深刻で直感に反する問題を引き起こすことがあります。 ある検査の偽陽性率が1万人に1人であっても、真の陽性は100万人に1人であれば、その検査で検出される陽性のほとんどは偽陽性となります。 観察された陽性結果が偽陽性である確率は、ベイズの定理を用いて計算することができます。

タイプIIエラー(偽陰性)。 “

偽陰性は、特に検索されている状態が一般的である場合、深刻で反直感的な問題を引き起こします。 偽陰性率がわずか10%の検査を、真の発生率が70%の集団の検査に使用した場合、検査によって検出された偽陰性の多くは偽のものとなります。

これは時に、患者とその病気の両方に対して不適切または不適当な治療につながります。

生体認証

指紋認証、顔認証、虹彩認証などの生体認証は、タイプIとタイプIIのエラーの影響を受けます。

仮説:「入力されたものは、検索された人のリストの中で誰かを特定していない」

帰無仮説:「入力されたものは、検索された人のリストの中で誰かを特定している」

タイプIのエラー(誤棄却率)。 “

タイプ II エラー (false match rate): 「真の事実は、その人が検索されたリストの誰かであるということだが、システムはデータに従ってその人がそうではないと結論づけた」

タイプ II エラー (false match rate): “真の事実は、人物が検索されたリストの中の誰かではないが、システムはデータに従ってその人物が探している誰かであると結論づけていることである。”

タイプIのエラーの確率を「false reject rate」(FRR)または「false non-match rate」(FNMR)と呼び、タイプIIのエラーの確率を「false accept rate」(FAR)または「false match rate」(FMR)と呼びます。

システムが容疑者とほとんど一致しないように設計されている場合、タイプIIのエラーの確率は「false alarm rate」と呼ぶことができます。

システムがほとんど容疑者と一致しないように設計されている場合、タイプIIエラーの確率は「誤認識率」と呼ぶことができます。

システムが検証のために使用されている(受け入れられることが普通である)場合、FARはシステムの安全性の尺度であり、FRRはユーザーの不便さのレベルを測定します。

セキュリティスクリーニング

主な記事:爆発物検知と金属探知機

最終的には目視検査システムである空港のセキュリティスクリーニングでは、誤認識が日常的に発見されます。 また、武器の持ち込みを防止するために設置されている警報器は、鍵、ベルトのバックル、小銭、携帯電話、靴の鋲などの些細なものでも1日に何度も警報が鳴るように高感度に設定されていることが多い。 “

帰無仮説: 「そのアイテムは武器ではない」

タイプIエラー (偽陽性)。 “

タイプ II エラー (偽陰性) 「真の事実は、アイテムは武器ではないが、システムはまだ警告を発していることである。”

偽陽性 (無実の旅行者をテロリストと見なす) と真陽性 (テロリストになりそうな人を検出する) の比率は非常に高く、ほとんどすべてのアラームが偽陽性であるため、これらのスクリーニング テストの陽性予測値は非常に低くなります。

偽結果の相対的なコストによって、テスト作成者がこれらのイベントの発生を許容する可能性が決まります。 このシナリオでは、偽陰性のコストが非常に高く (飛行機に持ち込まれた爆弾を検出できなかった場合、何百人もの死亡者が出る可能性があります)、一方、偽陽性のコストは比較的低い (合理的に簡単な追加検査を行うだけです) ので、統計的特異性が低く、統計的感度が高い (偽陰性を最小限に抑える代わりに、高い確率で偽陽性を許容する) 検査が最も適切です。

コンピュータ

偽陽性と偽陰性という概念は、コンピュータ セキュリティ、スパム フィルタリング、マルウェア、光学式文字認識など、コンピュータやコンピュータ アプリケーションの領域で広く使われています。

例えば、スパムフィルタリングの場合、仮説はメッセージがスパムであるということです。

従って、帰無仮説:「メッセージはスパムではありません」

タイプIエラー(偽陽性)。 “

ほとんどのアンチスパム戦術は、高い割合の不要な電子メールをブロックまたはフィルタリングすることができますが、重大な偽陽性の結果を生み出さずにそれを行うことは、はるかに厳しいタスクです。

タイプ II エラー (偽陰性)。 “スパムメールがスパムとして検出されず、非スパムに分類されること。” 偽陰性の数が少ないことは、スパムフィルタリングの効率性の指標となります。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です