Erreurs de type I et de type II

Médecine

Dans la pratique de la médecine, les différences entre les applications du dépistage et du test sont considérables.

Dépistage médical

Le dépistage implique des tests relativement bon marché qui sont administrés à de larges populations, dont aucune ne manifeste d’indication clinique de maladie (par ex, les frottis vaginaux).

Le dépistage implique des procédures beaucoup plus coûteuses, souvent invasives, qui ne sont administrées qu’aux personnes qui manifestent une certaine indication clinique de maladie, et qui sont le plus souvent appliquées pour confirmer un diagnostic suspecté.

Par exemple, la plupart des États américains exigent que les nouveau-nés soient soumis à un dépistage de la phénylcétonurie et de l’hypothyroïdie, entre autres troubles congénitaux.

Hypothèse : « Les nouveau-nés ont une phénylcétonurie et une hypothyroïdie »

Hypothèse nulle (H0) : » Les nouveau-nés ne présentent pas de phénylcétonurie et d’hypothyroïdie «

Erreur de type I (faux positif) : Le fait vrai est que les nouveau-nés n’ont pas de phénylcétonurie et d’hypothyroïdie mais nous considérons qu’ils ont les troubles selon les données.

Erreur de type II (faux négatif) : Le fait réel est que les nouveau-nés sont atteints de phénylcétonurie et d’hypothyroïdie mais nous considérons qu’ils ne présentent pas les troubles selon les données.

Bien qu’ils affichent un taux élevé de faux positifs, les tests de dépistage sont considérés comme précieux car ils augmentent considérablement la probabilité de détecter ces troubles à un stade beaucoup plus précoce.

Les simples tests sanguins utilisés pour dépister les éventuels donneurs de sang pour le VIH et l’hépatite présentent un taux important de faux positifs ; cependant, les médecins utilisent des tests beaucoup plus coûteux et beaucoup plus précis pour déterminer si une personne est réellement infectée par l’un ou l’autre de ces virus.

Peut-être que les faux positifs les plus discutés dans le dépistage médical proviennent de la procédure de dépistage du cancer du sein par mammographie. Aux États-Unis, le taux de mammographies faussement positives atteint 15 %, soit le taux le plus élevé au monde. L’une des conséquences de ce taux élevé de faux positifs aux États-Unis est que, sur une période de 10 ans, la moitié des femmes américaines dépistées reçoivent une mammographie faussement positive. Les mammographies faussement positives sont coûteuses, plus de 100 millions de dollars étant dépensés chaque année aux États-Unis en tests et traitements de suivi. Elles provoquent également une anxiété inutile chez les femmes. En raison du taux élevé de faux positifs aux États-Unis, 90 à 95 % des femmes qui reçoivent une mammographie positive ne sont pas atteintes de la maladie. Le taux le plus bas au monde est celui des Pays-Bas, soit 1 %. Les taux les plus bas se trouvent généralement en Europe du Nord, où les films de mammographie sont lus deux fois et où un seuil élevé est fixé pour les tests supplémentaires (le seuil élevé diminue la puissance du test).

Le test de dépistage idéal pour la population serait bon marché, facile à administrer et produirait zéro faux négatif, si possible. Ces tests produisent généralement plus de faux positifs, qui peuvent ensuite être triés par des tests plus sophistiqués (et coûteux).

Tests médicaux

Les faux négatifs et les faux positifs sont des problèmes importants dans les tests médicaux.

Hypothèse : « Les patients ont la maladie spécifique. »

Hypothèse nulle (H0) : » Les patients ne sont pas atteints de la maladie spécifique. «

Erreur de type I (faux positif) : « Le fait réel est que les patients n’ont pas de maladie spécifique mais les médecins jugent que les patients était malade selon les rapports de test. »

Les faux positifs peuvent également produire des problèmes graves et contre-intuitifs lorsque la condition recherchée est rare, comme dans le dépistage. Si un test a un taux de faux positifs de un sur dix mille, mais que seul un échantillon (ou une personne) sur un million est un vrai positif, la plupart des positifs détectés par ce test seront faux. La probabilité qu’un résultat positif observé soit un faux positif peut être calculée en utilisant le théorème de Bayes.

Erreur de type II (faux négatif) : « Le fait réel est que la maladie est effectivement présente, mais les rapports de test fournissent un message faussement rassurant aux patients et aux médecins selon lequel la maladie est absente. »

Les faux négatifs produisent des problèmes graves et contre-intuitifs, en particulier lorsque l’affection recherchée est courante. Si un test dont le taux de faux négatifs n’est que de 10 % est utilisé pour tester une population dont le taux d’occurrence réelle est de 70 %, un grand nombre des négatifs détectés par le test seront faux.

Cela conduit parfois à un traitement inapproprié ou inadéquat à la fois du patient et de sa maladie. Un exemple courant est de s’appuyer sur les tests d’effort cardiaque pour détecter l’athérosclérose coronaire, même si l’on sait que les tests d’effort cardiaque ne détectent que les limitations du flux sanguin de l’artère coronaire dues à une sténose avancée.

Biométrie

La comparaison biométrique, comme pour la reconnaissance des empreintes digitales, la reconnaissance faciale ou la reconnaissance de l’iris, est susceptible de comporter des erreurs de type I et de type II.

Hypothèse : » L’entrée n’identifie pas une personne dans la liste de personnes recherchées «

Hypothèse nulle : » L’entrée identifie bien une personne dans la liste de personnes recherchées «

Erreur de type I (taux de faux rejet) : « Le fait véritable est que la personne est quelqu’un de la liste recherchée mais le système conclut que ce n’est pas le cas selon les données. »

Erreur de type II (taux de fausse correspondance) : « Le fait vrai est que la personne n’est pas quelqu’un de la liste recherchée mais le système conclut que la personne est quelqu’un que l’on recherche selon les données. »

La probabilité des erreurs de type I est appelée « taux de faux rejet » (FRR) ou taux de fausse non-correspondance (FNMR), tandis que la probabilité des erreurs de type II est appelée « taux de fausse acceptation » (FAR) ou taux de fausse correspondance (FMR).

Si le système est conçu pour correspondre rarement aux suspects, alors la probabilité des erreurs de type II peut être appelée « taux de fausse alarme ». En revanche, si le système est utilisé pour la validation (et que l’acceptation est la norme), alors le FAR est une mesure de la sécurité du système, tandis que le FRR mesure le niveau de désagrément pour l’utilisateur.

Contrôle de sécurité

Articles principaux : détection d’explosifs et détecteur de métaux

Des faux positifs sont régulièrement constatés chaque jour dans les contrôles de sécurité des aéroports, qui sont en définitive des systèmes d’inspection visuelle. Les alarmes de sécurité installées ont pour but d’empêcher l’introduction d’armes dans les avions ; pourtant, elles sont souvent réglées sur une sensibilité si élevée qu’elles s’alarment plusieurs fois par jour pour des objets mineurs, tels que des clés, des boucles de ceinture, de la petite monnaie, des téléphones portables et des punaises dans les chaussures.

Ici, l’hypothèse est la suivante : » L’objet est une arme. «

L’hypothèse nulle : » L’objet n’est pas une arme. «

L’erreur de type I (faux positif) : » Le fait vrai est que l’objet n’est pas une arme mais le système alarme quand même. «

Erreur de type II (faux négatif) : » Le fait vrai est que l’objet est une arme mais le système garde le silence pour le moment. »

Le rapport entre les faux positifs (identification d’un voyageur innocent comme terroriste) et les vrais positifs (détection d’un terroriste potentiel) est, par conséquent, très élevé ; et parce que presque chaque alarme est un faux positif, la valeur prédictive positive de ces tests de dépistage est très faible.

Le coût relatif des faux résultats détermine la probabilité que les créateurs de tests laissent ces événements se produire. Comme le coût d’un faux négatif dans ce scénario est extrêmement élevé (ne pas détecter une bombe apportée dans un avion pourrait entraîner des centaines de décès) tandis que le coût d’un faux positif est relativement faible (une inspection complémentaire raisonnablement simple), le test le plus approprié est celui qui a une spécificité statistique faible mais une sensibilité statistique élevée (celui qui permet un taux élevé de faux positifs en échange de faux négatifs minimes).

Ordinateurs

Les notions de faux positifs et de faux négatifs sont largement répandues dans le domaine de l’informatique et de ses applications, notamment la sécurité informatique, le filtrage du spam, les logiciels malveillants, la reconnaissance optique des caractères et bien d’autres.

Par exemple, dans le cas du filtrage du spam, l’hypothèse est ici que le message est un spam.

Donc, hypothèse nulle : » Le message n’est pas un spam. «

Erreur de type I (faux positif) : « Les techniques de filtrage ou de blocage du spam classent à tort un message électronique légitime comme un spam et, par conséquent, interfèrent avec sa livraison. »

Alors que la plupart des tactiques antispam peuvent bloquer ou filtrer un pourcentage élevé de courriels indésirables, le faire sans créer de faux positifs importants est une tâche beaucoup plus exigeante.

Erreur de type II (faux négatif) : « L’email de spam n’est pas détecté comme spam, mais est classé comme non-spam ». Un faible nombre de faux négatifs est un indicateur de l’efficacité du filtrage des pourriels.

Laisser un commentaire Annuler la réponse