Articles

Errori di tipo I e di tipo II

Posted on

Medicina

Nella pratica della medicina, le differenze tra le applicazioni dello screening e dei test sono considerevoli.

Selezione medica

Lo screening comporta test relativamente economici che vengono dati a grandi popolazioni, nessuna delle quali manifesta alcuna indicazione clinica di malattia (es,

I test coinvolgono procedure molto più costose, spesso invasive, che vengono somministrate solo a coloro che manifestano qualche indicazione clinica di malattia, e sono più spesso applicate per confermare una diagnosi sospetta.

Per esempio, la maggior parte degli stati degli USA richiede che i neonati siano sottoposti a screening per la fenilchetonuria e l’ipotiroidismo, tra gli altri disturbi congeniti.

Ipotesi: “I neonati hanno fenilchetonuria e ipotiroidismo”

Ipotesi nulla (H0): “I neonati non hanno fenilchetonuria e ipotiroidismo”

Errore di tipo I (falso positivo): Il fatto vero è che i neonati non hanno fenilchetonuria e ipotiroidismo, ma riteniamo che abbiano i disturbi in base ai dati.

Errore di tipo II (falso negativo): Il fatto vero è che i neonati hanno la fenilchetonuria e l’ipotiroidismo ma noi riteniamo che non abbiano i disturbi in base ai dati.

Anche se mostrano un alto tasso di falsi positivi, i test di screening sono considerati preziosi perché aumentano notevolmente la probabilità di rilevare questi disturbi in una fase molto più precoce.

I semplici esami del sangue utilizzati per lo screening di possibili donatori di sangue per l’HIV e l’epatite hanno un tasso significativo di falsi positivi; tuttavia, i medici utilizzano test molto più costosi e molto più precisi per determinare se una persona è effettivamente infettata da uno di questi virus.

Forse i falsi positivi più ampiamente discussi nello screening medico provengono dalla procedura di screening del cancro al seno, la mammografia. Il tasso di falsi positivi delle mammografie negli Stati Uniti è fino al 15%, il più alto del mondo. Una conseguenza dell’alto tasso di falsi positivi negli Stati Uniti è che, in qualsiasi periodo di 10 anni, la metà delle donne americane sottoposte a screening riceve una mammografia falsamente positiva. Le mammografie falsamente positive sono costose, con oltre 100 milioni di dollari spesi ogni anno negli Stati Uniti per test e trattamenti successivi. Inoltre causano alle donne un’ansia inutile. Come risultato dell’alto tasso di falsi positivi negli Stati Uniti, fino al 90-95% delle donne che ottengono una mammografia positiva non hanno la condizione. Il tasso più basso nel mondo è nei Paesi Bassi, 1%. I tassi più bassi sono generalmente nel Nord Europa, dove le pellicole mammografiche vengono lette due volte e viene fissata una soglia elevata per ulteriori test (la soglia elevata diminuisce la potenza del test).

Il test di screening ideale per la popolazione dovrebbe essere economico, facile da somministrare e produrre zero falsi negativi, se possibile. Tali test di solito producono più falsi positivi, che possono essere successivamente risolti da test più sofisticati (e costosi).

Test medici

Falsi negativi e falsi positivi sono problemi significativi nei test medici.

Ipotesi: “I pazienti hanno la malattia specifica.”

Ipotesi nulla (H0): “I pazienti non hanno la malattia specifica.”

Errore di tipo I (falso positivo): “Il fatto vero è che i pazienti non hanno una malattia specifica, ma i medici giudicano che i pazienti erano malati secondo i rapporti del test.”

I falsi positivi possono anche produrre problemi seri e controintuitivi quando la condizione ricercata è rara, come nello screening. Se un test ha un tasso di falsi positivi di uno su diecimila, ma solo uno su un milione di campioni (o persone) è un vero positivo, la maggior parte dei positivi rilevati da quel test saranno falsi. La probabilità che un risultato positivo osservato sia un falso positivo può essere calcolata usando il teorema di Bayes.

Errore di tipo II (falso negativo): “Il fatto vero è che la malattia è effettivamente presente, ma i rapporti del test forniscono un messaggio falsamente rassicurante ai pazienti e ai medici che la malattia è assente.”

I falsi negativi producono problemi seri e controintuitivi, soprattutto quando la condizione ricercata è comune. Se un test con un tasso di falsi negativi di solo il 10% viene usato per testare una popolazione con un tasso di occorrenza reale del 70%, molti dei negativi rilevati dal test saranno falsi.

Questo a volte porta a un trattamento inappropriato o inadeguato sia del paziente che della sua malattia. Un esempio comune è l’affidarsi ai test da sforzo cardiaci per rilevare l’aterosclerosi coronarica, anche se i test da sforzo cardiaci sono noti per rilevare solo le limitazioni del flusso sanguigno delle arterie coronarie dovute a stenosi avanzate.

La biometria

La corrispondenza biometrica, come per il riconoscimento delle impronte digitali, del viso o dell’iride, è suscettibile di errori di tipo I e II.

Ipotesi: “L’input non identifica qualcuno nella lista di persone ricercate”

Ipotesi nulla: “L’input identifica qualcuno nella lista di persone ricercate”

Errore di tipo I (tasso di falso rifiuto): “Il fatto vero è che la persona è qualcuno nella lista cercata, ma il sistema conclude che la persona non lo è in base ai dati.”

Errore di tipo II (tasso di falsa corrispondenza): “Il fatto vero è che la persona non è qualcuno nella lista cercata ma il sistema conclude che la persona è qualcuno che stiamo cercando secondo i dati.”

La probabilità di errori di tipo I è chiamata “false reject rate” (FRR) o false non-match rate (FNMR), mentre la probabilità di errori di tipo II è chiamata “false accept rate” (FAR) o false match rate (FMR).

Se il sistema è progettato per abbinare raramente i sospetti allora la probabilità di errori di tipo II può essere chiamata “false alarm rate”. D’altra parte, se il sistema è usato per la convalida (e l’accettazione è la norma) allora il FAR è una misura della sicurezza del sistema, mentre l’FRR misura il livello di disagio dell’utente.

Security screening

Articoli principali: rilevamento di esplosivi e metal detector

I falsi positivi si trovano ogni giorno nei controlli di sicurezza degli aeroporti, che sono in definitiva sistemi di ispezione visiva. Gli allarmi di sicurezza installati hanno lo scopo di prevenire l’introduzione di armi sugli aerei; tuttavia sono spesso impostati su una sensibilità così alta che allarmano molte volte al giorno per oggetti minori, come chiavi, fibbie di cinture, spiccioli, telefoni cellulari e chiodini nelle scarpe.

Qui, l’ipotesi è: “L’oggetto è un’arma”

L’ipotesi nulla: “L’oggetto non è un’arma”

Errore di tipo I (falso positivo): “Il fatto vero è che l’oggetto non è un’arma ma il sistema continua ad allarmare.”

Errore di tipo II (falso negativo) “Il fatto vero è che l’oggetto è un’arma ma il sistema tace in questo momento.”

Il rapporto tra falsi positivi (che identificano un viaggiatore innocente come terrorista) e veri positivi (che individuano un aspirante terrorista) è, quindi, molto alto; e poiché quasi ogni allarme è un falso positivo, il valore predittivo positivo di questi test di screening è molto basso.

Il costo relativo dei falsi risultati determina la probabilità che i creatori dei test permettano il verificarsi di questi eventi. Poiché il costo di un falso negativo in questo scenario è estremamente alto (non rilevare una bomba che viene portata su un aereo potrebbe causare centinaia di morti) mentre il costo di un falso positivo è relativamente basso (un’ulteriore ispezione ragionevolmente semplice), il test più appropriato è uno con una bassa specificità statistica ma un’alta sensibilità statistica (uno che permette un alto tasso di falsi positivi in cambio di falsi negativi minimi).

Computer

Le nozioni di falsi positivi e falsi negativi hanno un’ampia diffusione nel regno dei computer e delle applicazioni informatiche, tra cui la sicurezza informatica, il filtraggio dello spam, il malware, il riconoscimento ottico dei caratteri e molti altri.

Per esempio, nel caso del filtraggio dello spam l’ipotesi è che il messaggio sia uno spam.

Quindi, ipotesi nulla: “Il messaggio non è uno spam”

Errore di tipo I (falso positivo): “Le tecniche di filtraggio o di blocco dello spam classificano erroneamente un messaggio email legittimo come spam e, di conseguenza, interferiscono con la sua consegna.”

Mentre la maggior parte delle tattiche anti-spam possono bloccare o filtrare un’alta percentuale di email indesiderate, farlo senza creare significativi risultati falsi-positivi è un compito molto più impegnativo.

Errore di tipo II (falso negativo): “L’email di spam non viene rilevata come spam, ma viene classificata come non spam”. Un basso numero di falsi negativi è un indicatore dell’efficienza del filtraggio dello spam.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *