Articles

Errores de tipo I y de tipo II

Posted on

Medicina

En la práctica de la medicina, las diferencias entre las aplicaciones del cribado y de las pruebas son considerables.

Cribado médico

El cribado implica pruebas relativamente baratas que se administran a grandes poblaciones, ninguna de las cuales manifiesta ningún indicio clínico de enfermedad (por ejemplo, Las pruebas de Papanicolaou).

Las pruebas implican procedimientos mucho más caros, a menudo invasivos, que se administran sólo a aquellos que manifiestan algún indicio clínico de enfermedad, y se aplican con mayor frecuencia para confirmar una sospecha de diagnóstico.

Por ejemplo, la mayoría de los estados de EE.UU. exigen que los recién nacidos sean sometidos a pruebas de detección de fenilcetonuria e hipotiroidismo, entre otros trastornos congénitos.

Hipótesis: «Los recién nacidos tienen fenilcetonuria e hipotiroidismo»

Hipótesis nula (H0): «Los recién nacidos no tienen fenilcetonuria e hipotiroidismo»

Error tipo I (falso positivo): El hecho verdadero es que los recién nacidos no tienen fenilcetonuria e hipotiroidismo pero consideramos que tienen los trastornos según los datos.

Error tipo II (falso negativo): El hecho real es que los recién nacidos tienen fenilcetonuria e hipotiroidismo pero consideramos que no tienen los trastornos según los datos.

Aunque muestran una alta tasa de falsos positivos, las pruebas de cribado se consideran valiosas porque aumentan en gran medida la probabilidad de detectar estos trastornos en una fase mucho más temprana.

Los sencillos análisis de sangre que se utilizan para detectar el VIH y la hepatitis en posibles donantes de sangre tienen una tasa significativa de falsos positivos; sin embargo, los médicos utilizan pruebas mucho más caras y mucho más precisas para determinar si una persona está realmente infectada por alguno de estos virus.

Quizás los falsos positivos más discutidos en el cribado médico provienen del procedimiento de cribado del cáncer de mama, la mamografía. La tasa de falsos positivos de las mamografías en Estados Unidos es de hasta un 15%, la más alta del mundo. Una de las consecuencias de la elevada tasa de falsos positivos en EE.UU. es que, en cualquier período de 10 años, la mitad de las mujeres estadounidenses sometidas a cribado reciben un mamograma falso positivo. Los falsos positivos de las mamografías son costosos, ya que se gastan más de 100 millones de dólares al año en Estados Unidos en pruebas de seguimiento y tratamiento. También causan a las mujeres una ansiedad innecesaria. Como resultado de la elevada tasa de falsos positivos en los Estados Unidos, hasta el 90-95% de las mujeres que obtienen un mamograma positivo no tienen la enfermedad. La tasa más baja del mundo es la de los Países Bajos, un 1%. Las tasas más bajas se dan generalmente en el norte de Europa, donde las mamografías se leen dos veces y se establece un umbral alto para la realización de pruebas adicionales (el umbral alto disminuye la potencia de la prueba).

La prueba de cribado poblacional ideal sería barata, fácil de administrar y produciría cero falsos negativos, si fuera posible. Este tipo de pruebas suelen producir más falsos positivos, que posteriormente pueden resolverse mediante pruebas más sofisticadas (y costosas).

Pruebas médicas

Los falsos negativos y los falsos positivos son problemas importantes en las pruebas médicas.

Hipótesis: «Los pacientes tienen la enfermedad específica»

Hipótesis nula (H0): «Los pacientes no tienen la enfermedad específica»

Error tipo I (falso positivo): «El hecho real es que los pacientes no tienen una enfermedad específica, pero los médicos juzgan que los pacientes estaban enfermos según los informes de las pruebas.»

Los falsos positivos también pueden producir problemas graves y contrarios a la intuición cuando la condición que se busca es rara, como en el cribado. Si una prueba tiene una tasa de falsos positivos de uno entre diez mil, pero sólo uno entre un millón de muestras (o personas) es un verdadero positivo, la mayoría de los positivos detectados por esa prueba serán falsos. La probabilidad de que un resultado positivo observado sea un falso positivo puede calcularse utilizando el teorema de Bayes.

Error de tipo II (falso negativo): «El hecho real es que la enfermedad está realmente presente, pero los informes de las pruebas proporcionan un mensaje falsamente tranquilizador a los pacientes y a los médicos de que la enfermedad está ausente»

Los falsos negativos producen problemas graves y contraintuitivos, especialmente cuando la condición que se busca es común. Si una prueba con una tasa de falsos negativos de sólo el 10% se utiliza para analizar a una población con una tasa de ocurrencia real del 70%, muchos de los negativos detectados por la prueba serán falsos.

Esto a veces conduce a un tratamiento inapropiado o inadecuado tanto del paciente como de su enfermedad. Un ejemplo común es confiar en las pruebas de esfuerzo cardíaco para detectar la aterosclerosis coronaria, a pesar de que se sabe que las pruebas de esfuerzo cardíaco sólo detectan limitaciones del flujo sanguíneo de las arterias coronarias debido a una estenosis avanzada.

La biometría

La coincidencia biométrica, como para el reconocimiento de huellas dactilares, el reconocimiento facial o el reconocimiento del iris, es susceptible de errores de tipo I y de tipo II.

Hipótesis: «La entrada no identifica a alguien en la lista de personas buscada»

Hipótesis nula: «La entrada sí identifica a alguien en la lista de personas buscada»

Error de tipo I (tasa de falso rechazo): «El hecho verdadero es que la persona es alguien de la lista buscada pero el sistema concluye que la persona no lo es según los datos»

Error tipo II (tasa de falsas coincidencias): «El hecho cierto es que la persona no es alguien de la lista buscada pero el sistema concluye que la persona es alguien a quien buscamos según los datos.»

La probabilidad de los errores de tipo I se denomina «tasa de falsos rechazos» (FRR) o tasa de falsas no coincidencias (FNMR), mientras que la probabilidad de los errores de tipo II se denomina «tasa de falsas aceptaciones» (FAR) o tasa de falsas coincidencias (FMR).

Si el sistema está diseñado para coincidir raramente con los sospechosos, entonces la probabilidad de los errores de tipo II puede denominarse «tasa de falsas alarmas». Por otro lado, si el sistema se utiliza para la validación (y la aceptación es la norma) entonces el FAR es una medida de la seguridad del sistema, mientras que el FRR mide el nivel de molestia del usuario.

Control de seguridad

Artículos principales: detección de explosivos y detector de metales

Los falsos positivos se encuentran de forma rutinaria todos los días en los controles de seguridad de los aeropuertos, que en definitiva son sistemas de inspección visual. Las alarmas de seguridad instaladas tienen como objetivo evitar que se introduzcan armas en los aviones; sin embargo, a menudo están configuradas con una sensibilidad tan alta que dan la alarma muchas veces al día por objetos menores, como llaves, hebillas de cinturones, monedas sueltas, teléfonos móviles y tachuelas en los zapatos.

Aquí, la hipótesis es: «El objeto es un arma»

La hipótesis nula: «El objeto no es un arma»

Error tipo I (falso positivo): «El hecho verdadero es que el ítem no es un arma pero el sistema sigue alarmando.»

Error tipo II (falso negativo) «El hecho verdadero es que el ítem es un arma pero el sistema guarda silencio en este momento.»

La proporción de falsos positivos (que identifican a un viajero inocente como terrorista) con respecto a los verdaderos positivos (que detectan a un posible terrorista) es, por tanto, muy alta; y como casi todas las alarmas son falsos positivos, el valor predictivo positivo de estas pruebas de detección es muy bajo.

El coste relativo de los falsos resultados determina la probabilidad de que los creadores de las pruebas permitan que se produzcan estos hechos. Como el coste de un falso negativo en este escenario es extremadamente alto (no detectar una bomba introducida en un avión podría provocar cientos de muertes) mientras que el coste de un falso positivo es relativamente bajo (una inspección posterior razonablemente sencilla), la prueba más adecuada es aquella que tiene una especificidad estadística baja pero una sensibilidad estadística alta (aquella que permite una alta tasa de falsos positivos a cambio de un mínimo de falsos negativos).

Informática

Las nociones de falsos positivos y falsos negativos tienen una amplia vigencia en el ámbito de la informática y las aplicaciones informáticas, incluyendo la seguridad informática, el filtrado de spam, el malware, el reconocimiento óptico de caracteres y muchos otros.

Por ejemplo, en el caso del filtrado de spam la hipótesis aquí es que el mensaje es un spam.

Por lo tanto, hipótesis nula: «El mensaje no es un spam»

Error tipo I (falso positivo): «Las técnicas de filtrado o bloqueo de spam clasifican erróneamente un mensaje de correo electrónico legítimo como spam y, como resultado, interfieren en su entrega.»

Aunque la mayoría de las tácticas antispam pueden bloquear o filtrar un alto porcentaje de correos electrónicos no deseados, hacerlo sin crear resultados falsos positivos significativos es una tarea mucho más exigente.

Error tipo II (falso negativo): «El correo electrónico spam no se detecta como spam, sino que se clasifica como no spam». Un bajo número de falsos negativos es un indicador de la eficacia del filtrado de spam.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *