Descripción
Los errores de tipo I y II son aquellos que pueden aparecer al intentar validar o refutar una hipótesis y llegar a una conclusión errónea. Si la hipótesis nula (llamada así porque establece que no hay relación entre dos eventos) es cierta, pero el investigador, por cualquier razón, da por cierta la hipótesis alternativa (es decir, cuando hay una relación), entonces estamos hablando de un falso positivo (se «encuentra» una relación inexistente), y esto se conoce como un error de tipo I. Si, por el contrario, la hipótesis nula es falsa (es decir, la hipótesis alternativa es la correcta) pero el investigador piensa que la cierta es la hipótesis nula (no se «encuentra» una relación existente), entonces estamos hablando de un falso negativo y esto se conoce como un error de tipo II.
Curiosamente, la nomenclatura I y II utilizada para este tipo de errores se debe a la notación utilizada por los autores (Jerzy Neyman y Egon Pearson) cuando en 1933 describieron los posibles escenarios que aparecen cuando se toma una decisión y se comete un error con respecto a la hipótesis que se está intentando validar o refutar. De hecho, esta notación ahora es considerada muy confusa por muchos autores y profesores, y genera muchos quebraderos de cabeza a los estudiantes de estadística, por lo que se cree que sería mejor hablar directamente de falsos positivos y falsos negativos, conceptos que son mucho más fáciles de entender.
Enlace al recurso
https://es.wikipedia.org/wiki/Errores_de_tipo_I_y_de_tipo_II
Ejemplo de uso
Por ejemplo, supongamos que diseñamos un sistema que analiza si un correo electrónico puede considerarse que es basura, para filtrarlo automáticamente y enviarlo a una carpeta independiente. Para ello, nuestro sistema puede considerar varias características del mensaje, como conocer o no quién lo envía, si contiene muchos enlaces, etc. Debido a que el sistema está destinado a detectar correo basura, nuestra hipótesis nula es que el mensaje no es correo basura, es decir, no hay relación entre el mensaje y el hecho de ser considerado correo basura. Entonces:
- Error de tipo I: un mensaje se considera correo basura cuando no lo es (falso positivo).
- Error de tipo II: un mensaje de correo basura no se detecta como tal (falso negativo).
En este caso, para ajustar nuestro sistema y medir su efectividad, será necesario ver cuántos errores cometemos de cada tipo, y determinar lo preferible que es tener más errores de un tipo que del otro. Así, un sistema que determina que todos los correos recibidos son basura, los detectaría todos, pero no sería útil, ya que habría un gran número de falsos positivos. En este escenario es mucho más aceptable que ocasionalmente un mensaje de correo basura se esté colando en la bandeja de entrada en lugar de al revés, es decir, perder un mensaje legal al clasificarlo como correo basura, es decir, preferimos tener falsos negativos que falsos positivos.
Enlaces relacionados
Hipótesis nula (Wikipedia): https://es.wikipedia.org/wiki/Hip%C3%B3tesis_nula
Artículo de Neyman y Pearson: https://royalsocietypublishing.org/doi/10.1098/rsta.1933.0009