Errors de tipus I i II

1. Cicle de vida

3. Àmbit d'aplicació

Descripció

Els errors de tipus I i II són els que poden aparèixer quan s’intenta validar o refutar una hipòtesi i s’arriba a una conclusió errònia. Si la hipòtesi nul·la (anomenada així perquè estableix que no hi ha relació entre dos esdeveniments) és certa però l’investigador, per la raó que sigui, dona per certa la hipòtesi alternativa (és a dir, quan sí que hi ha una relació), aleshores estem parlant d’un fals positiu (es «troba» una relació inexistent), i això és coneix com un error de tipus I. Si, pel contrari, la hipòtesi nul·la és falsa (és a dir, la hipòtesi alternativa és la correcta) però l’investigador pensa que la certa és la hipòtesi nul·la (no es «troba» una relació existent), aleshores estem parlant d’un fals negatiu i això és coneix com un error de tipus II.

Curiosament, la nomenclatura I i II usada per aquest tipus d’errors és deguda a la notació que varen usar els autors (Jerzy Neyman i Egon Pearson) quan l’any 1933 van descriure els possibles escenaris que apareixen quan es pren una decisió i es comet un error respecte a la hipòtesi que s’està intentant validar o refutar. De fet, aquesta notació actualment és considerada molt confusa per molts autors i docents, i genera molts maldecaps als estudiants d’estadística, així que es pensa que seria millor parlar directament de falsos positius i falsos negatius, conceptes que són molt més fàcils d’entendre.

Enllaç al recurs

https://ca.wikipedia.org/wiki/Errors_de_tipus_I_i_de_tipus_II

Exemple d’ús

Per exemple, suposem que dissenyem un sistema que analitza si un correu electrònic es pot considerar que és brossa, per a filtrar-lo automàticament i enviar-lo a una carpeta a banda. Per a fer-ho, el nostre sistema pot considerar diverses característiques del missatge, com ara conèixer o no qui l’envia, si conté molts enllaços, etc. Com que el sistema està pensat per a detectar correu brossa, la nostra hipòtesi nul·la serà que el missatge no és correu brossa, és a dir, no hi ha relació entre el missatge i el fet de poder ser considerat correu brossa. Aleshores:

  • Error de tipus I: un missatge és considerat correu brossa quan no ho és (fals positiu).
  • Error de tipus II: un missatge de correu brossa no és detectat com a tal (fals negatiu).

En aquest cas, per a ajustar el nostre sistema i mesurar-ne l’eficàcia caldrà veure quants errors cometem de cada tipus, i determinar com de preferible és tenir més errors d’un tipus que de l’altre. Així, un sistema que determini que tots els correus rebuts són brossa, els detectaria tots, però no seria útil, ja que hi hauria un gran nombre de falsos positius. En aquest escenari és molt més acceptable que de tant en tant es coli un missatge de correu brossa a la bústia d’entrada que no a l’inrevés, és a dir, perdre un missatge legal en classificar-lo com a correu brossa, és a dir, preferim tenir falsos negatius que falsos positius.

Enllaços relacionats

Hipòtesi nul·la (Viquipèdia): https://ca.wikipedia.org/wiki/Hipòtesi_nul·la

Article de Neyman i Pearson: https://royalsocietypublishing.org/doi/10.1098/rsta.1933.0009