El valor real dels p-valors

Autor: Julià Minguillón

Els textos i imatges publicats en aquesta obra estan subjectes (llevat que s'indiqui el contrari) a una llicència de Reconeixement-Compartir igual (BY-SA) v.3.0 Espanya de Creative Commons. Podeu modificar l'obra, reproduirla, distribuir-la o comunicar-la públicament sempre que en citeu l'autor i la font (FUOC. Fundació per a la Universitat Oberta de Catalunya), i sempre que l'obra derivada quedi subjecta a la mateixa llicència que el material original. La llicència completa es pot consultar a http://creativecommons.org/licenses/by-sa/3.0/es/legalcode.ca

1. Cicle de vida

2. Tipologia

3. Àmbit d'aplicació

Descripció

Aquesta presentació de Lucy D’Agostino McGowan sobre els p-valors fa un repàs per diferents articles acadèmics en què es discuteix l’ús dels p-valors en la recerca i els problemes associats.

Bàsicament, quan un fa un experiment per validar o refutar una hipòtesi observant (mesurant) alguna cosa, el que es calcula és la probabilitat d’obtenir un valor extrem superior a l’observat, de manera que per a valors molt petits de p, sigui plausible pensar que l’observació no s’ha fet per atzar (perquè és molt improbable), sinó perquè realment hi ha alguna raó que genera els valors extrems. És a dir, si tenim una distribució normal, obtenir valors per sobre de +/- 3 sigma és molt improbable, només passa un 0.03 % dels cops per atzar. Si la nostra hipòtesi és que les nostres dades segueixen una distribució normal i, en canvi, observem molts valors extrems, aleshores podrem pensar que possiblement la nostra hipòtesi de normalitat és falsa, però haurem de comprovar-ho amb un test estadístic que farà servir un p-valor per indicar com d’«improbable» és el que estem observant respecte a la hipòtesi inicial.

A la presentació, l’autora es pregunta per què es fas servir un llindar de p = 0.05 a les escoles per explicar els tests de significança estadística, i la resposta és perquè a la literatura s’utilitza aquest llindar. Però aleshores, perquè s’empra p = 0.05? Perquè és el que hom ha après a l’escola, i així es tanca el cercle. L’autora proporciona raons per trencar aquest cercle i mirar de fer servir els p-valors tenint en compte la nostra realitat actual, amb dades massives, ja sigui aplicant correccions, emprant intervals de confiança o bé fins i tot deixant de banda els p-valors per refutar o validar hipòtesis.

Enllaç al recurs

https://www.lucymcgowan.com/talk/north_carolina_translational_and_clinical_sciences_institute/

Exemple d’ús

Suposem que tenim una moneda i la llencem per veure si està trucada o no, és a dir, si cau més d’una banda que de l’altra. La nostra hipòtesi nul·la seria que la moneda no està trucada, aleshores la llançarem N vegades i mirarem si el nombre de cares i creus obtingudes està equilibrat, i si no és així, aleshores refutarem la hipòtesi de moneda no trucada i podrem dir que sí que ho està.

Si, per exemple, en 20 llançaments obtenim 14 cares o més (o 14 creus o més, a efectes pràctics per saber si la moneda està trucada o no és el mateix), què podem dir? Òbviament, hi ha un desequilibri important, 14 cares enfront de 6 creus (o 15 enfront de 5, etc.) no sembla gaire equilibrat. La distribució binomial ens diu que la probabilitat de tenir 14 cares o més quan llencem una moneda 20 cops és d’aproximadament 0.0577, igual que la de tenir 6 cares o menys. En total, la probabilitat d’obtenir alguna de les combinacions (cares, creus) com ara (0,20), (1,19), (2,18), (3,17), (4,16), (5,15), (6,14) i les anàlogues (14,6), (15,5), …, (20,0) és de 0.1154, simplement per atzar.

Aleshores, amb un p-valor de 0.05 no podem dir que la moneda estigui trucada, perquè la probabilitat d’observar a l’atzar 14 cares o més en 20 llançaments és més alta. Però, i si haguéssim fet 40 llançaments i haguéssim observat 28 cares (és a dir, el doble)?

A l’assignatura Probabilitat i estadística, del grau de Ciència de Dades Aplicada, de la UOC, aprendreu a formular hipòtesis i fer servir tests estadístics i p-valors per validar-les o refutar-les.

 

Enllaços relacionats

El valor p a Wikipedia: https://ca.wikipedia.org/wiki/Valor_p

Calculadora en línia per la distribució binomial: https://homepage.divms.uiowa.edu/~mbognar/applets/bin.html