Introducció al modelatge bayesià aplicat

Autor: Julià Minguillón

Els textos i imatges publicats en aquesta obra estan subjectes (llevat que s'indiqui el contrari) a una llicència de Reconeixement-Compartir igual (BY-SA) v.3.0 Espanya de Creative Commons. Podeu modificar l'obra, reproduirla, distribuir-la o comunicar-la públicament sempre que en citeu l'autor i la font (FUOC. Fundació per a la Universitat Oberta de Catalunya), i sempre que l'obra derivada quedi subjecta a la mateixa llicència que el material original. La llicència completa es pot consultar a http://creativecommons.org/licenses/by-sa/3.0/es/legalcode.ca

1. Cicle de vida

2. Tipologia

3. Àmbit d'aplicació

4. Llenguatge de programació

Descripció

Aquest llibre, escrit per Alicia A. Johnson, Miles Q. Ott i Mine Dogucu, descriu què és el modelatge segons la perspectiva bayesiana i com podem aplicar-lo en exemples reals, enfront de la perspectiva freqüentista, més habitual en els cursos d’estadística i probabilitat. Simplificant molt, la perspectiva bayesiana planteja que hi ha una probabilitat a priori que un fet tingui lloc, mentre que la freqüentista diu que si recollim prou dades, podrem estimar la probabilitat del fet. Per exemple, davant del llançament d’una moneda sense més informació, la perspectiva bayesiana diu que tant una cara com una creu són igualment probables. En canvi, la perspectiva freqüentista diu que si llancem la moneda prou vegades, podrem estimar la probabilitat que surti una cara (o una creu).

El llibre comença amb els fonaments bayesians, descrivint la regla de Bayes per a la probabilitat condicional, que permet fer estimacions emprant coneixement a priori d’un fet. Aquesta idea de coneixement previ es desenvolupa després en diferents capítols amb exemples en R, per modelar distribucions de probabilitat a priori, l’ús de simulacions, i el càlcul de les seves distribucions conjugades.

Més endavant, el llibre planteja com es poden fer servir simulacions per calcular els paràmetres d’una distribució a posteriori, incloent-hi el mètode de Montecarlo per cadenes de Markov i altres algorismes més avançats. Un altre bloc descriu com podem fer regressions i classificacions utilitzant la perspectiva bayesiana i acabant amb el classificador bayesià naive. Finalment, el llibre explica l’extensió cap a models jeràrquics. Es tracta d’un llibre d’un nivell clarament avançat, però que descriu molt bé els conceptes, de manera molt entenedora, i els enriqueix amb un munt d’exemples en R.

Enllaç al recurs

https://www.bayesrulesbook.com/

Exemple d’ús

El llibre comença amb un exercici molt interessant sobre la dualitat freqüentista-bayesiana, mitjançant un seguit de preguntes i les possibles respostes, que ens ajuda a entendre els conceptes darrere de la perspectiva bayesiana. Sobretot, el fet d’incorporar coneixement a priori del problema.

Suposem que escoltem una entrevista a un ciutadà estatunidenc a la televisió, però no sabem d’on és. D’entrada, el cens dels Estats Units ens diu que el 21 % viuen al Midwest (M); el 17 %, al Northeast (N); el 38 %, al South (S), i el 24 % restant, al West (W). Així, el més probable és que l’estatunidenc sigui del South, és tot el que podem dir.

Però suposem que a l’entrevista l’estatunidenc diu «passa’m la meva pop», en què pop és un nom possible per dir cola, igual que soda. A partir de les dades d’una enquesta, podem estimar la proporció de dir pop (en lloc de qualsevol altra cosa) per cadascuna de les regions anteriors, i sabem que pel Midwest és del 64,5 %; pel Northeast, del 27,3 %; pel South, del 7,9 %, i pel West ,del 29,4%, és a dir, és molt estrany que algú del South digui pop. Canvia això la nostra predicció sobre d’on és l’estatunidenc? Aquestes estimacions són el que anomenem versemblança (de l’anglès likelihood):

L(M|A) = 0.6447, L(N|A) = 0.2734, L(S|A) = 0.0792, L(W|A) = 0.2943

Primer de tot, podem estimar la probabilitat que una persona qualsevol als Estats Units digui pop, com la suma ponderada de les probabilitats de dir-ho en funció de cada regió, resultant un 28.3% aproximadament.

P(A) = L(M|A)P(M) + L(N|A)P(N) + L(S|A)P(S) + L(W|A)P(W) =

0.6447 · 0.21 + 0.2734 · 0.17 + 0.0792 · 0.38 + 0.2943 · 0.24 ≈ 0.2826

en què A és el fet de dir pop. Fent servir la regla de Bayes, aleshores podem estimar la probabilitat que l’estatunidenc visqui al South com un 10,7 % aproximadament. Si fem el mateix per totes les regions, podrem veure que la probabilitat a posteriori (després d’incloure el coneixement sobre el fet de dir “pop”) més alta correspon al Midwest amb un 47,9 %, així que aquesta serà la nostra predicció més acurada amb la informació que tenim.

A l’assignatura Modelització i inferència bayesiana, del grau de Ciència de Dades Aplicada, de la UOC, treballareu amb les eines necessàries per poder entendre el raonament bayesià.

Enllaços relacionats

Probabilitat bayesiana: https://ca.wikipedia.org/wiki/Probabilitat_bayesiana

Bayesian probability for babies: https://twitter.com/alliekmiller/status/1550143342394150912

Classificador bayesià naive: https://en.wikipedia.org/wiki/Naive_Bayes_classifier