Descripció
El biaix d’autoselecció és un dels problemes que pot aparèixer quan es dissenya un procediment per a recollir dades i aquest no estableix de forma adequada els protocols necessaris per a assegurar l’existència d’un grup experimental i d’un grup de control ben construïts, on els usuaris que formen part de cada grup s’han de triar aleatòriament i s’assegura que se satisfan certes condicions relatives a la seva distribució segons altres variables.
També apareix quan el canal usat per a recollir dades no respecta aquesta aleatorietat desitjada de tot procediment de mostreig. Per exemple, una enquesta executada a través de Twitter només reflectirà el tarannà dels usuaris d’aquesta xarxa social, però no el de la població real d’un territori o d’una regió, ni tots els rangs d’edats, donat que se sap que Twitter és una xarxa social amb poca presència de gent gran, per exemple.
Per a evitar o corregir aquest tipus de biaix hi ha diferents tècniques, basades en la manipulació de les dades disponibles i l’ús de dades externes quan sigui possible. La idea bàsica és utilitzar tècniques de mostreig, estratificació i correcció per pesos, per fer que els dos grups a comparar siguin el més semblants possibles, de forma que es pugui considerar que van ser triats aleatòriament de la mateixa població, sense biaix.
Enllaç al recurs
https://www.statisticshowto.com/self-selection-bias/
Exemple d’ús
El típic exemple de biaix d’autoselecció apareix quan, per exemple, es vol avaluar una innovació educativa en un entorn d’aprenentatge. Idealment, els estudiants haurien de ser repartits aleatòriament en dos grups, un d’experimental, on els estudiants participaran en la innovació docent, i un de control, on els estudiants seguiran treballant de la mateixa manera com ho feien abans. L’objectiu és mesurar l’impacte de la intervenció per se, i que no es vegi influenciada per les característiques dels participants. Quan no és possible fer un repartiment aleatori dels estudiants, molts cops la innovació s’avalua demanant voluntaris per a participar-hi, fet que introdueix un biaix d’autoselecció, ja que els estudiants que decideixen participar-hi voluntàriament poden tenir unes característiques o uns objectius especials que els fan participar, i que poden interferir amb l’anàlisi de la intervenció.
Per exemple, una innovació docent basada en l’ús de la realitat virtual es podria veure afectada pel biaix d’autoselecció si els estudiants participants resulta que són tots (o en la major part) usuaris avançats de videojocs interessats en aquests tipus de tecnologies, més motivats a participar en un experiment que usa la realitat virtual. Així, el resultat de la intervenció podria no estar mesurant l’impacte real de la innovació docent sobre el conjunt d’estudiants, sino l’habilitat dels estudiants que ja jugaven amb videojocs de forma intensiva anteriorment.
De totes formes, si es tenen les dades de tots els estudiants (la població) i dels participants en la intervenció, és possible usar diferents tests estadístics per veure si el grup de participants està molt esbiaixat respecte a la població, i indicar que és necessari aplicar alguna tècnica a posteriori per a resoldre el problema. Si no es fa, els resultats obtinguts de comparar els participants amb la resta no es podran imputar a la intervenció.
Enllaços relacionats
Wikipedia: https://en.wikipedia.org/wiki/Self-selection_bias
Com reduir el biaix de selecció en recerca: https://file.scirp.org/pdf/OJEpi_2015070913284831.pdf