Descripción
El sesgo de autoselección es uno de los problemas que pueden ocurrir cuando un procedimiento está diseñado para recopilar datos y no establece adecuadamente los protocolos necesarios para asegurar la existencia de un grupo experimental y un grupo de control bien construidos, donde los usuarios que forman parte de cada grupo deben ser elegidos aleatoriamente y asegurarse de que se cumplen ciertas condiciones en relación con su distribución de acuerdo con otras variables.
También aparece cuando el canal utilizado para recopilar datos no respeta esta aleatoriedad deseada de cualquier procedimiento de muestreo. Por ejemplo, una encuesta ejecutada a través de Twitter solo reflejará el carácter de los usuarios de esta red social, pero no el de la población real de un territorio o región, o todos los rangos de edad, ya que se sabe que Twitter es una red social con poca presencia de personas mayores, por ejemplo.
Para evitar o corregir este tipo de sesgo existen diferentes técnicas, basadas en la manipulación de los datos disponibles y el uso de datos externos siempre que sea posible. La idea básica es utilizar técnicas de muestreo, estratificación y corrección por pesos, para hacer que los dos grupos se comparen lo más similar posible, de modo que se pueda considerar que fueron elegidos aleatoriamente de la misma población, sin sesgo.
Enlace al recurso
https://www.statisticshowto.com/self-selection-bias/
Ejemplo de uso
El ejemplo típico de un sesgo de autoselección aparece cuando, por ejemplo, queremos evaluar una innovación educativa en un entorno de aprendizaje. Idealmente, los estudiantes deberíann ser repartidos aleatoriamente en dos grupos, uno experimental, donde los estudiantes participarán en la innovación docente, y uno de control, donde los estudiantes continuarán trabajando de la misma manera como lo hacían antes. El objetivo es medir el impacto de la intervención per se, y que no esté influenciada por las características de los participantes. Cuando no es posible hacer una distribución aleatoria de los estudiantes, la innovación se evalúa a menudo pidiendo a los voluntarios que participen en ella, lo que introduce un sesgo de autoselección, ya que los estudiantes que deciden participar voluntariamente en ella pueden tener unas características o unos objetivos especiales que los hacen participar, y pueden interferir con el análisis de la intervención.
Por ejemplo, una innovación docente basada en el uso de la realidad virtual podría verse afectada por el sesgo de autoselección si los estudiantes que participan son todos (o la mayoría) usuarios avanzados de videojuegos interesados en este tipo de tecnologías, más motivados para participar en un experimento que utiliza la realidad virtual. Por lo tanto, el resultado de la intervención puede no estar midiendo el impacto real de la innovación docente en el conjunto de los estudiantes, sino la habilidad de los estudiantes que ya jugaban con videojuegos intensamente antes.
De todos modos, si se tienen los datos de todos los estudiantes (la población) y de los participantes en la intervención, es posible utilizar diferentes pruebas estadísticas para ver si el grupo de participantes está muy sesgado con respecto a la población, e indicar que es necesario aplicar alguna técnica a posteriori para resolver el problema. Si no se hace, los resultados obtenidos de la comparación de los participantes con el resto no pueden atribuirse a la intervención.
Enlaces relacionados
Wikipedia: https://en.wikipedia.org/wiki/Self-selection_bias
Cómo reducir el sesgo de selección en la investigación: https://file.scirp.org/pdf/OJEpi_2015070913284831.pdf