Análisis visual de datos con esquisse

Autor: Julià Minguillón

Los textos e imágenes publicados en esta obra están sujetos (excepto que se indique lo contrario) a una licencia de Reconocimiento-Compartir igual (BY-SA) v.3.0 España de Creative Commons. Se puede modificar la obra, reproducirla, distribuirla o comunicarla públicamente siempre que se cite el autor y la fuente (FUOC. Fundació per a la Universitat Oberta de Catalunya), y siempre que la obra derivada quede sujeta a la misma licencia que el material original. La licencia completa se puede consultar en: http://creativecommons.org/licenses/by-sa/3.0/es/legalcode.es

1. Ciclo de vida

2. Tipología

3. Ámbito de aplicación

4. Lenguaje de programación

Descripción

Esta biblioteca permite crear visualizaciones interactivas de manera sencilla con un editor visual, lo que facilita una primera exploración de los datos desde dentro de RStudio sin tener que programar una sola línea de código.

Básicamente, lo que hace esquisse es proporcionar una interfaz gráfica para especificar todos los parámetros necesarios en una llamada de la función ggplot() mediante una aplicación escrita en Shiny.

Enlace al recurso

https://dreamrs.github.io/esquisse/index.html

Ejemplo de uso

Solo hay que instalar esquisse (y las dependencias que pueda necesitar en función de nuestra instalación de R), ejecutar la función esquisser() y pasar como parámetro los datos que queremos analizar.

Supongamos que tenemos un conjunto de datos que nos dice de qué se matriculan los estudiantes del grado en Ingeniería Informática de la UOC de primero y segundo semestre que empezaron los estudios en otoño de 2019. Podemos crear un gráfico para ver la matrícula por asignatura (abrv), con barras apiladas por género (gender) y con una segmentación por semestre (sem_enrol) y obtenemos el siguiente resultado:

Podemos ver que el porcentaje de mujeres es generalmente bajo, pero hay algunas asignaturas que, por la razón que sea, tienen un porcentaje de mujeres más elevado, aunque seguramente es porque hay menos hombres que se matriculen por tenerla convalidada; todo ello nos puede hacer pensar que es necesario explorar más combinaciones de variables, incluyendo la edad, la vía de acceso, etc.

La herramienta también nos genera el código que crea el gráfico, así pues, lo podemos usar en nuestros proyectos y terminar de ajustar pequeños detalles; por ejemplo, sería interesante ordenar las barras por porcentaje de mujeres, no por la abreviatura de la asignatura:

ggplot(data) +
  aes(x = abrv, fill = gender) +
  geom_bar(position = "fill") +
  scale_fill_hue(direction = 1) +
  theme_minimal() +
  facet_wrap(vars(sem_enrol), ncol = 1L)

Esta herramienta os puede ser muy útil para explorar los conjuntos de datos que usaréis en los ejercicios prácticos de asignaturas como Minería de datos o Visualización de datos, dentro del grado de Ciencia de Datos Aplicada de la UOC.

Enlaces relacionados

Shiny: https://shiny.rstudio.com/

ggplot2: https://ggplot2.tidyverse.org/