ggplot2

1. Ciclo de vida

2. Tipología

3. Ámbito de aplicación

4. Lenguaje de programación

Descripción

ggplot2 es un paquete R que permite la creación de gráficos avanzados mediante la superposición de capas que determinan el aspecto y posición de los elementos que componen el gráfico. Está basado en lo que se conoce como «la gramática de los gráficos», creada por Leland Wilkinson, que permite pensar un gráfico como una superposición (tanto en lo físico como en lo abstracto) de elementos y sus atributos, de forma que cada parte de la sentencia que genera el gráfico tiene su propia sintaxis y significado, ocupándose de un aspecto del gráfico.

Enlace al recurso

https://ggplot2.tidyverse.org/

Ejemplos de uso

El siguiente ejemplo muestra cómo crear un histograma usando ggplot2 de un conjunto de datos ficticio que contiene, entre otros campos, la edad de los usuarios de un servicio.

El código que genera el gráfico es el siguiente (se han numerado las líneas para mejorar su lectura):

1     # cargar el package         
2     library(ggplot2)            
3                                       
4     # creación del gráfico
5     ggplot(data=DATA, aes(DATA$AGE)) + 
6           geom_histogram(breaks=seq(20, 50, by = 2), 
                 col="red", 
                 fill="green", 
                 alpha = .2) + 
7           labs(title="Histogram for Age") +
8           labs(x="Age", y="Count") + 
9           xlim(c(18,52)) +
10          ylim(c(0,30))

DATA es la estructura o data.frame que almacena los datos (leídos de un fichero CSV, por ejemplo) y AGE es la columna que contiene la edad de la cual queremos visualizar el histograma.

Después de cargar el package mediante la línea 2, en la línea 5 se compone el gráfico mediante la suma (usando el mismo operador ‘+’) de las líneas 5 a la 10, ambas inclusive. Cada línea añade una capa o determina cierta información del gráfico que queremos obtener con el histograma. Así, por ejemplo:

  • La línea 5 crea un gráfico base indicando solamente qué datos y qué campo o atributo van a usarse para crear el gráfico.
  • La línea 6 determina la geometría del gráfico, en este caso, un histograma, indicando mediante el uso de parámetros el intervalo del eje de las abscisas y los colores usados.
  • Las líneas 7 y 8 permiten especificar el título del gráfico y los textos de cada eje respectivamente.
  • Finalmente, las líneas 9 y 10 permiten especificar el rango de valores de cada eje, lo que determinará el aspecto y posición del gráfico generado con respecto a la zona de trabajo, teniendo en cuenta, por ejemplo, lo especificado en la línea 6.

Enlaces relacionados

https://towardsdatascience.com/a-comprehensive-guide-to-the-grammar-of-graphics-for-effective-visualization-of-multi-dimensional-1f92b4ed4149

https://en.wikipedia.org/wiki/Leland_Wilkinson