Pandas

1. Ciclo de vida

2. Tipología

4. Lenguaje de programación

Descripción

Pandas es una librería de Python muy utilizada para el tratamiento y análisis de datos. Entre sus características más destacadas encontramos que ofrece el tipo de dato dataframe, que permite la manipulación de datos con indexación, proporciona funciones para la lectura y escritura en diferentes formatos de ficheros, incorpora herramientas y funciones para el tratamiento de los datos como agrupaciones, uniones, mezclas, datos faltantes, indexación jerárquica. Además, también incorpora funcionalidades para series temporales, como la generación de rangos de fechas, conversiones…

Enlace al recurso

https://pandas.pydata.org/

Ejemplos de uso

El siguiente ejemplo muestra cómo cargar un fichero externo localizado en la web usando pandas, así como su posterior tratamiento.

El código utilizado es el siguiente (se han numerado las líneas para mejorar su lectura):

1     import pandas as pd         
2          
3     file_name = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"
4     df = pd.read_csv(file_name, names = ['Sepal_Length', 'Sepal_Width', 'Petal_Length', 
      'Petal_Width', 'Species'])
5     df.head()
6     df.tail()
7     df[df.Species == 'Iris-setosa']

Cada línea añade un tratamiento a la información, de la siguiente manera:

  • La línea 4 realiza la carga del fichero iris.csv en dataframe denominado df, especificando el nombre de las columnas
  • La línea 5 nos mostrará las primeras 5 líneas del fichero iris, mientras que la línea 6 nos mostrará las 5 últimas.
  • En la línea 7 realizamos un filtro para obtener todas las filas de la especie «Iris-setosa».

Enlaces relacionados

http://pandas.pydata.org/pandas-docs/stable/