Pandas

1. Cicle de vida

2. Tipologia

4. Llenguatge de programació

Descripció

Pandas és una llibreria de Python molt utilitzada per al tractament i l’anàlisi de dades. Entre les seves característiques més destacades trobem que ofereix el tipus de dada dataframe, que permet la manipulació de dades amb indexació, proporciona funcions per a la lectura i escriptura en diferents formats de fitxers i incorpora eines i funcions per al tractament de les dades com ara agrupacions, unions, mescles, dades no disponibles i indexació jeràrquica. A més, també incorpora funcionalitats per a sèries temporals, com la generació de rangs de dates, conversions, etc.

Enllaç al recurs

https://pandas.pydata.org/

Exemples d’ús

El següent exemple mostra com penjar un fitxer extern localitzat a la web usant Pandas i el seu tractament posterior.

El codi utilitzat és el següent (s’han numerat les línies per a millorar-ne la lectura):

1     import pandas as pd         
2          
3     file_name = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"
4     df = pd.read_csv(file_name, names = ['Sepal_Length', 'Sepal_Width', 'Petal_Length', 'Petal_Width', 'Species'])
5     df.head()
6     df.tail()
7     df[df.Species == 'Iris-setosa']

Cada línia afegeix un tractament a la informació, de la següent manera:

  • La línia 4 puja el fitxer iris.csv en dataframe denominat df, especificant el nom de les columnes
  • La línia 5 ens mostrarà les primeres 5 línies del fitxer iris, mentre que la línia 6 ens mostrarà les 5 últimes.
  • A la línia 7 fem un filtre per obtenir totes les files de l’espècie «Iris-setosa».

Enllaços relacionats

http://pandas.pydata.org/pandas-docs/stable/