Descripció
Pandas és una llibreria de Python molt utilitzada per al tractament i l’anàlisi de dades. Entre les seves característiques més destacades trobem que ofereix el tipus de dada dataframe, que permet la manipulació de dades amb indexació, proporciona funcions per a la lectura i escriptura en diferents formats de fitxers i incorpora eines i funcions per al tractament de les dades com ara agrupacions, unions, mescles, dades no disponibles i indexació jeràrquica. A més, també incorpora funcionalitats per a sèries temporals, com la generació de rangs de dates, conversions, etc.
Enllaç al recurs
Exemples d’ús
El següent exemple mostra com penjar un fitxer extern localitzat a la web usant Pandas i el seu tractament posterior.
El codi utilitzat és el següent (s’han numerat les línies per a millorar-ne la lectura):
1 import pandas as pd 2 3 file_name = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data" 4 df = pd.read_csv(file_name, names = ['Sepal_Length', 'Sepal_Width', 'Petal_Length', 'Petal_Width', 'Species']) 5 df.head() 6 df.tail() 7 df[df.Species == 'Iris-setosa']
Cada línia afegeix un tractament a la informació, de la següent manera:
- La línia 4 puja el fitxer iris.csv en dataframe denominat df, especificant el nom de les columnes
- La línia 5 ens mostrarà les primeres 5 línies del fitxer iris, mentre que la línia 6 ens mostrarà les 5 últimes.
- A la línia 7 fem un filtre per obtenir totes les files de l’espècie «Iris-setosa».