El package ‘datasets’ de R

1. Cicle de vida

2. Tipologia

3. Àmbit d'aplicació

4. Llenguatge de programació

Descripció

El package de R datasets posa a la nostra disposició una sèrie de conjunts de dades amb què poder treballar. En l’actualitat podem trobar més de cinquanta, entre els quals destaquen iris (de R.A. Fisher), cars o Titanic, entre altres exemples utilitzats per comparar algorismes de classificació.

Enllaç al recurs

https://stat.ethz.ch/r-manual/r-devel/library/datasets/html/00index.html

Exemple d’ús

Un dels datasets més usats amb finalitats acadèmiques és mtcars. En aquest conjunt de dades es recull informació de proves en carretera per a 32 automòbils (models de 1973-1974), entre les quals podem trobar el consum de combustible, així com aspectes del seu disseny i rendiment. L’origen de la informació procedeix de la revista Motor Trend US de l’any 1974. El format del dataset és el següent. Conté 32 observacions amb 11 variables numèriques, una per columna:

Columna         Nom           Descripció                              
[, 1]           mpg             Milles (US) / galó                          
[, 2]           cyl             Nombre de cilindres                          
[, 3]           disp            Desplaçament (cu.in.)                        
[, 4]           hp              Potència bruta                            
[, 5]           drat            Relació eix posterior                         
[, 6]           wt              Pes (en 1.000 lbs)                          
[, 7]           qsec           1/4 milla temps                           
[, 8]           vs              Motor (0 = V-shaped, 1 = straight)                  
[, 9]           am             Transmissió (0 = automàtic, 1 = manual)               
[,10]           gear           Nombre de marxes                           
[,11]           carb           Nombre de carburadors

Enllaços relacionats

Conjunt iris: https://ca.wikipedia.org/wiki/Conjunt_de_dades_de_flors_Iris