Descripció
El package de R datasets posa a la nostra disposició una sèrie de conjunts de dades amb què poder treballar. En l’actualitat podem trobar més de cinquanta, entre els quals destaquen iris (de R.A. Fisher), cars o Titanic, entre altres exemples utilitzats per comparar algorismes de classificació.
Enllaç al recurs
https://stat.ethz.ch/r-manual/r-devel/library/datasets/html/00index.html
Exemple d’ús
Un dels datasets més usats amb finalitats acadèmiques és mtcars. En aquest conjunt de dades es recull informació de proves en carretera per a 32 automòbils (models de 1973-1974), entre les quals podem trobar el consum de combustible, així com aspectes del seu disseny i rendiment. L’origen de la informació procedeix de la revista Motor Trend US de l’any 1974. El format del dataset és el següent. Conté 32 observacions amb 11 variables numèriques, una per columna:
Columna Nom Descripció [, 1] mpg Milles (US) / galó [, 2] cyl Nombre de cilindres [, 3] disp Desplaçament (cu.in.) [, 4] hp Potència bruta [, 5] drat Relació eix posterior [, 6] wt Pes (en 1.000 lbs) [, 7] qsec 1/4 milla temps [, 8] vs Motor (0 = V-shaped, 1 = straight) [, 9] am Transmissió (0 = automàtic, 1 = manual) [,10] gear Nombre de marxes [,11] carb Nombre de carburadors
Enllaços relacionats
Conjunt iris: https://ca.wikipedia.org/wiki/Conjunt_de_dades_de_flors_Iris