Descripción
El package de R datasets pone a nuestra disposición una serie de conjuntos de datos con los que poder trabajar. En la actualidad podemos encontrar más de 50, entre los que destacan iris (de R.A. Fisher), cars o Titanic, entre otros ejemplos usados para comparar algoritmos de clasificación.
Enlace al recurso
https://stat.ethz.ch/R-manual/R-devel/library/datasets/html/00Index.html
Ejemplo de uso
Uno de los datasets más usados con fines académicos es mtcars. En este conjunto de datos se recoge información de pruebas en carretera para 32 automóviles (modelos de 1973-74), entre la que podemos encontrar el consumo de combustible, así como aspectos de su diseño y rendimiento. El origen de la información procede de la revista Motor Trend US del año 1974. El formato del dataset es el siguiente. Contiene 32 observaciones con 11 variables numéricas, una por columna:
Columna Nombre Descripción [, 1] mpg Millas (US) / galón [, 2] cyl Número de cilindros [, 3] disp Desplazamiento (cu.in.) [, 4] hp Potencia bruta [, 5] drat Relación eje trasero [, 6] wt Peso (en 1000 lbs) [, 7] qsec 1/4 milla tiempo [, 8] vs Motor (0 = V-shaped, 1 = straight) [, 9] am Transmisión (0 = automático, 1 = manual) [,10] gear Número de marchas [,11] carb Número de carburadores
Enlaces relacionados
Conjunto iris: https://es.wikipedia.org/wiki/Iris_flor_conjunto_de_datos