Descripció
Weka (Waikato Environment for Knowledge Analysis) és una plataforma de programari d’aprenentatge automàtice (machine learning) i mineria de dades que conté una col·lecció d’eines de visualització i algorismes per a anàlisi de dades i modelatge predictiu. En Weka trobarem funcionalitats orientades a la preparació de les dades, i també algorismes de classificació, regressió, clusterització, regles d’associació i certes característiques per a la visualització de dades.
Per a aprendre amb detall l’ús d’aquesta eina i mantenir-vos actualitzats pel que fa a totes les capacitats que s’hi van incorporant, la Universitat de Waikato posa a la nostra disposició una gran quantitat de recursos formatius.
Enllaç al recurs
https://www.cs.waikato.ac.nz/~ml/weka
Exemples d’ús
En el següent exemple veurem com fer un model de classificació utilitzant l’algorisme random forest a Weka. Partirem del nostre fitxer de dades en format CSV, que utilitzem com a font d’informació; en aquest cas, usarem el famós conjunt de dades Iris Flowers (iris.csv), que conté 150 observacions (files) i 5 atributs (columnes), en què es detalla per a cada tipus de flor (Iris setosa, Iris versicolor i Iris virginica) la longitud i l’amplària del sèpal i del pètal.
Posteriorment, a l’apartat de «classificació», començarem a crear el model seleccionat entre els diferents classificadors suportats per l’eina. En el nostre cas, usarem random forest, i indicarem que utilitzi un 70% del conjunt de dades per a entrenament del model. Seguidament, ja podrem començar el procés de generació del model i a analitzar els resultats, entre els quals podrem trobar la matriu de confusió, i també la precisió del model generat.
Enllaços relacionats
https://en.wikipedia.org/wiki/weka_(machine_learning)
https://www.cs.waikato.ac.nz/ml/weka/courses.html
https://machinelearningmastery.com/how-to-run-your-first-classifier-in-weka/