El repositori de dades de recerca Dataverse

Autor: Julià Minguillón

Els textos i imatges publicats en aquesta obra estan subjectes (llevat que s'indiqui el contrari) a una llicència de Reconeixement-Compartir igual (BY-SA) v.3.0 Espanya de Creative Commons. Podeu modificar l'obra, reproduirla, distribuir-la o comunicar-la públicament sempre que en citeu l'autor i la font (FUOC. Fundació per a la Universitat Oberta de Catalunya), i sempre que l'obra derivada quedi subjecta a la mateixa llicència que el material original. La llicència completa es pot consultar a http://creativecommons.org/licenses/by-sa/3.0/es/legalcode.ca

1. Cicle de vida

2. Tipologia

Descripció

Aquest repositori de dades de recerca mantingut pel Consorci de Serveis Universitaris de Catalunya té per objectiu proporcionar als investigadors un servei per emmagatzemar i publicar dades provinents de projectes de recerca. Els projectes finançats per la Comissió Europea requereixen que s’elabori un pla de gestió de dades (data management plan, DMP) i es dipositin les dades seguint els principis FAIR (findable, accessible, interoperable i reusable) amb l’objectiu d’augmentar l’eficiència i la transparència de la recerca a través d’una ràpida difusió dels resultats i de facilitar-ne la reutilització.

El repositori, que es va posar en marxa el març del 2021, permet buscar per institució, per àmbit de coneixement, paraules clau o tipus de dades, entre d’altres. Accepta dades en diferents formats típics com ara SPSS, R, CSV, Excel, etc.

Actualment, encara no s’està emprant al màxim potencial, principalment per la manca d’una cultura d’accés obert entre els cercadors i la complexitat inherent a preparar un conjunt de dades per a la seva publicació, ja que cal documentar-lo adequadament i descriure’l mitjançant metadades, de manera que es compleixin els principis FAIR, no es tracta simplement de penjar un conjunt de dades al web.

Enllaç al recurs

https://dataverse.csuc.cat/

Exemple d’ús

Un dels conjunts de dades interessants que es pot trobar al repositori és el resultat d’una recerca feta per la Universitat de Barcelona a la zona nord-oest del mar Mediterrani, on es van recollir mostres de plàstics presents a l’aigua. El conjunt de dades està compost per 6 fitxers de dades més un fitxer Readme.txt amb informació sobre el projecte, les publicacions relacionades i els altres fitxers.

Per exemple, hi ha un fitxer que conté 24.970 mostres trobades, sobre les quals es tenen 21 variables diferents, com ara la localització (per exemple, davant de quina platja es van trobar) i la data quan es van recollir, el nombre de partícules que componen la mostra, i altres mesures relacionades amb la forma, mida i color, tal com mostra la figura. Un altre fitxer permet identificar el tipus de plàstic d’un subconjunt de les mostres trobades, com ara polietilè, polipropilè o poliestirè, els tres més comuns.

Aquest conjunt de dades i d’altres us podran ser útils en diferents assignatures del grau de Ciència de Dades Aplicada de la UOC, en què haureu de manipular dades, visualitzar-les, i construir i avaluar models.

Enllaços relacionats

Portal de la recerca de Catalunya: https://portalrecerca.csuc.cat/

Dades FAIR: https://ca.wikipedia.org/wiki/FAIR

Els plàstics presents a la costa: https://iopscience.iop.org/article/10.1088/1748-9326/ac5df1