Wikidata

1. Cicle de vida

2. Tipologia

3. Àmbit d'aplicació

Descripció

Llançada el 2012, Wikidata és l’equivalent a Viquipèdia, però des d’una perspectiva d’ús pensada en dades i màquines, com a base de coneixement que pot ser explotada i interpretada sense intervenció humana. Així, Wikidata defineix entitats que representen conceptes de diversos tipus, així com relacions entre aquests conceptes. D’aquesta manera és possible «saltar» d’un concepte (entitat) a un altre mitjançant les relacions que hi ha entre ells, igual que a Viquipèdia es pot saltar d’un concepte (pàgina) a un altre mitjançant els hiperenllaços que hi ha a cada pàgina.

A diferència de Viquipèdia, Wikidata no té diferents versions d’una mateixa entitat per a diferents idiomes, atès que és una base de coneixement de fets i relacions, encara que s’usa l’anglès en el nom dels elements (entitats i relacions) que la componen. De totes maneres, és possible afegir títols i descripcions textuals en diversos idiomes, amb l’objectiu de documentar cada entitat.

Una altra característica interessant de Wikidata és que pot ser explotada mitjançant consultes SPARQL, la qual cosa permet buscar informació usant termes més complexos que una simple consulta per contingut. Mitjançant l’ús de les propietats que defineixen les relacions entre entitats és possible fer consultes que incloguin conceptes com ara distància, temps, pertinença, etc.

Seguint l’esperit de Viquipèdia, Wikidata ha estat creada com a projecte col·laboratiu, mitjançant l’esforç de milers d’usuaris i l’ajuda de bots que automatitzen certes tasques. Com a recurs obert, Wikidata i tot el seu contingut pot ser reutilitzat en altres projectes que n’explotin les capacitats, i és possible exportar les dades en diferents formats i fer consultes complexes, aprofitant la semàntica implícita en les entitats i les seves relacions.

Enllaç al recurs

https://www.wikidata.org/

Exemple d’ús

Suposem que volem saber quins municipis confronten amb Barcelona. Si consultem la Viquipèdia, a la pàgina de Barcelona podem trobar aquesta informació, tot i que de forma textual i no estructurada:

«El terme municipal de la ciutat limita, de sud a nord-est i en el sentit de les agulles del rellotge, amb els municipis del Prat de Llobregat, l’Hospitalet de Llobregat, Esplugues de Llobregat, Sant Just Desvern, Sant Feliu de Llobregat, Molins de Rei, Sant Cugat del Vallès, Cerdanyola del Vallès, Montcada i Reixac, Santa Coloma de Gramenet i Sant Adrià de Besòs.»

Processar aquesta informació de forma automàtica requereix analitzar aquest text i detectar que es tracta de la informació que estem buscant, a més de separar i explicar després els diferents municipis que hi ha en el text, la qual cosa no és trivial. D’altra banda, si volguéssim repetir aquest mateix procediment per a altres ciutats, es podria donar el cas que la informació estigués descrita d’una altra manera.

Wikidata resol aquest problema mitjançant l’establiment de relacions semàntiques («confrontar») entre entitats («municipis»). A la part alta de la pàgina de Barcelona a la Viquipèdia es pot veure que té un element de Wikidata associat, concretament el Q1492. Entre tots els statements (fets) que descriuen i relacionen Barcelona amb altres elements presents a Wikidata n’hi ha un d’anomenat shares border with, que pot ser interrogat per extreure la informació que estàvem buscant. Coneixent quina relació és la que descriu o resol la pregunta que estem formulant és molt més senzill obtenir la resposta, sense necessitat d’analitzar el text, la qual cosa facilita la creació d’aplicacions i serveis propis de la web semàntica.

La consulta SPARQL més senzilla que resol aquest problema és la següent:

1     select ?muni ?muniLabel where {
2       ?muni wdt:P47 wd:Q1492.
3       SERVICE wikibase:label { bd:serviceParam wikibase:language "ca". }
4     }

La línia 1 defineix la consulta especificant quins camps apareixeran com a resultat. La línia 2 és la que indica que volem aquelles entitats que estan relacionades amb l’entitat Q1492 (Barcelona) mitjançant la propietat P47 (shares border with). La línia 3 estableix que volem obtenir els noms d’aquestes entitats usant la versió catalana.

Enllaços relacionats

Barcelona (Viquipèdia): https://ca.wikipedia.org/wiki/Barcelona

Barcelona (Wikidata): https://www.wikidata.org/wiki/q1492

Propietat shares border with: https://www.wikidata.org/wiki/property:P47

Consultes a Wikidata en SPARQL: https://query.wikidata.org/