Wikidata

1. Ciclo de vida

2. Tipología

3. Ámbito de aplicación

Descripción

Lanzada en 2012, Wikidata es el equivalente a Wikipedia, pero desde una perspectiva de uso pensada en datos y máquinas, como base de conocimiento que puede ser explotada e interpretada sin intervención humana. Para ello Wikidata define entidades que representan conceptos de diversos tipos, así como relaciones entre dichos conceptos. De esta forma es posible «saltar» de un concepto (entidad) a otro mediante las relaciones que existen entre ellos, igual que en Wikipedia se puede saltar de un concepto (página) a otro mediante los hiperenlaces que hay en cada página.

A diferencia de Wikipedia, Wikidata no tiene diferentes versiones de una misma entidad para diferentes idiomas, dado que es una base de conocimiento de hechos y relaciones, aunque se usa el inglés para el nombre de los elementos (entidades y relaciones) que la componen. De todas formas, es posible añadir títulos y descripciones textuales en diversos idiomas, con el objetivo de documentar cada entidad.

Otra característica interesante de Wikidata es que puede ser explotada mediante consultas SPARQL, lo que permite buscar información usando términos más complejos que una simple consulta por contenido. Mediante el uso de las propiedades que definen las relaciones entre entidades es posible realizar consultas que incluyan conceptos como distancia, tiempo, pertenencia, etc.

Siguiendo el espíritu de Wikipedia, Wikidata ha sido creada como un proyecto colaborativo, mediante el esfuerzo de miles de usuarios y la ayuda de bots que automatizan ciertas tareas. Como recurso abierto, Wikidata y todo su contenido puede ser reutilizado en otros proyectos que exploten sus capacidades, y es posible exportar los datos en diferentes formatos y realizar consultas complejas, aprovechando la semántica implícita en las entidades y sus relaciones.

Enlace al recurso

https://www.wikidata.org/

Ejemplo de uso

Supongamos que queremos saber qué municipios colindan con Barcelona. Si consultamos la Wikipedia, en la página de Barcelona podemos encontrar dicha información, aunque de forma textual y no estructurada:

«Su término municipal limita, de sur a noreste y en sentido horario, con los municipios de: El Prat de Llobregat, Hospitalet de Llobregat, Esplugues de Llobregat, Sant Just Desvern, Sant Feliu de Llobregat, Molins de Rei, Sant Cugat del Vallès, Cerdanyola del Vallès, Montcada i Reixach, Santa Coloma de Gramenet y Sant Adrià de Besòs.»

Procesar esta información de forma automática requiere analizar este texto y detectar que se trata de la información que estamos buscando, además de separar y contar luego los diferentes municipios presentes en el texto, lo cual no es trivial. Por otro lado, si quisiéramos repetir este mismo procedimiento para otras ciudades, se podría dar el caso de que la información se encuentre descrita de otra manera.

Wikidata resuelve este problema mediante el establecimiento de relaciones semánticas («colindar») entre entidades («municipios»). En lo alto de la página de Barcelona en la Wikipedia se puede ver que tiene un elemento de Wikidata asociado, concretamente el Q1492. Entre todos los statements (hechos) que describen y relacionan Barcelona con otros elementos presentes en Wikidata se encuentra uno llamado shares border with, que puede ser interrogado para extraer la información que estábamos buscando. Conociendo qué relación es la que describe o resuelve la pregunta que estamos formulando es mucho más sencillo obtener la respuesta, sin necesidad de analizar el texto, lo que facilita la creación de aplicaciones y servicios propios de la web semántica.

La consulta SPARQL más sencilla que resuelve este problema es la siguiente:

1     select ?muni ?muniLabel where {
2       ?muni wdt:P47 wd:Q1492.
3       SERVICE wikibase:label { bd:serviceParam wikibase:language "ca". }
4     }

La línea 1 define la consulta especificando qué campos van a aparecer como resultado. La línea 2 es la que indica que queremos aquellas entidades que están relacionadas con la entidad Q1492 (Barcelona) mediante la propiedad P47 (shares border with). La línea 3 establece que queremos obtener los nombres de dichas entidades usando la versión catalana.

Enlaces relacionados

Barcelona (Wikipedia): https://es.wikipedia.org/wiki/Barcelona

Barcelona (Wikidata): https://www.wikidata.org/wiki/Q1492

Propiedad shares border with: https://www.wikidata.org/wiki/Property:P47

Consultas a Wikidata en SPARQL: https://query.wikidata.org/