Referencias bibliográficas

1. Ciclo de vida

2. Tipología

3. Ámbito de aplicación

Descripción

Este conjunto de datos, publicado por Crossref, una organización sin ánimo de lucro dedicada a la curación de contenidos bibliográficos y ponerlos en acceso abierto a la comunidad científica, contiene más de 112 millones de referencias bibliográficas en formato JSON, que ocupan más de 65 GB. De ellas, más de 50 millones incluyen información sobre referencias que citan a una referencia específica, para que sea posible analizar cómo se construye el conocimiento y cómo se avanza en las diferentes áreas del conocimiento humano, representado (parcialmente) por este gigantesco grafo.

Una referencia bibliográfica contiene, entre otros campos, un título, unos autores, una fecha de publicación y un lugar donde se ha publicado, que puede ser un libro, una revista, las actas de una conferencia, etc. En muchos casos también hay palabras clave que describen el trabajo, las afiliaciones de cada autor, etc. Por lo general, también hay los trabajos utilizados por los autores, que a su vez aparecen como referencias bibliográficas. De hecho, según el tipo de referencia bibliográfica, puede haber diferentes campos requeridos, por lo que han surgido varias normas para la descripción de las referencias bibliográficas y su uso en documentos científicos.

Los artículos y publicaciones científicas, en general, suelen ser publicados por editoriales que controlan su acceso. Desde hace algún tiempo, sin embargo, ha habido un esfuerzo por hacer que los metadatos sobre estas publicaciones sean accesibles en abierto, de modo que, sin perjuicio de las editoriales, sea posible saber quién publica qué, cuándo y dónde, y sobre todo quién cita a quién. El hecho de que actualmente todas las publicaciones importantes estén disponibles en línea e identificadas de manera única por un DOI (Digital Object Identifier) permite conocer y mantener esta información en un formato que permita su explotación.

Además, este conjunto también se puede consultar dinámicamente, a través de uno de los diversos API y motores de búsqueda proporcionados por Crossref, lo que es muy interesante para poder especificar una búsqueda a un tema, un autor o una publicación, además de poder realizar análisis sobre el propio proceso de publicación científica, conocido como cienciometría.

Enlace al recurso

https://www.crossref.org/blog/free-public-data-file-of-112-million-crossref-records/

Ejemplo de uso

Crossref tiene un servicio llamado Metadata Search que permite buscar en la base de datos de referencias bibliográficas. Este servicio está pensado para ser utilizado por personas, mientras que hay un equivalente basado en una API que permite a las máquinas también consultar y recuperar los registros deseados. En el caso de la interfaz para humanos, se utiliza una caja similar a la ofrecida por Google:

Pero como hemos dicho, es mucho más interesante la API que permite automatizar las búsquedas, que se puede utilizar directamente desde esta URL, si especificamos qué acción y qué parámetros queremos utilizar. Por ejemplo, la siguiente llamada le permite conocer el número de referencias disponibles (la podéis probar en vuestro navegador):

https://api.crossref.org/works?rows=0

Esta llamada devuelve el siguiente registro en formato JSON:

{
  "status":"ok",
  "message-type":"work-list",
  "message-version":"1.0.0",
  "message":{
              "facets":{},
              "total-results":113435614,
              "items":[], 
              "items-per-page":0,
              "query":{
                        "start-index":0,
                        "search-terms":null
                      }
            }
}

Toda la documentación necesaria para utilizar esta API, para realizar búsquedas automatizadas de referencias bibliogeráficas, se puede encontrar en el sitio web de la API de Crossref, que de hecho conduce a una página de GitHub.

Enlaces relacionados

DOI: https://www.doi.org/

Cienciometría: https://es.wikipedia.org/wiki/Cienciometr%C3%ADa

Buscador en Crossref: https://search.crossref.org/

API de Crossref: https://api.crossref.org/