Referències bibliogràfiques

1. Cicle de vida

2. Tipologia

Descripció

Aquest conjunt de dades, publicat per Crossref, una organització sense ànim de lucre que es dedica a curar continguts bibliogràfics i posar-los en obert a disposició de tota la comunitat científica, conté més de 112 milions de referències bibliogràfiques, en format JSON, que ocupen més de 65 GB. D’aquestes, més de 50 milions inclouen informació sobre les referències que cita una referència concreta, de forma que és possible també analitzar com es construeix el coneixement i com s’avança en els diferents àmbits del coneixement humà, representat (parcialment) per aquest graf gegantí.

Una referència bibliogràfica conté, entre d’altres camps, un títol, uns autors, una data de publicació i un lloc on s’ha publicat, que pot ser un llibre, una revista, les actes d’una conferència, etc. En molts casos hi ha també paraules clau que descriuen el treball, les afiliacions de cada autor, etc. Normalment, també hi ha els treballs usats pels autors i que apareixen al seu torn com a referències bibliogràfiques. De fet, en funció del tipus de cada referència bibliogràfica hi pot haver diferents camps necessaris, així que han aparegut diversos estàndards per a la descripció de referències bibliogràfiques i el seu ús en documents científics.

Normalment, els articles i les publicacions científiques en general acostumen a ser publicats per editorials que en controlen l’accés. Des de fa temps, però, hi ha hagut un esforç perquè les metadades sobre aquestes publicacions siguin accessibles en obert, de forma que sense perjudici de les editorials, sigui possible saber qui publica què, quan i on, i sobretot, qui cita qui. El fet que actualment totes les publicacions importants estan disponibles en línia i identificades de forma única per un DOI (Digital Object Identifier) fa que sigui possible conèixer i mantenir aquesta informació en un format que en permeti l’explotació.

A més, aquest conjunt també es pot consultar de forma dinàmica, mitjançant alguna de les diverses API i motors de cerca que proporciona Crossref, fet que resulta molt interessant per a poder concretar una cerca a un tema, un autor o una publicació, a banda de poder fer anàlisis sobre el propi procés de publicació científica, que es coneix com a cienciometria.

Enllaç al recurs

https://www.crossref.org/blog/free-public-data-file-of-112-million-crossref-records/

Exemple d’ús

Crossref té un servei anomenat Metadata Search que permet fer cerques a la base de dades de referències bibliogràfiques. Aquest servei està pensat per a ser usat per persones, mentre que hi ha un equivalent basat en una API que permet a les màquines fer també consultes i recuperar els registres desitjats. En el cas de la interfície per a humans, s’usa una caixa semblant a la que ofereix Google:

Però com hem comentat, és molt més interessant l’API que permet automatitzar cerques, la qual pot ser usada directament des d’aquesta URL, si especifiquem quina acció i quins paràmetres volem usar. Per exemple, la crida següent permet saber el nombre de referències disponibles (la podeu provar en el vostre navegador):

https://api.crossref.org/works?rows=0

Aquesta crida retorna el registre següent en format JSON:

{
  "status":"ok",
  "message-type":"work-list",
  "message-version":"1.0.0",
  "message":{
              "facets":{},
              "total-results":113435614,
              "items":[], 
              "items-per-page":0,
              "query":{
                        "start-index":0,
                        "search-terms":null
                      }
            }
}

Al web de l’API de Crossref, que de fet ens porta a una pàgina de GitHub, es pot trobar tota la documentació necessària per a usar aquesta API per a fer cerques automatitzades de referències bibliogràfiques.

Enllaços relacionats

DOI: https://www.doi.org/

Cienciometria: https://ca.wikipedia.org/wiki/Cienciometria

Cercador a Crossref: https://search.crossref.org/

API de Crossref: https://api.crossref.org/