Metadaten zum GND-Datensatz

Mit dem Dump vom Februar 2019 hat die DNB erstmals Metadaten zu GND-Datensätzen in die RDF-Darstellung aufgenommen. Diese beschränken sich allerdings auf

  • Lizenzangabe
  • Datum der letzten Änderung

wogegen etliche in der MARC21-Dastellung publizierte Angaben bisher unberücksichtigt bleiben.

Ergänzungen für den GND4C-Triplestore

Da bisher nicht zu erfahren war, ob und wann die GND weitere Metadaten in die RDF-Darstellung übernehmen wird, beginnen wir im Juli 2019 damit, diese Angaben selbst aus den MARC-Daten in den GND4C-Triplestore zu übernehmen. Hierbei handelt es sich um:

  • http://rdaregistry.info/Elements/u/P61160 aus MARC 042 $a - den sogenannten Katalogisierungslevel oder Authentifizierungscode mit folgenden Werten:
    • "gnd1" (GND-Datensatz authentifiziert von einem GND-Verbund- oder Fachredaktion)

    • "gnd2" (GND-Datensatz authentifiziert von einer lokalen GND-Redaktion)

    • "gnd3" (GND-Datensatz authentifiziert von geschultem GND-Personal)

    • "gnd4" (GND-Datensatz authentifiziert von ungeschultem GND-Personal)

    • "gnd5" (GND-Datensatz authentifiziert von einem sonstigen GND-Anwender)

    • "gnd6" (GND-Datensatz stammt aus Altbestand und ist maschinell eingespielt worden)
    • "gnd7" (GND-Datensatz ist maschinell aus Metadaten erstellt worden)
    • "gndz" (gesperrter GND -Datensatz, Änderungen sind nicht möglich)
  • http://purl.org/dc/terms/created aus MARC 008 Position 00-05 - das Datum der Ersterfassung

  • http://purl.org/dc/terms/creator aus MARC 040 $a - der Urheber der Ersterfassung als blank node mit folgenden Properties:

    • http://purl.org/dc/elements/1.1/identifier ISIL der Institution

    • http://dbpedia.org/property/shortName Kurzname der Institution aus dem ISIL-Register

  • http://purl.org/dc/elements/1.1/contributor aus MARC 040 $d - der Urheber der letzten Änderung als blank node mit folgenden Properties:

    • http://purl.org/dc/elements/1.1/identifier Urheberkennung der Bearbeitungsstelle

    • http://dbpedia.org/property/shortName Kurzname der Bearbeitungsstelle, soweit ermittelbar.

Die jeweiligen Property-URIs sind (noch) nicht von der DNB autorisiert. Nachfolgend ein Beispiel (die ergänzten Angaben sind hervorgehoben):

gnd:4000002-3 wdrs:describedby <http://d-nb.info//gnd/4000002-3/about> .

<https://d-nb.info/gnd/4000002-3/about>
     dcterms:license <http://creativecommons.org/publicdomain/zero/1.0/> ; # von DNB geliefert
     rdau:P61160 "gnd1" ;
     dcterms:created "1988-07-01"^^xsd:date ;
     dcterms:creator
     [     dc:identifier "DE-101" ;
           dbp:shortName "Frankfurt/M DNB"  ] ;
     dcterms:modified "2010-01-06T12:56:50.000"^^xsd:dateTime ; # von DNB geliefert
     dc:contributor
     [     dc:identifier "0832" ;
           dbp:shortName "Koeln FHB"  ] .

Anwendung

Mit der Übernahme der vorhandenen Metadaten in den Triplestore wird es möglich, die Ursprünge der Datensätze in einem Suchergebnis sichtbar zu machen. Daneben können die Beiträge einzelner Institutionen zur GND abgefragt und die Aktualität von Teilmengen der GND untersucht werden.

Das folgende Beispiel erzeugt mittels einer CONSTRUCT-Klausel eine vereinfachte Darstellung der Metadaten zu einem GND-Datensatz (gnd:4635287-9):

prefix gnd: <http://d-nb.info/gnd/>
prefix gndo: <http://d-nb.info/standards/elementset/gnd#>
prefix skos: <http://www.w3.org/2004/02/skos/core#>
prefix xsd: <http://www.w3.org/2001/XMLSchema#>
prefix rdau: <http://rdaregistry.info/Elements/u/>
prefix dc: <http://purl.org/dc/elements/1.1/>
prefix dct: <http://purl.org/dc/terms/>
prefix wdrs: <http://www.w3.org/2007/05/powder-s#>
prefix dbp: <http://dbpedia.org/property/>
prefix :	<_>

# vereinfachte Darstellung der Metadaten zu einem GND-Datensatz (auszuwählen
# mit der FILTER-Klausel)
construct
{
  ?gnduri a ?gndoclass ;
    gndo:preferredNameForTheSubjectHeading ?pterm ;
    :meta [ 
 	:katLevel ?level ;
    :erfasst [ :datum ?created ; :isil ?erfasserId; :name ?ersterfasser ] ;
    :geaendert [ :datum ?moddate ; :id ?bearbeiterId; :name ?bearbeiter ]
  ]
}
where 
{
  ?gnduri gndo:preferredNameForTheSubjectHeading ?pterm .
  ?gnduri wdrs:describedby ?m .
  ?m rdau:P61160 ?level ;
    dct:created ?created ;
    dct:creator [ dc:identifier ?erfasserId; dbp:shortName ?ersterfasser ] 
  OPTIONAL 
  { 
  	?m dct:modified ?moddate ;
    dc:contributor [ dc:identifier ?bearbeiterId; dbp:shortName ?bearbeiter ]
  }
  FILTER(?gnduri = gnd:4635287-9) .
}



Problem bekannt

Temporäres Problem in GND-RDF-Dumps vom Februar und Juni 2019

In diesen Releases weicht die IDN des wdrs:Document URI oft von der IDN des GND-Datensatzes ab (DE-101 vs. DE-588, beides in 035 a). Beispiele:

<http://d-nb.info/gnd/4000030-8> wdrs:describedby <http://d-nb.info/gnd/040000303/about>
<http://d-nb.info/gnd/5096558-X> wdrs:describedby <http://d-nb.info/gnd/940275864/about>

Das Problem ist bei der DNB auch bemerkt und in der RDF-Generierung korrigiert worden. Die Korrektur wird aber erst Im nächsten planmäßige Release (Okt. 2019) wirksam. Wir haben im Juli 2019 ein Zwischen-Release mit korrigierten ID-Nummern in den Metadaten-URIs erhalten, das sich allerdings aufgrund einer unkoordinierten Änderung der GND-URIs von http auf https als unbrauchbar erwies. Der aktuelle Triplestore verwendet daher das Juni-Release mit eigener, automatischer Korrektur des wdrs:Document URI.