Mit dem Dump vom Februar 2019 hat die DNB erstmals Metadaten zu GND-Datensätzen in die RDF-Darstellung aufgenommen. Diese beschränken sich allerdings auf
- Lizenzangabe
- Datum der letzten Änderung
wogegen etliche in der MARC21-Dastellung publizierte Angaben bisher unberücksichtigt bleiben.
Ergänzungen für den GND4C-Triplestore
Da bisher nicht zu erfahren war, ob und wann die GND weitere Metadaten in die RDF-Darstellung übernehmen wird, beginnen wir im Juli 2019 damit, diese Angaben selbst aus den MARC-Daten in den GND4C-Triplestore zu übernehmen. Hierbei handelt es sich um:
- http://rdaregistry.info/Elements/u/P61160 aus MARC 042 $a - den sogenannten Katalogisierungslevel oder Authentifizierungscode mit folgenden Werten:
"gnd1" (GND-Datensatz authentifiziert von einem GND-Verbund- oder Fachredaktion)
"gnd2" (GND-Datensatz authentifiziert von einer lokalen GND-Redaktion)
"gnd3" (GND-Datensatz authentifiziert von geschultem GND-Personal)
"gnd4" (GND-Datensatz authentifiziert von ungeschultem GND-Personal)
"gnd5" (GND-Datensatz authentifiziert von einem sonstigen GND-Anwender)
- "gnd6" (GND-Datensatz stammt aus Altbestand und ist maschinell eingespielt worden)
- "gnd7" (GND-Datensatz ist maschinell aus Metadaten erstellt worden)
- "gndz" (gesperrter GND -Datensatz, Änderungen sind nicht möglich)
http://purl.org/dc/terms/created aus MARC 008 Position 00-05 - das Datum der Ersterfassung
http://purl.org/dc/terms/creator aus MARC 040 $a - der Urheber der Ersterfassung als blank node mit folgenden Properties:
http://purl.org/dc/elements/1.1/identifier ISIL der Institution
http://dbpedia.org/property/shortName Kurzname der Institution aus dem ISIL-Register
http://purl.org/dc/elements/1.1/contributor aus MARC 040 $d - der Urheber der letzten Änderung als blank node mit folgenden Properties:
http://purl.org/dc/elements/1.1/identifier Urheberkennung der Bearbeitungsstelle
http://dbpedia.org/property/shortName Kurzname der Bearbeitungsstelle, soweit ermittelbar.
Die jeweiligen Property-URIs sind (noch) nicht von der DNB autorisiert. Nachfolgend ein Beispiel (die ergänzten Angaben sind hervorgehoben):
gnd:4000002-3 wdrs:describedby <http://d-nb.info//gnd/4000002-3/about> .
<https://d-nb.info/gnd/4000002-3/about>
dcterms:license <http://creativecommons.org/publicdomain/zero/1.0/> ; # von DNB geliefert
rdau::P61160 "gnd1";
dcterms:created "1988-07-01"^^xsd:date;
dcterms:creator
[ dc:identifier "DE-101";
dbp:shortName "Frankfurt/M DNB" ];
dcterms:modified "2010-01-06T12:56:50.000"^^xsd:dateTime . # von DNB geliefert
dc:contributor
[ dc:identifier "0832";
dbp:shortName "Koeln FHB" ] .
Temporäres Problem im GND-RDF-Dump vom Februar 2019
IDN des wdrs:Document URI weicht oft von IDN des GND-Datensatzes ab (DE-101 vs. DE-588, beides in 035 a)
Beispiele:
<http://d-nb.info/gnd/4000030-8> wdrs:describedby <http://d-nb.info/gnd/040000303/about>
<http://d-nb.info/gnd/5096558-X> wdrs:describedby <http://d-nb.info/gnd/940275864/about>
Hiervon gibt es weit über 1 Mio. Fälle.
Problem bekannt
Das Problem ist bei der DNB auch bemerkt und in der RDF-Generierung korrigiert worden. Die Korrektur wird aber erst Im nächsten planmäßige Release (Okt. 2019) wirksam. Wir haben im Juli 2019 ein Zwischen-Release mit korrigierten ID-Nummern in den Metadaten-URIs erhalten.
Kommentar hinzufügen