Daten

If you don’t think you have a quality problem with your data, you haven’t looked at it yet. Jeni Tennison 2015

Untergeordnete Seiten


Definition von data im ODLIS (Online Dictionary for Library and Information Science):

The plural of the Latin word datum, meaning "what is given," often used as a singular collective noun. Facts, figures, or instructions presented in a form that can be comprehended, interpreted, and communicated by a human being or processed by a computer. Compare with information and knowledge. See also: data bank, database, data set, and metadata.

Inhalt der GND-Normdaten

Unter Inhalt von GND-Datensätzen wird hier die Menge der Aussagen verstanden, die in dem Normdatensatz enthalten sind. Ein Normdatensatz zu einem Sachschlagwort macht unter anderem Aussagen darüber,

  1. welche Benennungen und Synonyme es fĂĽr den Begriff gibt
  2. zu welcher Gattung im aristotelischen Sinn der Begriff gehört (direkter Oberbegriff)
  3. welche Position der Begriff in der Hierarchieleiter einnimmt (weitere Oberbegriffe und Unterbegriffe)
  4. welcher GND-Sachgruppe und/oder DDC-Klasse der Begriff zugehört.

Diese Aussagen sind Faktenaussagen, die mit dem Stand des Wissens ĂĽbereinstimmen mĂĽssen. In der Dokumentation dienen diese Aussagen dem Information-Retrieval, indem sie

  1. das gesuchte Schlagwort (den Begriff) durch die Zeichenkette der Benennung auffindbar machen
  2. das gesuchte Schlagwort ĂĽber den Oberbegriff auffindbar machen
  3. in die Ergebnismenge fĂĽr ein Schlagwort die verbundenen Unterbegriffe einbezogen werden (Explode)
  4. eine Suche über gleich klassierte Schlagwörter ermöglichen
  5. und allgemein das Erkunden des Bestandes durch inhaltlich verknüpfte Schlagwörter unterstützen. 

Siehe zum Inhalt von GND-Datensätzen auch RSWK (2017), § 318, S. 160: "Überblick über die wichtigsten Informationen in einem Datensatz für ein Sachschlagwort (vgl. § 7,4)".
Zu identifizierenden Angaben im AAT siehe in den Guidelines Identifying numbers, status flags, and subject sources.

Tabelle Datenfehler

NrFehlerErläuterung und → BeispieleArt des FehlersAuffindenAnzahlBetrifftKorrekturAufwand
1Begriff nicht nachweisbar
ErfassungZufallEinzeln
ManuellNicht einschätzbar
2Entitätenzuordnung
 
 
Ein Entitätencode fehlt.Regelverstoß RSWK §§ 318 ; 18,5Maschinell



3

Die Entitätenzuordnung ist falsch.

→ Bettwärmer
→ Wojtek, Bär  

Redaktion Auswahlfehler




4

Ein Deskriptor hat mehrere Entitätencodes.

→ Beispiel

Regelverstoß RSWK § 730Maschinell35.800

Identify Select



5

Ein Deskriptor vermischt unterschiedliche Entitäten.

→ Beispiel

  • Redaktion
  • Regelwerk
Maschinell      > 1.500
Maschinell
6Oberbegriff


Ein Oberbegriff fehlt.

viele Beispiele

Regelverstoß RSWK § 318Maschinell66.446[1]Explode

7

Der Oberbegriff ist sachlich falsch.

→ Beispiel

RedaktionMatching
ExplodeManuell
8

Ein Deskriptor ist Unterbegriff des direkten UND des diesem übergeordneten Oberbegriffs. 

→ Beispiel

RedaktionMaschinell> 550 bei AB


9Instanzrelation

Der Deskriptor ist fälschlich über eine Instanzrelation verknüpft.

→ Beispiel
→ ICONDA

Redaktion
Regelwerk

Maschinell> 12.000[2]


10Relationen

Relationen zu sachlich direkt verbundenen Deskriptoren fehlen.

→ Beispiel

Erfassung Aktualisierung




11

Die Relationen eines Deskriptors schlieĂźen sich gegenseitig aus.

→ Welterbe 
→ ICONDA
→ Friedensrichter

Erfassung Aktualisierung




12

Die reziproke Relation fehlt.

Kunsthalle Mannheim


Maschinell 50.458[3]
Weitgehend maschinell
13DisambiguierungEin Homonymzusatz fehlt.Regelwerk RSWK und EH-MaschinellSehr häufigMatching



Redundante Synonyme
Maschinellca. 40.000


14Inkonsistenzen

Geschwisterbegriffe sind unterschiedlich erfasst.

→ Beispiel



Sehr häufig


15Faktenaussage

Mit dem Deskriptor verbundene Aussagen sind faktisch falsch.

→ Vaskulitis

Fachwissen AktualisierungMatching



Anmerkungen zur Tabelle:
[1] Ein Oberbergiff fehlt bei 36 Prozent Datensätze gndo:SubjectHeadingSensoStricto und gndo:NomenclatureInBiologyOrChemistry.
[2] Dies sind "echte" Fehler. Insgesamt gibt es ca. 30.000 Instanzbeziehungen innerhalb der Unterklassen von gndo:SubjectHeading, wobei es sich nicht immer um Allgemeinbegriffe handelt. Beispielsweise kann eine fiktive Person legitime Instanz eines Allgemeinbegriffs sein.
[3] Ermittelt für die allgemeinen Assoziationsrelationen (relatedX). Hierarchierelationen werden unidirektional erfasst; hierbei gibt es keine Verstöße.

Notizen

Regelwerksverstöße (RSWK)

Die vorliegenden Daten sind nach dem momentan gĂĽltigen Regelwerk (RSWK) nicht korrekt, zum Teil beruhend auf Altlasten:

EH-S-06-1, Bauwerke, Großplastiken, Grab- und Denkmäler, S. 2 (RSWK 730):  "Für Bauwerke werden grundsätzlich eigene Datensätze erfasst; eine Doppelnutzung desselben Datensatzes sowohl für die Körperschaft als auch für das Bauwerk ist nicht mehr zulässig."
EH-S-06-1, Bauwerke, Großplastiken, Grab- und Denkmäler, S. 14 (RSWK 730): "Datensätze mit doppelten Entitäten (gib und kiz) müssen entsprechend den jeweiligen Regeln wie folgt aufgearbeitet werden. Migration (Beispiel für doppelte Entitäten):"

  1. Multiple Instanziierung über Entitätstypen hinweg
    Beispiel: http://d-nb.info/gnd/7649774-4 Swaminarayan Temple (Ahmedabad)

Verstöße gegen Standards

Die vorliegenden Daten sind nach dem gĂĽltigen Vokabularstandard ISO 25964 nicht korrekt.

  1. Umkehrrelationen fehlen
    Beispiel: http://d-nb.info/gnd/1161143947 Neubau der Kunsthalle Mannheim

Systematische, häufig wiederkehrende Erfassungsfehler

  1. Datensätze ohne Entitätstyp
    Beispiel: Bei 66 direkten Unterbegriffen für "Architektur" fehlen 21 Datensätzen die Typ-Angabe
    13 Instanzen von "Architektur" ,Architektur hat Synonym "Baukunst"; Organisationen oder Verantstaltungen sind kein Beispiel fĂĽr Baukunst, sondern stehen mit Baukunst in einem zu spezifzierenden Zusammenhang.
  2. Allgemeinbegriffe als Instanzen von Allgemeinbegriffen
    Beispiel: http://d-nb.info/gnd/4115487-3 Pagode (saz) BTI Sakralbau (saz) Architektur (saz)
    Beispiel fĂĽr eine Instanz: http://d-nb.info/gnd/4678520-6 Da Qin Pagoda (gib) BTI Pagode (saz)
  3. Individualbegriffe als Instanzen von Allgemeinbegriffen, die einer anderen logischen Kategorie (einem anderen Entitätstyp) angehören
    Beispiel: http://d-nb.info/gnd/6089925-6 Reiners Stiftung (kiz) BTI Architektur (saz) ; (piz)
  4. Begriffe mit falscher Entitätencodierung
    Beispiel: http://d-nb.info/gnd/4504150-7 Dalmatika als siz
    http://d-nb.info/gnd/1077802587 Bettwärmer siz

Redundante Aussagen in verschiedenen Elementen

Beispiel: http://d-nb.info/gnd/4246124-8 ICONDA (siw) hat sowohl BTI wie auch Thema Raumordnung | Architektur | Bautechnik | Literaturdatenbank; nur Literaturdatenbank als Instanzrelation ist korrekt, Thema und Instanz schlieĂźen sich gegenseitig aus

Logisch nicht korrekte Hierarchierelationen

[Auch ein Beispiel fĂĽr Mappingprobleme]

Hierarchierelationen, die auf dem Kopf stehen
Beispiel: Schriftverkehr BT Brief (AAT correspondence NT letter); Probleme beim Mapping und bei der Anfrageausweitung (Explode) in Retrievalsystemen

Hierarchierelationen zwischen Begriffen, die logisch verschiedenen Fundamentalkategorien angehören:
Beispiel: Memoria BT Totengedächtnis

Sachlich falsche Hierarchien

Pyxis BT Vase

Interpretation von siz

Falsche siz

http://d-nb.info/gnd/4504150-7 Dalmatika korrekt saz

http://d-nb.info/gnd/7700289-1 schĂĽlerVZ korrekt ein Individuum

http://d-nb.info/gnd/4071428-7 Frauenbewegung korrekt saz ; Unterbegriffe siz

 Ziborium: Hier klicken


Link zu diesem Datensatzhttp://d-nb.info/gnd/4190775-9
SachbegriffZiborium
QuelleM 1.
Erläuterungen

Verwendungshinweis: Verknüpfe mit dem jeweiligen Anwendungsgebiet, z.B. Architektur, Reliquiar, Ikonographie; für das Gefäß benutze SW Ziborium <gefäss> </gefäss>

Verwendungshinweis: Verknüpfe mit dem jeweiligen Anwendungsgebiet, z.B. Architektur, Reliquiar, Ikonographie; für das Gefäß benutze SW Ziborium

SynonymeCiborium
DDC-Notation726.5293
Systematik13.2 Plastik ; 31.3a Architektur
Andere NormdatenLCSH: Ciboria (Architecture)
RAMEAU: Ciboria
Beispiele2 Begriffe
  1. Callixtus-Baptisterium
    Werk (wit)
  2. Klosterkirche Maria Laach (Glees) / Ziborium
    Bauwerk (gib)