Daten
Untergeordnete Seiten
Definition von data im ODLIS (Online Dictionary for Library and Information Science):
The plural of the Latin word datum, meaning "what is given," often used as a singular collective noun. Facts, figures, or instructions presented in a form that can be comprehended, interpreted, and communicated by a human being or processed by a computer. Compare with information and knowledge. See also: data bank, database, data set, and metadata.
Inhalt der GND-Normdaten
Unter Inhalt von GND-Datensätzen wird hier die Menge der Aussagen verstanden, die in dem Normdatensatz enthalten sind. Ein Normdatensatz zu einem Sachschlagwort macht unter anderem Aussagen darüber,
- welche Benennungen und Synonyme es für den Begriff gibt
- zu welcher Gattung im aristotelischen Sinn der Begriff gehört (direkter Oberbegriff)
- welche Position der Begriff in der Hierarchieleiter einnimmt (weitere Oberbegriffe und Unterbegriffe)
- welcher GND-Sachgruppe und/oder DDC-Klasse der Begriff zugehört.
Diese Aussagen sind Faktenaussagen, die mit dem Stand des Wissens übereinstimmen müssen. In der Dokumentation dienen diese Aussagen dem Information-Retrieval, indem sie
- das gesuchte Schlagwort (den Begriff) durch die Zeichenkette der Benennung auffindbar machen
- das gesuchte Schlagwort über den Oberbegriff auffindbar machen
- in die Ergebnismenge für ein Schlagwort die verbundenen Unterbegriffe einbezogen werden (Explode)
- eine Suche über gleich klassierte Schlagwörter ermöglichen
- und allgemein das Erkunden des Bestandes durch inhaltlich verknüpfte Schlagwörter unterstützen.
Siehe zum Inhalt von GND-Datensätzen auch RSWK (2017), § 318, S. 160: "Überblick über die wichtigsten Informationen in einem Datensatz für ein Sachschlagwort (vgl. § 7,4)".
Zu identifizierenden Angaben im AAT siehe in den Guidelines Identifying numbers, status flags, and subject sources.
Tabelle Datenfehler
Nr | Fehler | Erläuterung und → Beispiele | Art des Fehlers | Auffinden | Anzahl | Betrifft | Korrektur | Aufwand |
---|---|---|---|---|---|---|---|---|
1 | Begriff nicht nachweisbar | Erfassung | Zufall | Einzeln | Manuell | Nicht einschätzbar | ||
2 | Entitätenzuordnung | Ein Entitätencode fehlt. | Regelverstoß RSWK §§ 318 ; 18,5 | Maschinell | ||||
3 | Die Entitätenzuordnung ist falsch. | Redaktion Auswahlfehler | ||||||
4 | Ein Deskriptor hat mehrere Entitätencodes. | Regelverstoß RSWK § 730 | Maschinell | 35.800 | Identify Select | |||
5 | Ein Deskriptor vermischt unterschiedliche Entitäten. |
| Maschinell | > 1.500 | Maschinell | |||
6 | Oberbegriff | Ein Oberbegriff fehlt. viele Beispiele | Regelverstoß RSWK § 318 | Maschinell | 66.446[1] | Explode | ||
7 | Der Oberbegriff ist sachlich falsch. | Redaktion | Matching | Explode | Manuell | |||
8 | Ein Deskriptor ist Unterbegriff des direkten UND des diesem übergeordneten Oberbegriffs. | Redaktion | Maschinell | > 550 bei AB | ||||
9 | Instanzrelation | Der Deskriptor ist fälschlich über eine Instanzrelation verknüpft. | Redaktion | Maschinell | > 12.000[2] | |||
10 | Relationen | Relationen zu sachlich direkt verbundenen Deskriptoren fehlen. | Erfassung Aktualisierung | |||||
11 | Die Relationen eines Deskriptors schließen sich gegenseitig aus. | Erfassung Aktualisierung | ||||||
12 | Die reziproke Relation fehlt. | Maschinell | 50.458[3] | Weitgehend maschinell | ||||
13 | Disambiguierung | Ein Homonymzusatz fehlt. | Regelwerk RSWK und EH- | Maschinell | Sehr häufig | Matching | ||
Redundante Synonyme | Maschinell | ca. 40.000 | ||||||
14 | Inkonsistenzen | Geschwisterbegriffe sind unterschiedlich erfasst. → Beispiel | Sehr häufig | |||||
15 | Faktenaussage | Mit dem Deskriptor verbundene Aussagen sind faktisch falsch. | Fachwissen Aktualisierung | Matching |
Anmerkungen zur Tabelle:
[1] Ein Oberbergiff fehlt bei 36 Prozent Datensätze gndo:SubjectHeadingSensoStricto und gndo:NomenclatureInBiologyOrChemistry.
[2] Dies sind "echte" Fehler. Insgesamt gibt es ca. 30.000 Instanzbeziehungen innerhalb der Unterklassen von gndo:SubjectHeading, wobei es sich nicht immer um Allgemeinbegriffe handelt. Beispielsweise kann eine fiktive Person legitime Instanz eines Allgemeinbegriffs sein.
[3] Ermittelt für die allgemeinen Assoziationsrelationen (relatedX). Hierarchierelationen werden unidirektional erfasst; hierbei gibt es keine Verstöße.
Notizen
Regelwerksverstöße (RSWK)
Die vorliegenden Daten sind nach dem momentan gültigen Regelwerk (RSWK) nicht korrekt, zum Teil beruhend auf Altlasten:
EH-S-06-1, Bauwerke, Großplastiken, Grab- und Denkmäler, S. 2 (RSWK 730): "Für Bauwerke werden grundsätzlich eigene Datensätze erfasst; eine Doppelnutzung desselben Datensatzes sowohl für die Körperschaft als auch für das Bauwerk ist nicht mehr zulässig."
EH-S-06-1, Bauwerke, Großplastiken, Grab- und Denkmäler, S. 14 (RSWK 730): "Datensätze mit doppelten Entitäten (gib und kiz) müssen entsprechend den jeweiligen Regeln wie folgt aufgearbeitet werden. Migration (Beispiel für doppelte Entitäten):"
- Multiple Instanziierung über Entitätstypen hinweg
Beispiel: http://d-nb.info/gnd/7649774-4 Swaminarayan Temple (Ahmedabad)
Verstöße gegen Standards
Die vorliegenden Daten sind nach dem gültigen Vokabularstandard ISO 25964 nicht korrekt.
- Umkehrrelationen fehlen
Beispiel: http://d-nb.info/gnd/1161143947 Neubau der Kunsthalle Mannheim
Systematische, häufig wiederkehrende Erfassungsfehler
- Datensätze ohne Entitätstyp
Beispiel: Bei 66 direkten Unterbegriffen für "Architektur" fehlen 21 Datensätzen die Typ-Angabe
13 Instanzen von "Architektur" ,- Sachbegriffe (5) Belüfteter Raum ; ICONDA ; Innenraum ; Vesara-Stil ; Baustil ; Zentralraum.
- Organisationen (5)
- Veranstaltungen (3)
- Allgemeinbegriffe als Instanzen von Allgemeinbegriffen
Beispiel: http://d-nb.info/gnd/4115487-3 Pagode (saz) BTI Sakralbau (saz) Architektur (saz)
Beispiel für eine Instanz: http://d-nb.info/gnd/4678520-6 Da Qin Pagoda (gib) BTI Pagode (saz) - Individualbegriffe als Instanzen von Allgemeinbegriffen, die einer anderen logischen Kategorie (einem anderen Entitätstyp) angehören
Beispiel: http://d-nb.info/gnd/6089925-6 Reiners Stiftung (kiz) BTI Architektur (saz) ; (piz) - Begriffe mit falscher Entitätencodierung
Beispiel: http://d-nb.info/gnd/4504150-7 Dalmatika als siz
http://d-nb.info/gnd/1077802587 Bettwärmer siz
Redundante Aussagen in verschiedenen Elementen
Beispiel: http://d-nb.info/gnd/4246124-8 ICONDA (siw) hat sowohl BTI wie auch Thema Raumordnung | Architektur | Bautechnik | Literaturdatenbank; nur Literaturdatenbank als Instanzrelation ist korrekt, Thema und Instanz schließen sich gegenseitig aus
Logisch nicht korrekte Hierarchierelationen
[Auch ein Beispiel für Mappingprobleme]
Hierarchierelationen, die auf dem Kopf stehen
Beispiel: Schriftverkehr BT Brief (AAT correspondence NT letter); Probleme beim Mapping und bei der Anfrageausweitung (Explode) in Retrievalsystemen
Hierarchierelationen zwischen Begriffen, die logisch verschiedenen Fundamentalkategorien angehören:
Beispiel: Memoria BT Totengedächtnis
Sachlich falsche Hierarchien
Pyxis BT Vase
Interpretation von siz
Falsche siz
http://d-nb.info/gnd/4504150-7 Dalmatika korrekt saz
http://d-nb.info/gnd/7700289-1 schülerVZ korrekt ein Individuum
http://d-nb.info/gnd/4071428-7 Frauenbewegung korrekt saz ; Unterbegriffe siz