Überblick
Diese Seite gibt einen kurzen inhaltlichen Überblick über die untergeordneten Seiten und ihre Inhalte.
Daten
Die Seite Daten enthält eine tabellarische Übersicht über Fehlertypen und die Häufigkeit ihres Vorkommens in der GND. Auf den Unterseiten werden Beispiele für Fehler in der GND nach Fehlertyp aufgeführt und das resultierende Problem kurz notiert.
Elemente und Eigenschaften der GND
Diskussionswürdige Punkte zu Elementen und Eigenschaften der GND werden auf den folgenden Seiten behandelt:
Stichwörter
Die einzelnen Seiten haben Stichwörter, die mit den Themen wie folgt korrespondieren:
Stichwort | Erläuterung | Seite |
---|---|---|
Abstraktionsrelation | Fehler, die die generische Hierarchierelation betreffen | |
Aktualität | Fehler, die auf fehlende Aktualisierung der Daten zurückgehen | |
Altlasten | Diskrepanz, die sich aus unterschiedlichen Regelwerksständen ergibt | |
Erfassungsfehler | Individuelle und häufig wiederkehrende Erfassungsfehler | |
Hierarchierelation | Fehler, die allgemeine Hierarchierelationen betreffen | |
Instanzrelation | Fehler, die die Instanzrelation betreffen | |
Logik | Logische Brüche in Daten, Regelwerken, Modellen | |
Regelwerksverstoß | Die vorliegenden Daten sind nach gültigen Regelwerken falsch. | |
Teil-Ganzes-Relation | Fehler, die die partitive Relation betreffen | |
Fakten | Fehler, die Faktenaussagen betreffen |
Notizen
Datenfehler siehe Seite Daten
Verstöße gegen Regelwerke siehe Regelwerke
Modellfehler siehe Modelle,
- Unstimmigkeiten in GNDO,
- Defizite in GNDO,
- Unstimmigkeiten der GNDO mit anderen Modellen,
Nutzen für das Information-Retrieval siehe Seite Retrieval
Probleme bei der Datenintegration
Stichwörter für die folgenden Vorschläge von Matthias Manecke:
Vorschlag von Mathias Manecke
Berücksichtigt werden folgende Aspekte nach einem Vorschlag von Matthias Manecke (Auszug aus Mail vom 1.4.2019 an Detlev Balzer):
Mein Vorschlag: wir sollten unterscheiden
- Eigentliche Fehler (Die vorliegenden Daten sind nach dem momentan gültigen Regelwerk falsch.) → Regelwerkverstoß
- (vereinzelte) individuelle Erfassungsfehler. → Erfassungsfehler
Die können wir im Projekt unberücksichtigt lassen. - Diskrepanz, die sich aus unterschiedlichen Regelwerksständen ergeben. → Altlasten
Die werden wir weitgehend auch außer Acht lassen müssen. Aber zumindest wäre es gut, diese zu kennen, um sie von den systematischen Fehlern unterscheiden zu können. Und es wäre natürlich gut, wenn es für die bisherige GND parallel ein „Aufräum-Programm“ gäbe, mit dessen Hilfe nach und nach die unterschiedlichen Regelwerksstände an den aktuellen Stand angeglichen würden. - Systematische, häufig wiederkehrende Erfassungsfehler → Erfassungsfehler
Hier wären die Gründe für die Fehler zu analysieren (wenn beispielsweise ca. 13.000 Individualbegriffe Oberbegriffsrelationen zu einem Allgemeinbegriff mit obal (statt mit obin) haben, ist zu hinterfragen, woran das liegen könnte) - Defizite bei Oberbegriffshierarchien und Instanzrelationen → Hierarchierelation → Abstraktionsrelation → Instanzrelation → Teil-Ganzes-Relation
- geringe Sättigung https://wiki.dnb.de/pages/viewpage.action?pageId=146398965 → Abdeckung
- logische Brüche → Logik
Das sehe ich als Aufgabenfeld für das Fallbeispiel C (allerdings nicht im AP2) - Defizite, die auf strukturelle Ursachen zurückzuführen sind [Klärungsbedarf]
- Regeln, die zu logischen Brüchen führen [Klärungsbedarf] → Logik
- Datenstrukturen, die falsche Aussagen erzwingen / richtige Aussagen unmöglich machen.
Hier sehe ich das Aufgabenfeld von AP2. [Klärungsbedarf] - Ergänzt balilabs: Fehler, die auf fehlende Aktualisierung der Daten zurückgehen. → Aktualität