Überblick

Man soll alles so einfach wie möglich machen, aber nicht einfacher. Einstein


Diese Seite gibt einen kurzen inhaltlichen Überblick über die untergeordneten Seiten und ihre Inhalte.

Daten

Die Seite Daten enthält eine tabellarische Übersicht über Fehlertypen und die Häufigkeit ihres Vorkommens in der GND.  Auf den Unterseiten werden Beispiele für Fehler in der GND nach Fehlertyp aufgeführt und das resultierende Problem kurz notiert.

Elemente und Eigenschaften der GND

Diskussionswürdige Punkte zu Elementen und Eigenschaften der GND werden auf den folgenden Seiten behandelt:

Stichwörter

Die einzelnen Seiten haben Stichwörter, die mit den Themen wie folgt korrespondieren:

StichwortErläuterungSeite
AbstraktionsrelationFehler, die die generische Hierarchierelation betreffen
AktualitätFehler, die auf fehlende Aktualisierung der Daten zurückgehen
AltlastenDiskrepanz, die sich aus unterschiedlichen Regelwerksständen ergibt
ErfassungsfehlerIndividuelle und häufig wiederkehrende Erfassungsfehler
HierarchierelationFehler, die allgemeine Hierarchierelationen betreffen
InstanzrelationFehler, die die Instanzrelation betreffen
LogikLogische Brüche in Daten, Regelwerken, Modellen
RegelwerksverstoßDie vorliegenden Daten sind nach gültigen Regelwerken falsch.
Teil-Ganzes-RelationFehler, die die partitive Relation betreffen
FaktenFehler, die Faktenaussagen betreffen

Notizen

Datenfehler siehe Seite Daten

Verstöße gegen Regelwerke siehe Regelwerke

Modellfehler siehe Modelle,

  • Unstimmigkeiten in GNDO,
  • Defizite in GNDO,
  • Unstimmigkeiten der GNDO mit anderen Modellen,

Nutzen für das Information-Retrieval siehe Seite Retrieval

Probleme bei der Datenintegration

Stichwörter für die folgenden Vorschläge von Matthias Manecke:

Vorschlag von Mathias Manecke

Berücksichtigt werden folgende Aspekte nach einem Vorschlag von Matthias Manecke (Auszug aus Mail vom 1.4.2019 an Detlev Balzer):

Mein Vorschlag: wir sollten unterscheiden

  1. Eigentliche Fehler (Die vorliegenden Daten sind nach dem momentan gültigen Regelwerk falsch.) → Regelwerkverstoß
  2. (vereinzelte) individuelle Erfassungsfehler. → Erfassungsfehler
    Die können wir im Projekt unberücksichtigt lassen.
  3. Diskrepanz, die sich aus unterschiedlichen Regelwerksständen ergeben. → Altlasten
    Die werden wir weitgehend auch außer Acht lassen müssen. Aber zumindest wäre es gut, diese zu kennen, um sie von den systematischen Fehlern unterscheiden zu können. Und es wäre natürlich gut, wenn es für die bisherige GND parallel ein „Aufräum-Programm“ gäbe, mit dessen Hilfe nach und nach die unterschiedlichen Regelwerksstände an den aktuellen Stand angeglichen würden.
  4. Systematische, häufig wiederkehrende Erfassungsfehler → Erfassungsfehler
    Hier wären die Gründe für die Fehler zu analysieren (wenn beispielsweise ca. 13.000 Individualbegriffe Oberbegriffsrelationen zu einem Allgemeinbegriff mit obal (statt mit obin) haben, ist zu hinterfragen, woran das liegen könnte)
  5. Defizite bei Oberbegriffshierarchien und Instanzrelationen → Hierarchierelation → Abstraktionsrelation → Instanzrelation → Teil-Ganzes-Relation
  6. geringe Sättigung https://wiki.dnb.de/pages/viewpage.action?pageId=146398965 → Abdeckung
  7. logische Brüche → Logik
    Das sehe ich als Aufgabenfeld für das Fallbeispiel C (allerdings nicht im AP2)
  8. Defizite, die auf strukturelle Ursachen zurückzuführen sind [Klärungsbedarf]
  9. Regeln, die zu logischen Brüchen führen [Klärungsbedarf] → Logik
  10. Datenstrukturen, die falsche Aussagen erzwingen / richtige Aussagen unmöglich machen.
    Hier sehe ich das Aufgabenfeld von AP2. [Klärungsbedarf]
  11. Ergänzt balilabs: Fehler, die auf fehlende Aktualisierung der Daten zurückgehen. → Aktualität