Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

...

Dabei zeigen sich Hindernisse für einen automatischen Zeichenkettenabgleich auf beiden Seiten der Vokabulare: Fehlende Synonyme und Homonyme sind dabei die häufigsten Ursachen für ein Versagen des automatischen Abgleichs in Fällen, in denen tatsächlich ein bedeutungsgleicher Begriff im Vokabular des Museums und in der GND existiert.

Wir haben fünf sechs Typen von Matching-Ergebnissen identifiziert:

  1. eindeutiger und korrekter Match (sowohl die Benennung wie auch die Bedeutung stimmen auf beiden Seiten überein),
  2. zu viele Treffer im Zielvokabular (tritt auf, wenn beispielsweise Klammerzusätze nicht ausgewertet werden können),
  3. falsch positiver Match (der gefundene Begriff hat eine ander andere Bedeutung als der gesuchte Begriff),
  4. falsch ergebnisloser Match (der gesuchte Begriff ist im Zielvokabular vorhanden, wurde aber nicht gefunden),
  5. ergebnisloser Match (tatsächlich ist kein Äquivalent in der GND vorhanden; der Match ist ein Kandidat für eine Neuaufnahme in die GND),
  6. ähnliche Schreibweisen von Benennungen, die durch eine unscharfe Suche gefunden werden, können verschiedene Begriffe repräsentieren;
    es können durch eine unscharfe Suche aber auch exakte Übereinstimmungen entdeckt werden.

Die Matching-Ergebnisse werden stichprobenweise manuell einem der fünf Typen zugeordnet. Die Gründe für falsche Matches, falsch ergebnislose Matches sowie unentscheidbare Fälle bei zu vielen Ergebnissen werden intellektuell untersucht. Warum werden identische Zeichenketten nicht gefunden? Warum werden äquivalente Begriffe nicht gefunden? Was sind die Gründe für falsch positive Matches? Die Ergebnisse dieser Untersuchungen werden auch zur Verbesserung der Matching-Algorithmen herangezogen.

...