Glossar zur Toolbox

Fragen 2020-02-20:

  1. Zu https://wiki.dnb.de/pages/viewpage.action?spaceKey=GNDKULTURDATEN&title=Bericht+zum+Projektstand+Feb+2020 Was bedeutet der folgende Text:
    “Datenformatmatching, dem Datenmapping und der Datenqualitätsprüfung vor dem eigentlich "Match and Merge"-Prozess, mit dem Datenimporte in die GND selbst durchgeführt werden”

  2. Wer kann/darf/soll Daten in den NDS importieren können?

  3. In welchen Formaten (syntaktisch und semantisch) sollen die Daten importiert werden können?

  4. Was wird importiert? Werden einzelne Begriffe, Teile von Vokabularen oder ganze Vokabulare importiert?

  5. Wie und in welchem Arbeitsschritt wird die Datenqualität geprüft?

  6. Stellt die Werkzeugkiste (wie heißt sie?) ein Mapping-Tool bereit?

  7. Wer soll Mappings zwischen welchen Vokabularen zu welchem Zweck erstellen können?

  8. Welche Mapping-Richtlinien werden benötigt, vereinbart und was kann davon in die Werkzeugkiste implementiert werden (ISO 25964-2:2013)?

  9. Stellt die Werkzeugkiste ein Merging-Tool bereit? Was bedeutet “Merge” hier?

  10. Wer führt Mapping- und Datenimporte (Neueinträge) in die GND selbst durch? Push (von wem?) oder Pull (durch DNB).

  11. Welche Vokabulare kommen als Zielvokabulare in Frage? Welche Versionen der Zielvokabulare (z.B. AAT) werden zum Matching und Mapping bereitgestellt (AAT-Deutsch vs. AAT-xTree vs. AAT-Master; wenn AAT-xTree, dann nur Status “Freigegeben” oder auch Stand “In Bearbeitung”? Letzteres muss offengelegt und ein eigener Matching- und Mapping-Vorgang für diese Fälle definiert werden.)?

  12. Welche Funktion(en) soll Wikidata in diesem Prozess haben: als Ziel für Matchings, zur Bestätigung von Matchings (z.B. Matching-Tool findet Ziele in GND und AAT, aber WD hat anderes Mapping zwischen diesen), als Publikationsplattform für Mappings, …

Diese Seite ist eine Arbeitsseite, die in der Spalte Bezeichnung der Tabelle 1 möglichst vollständig Bezeichnungen auflistet, die auf den Oberflächen des gesamten Matching-Mapping-Merging-Werkzeuges erscheinen. Diese Bezeichnungen sind noch nicht mit dem Datenmodell abgeglichen, zum Teil uneinheitlich geschrieben, nicht immer intuitiv verständlich. Primär wäre also die Bedeutung der Bezeichnungen in der Spalte Definition zu klären. Zu klären ist außerdem, welche der Bezeichnungen für die Nutzer angezeigt werden sollen; ist zum Beispiel “Matching-Ereignis” verständlich und überhaupt erforderlich?

Diese Arbeitsliste soll auch zu einer Dokumentation des Tools beizutragen. Das Ziel ist ein für die Öffentlichkeit bestimmtes Glossar.

Etliche der Fragen überlappen sich mit jenen auf → dieser Seite, auf der wir mögliche Antworten ebenfalls dokumentieren sollten.

Hinweise zur Tabelle und textlichen Gestaltung

  1. Die Spalte Definition sollte vor dem Entwurf der Nutzeroberflächen ausgefüllt sein.

  2. Die Spalte Alternative Bezeichnungen enthält Varianten der Bezeichnung, wie sie in den Vokabularen (Quell- sowie Zielvokabularen) vorkommen.

  3. Die Spalte Fundstelle enthält Hinweise auf Fundstellen der Bezeichnungen im Wiki oder in der Werkzeugkiste.

  4. Die Spalte Anmerkungen enthält Fragen und Hinweise zu Unklarem oder alternative Vorschläge für die bevorzugten Bezeichnungen in der Anzeige.

  5. Rot geschrieben sind fragliche Schreibweisen, Falschschreibungen oder inhaltlich Unklares oder Überflüssiges. Diese Bezeichnungen sollten so schnell wie möglich geprüft und gegebenenfalls verbessert oder durch Hinweis auf einen anderen Eintrag ersetzt werden.

  6. Grün geschrieben sind akzeptierte Bezeichnungen.

  7. Kursiv gesetzt sind alternative Bezeichnungen für einen Glossareintrag. Alternative Bezeichnungen müssen eine Verweisung (siehe → ) auf einen bevorzugte Bezeichnung für einen Glossareintrag haben.

Frage: Wie heißt das Matching-Mapping-Merging-Werkzeug, also das Gesamtkunstwerk?

Vorschlag (DB): MMM-Studio oder M3-Studio.
Beispiele: https://www.altova.com/de/mapforce

Siehe auch https://digicult.atlassian.net/wiki/spaces/GND4C/pages/510066850

@Axel Vitzthum Ist die Bezeichnung endgültig Toolbox?

AV, 2020-07-08: nein. “Toolbox” ist nur für den Projektantrag für Phase 2 gesetzt. Danach kann die Bezeichnung nochmal geändert werden. Weitere Vorschläge aus dem letzten April: https://wiki.dnb.de/display/GNDKULTURDATEN/Alternative+Namen+Werkzeugkiste

Tabelle 1

Bezeichnung

Definition

Alternative Bezeichnungen

Fundstelle

Anmerkungen

Bezeichnung

Definition

Alternative Bezeichnungen

Fundstelle

Anmerkungen

Ähnlichkeit der Zeichenketten

 

 

Toolbox

 

Alternative Bezeichnung

 

Synonym

 

 

Analysetest

 

 

https://digicult.atlassian.net/wiki/spaces/GND4C/pages/646676571

 

Anzeigen

 

 

Toolbox

“anzeigen” ändern

Link zu Detailanzeige des Datensatzes

BCP

 

 

Toolbox

 

Benennung

siehe Bezeichnung

 

Toolbox

 

Bevorzugte Bezeichnung

 

 

 

 

Bezeichner

 

 

Toolbox

 

Bezeichnung

 

 

 

 

Datenformatmatching

 

 

Bericht zum Projektstand

 

Datenhistorie

 

 

 

Entspricht “Datenhistory

Was bedeutet das? Datenherkunft?

Datenhistory

 

 

 

Ändern in “Datenhistorie” oder “Datenherkunft” oder …? Wenn es ein Link ist, dann unterstreichen, nicht schwarz unterlegen.

Datenkorrektur Quelldaten

 

 

Folie Phase 1

 

Datenmapping

 

 

Bericht zum Projektstand

 

Datenqualitätsprüfung

 

 

Bericht zum Projektstand

 

Datenset

 

 

https://digicult.atlassian.net/wiki/spaces/GND4C/pages/646676571

 

Enrichment-Service

 

 

Folie Phase 1

 

Entität

 

 

 

 

Entitätstyp

 

 

 

 

Export-Service

 

 

Folie Phase 1

 

Event

 

 

 

 

Eventname

 

 

 

 

Import-Service

 

 

Folie Phase 1

 

Importmapping

 

 

https://digicult.atlassian.net/wiki/spaces/GND4C/pages/568197214

 

Klangähnlichkeit

 

 

 

 

Klick ins Zielsystem

 

 

 

Was bedeutet das? Der Link führt zur Sparql-Abfrage.

Kommentare

 

 

Folie Phase 1

 

Konfiguration

 

 

Auf Seite Matching

 

Konzeptionelles Schema-Mapping

 

 

Folie Phase 1

Schema-Mapping

Levenshtein-Distanz

 

 

Toolbox

Levenshtein Distanz korrigieren

Limit

 

 

https://digicult.atlassian.net/wiki/spaces/GND4C/pages/646676571

 

Listen

 

 

Folie Phase 1

 

Mapping

 

 

 

 

Mapping-Service

 

 

Folie Phase 1

 

Mapping-Store

 

 

Folie Phase 1

 

"Match and Merge"-Prozess

 

 

Bericht zum Projektstand

 

Matching

 

 

Seite mit Überschrift Matching

 

 

Matching-Durchlauf

Matching-Durchläufe werden in Matching-Ereignissen gespeichert und können kommentiert werden.

Quelle

 

 

Worin unterscheiden sich “Matching-Durchlauf”, “Matching-Prozess”, “Matching-Ereignis”, “Matching-Event”?

Matching-Ereignis

 

 

 

Matchingereignis Matchingevent nicht verwenden

vgl. Matching-Prozess

vgl. Matching-Vorgang

Matching-Format

 

 

https://digicult.atlassian.net/wiki/spaces/GND4C/pages/568262807

 

Matching-Konfiguration

 

 

auf Seite https://digicult.atlassian.net/wiki/spaces/GND4C2/pages/568393891

 

Matching-Prozess

 

 

https://digicult.atlassian.net/wiki/spaces/GND4C/pages/593723559

 

Matching-Regeln

 

 

https://digicult.atlassian.net/wiki/spaces/GND4C/pages/593920174

 

Matching-Service

Der Matching-Serice ist ein automatisches Verfahren zum Abgleich von Zeichenketten (Stringabgleich).

Quelle

 

https://digicult.atlassian.net/wiki/spaces/GND4C/pages/568230112

Folie Phase 1

 

Matching-Store

Im Matching-Store werden die Matching-Ereignisse mit den einzelnen Matchings gespeichert.

Quelle

 

https://digicult.atlassian.net/wiki/spaces/mI/pages/603979830

und auf Seite Matchingevent

Folie Phase 1

Matchingstore nicht verwenden

Merging

 

 

 

 

Normalisierter Datenspeicher

 

 

https://digicult.atlassian.net/wiki/spaces/GND4C2/pages/568393891

Ist syntaktisch und semantisch möglicherweise missverständlich; aber da bereits eingeführt https://digicult.atlassian.net/wiki/spaces/GND4C2/pages/568393891, sollte es wohl bei der Bezeichnung bleiben. Die Bedeutung müsste in der Definition geklärt werden.

NDS

 

 

 

Siehe “Normalisierter Datenspeicher” und Kommentar.

Normdatensystem

 

 

Auf Seite Matching

Was ist gemeint? Ist Zielvokabular gemeint?

preferredLabel

 

 

Werkzeugkiste

 

Quelldaten

 

 

 

 

Quellsystem

 

 

 

besser: Quellvokabular

ranking zielsystem

 

 

Auf Seite Matching

 

Recommender-Service

 

 

 

 

Registrierungsdienst

 

 

https://digicult.atlassian.net/wiki/spaces/GND4C/pages/646676571

 

Relevanz-Kriterien

 

 

Folie Phase 1

 

Relevanzschwelle

 

 

Auf Seite Matching

 

Report

 

 

https://digicult.atlassian.net/wiki/spaces/GND4C/pages/646676571

 

Reporting

 

 

 

 

Sachbegriff

 

 

 

“Sachbegriff” hat unterschiedliche Bedeutungen in der GND und im DDK-Vokabular

Score

 

 

Auf Seite Matching

 

Scoring

 

 

https://digicult.atlassian.net/wiki/spaces/GND4C/pages/646152193

 

Searchterm

 

 

Werkzeugkiste

Was ist Searchterm genau? Wie wird gesucht (linkstrunkiert, rechtstrunkiert, …)? Wenn der “Searchterm” für alle Ergebnisse je Eintrag derselbe ist, dann übergeordnet anzeigen.

Suchbegriff

 

 

 

 

Suchstring

 

 

Beziehung zur Bezeichnung im Suchfeld klären.

Suchbegriff; Search term;

Treffer gesamt

 

 

Werkzeugkiste

 

Treffer unique

 

 

Werkzeugkiste

 

Trefferuri

 

 

Werkzeugkiste

 

Vorzugsbezeichnung

siehe → Bevorzugte Bezeichnung

 

 

 

Zieldaten

 

 

Werkzeugkiste

 

Zieldaten details

 

 

Werkzeugkiste

 

Zielentität

 

 

 

 

Zielsystem

 

 

 

ist gemeint Zielvokabular (GND, AAT, …) oder Recherchewerkzeug (lobid)?