Glossar zur Toolbox
Fragen 2020-02-20:
Zu https://wiki.dnb.de/pages/viewpage.action?spaceKey=GNDKULTURDATEN&title=Bericht+zum+Projektstand+Feb+2020 Was bedeutet der folgende Text:
“Datenformatmatching, dem Datenmapping und der Datenqualitätsprüfung vor dem eigentlich "Match and Merge"-Prozess, mit dem Datenimporte in die GND selbst durchgeführt werden”Wer kann/darf/soll Daten in den NDS importieren können?
In welchen Formaten (syntaktisch und semantisch) sollen die Daten importiert werden können?
Was wird importiert? Werden einzelne Begriffe, Teile von Vokabularen oder ganze Vokabulare importiert?
Wie und in welchem Arbeitsschritt wird die Datenqualität geprüft?
Stellt die Werkzeugkiste (wie heißt sie?) ein Mapping-Tool bereit?
Wer soll Mappings zwischen welchen Vokabularen zu welchem Zweck erstellen können?
Welche Mapping-Richtlinien werden benötigt, vereinbart und was kann davon in die Werkzeugkiste implementiert werden (ISO 25964-2:2013)?
Stellt die Werkzeugkiste ein Merging-Tool bereit? Was bedeutet “Merge” hier?
Wer führt Mapping- und Datenimporte (Neueinträge) in die GND selbst durch? Push (von wem?) oder Pull (durch DNB).
Welche Vokabulare kommen als Zielvokabulare in Frage? Welche Versionen der Zielvokabulare (z.B. AAT) werden zum Matching und Mapping bereitgestellt (AAT-Deutsch vs. AAT-xTree vs. AAT-Master; wenn AAT-xTree, dann nur Status “Freigegeben” oder auch Stand “In Bearbeitung”? Letzteres muss offengelegt und ein eigener Matching- und Mapping-Vorgang für diese Fälle definiert werden.)?
Welche Funktion(en) soll Wikidata in diesem Prozess haben: als Ziel für Matchings, zur Bestätigung von Matchings (z.B. Matching-Tool findet Ziele in GND und AAT, aber WD hat anderes Mapping zwischen diesen), als Publikationsplattform für Mappings, …
Diese Seite ist eine Arbeitsseite, die in der Spalte Bezeichnung der Tabelle 1 möglichst vollständig Bezeichnungen auflistet, die auf den Oberflächen des gesamten Matching-Mapping-Merging-Werkzeuges erscheinen. Diese Bezeichnungen sind noch nicht mit dem Datenmodell abgeglichen, zum Teil uneinheitlich geschrieben, nicht immer intuitiv verständlich. Primär wäre also die Bedeutung der Bezeichnungen in der Spalte Definition zu klären. Zu klären ist außerdem, welche der Bezeichnungen für die Nutzer angezeigt werden sollen; ist zum Beispiel “Matching-Ereignis” verständlich und überhaupt erforderlich?
Diese Arbeitsliste soll auch zu einer Dokumentation des Tools beizutragen. Das Ziel ist ein für die Öffentlichkeit bestimmtes Glossar.
Etliche der Fragen überlappen sich mit jenen auf → dieser Seite, auf der wir mögliche Antworten ebenfalls dokumentieren sollten.
Hinweise zur Tabelle und textlichen Gestaltung
Die Spalte Definition sollte vor dem Entwurf der Nutzeroberflächen ausgefüllt sein.
Die Spalte Alternative Bezeichnungen enthält Varianten der Bezeichnung, wie sie in den Vokabularen (Quell- sowie Zielvokabularen) vorkommen.
Die Spalte Fundstelle enthält Hinweise auf Fundstellen der Bezeichnungen im Wiki oder in der Werkzeugkiste.
Die Spalte Anmerkungen enthält Fragen und Hinweise zu Unklarem oder alternative Vorschläge für die bevorzugten Bezeichnungen in der Anzeige.
Rot geschrieben sind fragliche Schreibweisen, Falschschreibungen oder inhaltlich Unklares oder Überflüssiges. Diese Bezeichnungen sollten so schnell wie möglich geprüft und gegebenenfalls verbessert oder durch Hinweis auf einen anderen Eintrag ersetzt werden.
Grün geschrieben sind akzeptierte Bezeichnungen.
Kursiv gesetzt sind alternative Bezeichnungen für einen Glossareintrag. Alternative Bezeichnungen müssen eine Verweisung (siehe → ) auf einen bevorzugte Bezeichnung für einen Glossareintrag haben.
Frage: Wie heißt das Matching-Mapping-Merging-Werkzeug, also das Gesamtkunstwerk?
Vorschlag (DB): MMM-Studio oder M3-Studio.
Beispiele: https://www.altova.com/de/mapforce
Siehe auch https://digicult.atlassian.net/wiki/spaces/GND4C/pages/510066850
@Axel Vitzthum Ist die Bezeichnung endgültig Toolbox?
AV, 2020-07-08: nein. “Toolbox” ist nur für den Projektantrag für Phase 2 gesetzt. Danach kann die Bezeichnung nochmal geändert werden. Weitere Vorschläge aus dem letzten April: https://wiki.dnb.de/display/GNDKULTURDATEN/Alternative+Namen+Werkzeugkiste
Tabelle 1
Bezeichnung | Definition | Alternative Bezeichnungen | Fundstelle | Anmerkungen |
---|---|---|---|---|
Ähnlichkeit der Zeichenketten |
|
| Toolbox |
|
Alternative Bezeichnung |
| Synonym |
|
|
Analysetest |
|
| https://digicult.atlassian.net/wiki/spaces/GND4C/pages/646676571 |
|
Anzeigen |
|
| Toolbox | “anzeigen” ändern Link zu Detailanzeige des Datensatzes |
BCP |
|
| Toolbox |
|
Benennung | siehe Bezeichnung |
| Toolbox |
|
Bevorzugte Bezeichnung |
|
|
|
|
Bezeichner |
|
| Toolbox |
|
Bezeichnung |
|
|
|
|
Datenformatmatching |
|
|
| |
Datenhistorie |
|
|
| Entspricht “Datenhistory” Was bedeutet das? Datenherkunft? |
Datenhistory |
|
|
| Ändern in “Datenhistorie” oder “Datenherkunft” oder …? Wenn es ein Link ist, dann unterstreichen, nicht schwarz unterlegen. |
Datenkorrektur Quelldaten |
|
|
| |
Datenmapping |
|
|
| |
Datenqualitätsprüfung |
|
|
| |
Datenset |
|
| https://digicult.atlassian.net/wiki/spaces/GND4C/pages/646676571 |
|
Enrichment-Service |
|
|
| |
Entität |
|
|
|
|
Entitätstyp |
|
|
|
|
Export-Service |
|
|
| |
Event |
|
|
|
|
Eventname |
|
|
|
|
Import-Service |
|
|
| |
Importmapping |
|
| https://digicult.atlassian.net/wiki/spaces/GND4C/pages/568197214 |
|
Klangähnlichkeit |
|
|
|
|
Klick ins Zielsystem |
|
|
| Was bedeutet das? Der Link führt zur Sparql-Abfrage. |
Kommentare |
|
|
| |
Konfiguration |
|
| Auf Seite Matching |
|
Konzeptionelles Schema-Mapping |
|
| Schema-Mapping | |
Levenshtein-Distanz |
|
| Toolbox | Levenshtein Distanz korrigieren |
Limit |
|
| https://digicult.atlassian.net/wiki/spaces/GND4C/pages/646676571 |
|
Listen |
|
|
| |
Mapping |
|
|
|
|
Mapping-Service |
|
|
| |
Mapping-Store |
|
|
| |
"Match and Merge"-Prozess |
|
|
| |
Matching |
|
| Seite mit Überschrift Matching |
|
Matching-Durchlauf | Matching-Durchläufe werden in Matching-Ereignissen gespeichert und können kommentiert werden. |
|
| Worin unterscheiden sich “Matching-Durchlauf”, “Matching-Prozess”, “Matching-Ereignis”, “Matching-Event”? |
Matching-Ereignis |
|
|
| Matchingereignis Matchingevent nicht verwenden vgl. Matching-Prozess vgl. Matching-Vorgang |
Matching-Format |
|
| https://digicult.atlassian.net/wiki/spaces/GND4C/pages/568262807 |
|
Matching-Konfiguration |
|
| auf Seite https://digicult.atlassian.net/wiki/spaces/GND4C2/pages/568393891 |
|
Matching-Prozess |
|
| https://digicult.atlassian.net/wiki/spaces/GND4C/pages/593723559 |
|
Matching-Regeln |
|
| https://digicult.atlassian.net/wiki/spaces/GND4C/pages/593920174 |
|
Matching-Service | Der Matching-Serice ist ein automatisches Verfahren zum Abgleich von Zeichenketten (Stringabgleich). |
| https://digicult.atlassian.net/wiki/spaces/GND4C/pages/568230112 |
|
Matching-Store | Im Matching-Store werden die Matching-Ereignisse mit den einzelnen Matchings gespeichert. |
| https://digicult.atlassian.net/wiki/spaces/mI/pages/603979830 und auf Seite Matchingevent | Matchingstore nicht verwenden |
Merging |
|
|
|
|
Normalisierter Datenspeicher |
|
| https://digicult.atlassian.net/wiki/spaces/GND4C2/pages/568393891 | Ist syntaktisch und semantisch möglicherweise missverständlich; aber da bereits eingeführt https://digicult.atlassian.net/wiki/spaces/GND4C2/pages/568393891, sollte es wohl bei der Bezeichnung bleiben. Die Bedeutung müsste in der Definition geklärt werden. |
NDS |
|
|
| Siehe “Normalisierter Datenspeicher” und Kommentar. |
Normdatensystem |
|
| Auf Seite Matching | Was ist gemeint? Ist Zielvokabular gemeint? |
preferredLabel |
|
|
| |
Quelldaten |
|
|
|
|
Quellsystem |
|
|
| besser: Quellvokabular |
ranking zielsystem |
|
| Auf Seite Matching |
|
Recommender-Service |
|
|
|
|
Registrierungsdienst |
|
| https://digicult.atlassian.net/wiki/spaces/GND4C/pages/646676571 |
|
Relevanz-Kriterien |
|
|
| |
Relevanzschwelle |
|
| Auf Seite Matching |
|
Report |
|
| https://digicult.atlassian.net/wiki/spaces/GND4C/pages/646676571 |
|
Reporting |
|
|
|
|
Sachbegriff |
|
|
| “Sachbegriff” hat unterschiedliche Bedeutungen in der GND und im DDK-Vokabular |
Score |
|
| Auf Seite Matching |
|
Scoring |
|
| https://digicult.atlassian.net/wiki/spaces/GND4C/pages/646152193 |
|
Searchterm |
|
| Was ist Searchterm genau? Wie wird gesucht (linkstrunkiert, rechtstrunkiert, …)? Wenn der “Searchterm” für alle Ergebnisse je Eintrag derselbe ist, dann übergeordnet anzeigen. | |
Suchbegriff |
|
|
|
|
Suchstring |
|
|
| Beziehung zur Bezeichnung im Suchfeld klären. Suchbegriff; Search term; |
Treffer gesamt |
|
|
| |
Treffer unique |
|
|
| |
Trefferuri |
|
|
| |
Vorzugsbezeichnung | siehe → Bevorzugte Bezeichnung |
|
|
|
Zieldaten |
|
|
| |
Zieldaten details |
|
|
| |
Zielentität |
|
|
|
|
Zielsystem |
|
|
| ist gemeint Zielvokabular (GND, AAT, …) oder Recherchewerkzeug (lobid)? |