2.2.2.1.1 Synonymkontrolle (In Bearbeitung)

1 Definition

Synonyme oder quasisynonyme Bezeichnungen für einen →Begriff werden in einem kontrollierten Vokabular zusammengefasst, und es wird eine →Bevorzugte Bezeichnung gewählt, die den Begriff für Indexierung und Retrieval repräsentiert. Alle diese Bezeichnungen sind mit dem Begriff verknüpft, sodass sie sich eindeutig auf ein und denselben Begriff beziehen. Dieser Vorgang des Sammelns und Verknüpfens von Synonymen wird "Synonymkontrolle" genannt.

Die Synonymkontrolle ist ein Teil der →Terminologischen Kontrolle und eine der wichtigsten Aufgaben bei der Erstellung von Thesauri.

2 Terminologie, Typografie, Kürzel

In Begriffssätzen oder alphabetischen Listen werden

  • die alternativen Bezeichnungen meist kursiv angezeigt, zum Beispiel "Kappenwindmühle"

  • die bevorzugten Bezeichnungen im Standardformat ausgegeben, zum Beispiel "Holländerwindmühle" oder in Standardschrift und fett formatiert, zum Beispiel "Holländerwindmühle"

In Thesauri wird die Beziehung zwischen den alternativen Bezeichnungen und der bevorzugten Bezeichnung eines Begriffes als → Äquivalenzrelation bezeichnet. Die Bezeichnungen bilden zusammen eine → Äquivalenzklasse.
Kürzel für die Verweisung auf die Bezeichnungen in der Äquivalenzrelation sind

  • USE für die Verweisung auf die bevorzugte Bezeichnung

  • UF (Use(d) for) für die Verweisung auf die alternative Bezeichnung oder alternativen Bezeichnungen.

Glossar: Synonym; Quasisynonym; Begriffssatz

https://wiki.dnb.de/x/AjlVCw

3 Erläuterung

Alternative Bezeichnungen sind in einem kontrollierten Vokabular bedeutungsgleiche (synonyme), bedeutungsähnliche oder bedeutungsnahe (quasisynonyme) Wörter oder Wortgruppen für einen Begriff. Sie helfen bei der Indexierung und Suche, das gewünschte Schlagwort (die bevorzugte Bezeichnung) zu finden und werden deshalb auch "Zugangsvokabular" oder "Einstiegsvokabular" genannt. Gleichzeitig tragen alternative Bezeichnungen auch zur Bedeutungsklärung bei, indem sie den Begriffsumfang explizieren.

Häufig gibt es in der natürlichen Sprache für einen Begriff mehr als eine Bezeichnung (Bezeichnungsvielfalt). Das können fremdsprachige Ausdrücke sein (wie "sarcophagus" für "Sarkophag") oder synonyme Bezeichnungen innerhalb einer Sprache.

Echte Synonyme können in jedem Sprachzusammenhang, zum Beispiel in einem Satz, gegeneinander ausgetauscht werden, ohne dass sich die Aussage des Satzes ändert. Zum Beispiel sind "Hauspferd" und "Equus caballus" echte Synonyme. "Pferd" und "Ross" oder "Gaul" sind dagegen bedeutungsähnliche Bezeichnungen, die sich zwar alle auf dieselbe Art Lebewesen beziehen, aber nicht ohne Bedeutungsänderung austauschbar sind: "Der stolze Ritter auf seinem Gaul" würde allenfalls Don Quijote auf seiner Rosinante gut beschreiben.

Häufiger sind es bedeutungsähnliche Bezeichnungen, die in kontrollierten Vokabularen unter einem Begriff zusammengefasst werden. Echte Synonyme kommen dagegen öfter vor bei generischen Bezeichnungen für konkrete Gegenstände, wie zum Beispiel bei Museumsobjekten.

Das Verfahren der Zusammenführung bedeutungsähnlicher Bezeichnungen zu einem Begriff wird "Synonymkontrolle" genannt. Die Synonymkontrolle ist mit der Homonymkontrolle Teil der "terminologischen Kontrolle" (Bezeichnungskontrolle).

Glossar: Alternative Bezeichnung; Zugangsvokabular; Begriffsumfang; Bevorzugte Bezeichnung; Terminologische Kontrolle; Synonymkontrolle;

3.1 Synonymkontrolle

Als Synonymkontrolle wird das Zusammenführen von verschiedenen Bezeichnungen für ein und denselben Sachverhalt (Begriff) bezeichnet. Üblicherweise wird in einem Thesaurus eine dieser Bezeichnungen als bevorzugt (englisch: preferred) zur Anzeige für Indexierung und Retrieval ausgewählt.

Die Synonyme und Quasisynonyme werden auch Zugangsvokabular genannt, weil sie die Suche nach einem Indexterm beziehungsweise einem Schlagwort für die Suche unterstützen. Es sollten deshalb möglichst viele gebräuchliche und treffende Einstiegsterme aufgenommen werden. Das quantitative Verhältnis zwischen Deskriptoren und alternativen Bezeichnungen sollte zwischen 1:3 bis 1:5 liegen.

3.2 Was wird als alternative Bezeichnung aufgenommen?

Welche Bezeichnungen gelten als bedeutungsgleich, bedeutungsähnlich oder bedeutungsnah? Welche sollten als alternative Bezeichnungen aufgenommen werden?

  • Synonym sind Bezeichnungen mit gleicher Bedeutung. Sie sollten so umfassend wie möglich aufgenommen werden, um den Recall im Retrieval zu erhöhen.

  • Quasisynonym sind Bezeichnungen mit ähnlicher Bedeutung, die in einem Thesaurus wie Synonyme behandelt werden, im natürlichen Sprachgebrauch aber nicht völlig bedeutungsgleich sind. Häufig werden Bezeichnungen als Quasisynonyme aufgenommen, wenn sie nicht zum Kernbereich des Vokabulars gehören.

Beispiel für Quasisynonymie im Standard-Thesaurus Wirtschaft:

Der Deskriptor "Altersvorsorge" wird "benutzt für":

Rentensystem, Hinterbliebenenrente, Altersversorgung, Alterssicherung, Old-age provision, Multi-pillar pension system

Beispiel für Quasisynonymie in der Gemeinsamen Normdatei:

Der Deskriptor "Druckwerk" ist "Varianter Name" für:

Druck | Druckwerke | Druckerzeugnis | Schrift | Publikation | Drucke | Druckschrift

4 Beispiele

Im Zuge der Synonymontrolle werden bedeutungsähnliche Bezeichnungen genau einem Begriff zugeordnet. Ein bestimmter Mühlentyp zum Beispiel, der mit einer drehbaren Kappe ausgestattet ist und im 16. Jahrhundert die Bockwindmühle ablöste, wird bezeichnet als

Holländerwindmühle; Kappenwindmühle; Holländermühle; Holländer; smock mill; smock windmill

Für jede Sprache wird eine dieser Bezeichnungen als →Bevorzugte Bezeichnung ausgewählt. In elektronischen Informationssystemen werden die Vorzugsbezeichnungen an den Suchschnittstellen angezeigt und die Synonyme und Quasisynonyme in der Regel automatisch in die Suchanfrage einbezogen.

4.1 Synonymkontrolle im AAT

Abb. 3: smock mills im AAT

Abbildung 3 zeigt die Terme (Bezeichnungen) für den Begriff SMOCK MILL im AAT mit chinesischen, niederländischen, deutschen und spanischen Sprachäquivalenten. Die deutschen Übersetzungen sollen nun näher betrachtet werden:

Vorzugsbezeichnung ist "Kappenwindmühle", eine selten gebrauchte Regionalvariante, die deshalb nicht als bevorzugte Bezeichnung geeignet ist. Auch der alternative Term "Holländische Windmühle" wird eher selten benutzt. Die als Synonym aufgenommene "Turmwindmühle" ist laut Wikipedia dagegen gar keine Holländerwindmühle, sondern ein anderer Windmühlentyp, verschieden vom "Turmholländer" als Typ einer Holländerwindmühle.

Es fehlen die geläufigsten Bezeichnungen "Holländerwindmühle" und "Holländermühle" als Synonyme. Welche Auswirkungen diese deutschen Terme für die Qualität von Suchergebnissen haben, wird in Kapitel 7 beschrieben.

4.2 Synonyme in der GND

Abb. 4: Holländerwindmühle in der GND

 

 

 

 

 

 

 

5 Indexierung und Retrieval

Alternative Bezeichnungen

  • erleichtern das Auffinden des gesuchten Schlagwortes

  • erhöhen den Recall (Vollständigkeit des Suchergebnisses).

Nicht kontrollierte Synonyme der natürlichen Sprache verursachen einen sogenannten Informationsverlust bei der Suche. Informationsverlust bedeutet, dass in einer Datenbank vorhandene Einträge nicht gefunden werden. Angenommen, es wird in einem Informationssystem nach einer Holländerwindmühle gesucht. Nun gibt es im Deutschen für diesen Windmühlentyp verschiedene synonyme Bezeichnungen, wie in Abschnitt 6 beschrieben:

 

Wenn diese Synonyme nicht zusammengeführt sind, müssten bei der Suche all diese Bezeichnungen mit einer ODER-Verknüpfung abgefragt werden, um eine möglichst vollständige Ergebnismenge zu erhalten. Das ist nicht nur mühsam, sondern setzt auch voraus, dass allen Informationssuchenden alle diese Synonyme bekannt sind und im Moment der Recherche auch einfallen. Ein Thesaurus erspart diese Arbeit, indem die alternativen Bezeichnungen bei der Thesauruserstellung in das Vokabular eingepflegt werden. Beim Retrieval können die alternativen Bezeichnungen automatisch in die Suche einbezogen werden.

 

 

5.1 Indexierung an einem Beispiel

Kontrolliertes Vokabular erleichtert nicht nur die Indexierung, sondern trägt wesentlich zu einer Vereinheitlichung der Indexate bei. Nur wenn sparten- und institutionenübergreifend verbindlich kontrolliert erschlossen wird, lässt sich die angestrebte Interoperabilität erreichen. Im Idealfall bietet das Erfassungssystem Begriffe aus kontrolliertem Vokabular zur Auswahl an.

In manchen Indexaten finden sich Synonyme und oft auch Oberbegriffe als Schlagwörter in einer Objektbeschreibung (Abbildung 5).

5.2 Retrieval an einem Beispiel

Gesucht werden Gemälde von Holländerwindmühlen. Eine Freitextsuche nach "Holländerwindmühle AND Gemälde" liefert keine Ergebnisse und auch die Suche mit "Holländermühle AND Gemälde" bleibt erfolglos. Erst mit der seltenen Bezeichnung "Holländische Mühle" werden Gemälde gefunden, die eine solche Mühle abbilden.

Die offensichtlich fehlende Synonymkontrolle führt dazu, dass die Suche für jedes Synonym einzeln oder verknüpft durchgeführt werden muss, ein erheblicher Mehraufwand im Retrieval. Wenn die Bezeichnung "Holländische Mühle", die zum Erfolg führt, bei der Suche aber nicht parat ist, werden Gemälde mit dargestellten Holländerwindmühlen gar nicht gefunden. Die fehlende Synonymkontrolle führt also zu einer Minderung der Retrievalqualität durch Informationsverlust.

6 Synonymkontrolle in xTree

Die Aufnahme bevorzugter und alternativer Bezeichnungen in xTree wird am Beispiel des Begriffs Holländerwindmühle gezeigt (Abbildung 2). "Holländerwindmühle" wird als Deskriptor gewählt, weil es im Deutschen die gebräuchlichste fachlich korrekte und informative Bezeichnung ist. Das Sprachäquivalent im Englischen ist "smock mills". Beide Bezeichnungen haben in xTree die Rolle "Bevorzugt". Die Synonyme "Holländermühle", "Kappenwindmühle", "Holländische Mühle" etc. werden mit der Rolle "Alternativ" aufgenommen. In elektronischen Informationssystemen werden die Vorzugsbezeichnungen an den Suchschnittstellen angezeigt und die Synonyme und Quasisynonyme in der Regel automatisch in die Suchanfrage einbezogen.

7 Zusammenfassung

Synonym ist in diesem Kontext die zusammenfassende Bezeichnung für alle als äquivalent angesehenen Benennungen. Dazu gehören unter anderen echte Synonyme, Quasi-Synonyme, unterschiedliche Schreibweisen oder Numeri, Kurzformen und Verweisungen auf Komposita. Synonyme unterstützen den Sucheinstieg und tragen zur Bedeutungsklärung des Begriffes bei.

Synonymkontrolle, das heißt das Zusammenführen von (möglichst vielen) Synonymen und alternativen Bezeichnungen, verbessert Matching-Ergebnisse und erhöht die Qualität im Information-Retrieval in Bezug auf die Vollständigkeit der Suchergebnisse (Recall).

https://wiki.dnb.de/x/QFNVCw

8 Siehe auch

2.2.2.1.3 Zerlegungskontrolle (In Bearbeitung)

3.4.1 Äquivalenzrelation (In Bearbeitung)

https://wiki.dnb.de/display/GNDKULTURDATEN/Synonym

9 Referenzen

"Bei der Synonymkontrolle werden Synonyme und Quasi-Synonyme zu Äquivalenzklassen einer Dokumentationssprache zusammengeführt." [Grundlagen 2004]

  • S. Stock/Stock S. 236-237

  • Äquivalenzrelation bezeichnet eine Relation, die die Eigenschaft hat, gleichzeitig reflexiv, symmetrisch und transitiv zu sein (Quelle: Wikipedia Äquivalenzrelation).

Und ein anschauliches Beispiel zur Äquivalenzrelation in Wikipedia

Nicht-Deskriptor (DIN 1463-1: 2.5 ) oder Nichtdeskriptor; non-preferred term (ISO 25964-1: 2.39 ) quasi-synonym (ISO 25964-1: 2.47) ; nonpreferred terms | alternate descriptors | inverted terms | used for terms (AAT) [Auszug aus GND4C: Synonyme – Analyse]

1 Beispiel aus DIN 1463-1:1987, 5.2
2 Beispiel aus Standard-Thesaurus Wirtschaft: Holzprodukt

In Bearbeitung: Unter 3 Beispiel: Abbildung 1: Synonyme für Pferd, Schreibmaschinentype, Tabellen, Type bei den Beispielen, Anker setzen

Anhang

Beispiele für alternative Bezeichnungen

Folgende Bezeichnungsvarianten können als alternative Bezeichnungen oder Quasisynonyme aufgenommen werden:

Tabelle 1: Beispiele für alternative Bezeichnungen

Art der Bezeichnung

Erläuterung

Beispiele

Art der Bezeichnung

Erläuterung

Beispiele

Kurzformen

Kurzformen, wenn sie weniger gebräuchlich sind als die Langform oder wenn sie mehrdeutig sind

DSchG alternativ für Denkmalschutzgesetz

Schreibweisenvarianten

alte und neue deutsche Rechtschreibung, amerikanisches und britisches Englisch

Roß für Ross

Pluralformen

Pluralformen im Deutschen beziehungsweise in der Fremdsprache

Häuser; houses

Invertierte Formen

invertierte Formen bei Adjektiv-Substantiv-Verbindungen

Haus, giebelständiges für Giebelständiges Haus, bevorzugte Bezeichnung: "Giebelhaus".
Nicht Haus (giebelständig).

Populäre und wissenschaftliche Bezeichnung

Bezeichnungen der Standardsprache und der Fachsprache können als Synonyme behandelt werden.

MühlenkundeMolinologie

Umgangsprachliche und standardsprachliche Bezeichnungen

Umgangssprachliche Bezeichnungen sind für den Sucheinstieg hilfreich, wenn sich das Vokabular auch an fachfremde Nutzer richtet.

ZiegelsteinZiegel

Bezeichnungen unterschiedlicher regionaler oder kultureller Herkunft

Regionale Bezeichnungsvarianten können in ein Vokabular aufgenommen werden, wenn sie gebräuchlich und als Sucheinstieg hilfreich sind.

HolländerwindmühleKappendreher

Aktuelle und historische oder veraltete Bezeichnungen

Hinweis: Je nach inhaltlichem Schwerpunkt des Thesaurus können aktuelle und historische Bezeichnungen auch als eigene Begriffe (Schlagwörter) behandelt und über eine chronologische Assoziationsbeziehung verbunden werden.

WerftSchiffszimmerplatz

Quasisynonyme

Bedeutungsnahe Bezeichnungen, die sich in der Standardsprache auf unterschiedliche Begriffe beziehen, in der jeweiligen Dokumentationssprache aber wie Synonyme behandelt werden

RetrievalRecherche1;
HolzproduktHolzwerkstoff2

Rollen für Bezeichnungen in xTree

In xTree gibt es verschiedene Typen von Bezeichnungen, die in xTree als Rolle der Bezeichnung ausgewählt werden können:

Tabelle 2: Die Rollen für Bezeichnungen in xTree

Art der Rolle

Erläuterung

Beispiele

Art der Rolle

Erläuterung

Beispiele

Alternativ

Bezeichnungen, die bedeutungsgleich oder so ähnlich in der Bedeutung sind, dass sie in einem gegebenen Zusammenhang ohne Bedeutungsänderung ausgetauscht werden könnten. Alternative Bezeichnungen diesen Typs können gegebenenfalls auch in eine → Bevorzugte Bezeichnung geändert werden.

Galerieholländer alternativ für Galerieholländermühle

Verborgen

Bezeichnung, die in die Suchanfrage einbezogen werden soll, dem Nutzer aber nicht angezeigt wird. Das trifft vor allem auf Falschschreibungen zu, wie zum Beispiel Progrom anstatt Pogrom.

 

Hinweis: Es sollten nur häufige Falschschreibungen, insbesondere von Fachtermini, aufgenommen werden.

Gallerieholländer verborgen für Galerieholländer

Quasisynonym

Bezeichnung, die ähnlich oder nah in der Bedeutung ist, aber in einem gegebenen Zusammenhang nicht ohne Bedeutungsänderung gegen die anderen alternativen Bezeichnungen des Begriffes ausgetauscht werden könnte.

Ross Quasisynonym für Pferd

Benutze Oberbegriff

Bezeichnung, die eigentlich ein Unterbegriff zum vorliegenden Begriff ist.

 

Hinweis: Ein Unterbegriff sollte nur als alternative Bezeichnung mit der Rolle "Benutze Oberbegriff" aufgenommen werden, wenn er nicht zum inhaltlichen Kernbereich des Vokabulars gehört, also eher einem thematischen Randgebiet entstammt. Thesaurusstandards und SKOS empfehlen die Nutzung dieses Relationstyps ausdrücklich nicht. Der Art & Architecture Thesaurus schließt diese Relation grundsätzlich aus.