2.2.2.1.2 Homonymkontrolle (In Bearbeitung)
1 Definition
Ein Homonym ist ein Wort, das mit einem anderen gleich lautet, aber in der Bedeutung verschieden ist. Homonyme sind mehrdeutige (ambige) Bezeichnungen. Die Homonymkontrolle ist ein Verfahren zur Klärung der Bedeutung (Disambiguierung) und Teil der terminologischen Kontrolle.
2 Terminologie
Im Folgenden wird die Bezeichnung Homonym zusammenfassen für alle mehrdeutigen Bezeichnungen, wie Homonyme, Polyseme und Homografen, verwendet. Die sprachwissenschaftliche Unterscheidung zwischen Homonymie und Polysemie ist für die Thesauruserstellung nicht wesentlich. Die Homonymkontrolle wird auch "Polysemkontrolle" oder "Homonym-/Polysemkontrolle" genannt.
3 Erläuterung
In der natürlichen Sprache haben Wörter oft zwei oder mehr als zwei Bedeutungen. Die Bezeichnung "Bank" zum Beispiel kann sich auf mindestens fünf verschiedene Sachverhalte beziehen: Finanzunternehmen, Gebäude eines Finanzinstitutes, Sitzmöbel, Werkbank oder Gesteinsschicht. Eine Hauptfunktion von Thesauri und anderen kontrollierten Vokabularen ist es, die Bedeutung von Bezeichnungen zu klären, sodass jede Bezeichnung eindeutig ist und genau einen Begriff repräsentiert.
Glossar: Homonym; Homonymkontrolle; Disambiguierung;
3.1 Homonymkontrolle
Die Homonymkontrolle ist ein Teil der →Terminologischen Kontrolle. Bei diesem Verfahren werden Homonyme identifiziert und deren Bedeutung geklärt.
Es gibt in Thesauri zwei Möglichkeiten zur Begriffsklärung:
Wahl einer eindeutigen Bezeichnung anstelle der mehrdeutigen
Disambiguierung durch Homonymzusätze
3.2 Wahl einer eindeutigen Bezeichnung
Wenn möglich, wird immer eine eindeutige Bezeichnungsvariante des Homonyms bevorzugt. "Eiweiß" hat gemäß Wörterbüchern zwei Bedeutungen: 1. Bestandteil des Hühnereis und 2. organische chemische Verbindung. Diese Begriffe können eindeutig bezeichnet werden:
BEISPIEL
Eiklar
Protein
Für den Sucheinstieg ist es nützlich, die mehrdeutigen Bezeichnungen jeweils mit → Homonymzusatz als alternative Bezeichnungen aufzunehmen:
Eiweiß (Protein) USE Protein
Eiweiß (Hühnereiweiß) USE Eiklar
3.3 Disambiguierung durch Homonymzusatz
Lässt sich keine eindeutige Bezeichnung für das Homonym finden, so muss die bevorzugte Bezeichnung durch einen →Homonymzusatz aufgelöst werden. Diese Zusätze werden der mehrdeutigen Bezeichnung in runden Klammern nachgestellt. Dieser Vorgang der Begriffsklärung wird fachsprachlich "Disambiguierung" (wörtlich: "Entmehrdeutigung") genannt. Der Homonymzusatz wird nach vorgegebenen Regeln formuliert:
BEISPIEL
Bank (Geldinstitut); Bank (Möbel)
4 Beispiel
Für die Bezeichnung "Hammer" kennt das Wörterbuch von Jacob und Wilhelm Grimm nicht weniger als 15 Bedeutungen, der Duden listet immerhin noch acht Lesarten, das DWDS sechs Auslegungen in den Bedeutungsübersichten, und Wiktionary verzeichnet sieben unterschiedliche Interpretationen, zum Beispiel Handwerkszeug, Werkzeugmaschine, Hammerwerk, Klöppel, Gehörknöchelchen, Sportgerät, Waffe, Symbol.
Ein Beispiel für Disambiguierung ist die Begriffsklärung von "Mühle" in Wikipedia.
5 Indexierung und Retrieval
Mehrdeutige Bezeichnungen können zu Fehlern bei der Indexierung und zu unerwünschten Suchergebnissen führen. In beiden Fällen wird die Retrievalqualität beeinträchtigt: Die Präzision der Suche ist in jedem Fall herabgesetzt, aber es kann auch Informationsverlust resultieren. Die folgenden Abschnitte zeigen an Beispielen, wie es zu diesen Qualitätsminderungen im Retrieval kommt.
5.1 Indexierung
Mehrdeutige Bezeichnungen, die nicht disambiguiert sind, können zu fehlerhaften Indexaten führen. Angenommen, das Homonym "Druck" im physikalischen Sinn ist nicht unterschieden von "Druck" im Sinne von "Gedrucktes", kann es, insbesondere bei automatischen Verfahren, zu Fehlindexaten kommen.
5.2 Retrieval
Mehrdeutige Bezeichnungen können bei der Suche zu unerwünschten Ergebnissen führen. Die Suche mit der Bezeichnung Schimmel zum Beispiel kann eine Ergebnismenge liefern, in der Dokumente zum Pferd und zum Pilz enthalten sind, wenn das Informationssystem nicht weiß, welche der möglichen Bedeutungen von Schimmel bei der Suchanfrage gemeint ist. Wenn Informationen zu Pferden gesucht werden, dann sind die Treffer zum Pilz überflüssig und sogenannter "Informationsballast".
Um Ballast zu vermeiden, wird die Bedeutung mehrdeutiger Bezeichnungen in Thesauri durch sogenannte Homonymzusätze geklärt. Im Prozess der Homonymkontrolle werden mehrdeutige Bezeichnungen (Homonyme und Polyseme, im Folgenden: Homonyme) eindeutig auf einen Begriff bezogen (Disambiguierung).
6 Homonymkontrolle in xTree
7 Zusammenfassung
Homonym ist in diesem Kontext die zusammenfassende Bezeichnung für alle gleichgeschriebenen Bezeichnungen mit unterschiedlicher Bedeutung. Dazu gehören Homonyme im engen Sinn und Polyseme. Homonymkontrolle, das heißt die Klärung von Homonymen durch identifizierende Zusätze, verbessert Matching-Ergebnisse und erhöht die Qualität im Information-Retrieval in Bezug auf die Genauigkeit der Suchergebnisse (Precision). |
8 Siehe auch
3.2.3 Bezeichnung (In Bearbeitung)
2.2.2.1 Terminologische Kontrolle (In Bearbeitung)
3.2.3.3 Zusatz für ein Homonym (In Bearbeitung)
9 Referenzen
Zu Homonymen und Homonymkontrolle s.a. § 306 Homonyme und § 10 Homonymenzusatz der Regeln für den Schlagwortkatalog (RSWK).
1 Duden, URL: Homonym | Duden: "Wort, das mit einem andern gleich lautet, den gleichen Wortkörper hat (aber in der Bedeutung [und Herkunft] verschieden ist)"
2 ISO 25964-1: "2.24 homograph – one of two or more words that are written in the same way, but have different meanings.”