2.2.2 Vokabularkontrolle (In Bearbeitung)

1 Definition

Vokabularkontrolle ist der Prozess in der Vokabularentwicklung, in dem über die Aufnahme von Elementen (zum Beispiel →Begriffe, →Bezeichnungen, →Strukturelemente) in das Vokabular entschieden wird. Die →Terminologische und die →begriffliche Kontrolle sind Teil der Vokabularkontrolle.

2 Terminologie

3 Erläuterung

Ein Vokabular ist terminologisch und begrifflich kontrolliert, wenn

  • Begriffe eindeutig sind. Sie haben eine klare Definition und lassen sich eindeutig auf einen Gegenstand oder Sachverhalt beziehen.

  • Bezeichnungen (die Wörter oder Wortkombinationen, mit denen Begriffe benannt werden) eindeutig einen bestimmten Begriff repräsentieren. Der Vorgang, in dem die Beziehung zwischen Bezeichnung und Begriff hergestellt wird, heißt "terminologische Kontrolle". Dabei wird die Bedeutung mehrdeutiger Bezeichnungen geklärt (→Homonymkontrolle) und Synonyme oder bedeutungsähnliche Bezeichnungen werden mit dem Begriff, den sie repräsentieren, verbunden (→Synonymkontrolle).

  • Begriffe untereinander in strukturierter Weise miteinander verknüpft sind, sodass sie ein Netz von →Relationen bilden.

3.1 Terminologische Kontrolle

Die natürliche Sprache ist oft mehrdeutig, denn die Bezeichnung (der sprachliche Ausdruck) und der Begriff (das Gemeinte) sind nicht dasselbe. Die terminologische Kontrolle ist ein Verfahren, mit dem Begriffe und Bezeichnungen eines Vokabulars eindeutig gemacht werden.

  • Synonyme (Bezeichnungsvielfalt): Ein Begriff kann mehrere Bezeichnungen haben, zum Beispiel hat der sechste Wochentag des bürgerlichen Kalenders im Deutschen die Bezeichnungen “Samstag” und “Sonnabend”. Bezeichnungsvielfalt entsteht durch Synonyme. Bei der Informationssuche führen Synonyme zu unvollständigen Ergebnismengen, wenn sie nicht kontrolliert sind (Informationsverlust).

  • Bedeutungsvielfalt: Eine Bezeichnung kann mehrere Bedeutungen haben, zum Beispiel kann “Atlas” sich auf den Begriff in der Kartografie oder in der Anatomie beziehen. Bedeutungsvielfalt entsteht durch Homonyme. Bei der Infomationssuche führen Homonyme zu unerwünschten Ergebnissen, wenn sie nicht kontrolliert sind (Informationsballast).

Aufgabe der terminologischen Kontrolle ist es, Begriffe und Bezeichnungen eindeutig aufeinander zu beziehen.

Das wird erreicht durch

  • das Zusammenfassen von bedeutungsähnlichen Bezeichnungen zu einer Äquivalenzklasse durch Synonymkontrolle.

  • Begriffsklärung (Disambiguierung) der natürlichsprachlichen Bezeichnungen durch Homonymkontrolle.

3.2 Begriffliche Kontrolle

Thesaurusbegriffe werden durch Relationen untereinander verbunden, sodass ein Netz mit einer definierten Struktur aus Oberbegriffen und Unterbegriffen sowie Verwandten Begriffen entsteht. Dieser Vorgang der Strukturierung wird →Begriffliche Kontrolle genannt.

3.3 Kriterien zur Aufnahme von Begriffen und Bezeichnungen

Wann Begriffe und Bezeichnungen in ein kontrolliertes Vokabular aufgenommen werden, sollte durch Belege der entsprechenden Wörter oder Phrasen abgesichert werden. Im Englischen spricht man von "warrant" und meint damit den Gebrauch eines Begriffes in einer relevanten Quelle, die die Aufnahme des Begriffes oder der Bezeichnung in das Vokabular rechtfertigt.

3.4 Wann wird eine Bezeichnung als eigenständiger Begriff aufgenommen?

Wann eine Bezeichnung als eigenständiger Begriff aufgenommen wird, hängt wesentlich vom inhaltlichen Schwerpunkt und dem Zweck des Vokabulars ab. Es gibt zwar einige allgemeine Kriterien, aber zusätzlich sind meist anwendungsspezifische Regelungen erforderlich.

Ein häufiger Fall mit systemspezifischem Regelungsbedarf sind Bezeichnungen für historische Sachverhalte oder Individualbegriffe. Sollen zum Beispiel "Werft" und "Schiffszimmerplatz" alternative Bezeichnungen für einen Begriff sein oder als zwei eigenständige Begriffe behandelt und über eine chronologische Beziehung (Vorgänger/Nachfolger) verbunden werden?

Bei Individualbegriffen sind es besonders Organisationen und Geografika, die nicht nur ihre Namen im Lauf der Zeit ändern können, sondern auch wesentliche Eigenschaften. Hier sind oft nur Einzelfallentscheidungen möglich, wann ein neuer Name auch eine neue begriffliche Einheit bedeutet. Grundsätzlich gibt es auch hier zwei Verfahren:

  1. Historische und aktuelle Bezeichnungen werden als alternative Bezeichnungen eines Begriffes geführt. In der Regel ist dann die aktuelle Bezeichnung die bevorzugte.
    Iráklion für die rezente und Heracleum für die historische Bezeichnung

  2. Historische und aktuelle Bezeichnung repräsentieren zwei unterschiedliche Begriffe, die über eine chronologische Beziehung verbunden werden.

Dies könnte für die "Demokratische Republik Kongo" und ihre wechselnden Namen zutreffen. Der "Getty Thesaurus of Geographic Names" behandelt die "Demokratische Republik Kongo" und "Zaïre" als alternative Benennungen und kennzeichnet die Namen jeweils als aktuell oder historisch.

4 Beispiele

5 Vokabularkontrolle in xTree

6 Indexierung und Retrieval

Die Mehrdeutigkeit der natürlichen Sprache kann zu unerwünschten Ergebnissen bei der Suche nach Informationen führen:

  • Bezeichnungsvielfalt durch Synonyme und Quasisynonyme führt zu Informationsverlust.

  • Bedeutungsvielfalt durch Homonyme und Polyseme führt zu Informationsballast.

7 Zusammenfassung

8 Siehe auch

9 Referenzen

Grundlagen 2004

"Bei der begrifflichen Kontrolle werden die Beziehungen zwischen den Begriffen bzw. den Äquivalenzklassen in einem Thesaurus zu einem semantischen Netz ausgebaut. Dieses Netz soll es Benutzern ermöglichen, für den gesuchten Sachverhalt einen zutreffenden -> Begriff aufzufinden. Die gebräuchlichsten Relationen in Thesauri sind die Äquivalenzrelation, die Hierarchische Relation sowie die Assoziationsrelation." [Grundlagen 2004, S. 9]

  1. vocabulary control: The process of organizing a list of terms (a) to indicate which of two or more synonymous terms is authorized for use; (b) to distinguish between homographs; and (c) to indicate hierarchical and associative relationships among terms in the context of a controlled vocabulary or subject heading list. [ANSI/NISO Z39.19, S. 167]

  2. vocabulary control: management of a vocabulary in order to disambiguate and constrain the form of the terms and limit the number of concepts and terms available for indexing [ISO 25964-1:2011, 2.64]

  3. "Vokabularkontrolle ist die Anwendung von Regeln, die über die Zugehörigkeit von Elementen zu dem Vokabular bzw. über die Aufnahme von Elementen in das Vokabular einer Dokumentationssprache entscheiden." [Grundlagen 2004, Glossar S. 128]

  4. "Terminologische Kontrolle ist die Anwendung von Regeln, die die Überführung von Termini natürlicher Sprachen in eine natürlich-sprachlich basierte Dokumentationssprache ermöglicht und somit insbesondere Synonym- und Homonymkontrolle erlauben." [Grundlagen 2004]

Anhang

Tabelle: Gründe für die Aufnahme eines Begriffes oder einer Bezeichnung

Begründung

Erläuterung

Gebrauch in der Literatur (literary warrant)

Das häufige Vorkommen eines Begriffes oder einer Bezeichnung in der Literatur ist ein Grund für die Aufnahme in das Vokabular.
Zur Beurteilung der Verbreitung des Begriffes oder der Bezeichnung in der Literatur können Wörterbücher, Lexika, Enzyklopädien, aber auch Monografien und andere Vokabulare herangezogen werden.

"Justification for the representation of a concept in an indexing language or for the selection of a preferred term because of its frequent occurrence in the literature."

Gebrauch durch Nutzer (user warrant)

Belege des Termgebrauchs durch Benutzer und Anforderungen, die sich aus der Zielgruppe ergeben; in der Regel zu ermitteln durch die Auswertung von Log-in-Dateien oder näherungsweise durch statistische Angaben zur Termhäufigkeit wie in Wortschatz Leipzig

"Justification for the representation of a concept in an indexing language or for the selection of a preferred term because of frequent requests for information on the concept or free-text searches on the term by users of an information storage and retrieval system."

Gebrauch in der Institution (organizational warrant)

Determining organization warrant requires identifying the form or forms of terms that are preferred by the organization or organizations that will use the controlled vocabulary.

"Justification for the representation of a concept in an indexing language or for the selection of a preferred term due to characteristics and context of the organization."

Kultureller Gebrauch (cultural warrant)

courses.washington.edu/imt530/schedule/7b.ppt und Beghtol in Bean 2001, S. 105 kluwer

terms or organization derived from cultural practice or understanding; for example, Dewey and LCSH reflect American/Western cultural bias; Colon Classification reflects Indian/Eastern cultural bias (this also can be partly a function of literary warrant…)

Anforderungen aus der Vokabularstruktur (structural warrant)

Auch Anforderungen aus der Vokabularstruktur können die Aufnahme von Bezeichnungen rechtfertigen, selbst wenn diese nicht durch Literatur oder Nutzergebrauch belegt sind. Das ist besonders der Fall, wenn ein generischer Begriff eingeführt wird, der die Unterbegriffe zusammenführt und damit die Navigation erleichtert sowie das Suchergebnis verbessern kann