1 Definition

Ein Thesaurus ist in der Dokumentation ein kontrolliertes und strukturiertes Vokabular, das Begriffe und Bezeichnungen zur Erschließung und zum Finden von Dokumenten, Objektbeschreibungen oder anderen Arten von Ressourcen bereitstellt. Diese Art Thesaurus heißt deshalb auch Information-Retrieval-Thesaurus (IR-Thesaurus). Andere Bedeutungen von "Thesaurus" werden in Abschnitt 2 "Etymologie" beschrieben.

Ein Thesaurus für das Information-Retrieval ist ein

2 Etymologie

Das Wort "Thesaurus" ist ein "Polysem". Es hat mehrere Bedeutungen, die auf einen gemeinsamen Urspung zurückgeführt werden können.

3 Erläuterung

Wie ein Wörterbuch besteht ein Thesaurus aus einer Menge von Wörtern oder Wortkombinationen der natürlichen Sprache. Von einem Wörterbuch, einem Glossar oder einem Lexikon unterscheidet sich ein Thesaurus aber durch seine Funktion als →Dokumentationssprache für das Information-Retrieval. Im Vordergrund steht hier die eindeutige Festlegung von Begriffen und ihren Bezeichnungen für die Erschließung und das Wiederauffinden von Informationsressourcen. Anders als ein Wörterbuch bildet ein Thesaurus deshalb auch nicht möglichst vollständig den Wortschatz einer natürlichen Sprache ab, sondern beschränkt sich auf die für Indexierung und Suche relevanten Terme. Thesauri orientieren sich an der Standardsprache oder an der gängigen Fachterminologie, um die Deskriptoren vorhersehbar und leicht auffindbar zu machen. Viele Thesauri bieten auch Konkordanzen (→Mappings) zu Begriffen anderer kontrollierter Vokabulare an, um Recherchen in verschiedenene Datenbanken gleichzeitig zu ermöglichen.

In einem Thesaurus werden Bezeichnungen der natürlichen Sprache regelbasiert formuliert (normiert) und mit dem Begriff, auf den sie verweisen, verbunden. Die Begriffe werden in Beziehung zueinander gesetzt, sodass ein Netz aus hierarchisch und assoziativ verknüpften Elementen entsteht.

4 Kernelemente eines Thesaurus

Die Grundbausteine eines Thesaurus sind die →Begriffe, die durch Bezeichnungen repräsentiert und zueinander in Beziehung gesetzt werden. Die üblichen Begriffsrelationen sind die →Hierarchierelation und die →Assoziationsrelation.