2.2 Zweck von Thesauri (In Bearbeitung)

 

1 Welche Aufgaben hat ein Thesaurus?

Thesauri werden zur formalen und inhaltlichen Erschließung von Ressourcen sowie zum Wiederauffinden von Informationen (Information-Retrieval) in allen kulturellen und wissenschaftlichen Bereichen eingesetzt. Aber auch im kommerziellen Bereich und zur Informationsorganisation in Intranets sind Thesauri verbreitet.

Zunehmend gewinnen Thesauri auch an Bedeutung als Referenzvokabulare für inhaltsbeschreibende Metadaten. So empfiehlt zum Beispiel die Dublin Core Metadata Initiative die Nutzung des Getty Thesaurus of Geographic Names (TGN) oder der Library of Congress Classification für die Werte der Metadatenelemente "Coverage" und "Subject". In den DCMI Metadata Terms werden die kontrollierten Vokabulare als Encoding Schemes bezeichnet.

Eine besondere Bedeutung haben Thesauri, wie kontrollierte Vokabulere überhaupt, bei der Erschließung nicht-textueller Materialien.

2 Funktion im Information Retrieval

→Kontrollierte Vokabulare beeinflussen die Qualität des Information Retrieval positiv. Die Qualität wird üblicherweise in den Größen "Recall" und "Precision" gemessen.

  • "Recall" ist das Maß für die Vollständigkeit des Suchergebnisses bezogen auf die Gesamtzahl der relevanten Dokumente in einem System. Angenommen, es gibt 100 Dokumente zum Thema "Weihnachtsbräuche" in einer Datenbank. Wenn auf eine entsprechende Suchanfrage zu "Weihnachtsbräuchen" alle 100 Dokumente gefunden werden, ist der Recall 100 Prozent.

  • "Precision" ist das Maß für die Genauigkeit des Suchergebnisses bezogen auf die Gesamtzahl aller Dokumente eines Systems. Angenommen, 100 Dokumente von insgesamt 1000 Dokumenten einer Datenbank behandeln das Thema "Weihnachtsbräuche". Wenn auf eine entsprechende Suchanfrage zu "Weihnachtsbräuchen" genau nur diese 100 Dokumente gefunden werden, und nicht auch solche zu "Osterbräuchen" zum Beispiel, ist die Precision 100 Prozent.

Die Retrievalqualität ist also optimal bei einem Recall und einer Precision von 100 Prozent.

Thesauri tragen zur Verbesserung der Retrievalqualität bei, indem sie

  • verbindliche Schlagwörter (→Deskriptoren) bereitstellen, die eine einheitliche, konsistente Indexierung unterstützen

  • →alternative Bezeichnungen für das Auffinden von Indextermen beziehungsweise Schlagwörtern bereitstellen

  • Beziehungen zwischen Begriffen und/oder Bezeichnungen darstellen, die eine automatische Ausweitung der Suchanfrage (Expand oder Explode) ermöglichen, zum Beispiel durch Einbeziehen von Synonymen oder Unterbegriffen in die Suche

  • erhöhen die Interoperabilität, indem sie Konkordanzen zu Begriffen anderer Vokabulare bereitstellen

  • können zur Überwindung von Sprachbarrieren beitragen.