0 Einleitung

„Warum haben Fische keine Haare?“ – „Weil sie Schuppen haben.“ – „Und warum haben sie Schuppen?“ – „Weil sie nichts dagegen tun.“ -– „Und warum tun sie nichts dagegen?“ – „Damit sie ihre Fahrräder unterstellen können.“

Die natürliche Sprache bietet reichlich Gelegenheit zu Missverständnissen. Viele Wörter haben mehr als eine Bedeutung, was sich dieser alberne Kalauer, dessen absurder Witz in drei verschiedenen Bedeutungen von „Schuppen“ gründet, zunutze macht. Menschen können sich unschwer das Gemeinte aus dem Kontext zusammenreimen. Aber wie ist es, wenn das Wort „Schuppen“ ohne Zusammenhang auftaucht? Weiß ein Mensch dann, was gemeint ist? Und kann gar eine Maschine die Bedeutung entschlüsseln?

Auf die Suchanfrage „Schuppen“ liefert die Bildersuche in Google (2024-08-07) eine große Auswahl an Vorschlägen, die zur Anfrage passen könnten, darunter auch die folgenden drei Begriffe zum Filtern.

Fisch Haar Carport

Woher kennt die Maschine diese unterschiedlichen Bedeutungen und ordnet die passenden Dokumente korrekt zu? Die Dokumente enthalten Hinweise auf den Kontext, die maschinell ausgewertet werden können.

Ob Texte oder Bilder, Museumsobjekte oder Archivakten, wir müssen meist (noch) das Zeichensystem Sprache als Kommunikationsmittel nutzen, um die Dokumente beschreiben und finden zu können. Die Erschließung der Dokumente geschieht unter anderem durch einzelne „Schlagwörter“, die den Inhalt eines Textes oder das Dargestellte auf einem Bild mit einem Wort oder einer Wortkombination charakterisieren. Die natürliche Sprache eignet sich aber, wie wir gesehen haben, nur bedingt für eine „Verschlagwortung“, weil die sprachlichen Ausdrücke ohne weiteren Kontext mehrdeutig sein können oder auch weil es oft mehrere Bezeichnungen für eine Sache gibt. Es wird also eine Art „Kunstsprache“ benötigt, die die Mehrdeutigkeiten und die Bezeichnungsvielfalt der natürlichen Sprache soweit reduziert, dass die Schlagwörter das Gemeinte unmissverständlich ausdrücken und die Suche nach dem passenden Schlagwort erleichtert und unterstützt wird. Eine solche Kunstsprache wird auch Dokumentationssprache genannt.

→Kontrollierte Vokabulare sind solche Dokumentationssprachen. Sie sind eine Vereinbarung über Begriffe und Bezeichnungen, die der Beschreibung und dem Auffinden von Dokumenten dienen.