Einleitung

Einleitung

„Warum haben Fische keine Haare?“ – „Weil sie Schuppen haben.“ – „Und warum haben sie Schuppen?“ – „Weil sie nichts dagegen tun.“ – „Und warum tun sie nichts dagegen?“ – „Damit sie ihre Fahrräder unterstellen können.“

Die natürliche Sprache bietet reichlich Gelegenheit zu Missverständnissen. Viele Wörter haben mehr als eine Bedeutung, was sich dieser alberne Kalauer, dessen absurder Witz in drei verschiedenen Bedeutungen von „Schuppen“ gründet, zunutze macht. Menschen können sich unschwer das Gemeinte aus dem Kontext zusammenreimen. Aber wie ist es, wenn das Wort „Schuppen“ ohne Zusammenhang auftaucht? Weiß ein Mensch dann, was gemeint ist? Und kann gar eine Maschine die Bedeutung entschlüsseln?

Auf die Suchanfrage „Schuppen“ liefert die Bildersuche in Google (2024-08-07) eine große Auswahl an Vorschlägen, die zur Anfrage passen könnten, darunter auch die folgenden drei Einträge als Filtermöglichkeiten.

Fisch Haar Carport

Woher kennt die Maschine diese unterschiedlichen Bedeutungen und wie ist es möglich, dass sie einem Dokument das passende Schlagwort zuordnet?

Um mögliche Bedeutungen zu ermitteln, kann die Maschine auf Wörterbücher oder KI zurückgreifen. ChatGPT, gefragt, was das Wort „Schuppen“ bedeutet, antwortet mit vier Vorschlägen (2025-09-17):

  1. Schuppen (Gebäude)

  2. Schuppen (Haut / Kopfhaut)

  3. Schuppen (Tierhaut)

  4. Schuppen (Ort / Lokal) (umgangssprachlich)

ChatGPT zeigt an, dass es die vier unterschiedlichen Begriffe auseinanderhält, indem es in Klammern den Kontext hinzufügt, der die Bedeutung bestimmt. (Bei 2. und 3. verschweigt die KI allerdings, dass es sich um den Plural des Wortes „Schuppe“ handelt.) Diese Methode zur Auflösung von Mehrdeutigkeiten wird auch in der Vokabulararbeit verwendet.

Aber wie kann nun für ein Dokument das passende Schlagwort gefunden werden? Offensichtlich enthalten die Dokumente Hinweise auf den Kontext, die maschinell ausgewertet werden können.

Ob Texte oder Bilder, Museumsobjekte oder Archivakten, wir müssen meist (noch) das Zeichensystem Sprache als Kommunikationsmittel nutzen, um die Dokumente beschreiben und finden zu können. Die Erschließung der Dokumente geschieht unter anderem durch einzelne „Schlagwörter“, die den Inhalt eines Textes oder das Dargestellte auf einem Bild mit einem Wort oder einer Wortkombination charakterisieren. Die natürliche Sprache eignet sich aber, wie wir gesehen haben, nur bedingt für eine „Verschlagwortung“, weil die sprachlichen Ausdrücke ohne weiteren Kontext mehrdeutig sein können oder auch weil es oft mehrere Bezeichnungen für ein und dieselbe Sache gibt. Es wird also eine Art „Kunstsprache“ benötigt, die die Mehrdeutigkeiten und die Bezeichnungsvielfalt der natürlichen Sprache soweit auflöst, dass die Schlagwörter das Gemeinte möglichst unmissverständlich ausdrücken, um die Suche nach dem passenden Schlagwort zu erleichtern. Eine solche Kunstsprache wird auch Dokumentationssprache genannt.

→Kontrollierte Vokabulare sind solche Dokumentationssprachen. Sie sind eine Vereinbarung über Begriffe und Bezeichnungen, die der Beschreibung und dem Auffinden von Dokumenten dienen.