Datengrundlage

Eine zusammenfassende Übersicht über die untersuchten Datenquellen gibt es im Beitrag → Bestandsanalysen im DNB-Wiki.

Bei allen drei Datenquellen sind die Nutzungshäufigkeiten der Deskriptoren bekannt. Nachfolgend ein Vergleich der Häufigkeitsverteilungen in den untersuchten Beständen:

Die Y-Achse (log(ft)) gibt hier die logarithmierte Verwendungshäufigkeit für jedes Vokabularelement an.

Für das DHM beschränkt sich die Auswertung auf das Vokabular für die Eigenschaft "Thema" (lido:subject) des Metadatensets, wogegen für das DDK alle elementspezifischen Vokabulare zusammengefasst ausgewertet wurden. Dadurch weist die Verteilung beim DDK einen größeren Anteil von Verwendungen im optimalen Diskriminanzbereich (log(ft) meist zwischen ca. 2 und 6) auf. Der geringsten Anteil optimaler Diskriminanz findet sich bei den Museen Saarland, was nicht zuletzt auf die große Zahl von Vokabularelementen mit der Verwendungshäufigkeit 1 (hier dargestellt als log(ft)=0) zurückgeht.