Staatsbibliothek zu Berlin wird modernisiert

"Maschinen können vieles besser"

Reinhard Altenhöner, Ständiger Vertreter der Generaldirektorin der Staatsbibliothek zu Berlin
Reinhard Altenhöner, Ständiger Vertreter der Generaldirektorin der Staatsbibliothek zu Berlin © Deutsche Nationalbibliothek
Moderation: Ute Welty |
Maschinen übernehmen die Verschlagwortung der Bücher der Staatsbiblothek zu Berlin. Reinhard Altenhöner, der Ständige Vertreter der Generaldirektorin, erklärt, dass der Mensch keineswegs obsolet werde. Vielmehr sei eine "Kombination aus Maschine und Mensch" erforderlich.
Ute Welty: Vielleicht träumen Roboter nicht von elektrischen Schafen, aber immerhin ist es so, dass Maschinen demnächst Bücher lesen. Die Nationalbibliothek stellt ihr System der sogenannten Verschlagwortung um. Bislang wurde diese Arbeit von Menschen gemacht, jetzt sollen Rechner das übernehmen. Die Nationalbibliothek will damit das gesamte System vereinheitlichen, denn digitale Publikationen werden schon länger maschinell erfasst. Über die Sinnhaftigkeit dieser Unternehmung wird heftig gestritten. Kritiker befürchten so was wie den Untergang des Abendlandes. Wir bemühen uns an dieser Stelle um sachdienliche Aufklärung, und zwar zusammen mit Reinhard Altenhöner von der Staatsbibliothek zu Berlin, ein ausgewiesener Fachmann, wenn es um den Zusammenhang von Gedrucktem und Digitalem geht. Guten Morgen, Herr Altenhöner!
Reinhard Altenhöner: Guten Morgen, hallo!
Welty: Ich habe es gerade gesagt: Der Aufschrei ist zum Teil groß und auch nicht zu überhören. Ist es tatsächlich so, dass der Mensch was besser kann als die Maschine, nämlich die Verschlagwortung von Büchern?
Altenhöner: Darauf gibt es natürlich wie auf so vieles keine eindeutigen Antworten. Wir haben so ein bisschen so eine Maschinenstürmerdebatte. Also so die Zeiten, in denen Maschinen drohten, Menschen Arbeit wegzunehmen, die natürlich dann heftige Reaktionen auslösen, auch emotionale. Ich würde da zur Vorsicht tendieren, und man kann die Antwort eben auch nicht pauschal geben. Maschinen können vieles besser, wenn es um große Mengen geht, aber sie können auf der anderen Seite komplexe, schwierige Zusammenhänge dort einbinden. Das Zuordnen eines Buches zum Beispiel in ein Wissenssystem, das können sie mitunter gut, aber eben mitunter auch schlecht. Und die Ausbrüche sind natürlich da zum Teil auch massiv, also die Fehler ziemlich hoch. Aber diese Maschinen lernen, und die lernen natürlich dann gut, wenn wir Menschen ihnen Hilfe zum Lernen geben, das heißt, Material, das eben von Menschen erschlossen ist. Daran können sie lernen. Erschließen übrigens kann mehrerlei sein, es geht aber immer darum, dass diese Objekte in ein Wissenssystem eingebettet werden, eingehängt werden sozusagen, in eine Schublade getan werden, gesagt wird, wenn man systematisch sucht, findest du in dieser Schublade Werke von verschiedenen Autoren zu diesem Thema.
Welty: Wie muss ich mir denn diese digitale Verschlagwortung praktisch vorstellen?
Altenhöner: Die Maschine muss zunächst mal Material haben. Wenn es das Objekt digital gibt – machen wir uns nichts vor, es gibt ja viele der Bücher, die gedruckt erscheinen, eben auch digital, wir reden da sowieso von so einer Zusammenführung der beiden Veröffentlichungsarten, die man auch schlecht gegeneinander stellen kann. Dann habe ich erstmal ein Rohmaterial, dann habe ich den Text. Und die Maschine wertet Häufigkeiten und Zusammenhänge aus, in denen diese Wörter, die einzelnen Wörter, in den Texten vorkommen. Darüber hinaus kann sie sich natürlich auch die Inhaltsverzeichnisse angucken und die höher gewichten. Sie gucken sich von mir aus auch Klappentexte an, Informationen, die zu der Veröffentlichungen erschienen sind, und bewertet die. Deswegen strauchelt die Maschine auch immer dann, wenn Begriffe, und das sind meistens nicht die technischen, die naturwissenschaftlichen Disziplinen, sondern eben die Gesellschaftswissenschaften, Geisteswissenschaften, dann, wenn ein Begriff doppeldeutig ist. Ich kann mich auf eine Bank setzen, ich kann aber auch sie als Geldinstitut nutzen. Wie soll die Maschine das wissen?

Nationalbibliothek setzt auf ein einheitliches Wissenssystem

Welty: Das ergibt sich nur aus dem Zusammenhang.
Altenhöner: Genau. Und das kann man ihr sozusagen dann nur antrainieren, indem sie lernt, bestimmte Zusammenhänge, vielleicht den Namen des Autoren, der Autorin, den Titel, ein Zitat richtig zuzuordnen und zu sagen, das gehört offensichtlich in den Bereich der Bankwirtschaft. Das ist aber ein langer Prozess, der muss ständig kontrolliert werden. Wir brauchen Qualitätsmanagement, sonst funktioniert das nicht.
Welty: Die Nationalbibliothek argumentiert damit, dass man die Verschlagwortung vereinheitlichen möchte. Wenn ich Sie richtig verstanden habe, bedeutet das aber zumindest am Anfang auf jeden Fall eine Qualitätseinbuße. Vereinheitlicht man also auf niedrigem Niveau?
Altenhöner: Nein, die Nationalbibliothek bezieht sich, glaube ich, da vor allen Dingen darauf, dass man ein einheitliches Wissenssystem nutzt, und das bleibt ja und soll ja der Fall bleiben. Da muss man vielleicht auch bei den Zahlen noch mal genau hinschauen. Der Vorwurf ist, dass es einheitlich schlechter wird. Bisher geht es darum, dass eine Reihe, die bisher gar nicht verbal erschlossen wurde, nun auf maschinellem Wege erschlossen werden soll. Da ist ein bisschen was durcheinander gerutscht. Also die Kernreihe, die dessen, was im Buchhandel erscheint, soll ja jedenfalls erstmal weiter – ich gehe mal davon aus, solange man die Qualitäten nicht hat, verbal erschlossen werden durch Menschen. Während die Reihe B, das sind die Sachen außerhalb des Buchhandels, bisher nicht mehr verbal erschlossen wurde, eben in Zukunft mit einer Anreicherung durch die BEC-Klassen und Schlagwörtern maschinell erschlossen. Also da wird mehr passieren. Es kann mehr natürlich auch falsch sein, das ist völlig richtig. Deswegen mein klarer Appell, wenn man das tut, Qualitätssicherung ganz hoch zu schreiben und zu schauen, dass man die Maschine ständig weiter kontrolliert und lehrt. Die Maschine gibt Konfidenzwerte, das heißt, die sagt uns auch, wie sicher sie ist. Und das bedeutet auch, dass man da die Schere streng ansetzen muss und immer wieder Menschen drauf gucken lassen muss. Die Systeme ändern sich ja auch, also insofern, die Menschen lernen das vielleicht über die Materialien. Aber wir ändern uns auch in der Art, wie wir Wissen verstehen, wie wir Wissen aufnehmen.

Beim Qualitätsmanagement braucht die Nationalbibliothek Hilfe

Welty: Merke ich als Leser eigentlich, ob da ein Mensch am Werke war oder eine Maschine, wenn ich dann später nach solchen Schlagworten suche?
Altenhöner: Ich fürchte, Sie merken das nicht. Wenn ich drei Menschen an eine Gruppe von Objekten setze, dann können Sie ziemlich sicher sein, dass die Beschreibungen dessen, was da kommt, auch durchaus unterschiedlich ausfallen. Die Maschine macht nur krassere Fehler, aber auch die können natürlich beim Menschen durchaus vorkommen. Sie merken es wahrscheinlich nicht. Sie merken es vermutlich dann, wenn Sie sehr präzise wissen, was Sie suchen. Dann suchen Sie vielleicht aber auch genau den Titel. Vor allen Dingen aber, wenn Sie sehr präzise nach bestimmten Wissensbereichen suchen, da kann das schon auffallen. Insofern würde ich aber nochmals sagen, deswegen ist das Qualitätsmanagement so sicher wichtig. Wir arbeiten in der Staatsbibliothek – oder haben einen sehr guten Erfolg gehabt mit dem Test, einem weiträumigen Test mit einem digitalen Assistenten. Der kann noch nicht so furchtbar viel, aber er liefert den Kolleginnen und Kollegen Vorschläge dazu, wie die Verschlagwortung hier richtig sein könnte. Er liefert Vorschläge, und der Mensch kontrolliert und wählt aus. Und ich denke, diese Kombination aus Maschine und Mensch kann an der Stelle uns wirklich weiterführen.
Welty: Wenn die Nationalbibliothek in Zukunft so arbeitet, wie wird das dann sich insgesamt auf Bibliotheken auswirken, denn es muss ja auch eine Kooperation in irgendeiner Form geben.
Altenhöner: Ja, also vielleicht habe ich es deutlich gemacht, also ich halte den Weg, den die Nationalbibliothek geht, da für richtig. Aber das muss gut im Qualitätsmanagement verlaufen, und dieses Qualitätsmanagement kann die Nationalbibliothek wahrscheinlich allein gar nicht leisten. Es kann nicht darum gehen, dass die Arbeit schlicht anders verteilt wird. Da hat es in der Vergangenheit schon Versuche gegeben, dass Bibliotheken bestimmte Bereiche übernehmen in der klassischen Art, rein intellektuelle Erschließung. Das hat nicht funktioniert. Insofern, meine ich, muss man Kooperation an der Stelle auch auf die Verfahren schieben, das heißt Qualitätssicherung bedeutet, ich muss sehr klar wissen, nach welchen Kriterien läuft das. Wie lernen diese Algorithmen? Das muss transparenter sein, das ist es nicht. Es muss Vorlaufzeiten geben, damit man sich drauf einstellen kann. Denn in der Tat müssen Bibliotheken in bestimmten Bereichen jetzt vielleicht dann jedenfalls, wenn auch die Reihe A erfasst wird, mit unsicheren Daten rechnen und damit umgehen lernen. Sie müssen entscheiden, ob sie solche Daten nutzen wollen oder nicht. Ich denke, wir werden es tun. Aber diese Kooperation bezieht sich vor allem auch darauf, dass diese Idee, dass eine Beschreibung zu einem Objekt nach und nach wächst, dass man nach und nach weitere Informationen dazufügt, auch gegebenenfalls Falschinformationen wieder rausnimmt, dass das davon lebt, dass die Bibliotheken in der Lage sind, solche Daten auch zu übernehmen. Und das ist nicht nur ein technisches Problem, wie es gern gesagt wird, sondern das hat auch damit zu tun, was ist eine Bibliothek bereit, von einer anderen Bibliothek zu akzeptieren, als Wissensbase sozusagen zu nutzen und dann diesen Nutzern wieder zur Verfügung zu stellen. Das ist ein solcher Lernprozess.
Welty: Ja, nicht nur die Maschinen lernen, auch die Menschen. Reinhard Altenhöner von der Staatsbibliothek zu Berlin. Denn die Staatsbibliothek beginnt mit der Verschlagwortung. Und ob Roboter von elektrischen Schafen träumen, das besprechen wir dann das nächste Mal. Herr Altenhöner, haben Sie herzlichen Dank, und beste Grüße an den digitalen Assistenten. Den wünsche ich mir auch manchmal.
Altenhöner: Vielen Dank, auf Wiederhören!
Äußerungen unserer Gesprächspartner geben deren eigene Auffassungen wieder. Deutschlandradio Kultur macht sich Äußerungen seiner Gesprächspartner in Interviews und Diskussionen nicht zu eigen.
Mehr zum Thema