Ein Beitrag von Paul Schrickel im Rahmen seines Praktikums bei Algoright im März und April 2025.

 „Der Historiker von morgen wird ein Programmierer sein oder er wird nicht existieren“.(1) 

Künstliche Intelligenz ist spätestens seit dem Launch von Chat GPT ein „Hype-Begriff“. Bis es aber zu solchen Large Language Models (LLMs) kommen konnte, ist die Digitalisierung einen sehr langen Weg gegangen. 

Auch in den Geschichtswissenschaften beschäftigt man sich schon länger mit dieser fortschreitenden Digitalisierung. Bereits in den 1960er Jahren gab es erste Projekte, die mit Hilfe von Computern Daten untersuchten. Als 1968 Historikerinnen(2) mit Hilfe von Computern die Abstimmungsergebnisse des britischen Parlaments in den 1840er Jahren untersuchten, fällt obengenanntes Zitat des Historikers Emmanuel LeRoy Ladurie. Torsten Hiltmann(3) spricht gar von einer „Digitalen Revolution“, die wir zurzeit selbst miterleben können. 

Torsten Hiltmann vergleicht diese digitale „Revolution“ mit zwei weiteren bedeutenden Revolutionen für die historische Forschung: Zum einen der Revolution der Verschriftlichung, zum anderen der des Buchdrucks. 

Mit der Verschriftlichung wurde die Grundlage geschaffen, wie Texte, Aussagen und Informationen gespeichert und verlässlich übermittelt werden konnten. Das Speichern passiert hier unter anderem auf Papier oder anderen Materialien, auf die Buchstaben, Zeichen oder Bilder aufgetragen werden. Damit wird der Absprung von der mündlichen Tradition, bei der Daten im Gedächtnis der Teilnehmenden gespeichert werden, geschafft. Die Vorteile der Verschriftlichung sind vielfältig. Daten können effizienter gesammelt, verglichen und erweitert werden, während der Verlust von Daten deutlich reduziert wird. Die Formulierung der Informationen ist präziser und komplexer möglich als zuvor. Es ist der fundamentalste mediale Bruch mit den weitreichendsten gesellschaftlichen und kulturellen Veränderungen. Erst durch ihn wird Geschichtswissenschaft möglich. 

Mit der Erfindung des Buchdrucks wird es erstmals möglich, Texte in großer Stückzahl und identisch zu vervielfältigen. Die Produktion von Büchern und Texten wird deutlich günstiger, wodurch sich ganz neue literarische Gattungen bilden und Informationen nun deutlich größere Gruppen erreichen können. Während die Druckereien zunächst versuchen, das Handschriftbild mit sogenannten „Inkunabeln“ zu imitieren, entwickelt sich schnell eine Verselbständigung des Buchdrucks mit eigenen Schrifttypen, Formaten und Regeln. 

Hunderte Jahre später, Ende der 1960er Jahre, beginnt die Digitalisierung in den Geschichtswissenschaften. Vorreiter wie Manfred Thaller, der an zahlreichen Digitalisierungsprojekten wie „CEEC(4)“, „Delos(5)“ oder „Prometheus(6)“ mitwirkte, gestalten die 70er und 80er Jahre. Bis 1990 wird die Frage, wie man Computer für die historische Forschung nutzen kann, in über 700 Aufsätzen diskutiert. Große Projekte sind zu der Zeit aber noch aufwendig, da Quellen und Daten erst digitalisiert werden müssen, bevor ein Computer sie verarbeiten kann. 

Erst das Internet und der Einzug des PCs in das Leben der Wissenschaftler ändern diese Arbeit grundlegend. Die Etablierung des Internets lässt sich gut mit der des Buchdrucks vergleichen. Denn durch beide erlebt die Forschung einen vergleichbaren Entwicklungssprung in der Möglichkeit der Veröffentlichung und Verbreitung von Daten. Das Internet verändert die Art und Weise, wie Informationen übermittelt und gespeichert werden können. Daten müssen nicht länger auf Papier gebracht werden, sondern werden digital kodiert. PCs können Medien auf die gleiche Weise lesen, verarbeiten und ihre Daten abspeichern. Für die Geschichtswissenschaften bedeutet das konkret, dass aufwendige Literaturrecherchen nicht mehr in den Bibliotheken und Registern, sondern ab den 1990er Jahren bequem über den Computer möglich werden. Viele weitere Projekte beginnen, ihre Datensammlungen zu digitalisieren und online zugänglich zu machen. So beginnt auch die Regesta Imperii ab 2001, alle bereits erschienenen Bände zu retrodigitalisieren. Für die Erforschung des Mittelalters nicht weniger relevant, beginnt auch 2004 die Digitalisierung und Bereitstellung der (d)MGH übers Internet. 

Zum Ende dieser ersten Phase, wie sie Torsten Hiltmann beschreibt, ist es möglich, vorher analoge, jetzt digitale Medien am Rechner zu lesen, sehen und hören. Die interpretative Ebene der Daten orientiert sich, ähnlich wie beim Buchdruck und den „Inkunabeln“, weiterhin am analogen Gebrauch. 

Ab hier beginnt die etwa 20 Jahre lange Phase der konzeptionellen Nutzung. Projekte lernen, die zunächst als PDF digitalisierten Daten an die neuen Möglichkeiten anzupassen. Die Daten werden um Register und komplexe Suchmasken ergänzt. Projekte wie „Germania Sacra“, das sich mit der Kirchengeschichte in Deutschland beschäftigt, ermöglichen es, die gesammelten Daten über eine API herunterzuladen und für eigene Forschung zu verwenden. Damit wird es den Forschenden möglich, die Daten eigenständig mit entsprechenden Analysemethoden zu bearbeiten und zu verändern. Damit beginnt die Auswertung der Daten auf der Datenebene selbst und es wird nun mehr und mehr möglich, mittels Algorithmen große Datenmengen maschinell auszuwerten. 

Durch die fortschreitende Digitalisierung und auch die Etablierung der Digital Humanities beginnt man ab 2009(7) im deutschsprachigen Raum mit der Etablierung des Forschungsfeldes: Digital History. Wenig später folgen die ersten Lehrstühle und es beginnt eine intensive Forschung zur digitalen Geschichtswissenschaft(8). 

Durch die Forschung ändert sich auch die Forschungslandschaft. Es entstehen kommerzielle und Open-Source-Programme für Datenanalysen. Es entstehen Forschungsinitiativen und mit dem „Journal of Digital History“ 2021 auch die ersten großen Zeitschriften mit digitalem Fokus. 

1968 prognostizierte Ladurie, dass Historikerinnen lernen müssten zu programmieren, um zu überleben. Diese Prophezeiung beginnt sich stetig zu bewahrheiten. Komplizierte Computerprogramme müssen gewartet und verstanden werden und Algorithmen selbstständig erstellt werden. 

Als 2022 das LLM ChatGPT veröffentlicht wird, löst es nicht nur einen großen medialen Hype aus. Auch für die geschichtswissenschaftliche Forschung beginnt damit eine neue Phase. KI-Systeme werden als neue „Werkzeuge“ genutzt, mit dem Potenzial, die Art und Weise, wie wir die Vergangenheit analysieren und wahrnehmen, zu revolutionieren. 

Die automatische Datenanalyse von KI-Systemen kann große Mengen an Daten nun automatisch durchsuchen, wodurch Analysen möglich werden, die für Menschen zu aufwendig wären. Projekte zur Übersetzung von historischen handgeschriebenen Quellen können nun KI-gestützt in kürzester Zeit Ergebnisse liefern. 

Die Notwendigkeit, selbst zu programmieren, verliert in kurzer Zeit an Bedeutung. Die Modelle sind zu groß, zu kompliziert und die Berechnung selbst bei Open-Source-Modellen häufig unverständlich. Laduries Prophezeiung hätte sich damit fast bewahrheitet, mit der Etablierung von LLMs und dem darauffolgenden Push für andere KI-Systeme können Historikerinnen das Programmieren der Maschine aber nun selbst überlassen. 

Mit der Nutzung von LLMs wird es jedoch auch wichtig, Herausforderungen wie Bias und Halluzinationen im Blick zu behalten. Entzifferte oder übersetzte Daten müssen nach der Nutzung von KI gesichtet und geprüft werden. Durch das Abtreten der Analyse an KI-Systeme wie LLMs verlieren Forscher zu einem Stück die Kontrolle daran. 

Traditionelle Quellenkritik wird durch täuschend echt aussehende Halluzinationen und unsichtbare Bias erschwert. Raphael Besenbäck und Lorenz Praer betonen daher die Notwendigkeit einer neuen Quellenkritik. Dazu gehört auch die Festlegung auf einen Dokumentationsstandard und eine normative Orientierung für die Zusammenarbeit von Mensch und Maschine(9). 

Damit wir tatsächlich von einer digitalen Revolution sprechen können, muss die Etablierung solcher Standards gelingen. Wenn wir garantieren können, dass Daten objektiv, ohne Bias, anhand von realen zitierten Quellen, ohne Halluzinationen ausgewertet werden können, wird aus einer KI wie den LLMs erst ein digitales Werkzeug. 

Denn erst dann ist ein Umgang mit ihnen möglich, ohne dass eine Historikerin jeden Arbeitsschritt der Maschine verstehen und überprüfen muss. Erst dann ist es für Historikerinnen möglich, digitale Werkzeuge zu nutzen und sich trotzdem komplett der Forschung zu widmen. 

In der festen Hoffnung, dass die Etablierung solcher Standards gelingen wird, lässt sich sagen, dass Ladurie mit seiner These, ein Historiker müsse programmieren können, nicht recht behalten wird und wir tatsächlich mitten in der digitalen Revolution für die Geschichtswissenschaften stecken. 

 

1 Emmanuel LeRoy Ladurie 1968 

2 Aufgrund der vereinfachten Lesbarkeit wird in diesem Beitrag das generische Femininum benutzt. 

3 Professor für Digital History in Berlin 

4 CEEC: „Codices Electonici Ecclesiae Coloniensis“- Digitale Handschriftenbibliothek in Köln 

5 Delos: Digitalisierungsprojekt der Europäischen Digitalen Bibliothek 

6 Prometheus: Deutsches digitales Bildarchiv für Kunst- und Kulturwissenschaften

7 Zuerst geprägt durch Peter Haber 2009 und Wolfgang Schmale 2010 

8 Unter anderem: Arbeitsgruppe: „Digitale Geschichtswissenschaft“, 2012 vom Verband deutscher Historiker und Historikerinnen gegründet  

9 „Künstliche-Intelligenz-Quellen“ Artikel von Besenbäck, Prager