Icon

Clio-Guide: Historisch-statistische Daten

Tobias A. Jopp / Mark Spoerer, Clio-Guide: Historisch-statistische Daten , in: Clio Guide – Ein Handbuch zu digitalen Ressourcen für die Geschichtswissenschaften, hrsg. von Silvia Daniel, Wilfried Enderle, Rüdiger Hohls, Thomas Meyer, Jens Prellwitz, Claudia Prinz, Annette Schuhmann, Silke Schwandt, 3. erw. und aktualisierte Aufl., Berlin 2023–2024, https://doi.org/10.60693/ptwx-x582

1. Statistische Daten als Quelle für die historische Forschung

1.1 Einführung

Zur Aneignung der quellenkundlichen und methodischen Grundlagen ihres Faches stehen angehenden Historiker:innen etliche (deutschsprachige) Einführungen in das geschichtswissenschaftliche Arbeiten zur Verfügung. In vielen Einführungen sucht man vergeblich nach Begriffen wie „historisch-statistische Daten“, „(Historische) Statistik“, „quantitative Methoden“, oder „Kliometrie“.[1] In anderen wiederum tauchen diese Begriffe zwar auf, werden aber eher stiefmütterlich abgehandelt und vielfach ganz mit der Wirtschafts- und Sozialgeschichte als der Spezialdisziplin, für welche sie einzig relevant seien, konnotiert.[2] Eher selten werden sie in größerem Detail diskutiert.[3] Zusammengefasst: Es besteht unter etablierten Historiker:innen augenscheinlich nach wie vor kein Konsens über den erkenntnistheoretischen Mehrwert historisch-statistischer Daten in Verbindung mit dem entsprechenden Analyseinstrumentarium für das geschichtswissenschaftliche Arbeiten, der es rechtfertigen würde, das Thema standardmäßig in Einführungen und Überblicken zu behandeln. Vor diesem Hintergrund werden auch Student:innen der Geschichtswissenschaft dem Thema mit Skepsis oder gar Unverständnis begegnen.

Beides soll mit diesem Clio-Guide, der sich an angehende wie etablierte Historiker:innen richtet, ein Stück weit reduziert werden. Was formal unter „historisch-statistischen Daten“ zu verstehen ist, wird im nachfolgenden Abschnitt geklärt. Die dort vorgeschlagene Definition wird ergänzt um eine Gegenüberstellung der Pros und Kontras der Anwendung eines quantifizierenden historiographischen Ansatzes (Abschnitt 1.3), um eine Abschätzung der Häufigkeit, mit der ein solches Vorgehen bisher von Historiker:innen überhaupt gewählt worden ist (Abschnitt 1.4), um eine Einführung in einschlägige gedruckte Quellen sowie Spezialliteratur und Software-Lösungen zum Umgang mit historisch-statistischen Daten (Abschnitt 1.5) und um eine Diskussion der „Institutionalisierung“ historisch-statistischer Daten in Deutschland. In Abschnitt 2 erfolgt die Vorstellung hilfreicher Online-Ressourcen. Abschnitt 3 beschließt diesen Clio-Guide mit einem Fazit.

Aus dem zuvor Gesagten folgt eine vielleicht trivial klingende, aber doch wesentliche Erkenntnis: Wer historisch-statistische Daten verwendet, gleich in welcher Form, der quantifiziert. Im Grunde lassen sich zwei Motive für den Rückgriff auf historisch-statistische Daten unterscheiden: Zum einen mögen bestimmte Aspekte eines historiographischen, auf einer qualitativen Herangehensweise beruhenden Narrativs durch empirisch-quantitative Befunde illustriert oder untermauert werden. Zum anderen mögen historisch-statistische Daten als eigene Quelle historiographischer Forschung und als primäre Basis historiographischen Erkenntnisfortschritts dienen, vornehmlich dann, wenn qualitative Evidenz nicht beizubringen oder prima facie sehr widersprüchlich ist oder die interessierenden Datenquellen nun einmal genuin statistisch sind (s. Abschnitt 1.2). Entsprechend sei im ersten Fall vom Überwiegen der Illustrations- oder Untermauerungs-, im zweiten vom Überwiegen der Erkenntnisfortschrittsfunktion historisch-statistischer Daten gesprochen (oft geht das eine in das andere über). Unseres Erachtens hängt der Nutzen, den man aus den spezifischen Online-Ressourcen ziehen kann, die im zweiten Teil vorgestellt werden, sehr davon ab, ob man entweder vorgefertigte Daten finden möchte oder vielmehr einen Datensatz, den es (in dieser Form) noch nicht gibt, von Grund auf zusammenstellen möchte. Ersteres wird eher der Fall sein, wenn man historisch-statistische Daten zur Illustration bzw. Untermauerung eines Arguments nutzen möchte (auch und gerade im Rahmen der Erstellung einer Lehrveranstaltung oder einer Hausarbeit); in diesem Fall dürften die Online-Ressourcen für die Leser:innen sehr nützlich sein. Möchte man jedoch einen Datensatz selbst erstellen – mit anderen Worten: historisch-statistische Daten aus Primärquellen selbst erheben –, wird man eher auf die diversen Online-Ressourcen zur klassischen Literatur- und Textrecherche (etwa Online-Findbücher und Volltextsuchmaschinen) zurückgreifen wollen, die in anderen Clio-Guides vorgestellt werden. Die spezifischen hier hervorgehobenen Online-Ressourcen können dann in erster Linie dazu dienen, sich zu vergewissern, dass bestimmte Daten(sätze) tatsächlich noch nicht existieren oder zumindest noch nicht allgemein verfügbar gemacht worden sind.

Um zu einem ersten, intuitiven Verständnis des erkenntnistheoretischen Mehrwerts historisch-statistischer Daten zu gelangen, sollte man sich Folgendes bewusst machen: In historiographischen Narrativen kommen unbestimmte Zahlwörter genauso häufig wie in anderen Sprachkontexten vor. Quantoren wie „einige“, „etliche“ „viele“, „oft“, „mehr“ und „weniger“ sind letztlich Ausdruck einer inhärent quantitativen Sprache. Welche rechnerische Abwägung zwischen zwei (oder mehr) Mengen Autor:innen dabei im Geiste und häufig(!) nach Gefühl vollführen, bleibt dabei üblicherweise (!) unausgesprochen. Der implizite numerische Vergleich und dessen spezifischer Kontext bleiben mehr oder weniger(!) stark im Dunkeln. Vor diesem Hintergrund ist Quantifizierung in der Geschichtswissenschaft zunächst einmal nichts anderes als ein expliziter numerischer Vergleich, der die rechnerische Abwägung gegenüber den Leser:innen offenlegt. Diese Offenlegung erhöht im Zweifel die Verständlichkeit der Argumentation und macht die Abwägung intersubjektiv nachprüf- und falsifizierbar.

1.2 Was sind historisch-statistische Daten? Ein Definitionsversuch

Definition

Daten sind bereits im Moment ihrer Darstellung in dem Sinne historisch, als sie einen vergangenen Zustand beschreiben. Als „historisch“ kann man sie vielleicht dann bezeichnen, wenn es für dieselbe Beobachtungseinheit eine aktuellere Beobachtung gibt. Hier wird jedoch eine ganz pragmatische Definition vorgeschlagen: Erstens sind Daten dann historisch, wenn sie zur Beschreibung oder zur Analyse eines historischen Sachverhalts verwendet werden. Zweitens bringt das Attribut „statistisch“ zum Ausdruck, dass eine Quelleninformation in Form eines numerischen Wertes, sprich: einer Zahl, vorliegt. Dabei kann es sein, dass diese Zahl so bereits in der betrachteten Quelle steht und nur noch kopiert werden muss (d.h. eine genuin quantitative Quelleninformation darstellt) oder dass sie erst durch die Historikerin bzw. den Historiker im Zuge der Kategorisierung, Klassifizierung und Kodierung einer nichtnumerischen (d.h. genuin qualitativen) Quelleninformation vergeben wird. Was also eine historische Quellenformation zu einem historisch-statistischen Datum macht, ist die Zuweisung eines numerischen Werts als notwendige Grundlage der Anwendung mathematisch-statistischer Werkzeuge bzw. Methoden. Im Falle numerischer Informationen kann man sich diese Zuweisung als an den Urheber der Quelle (z.B. das Kaiserliche Statistische Amt) outgesourct vorstellen; ein Aspekt, den man, je nach Kontext, im Rahmen der Quellenkritik an seinen Daten diskutieren kann oder sogar sollte.[4]

Von historisch-statistischen Daten lässt sich dann sprechen, wenn eine größere Anzahl gleichförmiger Beobachtungen vorliegt. Die Menge der Beobachtungen bildet dann einen Datensatz, der als einer von drei Grundtypen vorkommen kann, nämlich entweder als (1) Querschnitt (z.B. die Verteilung der Sterbefälle in einem gegebenen Zeitraum auf Regionen oder Todesursachen), als (2) Längsschnitt bzw. Zeitreihe (z.B. die Sterbefälle in einer bestimmten Region oder einer bestimmten Ursachenkategorie zu aufeinanderfolgenden Zeiträumen) oder als (3) Panel, eine Kombination der ersten beiden Grundtypen (s. Tab. 1). Typischerweise werden Daten(sätze) in Form von Tabellen dargestellt und durch Grafiken illustriert.

Abbildung 1: Datensatztypen

Abbildung 1. Datensatztypen.

Ein wichtiges Charakteristikum (historisch-)statistischer Daten ist deren sog. „Skalenniveau“, von dem es abhängt, welche mathematischen Basisrechenoperationen auf sie angewendet werden können. Hierdurch wiederum bestimmt sich, welche statistischen Werkzeuge zur Analyse zur Verfügung stehen. Gemeinhin werden vier Kategorien statistischer Daten unterschieden, nämlich (1) nominal-, (2) ordinal-, (3) intervall- und (4) verhältnisskalierte Daten. Von (1) nach (4) nehmen die möglichen Rechenoperationen, mithin der in den Daten steckende Informationsgehalt, zu. Nominalskalierte Daten lassen sich lediglich auszählen; es besteht keinerlei natürliche Hierarchie zwischen den Datenpunkten (qualitative Merkmale wie z.B. Name, Beruf und Geschlecht einer Person). Ordinalskalierte Daten lassen sich auszählen und ordnen (qualitative Daten, die eine natürliche Hierarchie widerspiegeln, wie z.B. Schulnoten). Für intervallskalierte Daten lassen sich zusätzlich Differenzen zwischen den Datenpunkten bilden, die eine eigene konkrete inhaltliche Bedeutung haben (numerische Merkmale wie z.B. Zeiteinheiten). Schließlich sind verhältnisskalierte Daten auch durch die Eigenschaft ausgezeichnet, dass der Quotient aus zwei Datenpunkten zu bilden ist, da sie einen natürlichen Nullpunkt besitzen (numerische Merkmale wie z.B. Alter, Preise und Löhne). Nominal- und ordinalskalierte Daten werden auch zur kategorialen Skala, intervall- und verhältnisskalierte Daten zur metrischen Skala zusammengefasst. Als Anwender:in historisch-statistischer Daten muss man sich über die Skalierung der Daten bewusst sein, da hiervon die Methodenwahl abhängt.[5]

Ergänzung 2: Statistische Quellen

Quellen, auf deren Grundlage historisch-statistische Daten prinzipiell von Historiker:innen erhoben werden können, seien als „statistische Quellen“ bezeichnet. Ganz grundsätzlich kann man statistische Quellen in qualitative und quantitative einteilen, also solche, die entweder mehrheitlich oder gar ausschließlich nichtnumerische oder aber numerische Informationen (s.o.) beinhalten.[6] Genauer lassen sich vier Typen statistischer Quellen unterscheiden, von denen die drei zuerst genannten unmittelbar oder durch Verknüpfung eine Zeitkomponente aufweisen:[7]

– Typ 1 (serielle Quelle i.e.S.): Eine Quelle, die vom Urheber (Obrigkeit, Kirche, privater Träger) bewusst als fortlaufend und (mehr oder weniger) standardisiert ausgewiesen ist (z.B. Veröffentlichungen der amtlichen Statistik, Kirchenmatrikel, Rechnungsbücher).

– Typ 2 (serielle Quelle i.w.S.): Eine solche, die nicht bewusst als Teil einer Serie geschaffen, gleichwohl regelmäßig, in (mehr oder weniger) standardisierter Form produziert worden ist (z.B. Totenscheine). Die Serie ergibt sich erst aus der Perspektive des Forschenden, der vergleichbare Dokumente zu einem Datensatz verknüpft.

– Typ 3 (quasi-serielle Quelle): Eine solche, die grundsätzlich nicht-seriell ist, d.h. die nicht bewusst als fortlaufend und standardisiert entworfen worden ist, die Forschenden jedoch als Ausgangspunkt zur Erarbeitung einer Serie dienen könnte. Es könnte sich hierbei z.B. um Dissertationen aus einer bestimmten wissenschaftlichen Disziplin handeln, die dahingehend untersucht werden, ob ihre formale Verfasstheit im Laufe der Zeit Veränderungen unterworfen gewesen ist.

– Typ 4 (nicht-serielle Quelle): Eine Quelle, die nur Daten zu einem spezifischen Zeitpunkt enthält, also ein Querschnittsdatensatz (s.o.).

Ob eine Quelle einer seriellen Quelle des Typs 2 oder 3 entspricht, hängt sehr vom konkreten Erkenntnisinteresse bzw. der konkreten Fragestellung des Forschenden, also letztlich vom Einzelfall, ab.

1.3 Nutzen und Kosten von Quantifizierung in der Geschichtswissenschaft

Definition „Quantifizierung“

Wer historisch-statistische Daten verwendet, der quantifiziert. So wurde „Quantifizierung“ in Abschnitt 1.1 dieses Clio-Guides zunächst kurz und bündig definiert. Mit Jürgen Kocka etwa lässt sich formaler, und den Kern des vorherigen Abschnitts aufgreifend, formulieren:

„Quantifizierung in der Geschichtswissenschaft – das bedeutet die systematische Bearbeitung numerisch zusammenfaßbarer [sic!] und insofern in größerer Zahl ähnlich oder gleich auftretender Quelleninformationen (oder Daten) mit Hilfe vielfältiger arithmetischer und statistischer Methoden zum Zweck der Beschreibung und Analyse historischer Wirklichkeit; diese Methoden reichen vom bloßen Zählen und Klassifizieren in einer deskriptiven Statistik über die Bildung und Anwendung statistischer Indices bis hin zur Regressionsanalyse und zur Anwendung mathematischer Modelle.“[8]

Diese Definition hat unseres Erachtens den Vorteil gegenüber konkurrierenden Definitionen, dass der Fokus nicht auf das unbedingte Vorliegen theoretischer Modelle zur Etablierung eines zu testenden Kausalzusammenhangs verengt wird.[9]

Zur Abgrenzung: Kliometrie

Ein verbreitetes Label für quantifizierende Ansätze in der Geschichtswissenschaft ist „Kliometrie“ – eine Zusammensetzung aus „Klio“, der Muse der Geschichtsschreibung, und dem Suffix „-metrie“ für „Messung“. Wenngleich jede quantifizierende historiographische Studie dem Wortsinn nach als kliometrisch gelten kann (man schaue sich nur den entsprechenden Duden-Eintrag an), wird mit Kliometrie üblicherweise aber die auf sozialwissenschaftliche Methoden und quantitative Verfahren aus den Wirtschaftswissenschaften zurückgreifende Wirtschaftsgeschichtsschreibung konnotiert („New Economic History“).[10] Diese Verengung ist sicherlich insofern nachvollziehbar (deswegen aber nicht zwingend geboten), als dass die Wirtschaftsgeschichte die am stärksten auf historisch-statistische Daten zurückgreifende historische Teildisziplin ist (s. Abschnitt 1.4).

Nutzen bzw. Stärken eines quantifizierenden Ansatzes

Welcher Nutzen entspringt nun der Anwendung eines quantifizierenden historiographischen Ansatzes? Was sind die Kosten? Um dies noch einmal zu betonen: Historiographische Narrative sind nicht weniger gespickt mit impliziten quantitativen Vergleichen jedweder Form wie andere „Sprachprodukte“. Wer beispielweise über die Lebensverhältnisse der Textilarbeiterinnen in Esslingen im Jahre 1848 schreiben oder lesen möchte, wird wissen wollen, wie hoch ihr Lohn war und was die Grundnahrungsmittel kosteten. Da sich gerade für die direkte Beschreibung der Lebensverhältnisse der unteren Schichten nur wenige Quellen finden lassen, sind hier konkrete Lohn- und Preisangaben sehr hilfreich, insbesondere, wenn man die Lebensverhältnisse über die Zeit, regional oder mit männlichen Textilarbeitern vergleichen möchte. Eine eher schwammige Aussage im Sinne einer (gefühlt) „besseren“ oder „schlechteren“ Lebenssituation wird hier unter Umständen nicht überzeugen. In der besseren Vergleichbarkeit und damit Kontextualisierung liegt der Kernnutzen einer quantifizierenden Darstellung.

Darüber hinaus stellt Quantifizierung einen standardisierten „modus communicandi“ dar, der auf der Verwendung von Tabellen, Abbildungen und gegebenenfalls Formeln als Analysewerkzeuge beruht. Auch klang im vorherigen Abschnitt bereits an, dass es Quellen gibt, die genuin quantitativ sind und gar nicht anders erschlossen werden können als unter Einsatz mathematisch-statistischer Verfahren; wer quantitativen Methoden kategorisch kritisch gegenübersteht, muss letztlich begründen, warum man solche Quellen gegebenenfalls ignorieren möchte. Schließlich hilft Quantifizierung besonders in Kontexten, in denen Gruppencharakteristika für Historiker:innen von Interesse sind;[11] das Beispiel der Esslinger Textilarbeiterinnen ist dabei eines von vielen, das diesen Aspekt verdeutlicht.[12]

Kosten bzw. Schwächen eines quantifizierenden Ansatzes

Die handfesten Kosten bestehen vor allem in der Informationsbeschaffung und der quellenkritischen Interpretation der Daten(quelle). Wenn man zum in einer Quelle gefundenen Lohn einer Esslinger Textilarbeiterin im Jahre 1848 Lebensmittelpreise sucht, wo findet man sie? Und wenn man nur die Brotpreise in Stuttgart und von 1847 findet, darf man diese dann verwenden? Ist der Brotpreis ex post (und zuverlässig) erhoben, oder handelt es sich (ex ante) um eine Preistaxe, also einen behördlich festgesetzten Höchstpreis, von dem man nicht weiß, ob ihn die Marktteilnehmer auch tatsächlich als maßgeblich ansahen? Zur Beantwortung dieser und ähnlicher quellenkritischer Fragen an die Daten gibt es keinen Standardweg. Prinzipiell gelten für die Quellenkritik an statistischen Daten und -quellen dieselben Prinzipien wie für die Quellenkritik an jedem anderen Quellentyp.[13]

Im Zuge des fachlichen Diskurses um Kosten und Nutzen von Quantifizierung, der vor allem in den 1970er- und 1980er-Jahren geführt worden ist, sind folgende Schwächen benannt worden: Quantifizierung (1) nutze unanschauliche Sprache, (2) erzeuge eine Präzisionsillusion, (3) verwende Daten, die ein direktes Ergebnis interessegeleiteten Handelns seitens des Urhebers seien und somit per se keine Repräsentativität gewährleisten können, (4) führe zu ahistorischen Ergebnissen, (5) reflektiere den Hang, quantifizierende Verfahren um der technischen Spielerei willen einzusetzen, (6) führe zur Rosinenpickerei von Forschungsthemen, (7) sei nicht leistungsfähiger, als die klassische historisch-hermeneutische Methode, und (8) offenbare ein falsches Zeitverständnis.[14] Unserer Ansicht nach sind die Punkte (1), (2), (4) und (8) Ausdruck einer mangelnden Bereitschaft, sich eine neue Methode mit ihren Chancen (und Grenzen, s. Punkte (4) und (8)) zumindest passiv anzueignen, während der Punkt (3) in noch viel stärkerem Maße für qualitative Argumentationsweisen zutrifft, bei denen man sich zur eigenen Hypothese passende Beispiele eklektisch herauspickt. Die Punkte (5) und (6) sprechen nicht gegen quantitative Methoden an sich und Punkt (7) ist in seiner Allgemeinheit durch hunderte empirischer Studien klar widerlegt.

Zwar sollte man diese reklamierten Schwächen ernst nehmen. Doch steht unseres Erachtens auch fest, dass sich qualitative und quantitative Quellen nicht gegenseitig ausschließen, sondern idealerweise im Verbund analysiert werden sollten.

1.4 Wie quantitativ ist die geschichtswissenschaftliche Forschung?

Das Gros der relevanten Untersuchungen zum Umfang der Quantifizierung in der Geschichtswissenschaft fällt in die 1980er- und 1990er-Jahre.[15] Studien mit einem langen Zeithorizont, die es ermöglichen, das Ausmaß von Quantifizierung über die letzten fünf Dekaden und mehr bis in die Gegenwart hinein zu verfolgen, sind rar und stark auf die englischsprachige Wirtschaftsgeschichtsschreibung fokussiert.[16] Mit Michael Buchner et al. (2020) liegt allerdings auch eine aktuelle Studie speziell zur deutschsprachigen Geschichtswissenschaft im Zeitraum von 1951 bis 2016 vor.[17]

Ausgangspunkt der Studie ist ein Korpus aller Forschungsartikel, die in zehn einschlägigen geschichtswissenschaftlichen Fachzeitschriften erschienen sind; das Korpus besteht aus einem allgemeinhistorischen und einem wirtschaftshistorischen Subkorpus (sieben bzw. drei Zeitschriften). Neben einem komplexeren linguistischen Ansatz, der an der mathematisch-statistischen Sprache quantifizierender Studien ansetzt, zählen die Autoren zur Identifikation eines quantitativen Artikels auch schlicht die Abbildungen und Tabellen (pro 100 Seiten) als spezifischen Ausdruck von Quantifizierung aus. Die beiden folgenden Abbildungen zeigen die dazugehörigen Ergebnisse auf der Ebene der Subkorpora für Fünfjahreszeiträume; zum Zwecke dieses Clio-Guides wurde das Korpus bis in das Jahr 2020 fortgeschrieben, wodurch es nun über 8.000 Aufsätze erfasst.

Wenig überraschen dürfte, dass das wirtschaftshistorische Subkorpus über den gesamten Betrachtungszeitraum ein höheres Maß an Quantifizierung (im Sinne der weiten Definition nach Kocka) als das allgemeinhistorische aufweist.

Abbildung 2. Tabellen und Abbildungen pro 100 Seiten über die Zeit

Abbildung 2. Tabellen und Abbildungen pro 100 Seiten über die Zeit (Eigene Darstellung basierend auf der Erweiterung der Datenbasis aus Buchner et al., Zur Konjunktur des Zählens, hier S. 594, um die Jahre 2017 bis 2020).

Abbildung 3. Der Anteil quantitativer Artikel über die Zeit (Vgl. zur Quelle Abbildung 2)

Abbildung 3. Der Anteil quantitativer Artikel über die Zeit (Vgl. zur Quelle Abbildung 2).

Während die Wirtschaftsgeschichtsschreibung über zweieinhalb Jahrzehnte (ca. 1960 bis 1985) die maßgeblich von den USA ausgehende „kliometrische Revolution“ erlebte, die bis in die Gegenwart nichts von ihrer Prägekraft verloren hat, fand diese im großen Rest der deutschsprachigen Geschichtswissenschaft mit deutlicher Verzögerung erst in den 1970er-Jahren statt und erlebte danach eine zumindest partielle Restauration über die 1980er- und 1990er-Jahre, die man mit dem Cultural Turn begründen könnte.[18] Die spezifisch deutsche Ausprägung quantitativer Forschung wird auch mit der Bewegung der „Historischen Sozialwissenschaft“ (Stichwort „Bielefelder Schule“) assoziiert.[19] Nach 1980 hat sich der Anteil der quantifizierenden Artikel an allen wirtschaftshistorischen Artikeln auf gut 50 % gehalten, während er unter allgemeinhistorischen Artikeln von 20 % anfangs der 1980er-Jahre langfristig auf 10 % zurückgegangen ist, auf das um die Mitte der 1970er-Jahre erreichte Niveau. Bei der Interpretation ist allerdings zu berücksichtigen, dass dezidiert kliometrische Artikel seit etwa Mitte der 1990er-Jahre verstärkt in (den hier nicht erfassten) angelsächsischen field journals und teilweise auch in rein wirtschaftswissenschaftlichen Zeitschriften publiziert werden.[20]

1.5 Publikationen zur Historischen Statistik und Software

Gedruckte Quellen

Die regelmäßige statistische Erfassung vieler Sachverhalte hat in Deutschland zu Beginn des 19. Jahrhunderts eingesetzt. Die wenigen Staaten, die die politisch-militärischen Verwerfungen der Jahre 1792 bis 1815 überlebten, mussten ihre zum Teil erheblich erweiterten Territorien verwaltungsmäßig erfassen, um sie kontrollieren zu können. Zunächst wurden Volks- und Vieh-, später auch Gewerbezählungen durchgeführt. Vor allem in der zweiten Hälfte des 19. Jahrhunderts differenzierte sich die amtliche Statistik immer weiter aus. Ihre Ergebnisse wurden auf Ebene der einzelnen Staaten, ab 1871 Bundesstaaten, und ab 1881 auch auf Ebene des Reichs veröffentlicht.[21] In diesen zeitgenössischen statistischen Jahrbüchern findet sich eine Fülle von Informationen zu sozioökonomischen, politischen und kulturellen Themen. Nur ein sehr kleiner Teil von ihnen wurde bislang digitalisiert (vgl. unten 2.3). Weil die Ergebnisse der amtlichen Statistik immer umfangreicher wurden, veröffentlichten sie das Statistische Reichsamt bzw. die statistischen Ämter der Länder in separaten Reihen.[22] Diese wechselten öfters den Reihentitel, so dass es sich empfiehlt, diese Publikationen in den Quellenangaben der regelmäßig erscheinenden statistischen Jahrbücher zu recherchieren.[23]

Auf der amtlichen Statistik des Statistischen Bundesamts und der Deutschen Bundesbank basieren eine Reihe älterer, gleichwohl für einfachere Fragestellungen für das 19. und die ersten drei Viertel des 20. Jahrhunderts immer noch nützliche Publikationen.[24] Für die Wirtschaftsgeschichte finden sich zudem in den Pionierarbeiten von Walther G. Hoffmann und seinen Mitarbeitern viele Informationen.[25] Und wer europäische oder weltweite Vergleichsdaten sucht, wird vielleicht in den vergleichenden Übersichten von Brian R. Mitchell fündig.[26]

Da diese Daten veraltet sein können, empfiehlt es sich in jedem Fall, zunächst die Publikation „Deutschland in Daten“ anzusehen, die Thomas Rahlf 2015 in erster und 2022 in zweiter Auflage herausgegeben hat. Darin haben Historiker:innen für ihre jeweiligen Fachgebiete die wichtigsten historischen Daten zusammengestellt und kommentiert.[27] Dieser ungemein hilfreiche Band ist in der Print-Fassung bei der Bundeszentrale für politische Bildung gegen Portoersatz erhältlich und kann online kostenlos heruntergeladen werden. Auch die Zeitreihen, die im Band selbst nur ausschnittweise für Stichjahre wiedergegeben werden, sind im Internet durchgehend erhältlich.

Es ist denkbar, dass „Deutschland in Daten“ die letzte Print-Publikation ihrer Art sein wird. Es ist derzeit (im August 2023) schon abzusehen, dass in Bälde durch das Konsortium 4Memory im Rahmen der Nationalen Forschungsdateninitiative (NFDI) ein Portal aufgebaut wird, das erlaubt, auf die bereits existierenden Datenrepositorien zuzugreifen („dataspace“).[29] Ob es in absehbarer Zeit die Online-Plattform geben wird, auf der man zuverlässig historische Daten, idealerweise sogar qualitätsgeprüft, recherchieren kann, bleibt abzuwarten. Technisch-organisatorisch wäre das möglich, doch hat sich bislang in Deutschland keine Institution gefunden, die den Aufbau und den Weiterbetrieb finanzieren würde.

Lehrbücher

Was die Verarbeitung historischer Daten angeht, so ist die Situation weitaus besser, da man hier mit Problemen zu tun hat, die auch andere Wissenschaftsbereiche haben und für die entsprechende Lösungen entwickelt worden sind. Zu nennen sind hier einerseits Lehrbücher und andererseits statistische Software.

Gute englischsprachige Lehrbücher, die einen breiten Überblick geben, sind nach wie vor „History by Numbers“ (in erster Auflage 2000 und in zweiter Auflage 2017 erschienen) und „Making History Count“ (erschienen 2002 und eine Online-Version 2012).[30] Daneben ist auch „Quantitative Methods in the Humanities“ (erschienen 2019) zu nennen, das den Schwerpunkt stärker auf Werkzeuge zur Analyse von nominal- und ordinalskalierten Daten (vgl. den Abschnitt 1.2) und Quellenkritik legt.[31]

Auf Deutsch existiert eine Reihe älterer Darstellungen in Monographieform, die allesamt aus den 1980er- und 1990er- Jahren stammen,[32] und ein paar jüngere, vor allem in Aufsatzform.[33] Helmut Thome und Volker Müller-Benedict haben 2021 mit „Statistische Methoden für die Geschichtswissenschaften“ eine sehr umfangreiche Einführung vorgelegt – und die erste ganz auf die Belange von Historiker:innen zugeschnittene seit mehr als zwei Jahrzehnten (die interessanterweise nicht durch zwei Historiker, sondern zwei Sozialwissenschaftler verfasst worden ist). Sie hat, abgesehen von der einfacheren sprachlichen Zugänglichkeit, den großen Vorteil, dass die Beispiele im Internet heruntergeladen und mit SPSS (s.u.) bearbeitet werden können.[34] Ähnlich wie Feinstein/Thomas gehen Thome/Müller-Benedict bis zur nicht-linearen Regression. Letztere gehen allerdings sehr in mathematische Details und diskutieren auch etliche Verfahren, die, bislang jedenfalls, bei historischen Studien praktisch nie zur Anwendung gekommen sind. Um für die Durchführung einer entsprechenden Lehrveranstaltung einen Sinn für Prioritäten zu bekommen, mag daher für Lehrende das Büchlein der Autoren dieses Clio-Guides hilfreich sein.[35]

Statistikprogramme

Mit SPSS ist auch schon das Standardprogramm für statistische Methoden in den Sozial- und Geisteswissenschaften genannt, für das jedes Universitätsrechenzentrum genügend Lizenzen vorhält. Für anspruchsvollere statistische Methoden setzen vor allem Wirtschaftshistoriker:innen oft auf Stata, das zudem auch bessere Grafik-Tools aufweist, oder auf EViews, das besonders auf Zeitreihenanalysen zugeschnitten ist. Wer in R programmieren kann oder dies zeitgleich lernen möchte, findet im Internet viele Einführungen zum Selbstlernen.[39]

Einfache statistische Berechnungen kann man im Übrigen, sozusagen ganz barrierefrei, auch mit dem Office-Standardprogramm Excel machen. Unter dem Reiter „Formeln“ findet man unter „Mehr Funktionen“ das Untermenü „Statistik“, welches Dutzende von statistischen Größen bis hin zu solchen der einfachen linearen Regression enthält. Und selbst wenn man keine statistischen Methoden anwenden möchte, lässt sich Excel zur Strukturierung bzw. Organisation der Daten verwenden. Insbesondere bietet Excel auf leicht zugängliche Weise viele Möglichkeiten, Daten zu visualisieren. Auch wenn die erwähnten Statistikprogramme für die Erstellung komplexerer Graphiken irgendwann unerlässlich werden, kommt man mit Excel für viele Zwecke hier schon sehr weit.[40]

1.6 Institutionalisierung

Universitäre Lehre

Obwohl die Verwendung deskriptiver Statistiken in der Sozial- und Wirtschaftsgeschichte sowie der historischen Wahlforschung seit den 1970er-Jahren ganz selbstverständlich ist, hat keine wie auch immer geartete Institutionalisierung stattgefunden. Einen Lehrstuhl bzw. eine Professur mit einer expliziten Denomination für „historische-statistische Daten“ oder „Historische Statistik“ gibt es unseres Wissens nicht.

Statistische Methodenlehre gehört im Prinzip unter das Dach der historischen Hilfswissenschaften bzw. neuerdings der Digital History/Humanities, wird aber an historischen Instituten ganz überwiegend fakultativ, oft sogar gar nicht angeboten. Eine von uns dazu „quick and dirty“ durchgeführte Recherche von in Frage kommenden Lehrveranstaltungen an den vierzig größten Universitäten mit öffentlich-rechtlicher Trägerschaft in Deutschland[41] ergab, dass im aktuellen Wintersemester 2022/23 nur an drei geschichtswissenschaftlichen Fachbereichen explizit ein solcher Kurs („Statistik für Historiker:innen“ oder ähnlich lautend) angeboten wird.[42]

Einen Spezialfall stellen die wenigen wirtschaftshistorischen Lehrstühle dar, die organisatorisch den Wirtschaftswissenschaften angegliedert (oder auf irgendeine Weise mit diesen verwoben) sind. Statistische Methodenlehre ist ein obligatorischer Bestandteil des Grundstudiums aller wirtschaftswissenschaftlichen Studiengänge, wobei historische Spezifika naturgemäß außer Betracht bleiben. Sofern fakultätsübergreifende Kooperationen bestehen, mögen auch Geschichtsstudent:innen von solchen Kursangeboten (und ggf. zusätzlichen wirtschaftshistorischen Lehrveranstaltungen zur historischen Statistik) profitieren.

Forschungsdateninfrastrukturen

Mangelnde Institutionalisierung lässt sich auch mit Blick auf ein im Prinzip denkbares zentrales Datenrepositorium für historisch-statistische Daten zu Deutschland feststellen. Das Statistische Bundesamt hat keinen entsprechenden Auftrag und lässt mittlerweile die meisten Zeitreihen, auf die man online zugreifen kann, bei der Wiedervereinigung enden; will man weiter zurückreichende historisch-statistische Daten haben, muss man entweder in die papiernen oder digital verfügbaren Volltexte hineingehen oder Studien finden, die das schon getan haben und in einem Repositorium hinterlegt sind. Eine institutionelle Verankerung bei Fachgesellschaften wie etwa der Gesellschaft für Sozial- und Wirtschaftsgeschichte existiert ebenfalls nicht, so dass man auf die in Abschnitt 2.1 beschriebenen Insellösungen, allen voran histat, angewiesen ist.

Arbeitskreise, Verbände etc.

Über Forschungsdateninfrastrukturen hinausgehend, mögen historisch-statistische Daten bei den einschlägigen Fachgesellschaften in vielfältigen Kontexten (bspw. Workshops und Tagungen) unter den Mitgliedern diskutiert werden. Institutionalisierte Arbeitsgruppen zu dem Thema sind uns allerdings nicht bekannt. Darüber hinaus scheinen auch Arbeitskreise, die sich der Förderung des Wissens um und des Gebrauchs von historisch-statistischen Daten verschrieben haben, nicht mehr aktiv zu sein. Die Arbeitsgemeinschaft für Quantifizierung und Methoden in der historisch-sozialwissenschaftlichen Forschung e.V. (QUANTUM) etwa, die den Aufbau des Zentrums für Historische Sozialforschung (ZHSF) mit initiiert hat, welches später wiederum in Gesis aufging, verfügt über keinen eigenen Webauftritt (mehr). An aktiven Arbeitskreisen ist prinzipiell die Arbeitsgemeinschaft Geschichte und EDV (AGE) zu nennen, deren erste Jahrestagung im Jahr 2002 stattgefunden hat; auf explizit mit historisch-statistischen Daten befasste Vorträge stößt man in den Programmen der bisherigen Tagungen allerdings nicht.

2. Digitale Ressourcen

2.1 Daten-Repositorien / Daten-Portale

Repositorien

Ein Datenrepositorium enthält Daten(sätze), die von Forschenden darin eingestellt worden sind. Es hat also nicht den Anspruch, historische Daten in systematischer Weise anzubieten, sondern vielmehr die Langzeitarchivierung mit Zugriffsmöglichkeiten für interessierte Nutzer:innen zu gewährleisten. Das umfangreichste Datenrepositorium ist die beim Leibniz-Institut für Sozialwissenschaften GESIS in Köln durch Thomas Rahlf, Jürgen Sensch, Rainer Metz und Gabriele Franzmann aufgebaute und 2004 freigeschaltete Daten-Plattform histat – Zeitreihen zur Historischen Statistik, die seit Oktober 2021 vom Leibniz-Institut für Finanzmarktforschung SAFE in Frankfurt/Main gehostet wird.[46] Dort findet man über 436.000 Zeitreihen aus über 500 Studien. Insbesondere ermöglicht histat Forschenden auch, selbst zusammengetragene Daten, d.h. originäre Datensätze, zu veröffentlichen. Dies wird in der Zukunft immer wichtiger, da Förderinstitutionen wie die Deutsche Forschungsgemeinschaft von ihren Geförderten erwarten, dass die steuerfinanzierte Forschung auch für Dritte zugänglich gemacht wird (Stichwort „open access“ bzw. „open data“). Inhaltlich sind die Studien 29 Themenbereichen (z.B. Arbeit, Bildung, Hanse, Kriminalität und Wahlen) zugeordnet. Zeitlich liegt der Schwerpunkt auf Reihen ab dem 16. Jahrhundert; es gibt aber auch Studien, die Daten bis ins Mittelalter zurückreichend bereitstellen. Die Nutzung von histat ist gebührenfrei, erfordert aber eine einmalige Registrierung. Eine durchaus vergleichbare Plattform mit klarem sozialhistorischem Schwerpunkt wird international durch das Institute of Social History (IISH) in Amsterdam bereitgestellt; aktuell sind 287 Studien mit Datensätzen hinterlegt, davon beschäftigen sich einige mit Deutschland.

Während histat seine Stärken bei der Archivierung von Zeitreihen hat, bietet Emporion – ein Produkt der Zusammenarbeit des DFG-Schwerpunktprogramms 1859 Experience and Expectations: Historical Foundations of Economic Behavior, der Gesellschaft für Sozial- und Wirtschaftsgeschichte und der Staatsbibliothek zu Berlin/Preußischer Kulturbesitz – seit 2023 auch eine einfachere Archivierung von Querschnitts- und Paneldaten, auch georeferenziert, an. Zum gegenwärtigen Zeitpunkt (August 2023) ist der Bestand an Datensätzen noch gering, er sollte aber zügig wachsen.

Die Überlassung von oft unter vielen Mühen erhobenen Daten an die Allgemeinheit ist für viele Forschende unter Umständen ein wenig schmerzvoll. Um entsprechende Anreize zu setzen, hat die Vierteljahrschrift für Sozial- und Wirtschaftsgeschichte (VSWG) im Jahr 2019 die Rubrik „Forschungsdaten“ eingeführt. In dieser können Forschende beschreiben, welche Daten sie nach welchen Kriterien erhoben haben, was bei der Auswertung zu beachten ist und welche Forschungsmöglichkeiten sich neu ergeben. Die Daten werden im ZBW Journal Data Archive kostenfrei gehostet; wer sie verwendet, sollte den entsprechenden Forschungsdatenartikel und gegebenenfalls die Originalstudie(n) zitieren.

Bei den Top-Journals in den Wirtschaftswissenschaften ist es mittlerweile gängig, wenn nicht gar obligatorisch, alle Daten (und gegebenenfalls auch verwendete Statistiksoftware-Codes) zu einem empirischen Artikel entweder direkt auf der Zeitschriften-Homepage oder in Repositorien zu hinterlegen. Der primäre Zweck ist neben der Langzeitarchivierung vor allem die Möglichkeit zur Replikation der Ergebnisse. Die einzige historische Zeitschrift, die unseres Wissens dieser Praktik folgt, ist das Journal of Economic History, das zur Hinterlegung openICPSR nutzt; derzeit sind 161 Datensätze (seit August 2016) eingestellt, darunter auch einige zu Artikeln, die deutsche Geschichte betreffen.

Portale

Auf den Homepages geschichtswissenschaftlicher Lehrstühle und Professuren findet man mitunter Linksammlungen mit Links u.a. zu Datenbanken aller Art. Insbesondere verlinken so einige wirtschafts- und sozialhistorische Lehrstühle auch spezifische Datensätze, einzelne Datenprojekte oder Daten-Portale.[51] Letztere seien hier als umfangreichere und gegebenenfalls kommentierte Linksammlungen (oder Verlinkungshubs) verstanden. Im Grunde fungieren schon Lehrstühle (oder auch bspw. Bibliotheken), sobald sie solche Links setzen (die sich zunächst einmal an die eigenen Studierenden richten), als einfaches Daten-Portal. Es lohnt sich also prinzipiell, die vielen Homepages von Lehrstühlen und anderen Einrichtungen des (geschichtswissenschaftlichen) Wissenschafts- und Lehrbetriebs im In- und im Ausland nach solchen Linksammlungen abzusuchen.

Das unserer Kenntnis nach umfangreichste, aber deutlich in die Jahre gekommene geschichtswissenschaftliche Datenportal im oben definierten Sinne ist Historicalstatistics.org, das für 21 Länder (und eine Kategorie „other countries“) spezifische Datensätze verlinkt. Die Auswahl für Deutschland ist mit vier solchen Links gering. Allerdings finden sich unter den allgemeinen Links auch eine Reihe nützlicher; zu beachten ist jedoch, dass nicht mehr alle Links funktionieren.

2.2 Datenbanken einzelner Projekte

Auf ein paar Datenbanken einzelner Projekte (für weitere s. die Liste „Webressourcen“) soll hier gesondert hingewiesen werden. Zur bereits erwähnten Publikation „Deutschland in Daten“ kann man den vollständigen Zeitreihendatensatz in Englisch bequem über die Homepage des Projekts herunterladen; zum Herunterladen des Datensatz in Deutsch wird man auf histat verlinkt. In den Tabellen zum jeweiligen Oberthema, von denen es 22 gibt (z.B. Migration, Kultur oder Landwirtschaft), werden Daten zu insgesamt 1.073 Variablen konstant für vier Gebietseinheiten – Deutscher/Bund/Zollverein/Deutsches Reich (1834–1945), Bundesrepublik Deutschland (1949–1989), Deutsche Demokratische Republik (1949–1989), Deutschland nach der Wiedervereinigung (ab 1990) – ausgewiesen. Das kann im ersten Moment etwas verwirrend sein, da es aus Gründen der Daten(nicht)verfügbarkeit sehr viele leere Zellen in den Tabellen gibt.

Zu weiteren, für wirtschafts- und sozialhistorische, aber auch andere historische Studien zur deutschen Geschichte sehr wertvollen Datenbanken zählt die ifo Prussian Economic History Database (iPEHD), die eine große Menge an Daten auf Kreisebene und ausgewählte Jahre zwischen 1816 und 1901 bereitstellt (über 1.500 Variablen und über 600.000 Datenpunkte);[55] man beachte, dass auf die Datenbank über den englischsprachigen Webauftritt zugegriffen werden kann. Auch die Historische Geld- und Kapitaldatenbank, die am SAFE (s.o.) gehostet wird, kann zur Beantwortung vielfältiger (wirtschafts-)historischer Fragestellungen von Interesse sein; erfasst sind Renten- sowie Aktienmarktdaten, vor allem Wertpapierkurse, für den Zeitraum 1871 bis 1914. Viabundus rekonstruiert Hansische Handelsstraßen für den Zeitraum von 1350 bis 1650 und stellt dazu auch Daten etwa zur Einwohnerzahl der erfassten Ortschaften bereit.

Für eine Diskussion der von Wirtschaftshistoriker:innen weitgenutzten Maddison-Database sei auf den Clio-Guide „Wirtschafts- und Sozialgeschichte“ verwiesen. Insbesondere für Kolonial- und Globalhistoriker:innen dürfte die umfangreiche und online (in Form von digitalen Karten) ansprechend aufbereitete Trans-Atlantic Slave Trade Database von Interesse sein, die den Anspruch erhebt, den bei weitem größten Teil der Sklavenfahrten in Richtung des amerikanischen Kontinents seit dem 16. Jahrhundert erfasst zu haben. Schließlich sei auch auf das Projekt Our world in data hingewiesen, das insbesondere unzählige auf historisch-statistischen Daten basierende Graphiken zu vielen Themengebieten anbietet.

2.3 Retrodigitalisierte Text-/Statistikbestände

Nachfolgend sei auf eine Reihe von für die historische Forschung und die Erhebung von historisch-statistischen Daten relevanten retrodigitalisierten Publikationen hingewiesen:

Statistisches Jahrbuch für das Deutsche Reich/die Bundesrepublik Deutschland/die Deutsche Demokratische Republik;

Die Volkszählung im Deutschen Reich am … (1890–1939);

Handbuch der deutschen Aktiengesellschaften;

Saling’s Börsenpapiere;

Statistisches Jahrbuch der Stadt Berlin (1876–1939);

Diese Liste ließe sich um etliche Titel erweitern; noch viele mehr harren der Retrodigitalisierung (wie etwa der größte Teil der Reihe Statistik des Deutschen Reiches). Für weitere Details sei auf die einschlägigen Clio-Guides „Amtliche Publikationen und Statistiken“, „Archive“, „Historische Volltextdatenbanken“ und „Wirtschafts- und Sozialgeschichte“ verwiesen.

2.4 Online-Ressourcen zum Umgang mit historisch-statistischen Daten

Werkzeug-Portale

Die einzige uns bekannte, gleichwohl sehr umfangreiche Online-Ressource zum Umgang mit Verfahren zur Analyse historischer Quellen ist die Web-Plattform Programming Historian. In der englischen Version sind dort über 100 von Experten begutachtete („peer-reviewed“) Tutorials verfügbar, von denen für den Umgang mit historisch-statistischen Daten folgende besonders nützlich sein können: Generating an Ordered Data Set from an OCR Text File, R-Basics with Tabular Data, Introduction to MySQL with R, Data Wrangling and Management in R, Dealing with Big Data and Network Analysis Using Neo4j, Preserving your research data, Regression Analysis with Scikit-Learn 1 (linear) und 2 (logistic).

Teils beruhen die vorgestellten Verfahren auf der Nutzung der Programmiersprache R, die in Abschnitt 1.5 kurz erwähnt wurde. Während man SPSS, Stata oder EViews mit minimalem eigenen Programmieraufwand und minimalen bis gar keinen Programmierkenntnissen bedienen kann und daher entsprechend schnell zum Erfolg kommt, setzt der Rückgriff auf R ein gewisses Maß an Programmierinteresse, wenn nicht gar -kenntnissen voraus sowie einen längeren Atem bei der Einarbeitung.[73] Hat man aber erst einmal diese Hürde genommen, ist man deutlich flexibler.

Häufig stellt sich die Frage nach historischen Wechselkursen. Hierfür stellt auf Eh.net die Unterseite MeasuringWorth eine sehr hilfreiche Funktion bereit.

Wichtige Zeitschriften

Die nachfolgend aufgezählten E-Journals sind einschlägige Publikationsorte für quantitative historische Studien aus allen Teilbereichen der Geschichtswissenschaft und können als Ausgangspunkt einer Suche nicht nur nach empirischen, sondern gerade auch nach theoretischen Arbeiten zu allen Aspekten des Umgangs mit historisch-statistischen Daten dienen:

Historical Methods: A Journal of Quantitative and Interdisciplinary History. London 1967ff (DFG-Nationallizenz für 1967 bis 1995);

History and Computing. Edinburgh 1989–2002, und seine Nachfolger International Journal of Humanities and Arts Computing. Edinburgh 2007–2014, und IJHAC: A Journal of Digital Humanities. Edinburgh 2015ff (ggf. lizenzierter Zugang an einzelnen Bibliotheken);

Historical Social Research/Historische Sozialforschung. Köln 1976ff (Volltextarchiv frei zugänglich bis auf die letzten sechs Monate);

Journal of the Association for History and Computing. Ann Arbor 1998–2010. (Volltextarchiv frei zugänglich);[79]

The Journal of Interdisciplinary History. Cambridge/Mass. 1970ff. (ggf. Zugriff auf Volltexte bis 2017 über JSTOR);

Social Science History. Cambridge 1976ff (OA-Transformations-Lizenz für 2013ff; DFG-Nationallizenz für 2019–2021; ggf. Zugriff auf Volltexte bis 2019 über JSTOR).

Zu ergänzen ist diese Liste natürlich um einschlägige nationale und internationale wirtschaftshistorische E-Journals, die man bei theoretischen und technischen Fragen zur Datenerhebung, -aufbereitung und -analyse (und zu historischen Inhalten selbst) auch im Blick haben sollte (s. Datei „Webressourcen").

Um einen Gesamtüberblick über das Angebot an elektronisch verfügbaren geschichtswissenschaftlichen und anderen relevanten Disziplinen zuzuordnenden Zeitschriften zu bekommen, sei auf die Elektronische Zeitschriftenbibliothek verwiesen.

Kommunikation

Die einschlägigen Kommunikationsplattformen, die Historiker:innen prinzipiell zum Austausch über inhaltliche und formale Fragen zur Verfügung stehen, werden in anderen Clio-Guides vorgestellt. Auf Folgendes sei aber hingewiesen: Auf H-Net bspw. findet sich eine große Anzahl an Netzwerken, unter denen allerdings keines explizit dem Umgang mit historisch-statistischen Daten gewidmet ist. Entsprechende Fragen an die Community müssten dann wohl in ein anderweitig passendes Netzwerk eingespeist werden. Eh.net bietet neben Links auf Datensätze (s.o.) auch die Möglichkeit, den Kreis der Abonnenten über ein Newsletter-Posting über neue Datensätze zu informieren oder umgekehrt Datenanfragen an ihn zu richten. Unseren Erfahrungen nach kommt beides aber nur sporadisch vor. H-Soz-Kult bietet ähnliche Möglichkeiten.

3. Resümee und Ausblick

In der Geschichtswissenschaft hat die Nutzung von historisch-statistischen Daten ihr Potenzial noch nicht annähernd erreicht. Dies liegt zum einen an der wenig benutzerfreundlichen Dateninfrastruktur – zu wenige historische Daten sind auf zu viele Insellösungen verteilt, so dass es geradezu Expertenwissen erfordert, die richtige Information zu finden. Zum anderen stehen einer solchen Nutzung mentale und wissensmäßige Barrieren entgegen. Als Geisteswissenschaftler sehen viele Historiker:innen die Beschäftigung mit quantitativen Daten als ihrem Fach wesensfremd an. Und auch wenn solche mentalen Widerstände nicht vorliegen, fehlt oft das Wissen, historisch-statistische Daten zu recherchieren und sie adäquat auszuwerten. Dies liegt auch an der Gestaltung des geschichtswissenschaftlichen Studiums, das Gefahr läuft, in der Digitalisierung nur eine Chance für bessere Visualisierung historischer Erkenntnisse zu sehen. Darüber hinaus sollte, so unsere Überzeugung, der „digital history“, und damit auch der statistischen Methodenlehre als historischer Hilfswissenschaft viel mehr Raum zugestanden werden, als dies bislang der Fall ist. Diese Notwendigkeit stellt sich umso mehr, als auch die Quellen zunehmend digital anfallen. Neben dem traditionellen „close-reading“ ist daher nun auch „distant reading“ möglich. Doch die Anwendung entsprechender Text Mining-Verfahren setzt ganz basale statistische Grundkenntnisse zum Verständnis der oft auf probabilistischen Prinzipien beruhenden Algorithmen voraus, die an den wenigsten historischen Instituten vermittelt werden. Schon von den Quellen her ist daher zwangsläufig zu erwarten, dass sich die Geschichtswissenschaft, und insbesondere die Zeitgeschichte, in weitaus größerem Umfang historisch-statistischen Daten und Methoden öffnen muss.

Literaturhinweise

Boldizzoni, Francesco, The Poverty of Clio: Resurrecting Economic History, Princeton 2011.
Fischer, Wolfram; Kunz, Andreas, Quellen und Forschungen zur Historischen Statistik von Deutschland, Wiesbaden 1992.
Jopp, Tobias A.; Spoerer, Mark, Cliometrics and the Study of German History, erscheint in: Diebolt, Claude; Haupert, Michael (Hrsg.), Handbook of Cliometrics, 3. Aufl., Berlin/Heidelberg 2023/24.
Wehrheim, Lino, Economic History Goes Digital: Topic Modeling the Journal of Economic History, in: Cliometrica 12 (2019), S. 83–125.
Wehrheim, Lino; Jopp, Tobias A.; Spoerer, Mark, Diskurs, Narrativ, Sonderweg, Hitler, Turn: Konjunkturen geschichtswissenschaftlicher Begriffe im „Clio Viewer“, in: Historische Zeitschrift 313 (2021), S. 129–154.

Fußnoten

  1. [1] Vgl. exemplarisch Brandt, Ahasver von, Werkzeug des Historikers. Eine Einführung in die Historischen Hilfswissenschaften, 8. Aufl., Stuttgart 2012; Beck, Friedrich; Henning, Eckart (Hrsg.), Die archivalischen Quellen. Mit einer Einführung in die Historischen Hilfswissenschaften, 4. durchgesehene Aufl., Köln u.a. 2004; Sellin, Volker, Einführung in die Geschichtswissenschaft, erweiterte Neuausgabe, Göttingen 2008.
  2. [2] Vgl. exemplarisch Kwaschik, Anne; Wimmer, Mario (Hrsg.), Von der Arbeit des Historikers. Ein Wörterbuch zu Theorie und Praxis der Geschichtswissenschaft, Bielefeld 2010, hier S. 117ff; Jordan, Stefan, Theorien und Methoden der Geschichtswissenschaft, 3. aktualisierte Aufl., Paderborn 2016, hier S. 134; Rhode, Maria; Wawra, Ernst (Hrsg.), Quellenanalyse. Ein epochenübergreifendes Handbuch für das Geschichtsstudium, Leiden u.a. 2020, hier S. 399ff.
  3. [3] Vgl. bspw. Howell, Martha; Prevenier, Walter, Werkstatt des Historikers. Eine Einführung in die historischen Methoden, Köln u.a. 2004, hier S. 64ff; Lingelbach, Gabriele; Rudolph, Harriet, Geschichte studieren. Eine praxisorientierte Einführung für Historiker von der Immatrikulation bis zum Berufseinstieg, Wiesbaden 2005, hier S. 118ff u. s 141ff.
  4. [4] Eine empfehlenswerte geschichtstheoretische Diskussion der Übersetzung qualitativer Information in numerische Werte bieten Carus, A. W./Ogilvie, Sheilagh, Turning Qualitative Data into Quantitative Evidence: A Well-used Method Made Explicit, in: Economic History Review 62 (2009), S. 893–925.
  5. [5] Vgl. Mittag, Hans-Joachim, Statistik. Eine Einführung mit interaktiven Elementen, 4. Aufl., Berlin und Heidelberg 2016, S. 20.
  6. [6] Vgl. auch Pitz, Ernst, Entstehung und Umfang statistischer Quellen in der vorindustriellen Zeit, in: Historische Zeitschrift 223 (1976), S. 1–39.
  7. [7] Jopp, Tobias A.; Spoerer, Mark, Historische Statistik lehren. Quellenkritische Vermittlung von Zielen und Methoden statistischen Arbeitens in der Geschichtswissenschaft, Schwalbach 2017, S. 12f.
  8. [8] Kocka, Jürgen, Quantifizierung in der Geschichtswissenschaft, in: Best, Heinrich; Mann, Reinhard (Hrsg.), Quantitative Methoden in der historisch-sozialwissenschaftlichen Forschung, Stuttgart 1977, S. 4–10, hier S. 4.
  9. [9] Vgl. Jarausch, Konrad H., Möglichkeiten und Probleme der Quantifizierung in der Geschichtswissenschaft, in: Ders. (Hrsg.), Quantifizierung in der Geschichtswissenschaft. Probleme und Möglichkeiten, Düsseldorf 1976, S. 11–30, hier S. 12.
  10. [10] Vgl. Komlos, John; Eddie, Scott, Deutsche Kliometrie, in: Zeitschrift für Wirtschafts- und Sozialwissenschaften 119 (1999), S. 293–311; Pammer, Michael, Kliometrie, in: Kwaschik; Wimmer (Hrsg.), Von der Arbeit des Historikers, S. 117–122.
  11. [11] Vgl. auch Jarausch, Möglichkeiten und Probleme, S. 16, für den Aspekt des Gruppencharakteristikums.
  12. [12] Vgl. für eine Übersicht über den Nutzen bzw. die Potenziale von Quantifizierung auch Jopp; Spoerer, Historische Statistik lehren, S. 18ff.
  13. [13] Vgl. mit Blick auf quantitative Quellen bspw. Tilly, Charles, Formalization and Quantification in Historical Analysis, in: Jarausch, Konrad H.; Schröder, Wilhelm H. (Hrsg.), Quantitative History of Society and Economy: Some International Studies, St. Katharinen 1987, S. 19–48, hier S. 46; De Vries, Jan, Problems in Handling Process-Produced Data, in: Clubb, Jerome M.; Scheuch, Erwin K. (Hrsg.), Historical Social Research. The Use of Historical Process-Produced Data, Stuttgart 1980, S. 431–443, hier S. 433ff.
  14. [14] Vgl. für zusätzliche Erläuterungen und weiterführende Literaturhinweise Jopp; Spoerer, Historische Statistik lehren, S. 16ff.
  15. [15] Vgl. dazu folgende Auswahl: Kousser, J. Morgan, Quantitative Social-Scientific History, in: Kammen, Michael G.; Hope Franklin, John (Hrsg.), The Past Before Us. Contemporary Historical Writing in the United States, Ithaca/NY 1980, S. 433–456; Johnson, Eric A., Counting ‘How It Really Was’: Quantitative History in West Germany, in: Historical Methods 21 (1988), S. 61–79; Oberwittler, Dietrich, Die Historische Sozialforschung in den achtziger Jahren. Quantitative Analyse eines Forschungsgebiets, in: Historical Social Research 18 (1993), S. 76–108; Oberwittler, Dietrich, From Coding to Decoding? An Analysis of Historical Social Research in Germany in the 1980s and Early 1990s, in: Historical Methods 30 (1997), S. 192–196; Reynolds, John F., Do Historians Count Anymore? The Status of Quantitative Methods in History, 1975–1995, in: Historical Methods 31 (1998), S. 121–148.
  16. [16] Vgl. Diebolt, Claude; Haupert, Michael, A Cliometric Counterfactual: What If There Had Been neither Fogel nor North?, in: Cliometrica 12 (2018), S. 407–434; Ruggles, Steven; Magnuson, Diana L., The History of Quantification in History: The JIH as a Case Study, in: Journal of Interdisciplinary History 50 (2019), S. 363–381; Cioni, Martina; Federico, Giovanni; Vasta, Michelangelo, The Long-Term Evolution of Economic History: Evidence from the Top Five Field Journals (1927–2017), in: Cliometrica 14 (2020), S. 1–39.
  17. [17] Vgl. Buchner, Michael; Jopp, Tobias; Spoerer, Mark; Wehrheim, Lino, Zur Konjunktur des Zählens – oder wie man Quantifizierung quantifiziert: Eine empirische Analyse der Anwendung quantitativer Methoden in der deutschen Geschichtswissenschaft, in: Historische Zeitschrift 310 (2020), S. 580–621.
  18. [18] Vgl. neben Buchner et al., Zur Konjunktur des Zählens, hierzu auch Wehrheim, Lino; Jopp, Tobias; Spoerer, Mark, Turn, Turn, Turn: A Digital History of German Historiography, 1950–2019, in: Journal of Interdisciplinary History 53 (2022), S. 471–507.
  19. [19] Vgl. zur Vertiefung bspw. Iggers, Georg G., Geschichtswissenschaft im 20. Jahrhundert. Ein kritischer Überblick im internationalen Zusammenhang, Göttingen 2007; Raphael, Lutz, Geschichtswissenschaft im Zeitalter der Extreme. Theorien, Methoden, Tendenzen von 1900 bis zur Gegenwart, 2. Aufl., München 2010; Nathaus, Klaus, Sozialgeschichte und Historische Sozialwissenschaft, Version: 1.0, in: Docupedia-Zeitgeschichte, 24.09.2012, https://docupedia.de/zg/Sozialgeschichte_und_Historische_Sozialwissenschaft, DOI: http://dx.doi.org/10.14765/zzf.dok.2.268.v1.
  20. [20] Für das Subkorpus der allgemeinhistorischen (wirtschaftshistorischen) Artikel gilt, dass 35 % (35 %) der Artikel ausschließlich Rohdaten visualisieren und diskutieren, 62 % (56 %) einfachere mathematisch-statistische Transformationen an den Daten vornehmen bzw. Werkzeuge der deskriptiven Statistik anwenden und nur 3 % (9 %) auf komplexere inferenzstatistische Verfahren zurückgreifen.
  21. [21] Vgl. Schneider, Michael C., Wissensproduktion im Staat. Das königlich preußische statistische Bureau 1860–1914, Frankfurt a.M. 2013; Behrisch, Lars, Statistics and Politics in the 18th Century, in: Historical Social Research 41 (2016), S. 238–257.
  22. [22] Ein Beispiel wäre etwa die Statistik der Eheschließungen, Geburten und Todesfälle sowie der Auswanderung nach Übersee, die das Kaiserliche Statistische Amt bzw. sein Nachfolger, das Statistische Reichsamt, unter dem Titel „Bewegung der Bevölkerung im Jahre …“ periodisch in den Bänden 223, 227, 236, 246, 256, 266, 275, 276, 307, 316 usw. in der Reihe “Statistik des Deutschen Reichs” veröffentlichte.
  23. [23] Vgl. Roeske, Ulrich, Die amtliche Statistik des Deutschen Reichs 1872 bis 1939. Historische Entwicklung, Organisationsstruktur, Veröffentlichungen, in: Jahrbuch für Wirtschaftsgeschichte 19/4 (1978), S. 85–108.
  24. [24] Vgl. Statistisches Bundesamt, Bevölkerung und Wirtschaft 1872–1972. Stuttgart, u.a. 1972; Deutsche Bundesbank, Deutsches Geld- und Bankwesen in Zahlen 1876–1975, Frankfurt a.M. 1976; dies., 40 Jahre Deutsche Mark. Monetäre Statistiken 1948–1987, Frankfurt a.M. 1988.
  25. [25] Vgl. Hoffmann, Walther G.; Müller, J. Heinz, Das deutsche Volkseinkommen 1851–1957, Tübingen 1959; Hoffmann, Walther G. u. a., Das Wachstum der deutschen Wirtschaft seit der Mitte des 19. Jahrhunderts, Berlin u.a. 1965.
  26. [26] Vgl. Mitchell, Brian R., International Historical Statistics, 1750–2010, London 2013, https://link.springer.com/referencework/10.1057/978-1-137-30568-8.
  27. [27] Vgl. Rahlf, Thomas (Hrsg.), Deutschland in Daten. Zeitreihen zur Historischen Statistik. Bonn 2015, 2. Aufl. 2022; http://www.deutschland-in-daten.de/.
  28. [29] Vgl. https://4memory.de/our-task-areas/, Task Area 3.
  29. [30] Vgl. Feinstein, Charles H.; Thomas, Mark, Making History Count. A Primer in Quantitative Methods for Historians, Cambridge u.a. 2002 https://doi.org/10.1017/CBO9781139164832; Hudson, Pat; Ishizu, Mina, History by Numbers. An Introduction to Quantitative Approaches, 2. Aufl., London u.a. 2017.
  30. [31] Vgl. Lemercier, Claire; Zalc, Claire, Quantitative Methods in the Humanities. An Introduction, Charlottesville u.a. 2019. Zu den älteren englischsprachigen Darstellungen zählen Floud, Roderick, An Introduction to Quantitative Methods for Historians, London 1973; Jarausch, Konrad; Hardy, Kenneth A., Quantitative Methods for Historians. A Guide to Research, Data, and Statistics, Chapel Hill 1991; Archdeacon, Thomas J., Correlation and Regression Analysis: A Historian’s Guide, Madison 1994.
  31. [32] Vgl. bspw. Floud, Roderick, Einführung in quantitative Methoden für Historiker, Stuttgart 1980; Ohler, Norbert; Schäfer, Hermann, Quantitative Methoden für Historiker, München 1980; Jarausch, Konrad; Arminger, Gerhard; Thaller, Manfred, Quantitative Methoden in der Geschichtswissenschaft. Eine Einführung in die Forschung, Datenverarbeitung und Statistik, Darmstadt 1985.
  32. [33] Komprimierte Beiträge in Einführungsbänden sind Krüger, Kersten, Historische Statistik, in: Goertz, Hans-Jürgen (Hrsg.), Geschichte – Ein Grundkurs, 3. Aufl., Reinbek bei Hamburg 2007, S. 66–87, und jetzt vor allem Burhop, Carsten, Statistische Methoden in der Geschichtswissenschaft, in: Haas, Stefan (Hrsg.), Handbuch Methoden der Geschichtswissenschaft, Wiesbaden 2022, online verfügbar unter https://link.springer.com/referenceworkentry/10.1007/978-3-658-27798-7_11-1. Vgl. auch Thome, Helmut, Zeitreihenanalyse. Eine Einführung für Sozialwissenschaftler und Historiker, München 2005.
  33. [34] Vgl. Thome, Helmut; Müller-Benedict, Volker, Statistische Methoden für die Geschichtswissenschaften, Wiesbaden 2021.
  34. [35] Vgl. Jopp; Spoerer, Historische Statistik lehren.
  35. [39] Vgl. allgemein z.B. https://www.idf.uni-heidelberg.de/fileadmin/user/gerwien/Tutorials/RTutorial.html; und für historisch-statistische Daten https://programminghistorian.org/en/lessons/r-basics-with-tabular-data.
  36. [40] Eine dezidiert auf die Belange von HistorikerInnen zugeschnittene Einführung in das Tabellenkalkulationsprogramm Excel gibt es unseres Wissens nicht. Mit z.B. Kronthaler, Franz, Statistik angewandt mit Excel. Datenanalyse ist (k)eine Kunst, 2. Aufl., Heidelberg 2021, liegt aber eine aktuelle Einführung für einen breiten Adressatenkreis vor.
  37. [41] Vgl. hierzu die nach Hochschultyp und Studierendenzahl sortierbare Liste unter https://de.wikipedia.org/wiki/Liste_der_Hochschulen_in_Deutschland.
  38. [42] Insgesamt wurden an neun Fachbereichen explizit Lehrveranstaltungen zur Statistik und/oder Digital History/Humanities und/oder Theorien/Methoden der Geschichtswissenschaft angeboten.
  39. [46] Vgl. auch Metz, Rainer; Berg, Alexander, Datenbanken der Historischen Statistik im ZHSF, in: Historical Social Research 29 (2004), S. 160–171; Rahlf, Thomas et al., histat – Zeitreihen zur Historischen Statistik von Deutschland online: Aufbau, Inhalt, Aufbereitung und technische Umsetzung, GESIS Technical Reports 09 (2012); Franzmann, Gabriele, The Online-Database histat as an Example for Research-Promoting Infrastructures for Studies in Quantitative Historical Research, in: Économies et Sociétés, Série «Histoire économique quantitative» 50 (2015), S. 821–856.
  40. [51] Vgl. bspw. https://www.uni-regensburg.de/philosophie-kunst-geschichte-gesellschaft/wirtschafts-und-sozialgeschichte/links/index.html.
  41. [55] Vgl. auch Becker, Sascha; Cinnirella, Francesco; Hornung, Erik; Wößmann, Ludger, iPEHD – The ifo Prussian Economic History Database, in: Historical Methods 47 (2014), S. 57–66.
  42. [73] Sehr nützlich sind in dieser Hinsicht neuedings im Web verfügbare KI-Programme wie etwa ChatGPT, die den R-Code generieren können.
  43. [79] Ob es sich hierbei um dasselbe Format wie das von Edinburgh Press herausgegebene Journal handelt, ist unklar, da sich die Band- und Heftzählungen unterscheiden.

PD Dr. Tobias A. Jopp ist derzeit Akademischer Oberrat a. Z. am Lehrstuhl für Wirtschafts- und Sozialgeschichte der Universität Regensburg. Zwischen Oktober 2013 und März 2014 vertrat er den Lehrstuhl für Wirtschafts- und Sozialgeschichte mit Agrargeschichte an der Universität Hohenheim und zwischen Februar 2021 und Januar 2022 die Professur für Wirtschaftsgeschichte an der Universität Mannheim. Seine Forschungsschwerpunkte liegen auf dem 19. und 20. Jahrhundert, insbesondere auf der Genese des modernen Wohlfahrtsstaates sowie Ressourcen-, Finanzmarkt- und Historiografiegeschichte.

Prof. Dr. Mark Spoerer ist Inhaber des Lehrstuhls für Wirtschafts- und Sozialgeschichte am Institut für Geschichte der Universität Regensburg. Außerdem ist er verantwortlicher Herausgeber der Vierteljahrschrift für Sozial- und Wirtschaftsgeschichte und Vorsitzender der Gesellschaft für Sozial- und Wirtschaftsgeschichte.

[Weiter zur ergänzenden Linkliste...]
Für Clio-online verfasst von:

Tobias A. Jopp / Mark Spoerer

PD Dr. Tobias A. Jopp ist derzeit Akademischer Oberrat a. Z. am Lehrstuhl für Wirtschafts- und Sozialgeschichte der Universität Regensburg. Zwischen Oktober 2013 und März 2014 vertrat er den Lehrstuhl für Wirtschafts- und Sozialgeschichte mit Agrargeschichte an der Universität Hohenheim und zwischen Februar 2021 und Januar 2022 die Professur für Wirtschaftsgeschichte an der Universität Mannheim. Seine Forschungsschwerpunkte liegen auf dem 19. und 20. Jahrhundert, insbesondere auf der Genese des modernen Wohlfahrtsstaates sowie Ressourcen-, Finanzmarkt- und Historiografiegeschichte.

Prof. Dr. Mark Spoerer ist Inhaber des Lehrstuhls für Wirtschafts- und Sozialgeschichte am Institut für Geschichte der Universität Regensburg. Außerdem ist er verantwortlicher Herausgeber der Vierteljahrschrift für Sozial- und Wirtschaftsgeschichte und Vorsitzender der Gesellschaft für Sozial- und Wirtschaftsgeschichte.