Big Data: Als Daten laufen lernten

Wirtschaftshistoriker der Max-Planck-Gesellschaft warnen vor "Vollständigkeitsträumen" durch Big Data. Auch in der Vergangenheit gab es eine große Begeisterung und den Glauben an die vollständige Erfassbarkeit der Wirklichkeit, so Wirtschaftshistoriker an der Max-Planck-Gesellschaft. (Foto: Hannes Grobe/AWI, CC BY 3.0) 3.0)

Big Data steht für das 21. Jahrhundert wie kein anderes Thema. Allerdings zeigen Historiker von der Max-Planck-Gesellschaft, dass auch in der Vergangenheit große Datenmengen ausgewertet wurden. Vor allem war die Datenauswertung eine typisch weibliche Heimarbeit.  (Foto: Hannes Grobe/AWI, CC BY 3.0)

Big Data. Es ist ein Mega-Thema unserer Zeit. Es bildet die Grundlage für Künstliche Intelligenz, Virtual und Augmented Reality, predictive analytics und autonome Fertigungsbetriebe. Wer sich mit Big Data beschäftigt, der blickt in Richtung Zukunft. Eine Gruppe von Wissenschaftshistorikern am Max-Planck-Institut für Wissenschaftsgeschichte in Berlin stimmt dieser Aussage nur bedingt zu.

Elena Aronova, Christine von Oertzen und David Sepkoski rekonstruieren in ihrem Forschungsprojekt, welche Methoden Preußische Verwaltungen eingesetzt haben, um die riesigen Datenmengen auszuwerten. Auch in der Vergangenheit wurden umfangreiche Daten über die Bevölkerung gesammelt und gestapelt – besser gesagt: Striche gezählt. “Ausstricheln” nannte man das Verfahren, in dem die Auszähler in jede passende Rubrik einen Strich gesetzt haben. Später wurden sie zusammengezählt. Es war ein langwieriges, teures und fehleranfälliges Verfahren.

Vom Zählblättchen zur Zählkarte – eine Revolution

Zwanzig Jahre später wurde das Ausstricheln durch das “Zählblättchen” ersetzt. Es mag für heutige Ohren ungewohnt klingen, aber der Umstieg war eine echte Revolution. Zum ersten Mal wurde das ursprüngliche Datenmaterial in eine Tabelle überführt, wodurch die Daten weiterverarbeitet werden konnten. Eine Revolution war es, weil erstmals möglich wurde, Daten zu korrelieren. Echte statistische Analysen ermöglichte die so genannten Zählkarten, die auf das Zählblättchen folgten.

Sie hatten etwa DIN A5-Format und waren damit knapp vier Mal größer als das Zählblättchen, aber ähnlich handlich. Auf ihnen mussten die Einwohner Preußens zahlreiche Angaben zu sich selbst (Alter, Geburtsort, Familienstand, Lesefähigkeit) machen. Damit sparte Engel die Erhebungslisten und den Zwischenschritt der manuellen Datenübertragung auf das Zählblättchen ein. „Die preußischen Statistiker waren ganz begeistert von der neuen Möglichkeit, unterschiedliche Kriterien zu kombinieren“, sagt die Historikerin Christine von Oertzen.

Kindersterblichkeit und Armut statistisch sichtbar

Sie gingen dazu über, die Kärtchen in drei Auszählungsdurchgängen auszuwerten, jeweils nach mehreren Kriterien. Jetzt konnte man etwa gezielt verwitwete katholische Frauen auf dem Land erfassen oder alleinstehende evangelische Arbeiter in Kleinstädten. Genau das war das Ziel des ambitionierten Statistikers Engel gewesen: Er wollte ein Verfahren, das nicht nur das Auszählen verbesserte, sondern das Material für eine weiterführende Lesbarkeit aufbereitete. Erstmals wurde möglich, soziale und ökonomische Phänomene sichtbar zu machen. Die gesammelte Materialmasse wies auf Kindersterblichkeit hin oder bot ein Armutsindikator.

Als Wissenschaftshistorikerin interessiert sich Christine von Oertzen besonders für die Entwicklung von Technologien und deren konkrete Anwendungen. In der Umstellung von Listen auf bewegliche Papierdatenträger wie Zählblättchen und Zählkarte in Preußen nach 1860 sieht sie eine bisher wenig beachtete Revolution im Umgang mit Daten: „Die Daten wurden aus den starren Listen gelöst, sie lernten sozusagen laufen. Das ist der Beginn der modernen Datenverarbeitung, nicht die Einführung von Hollerith-Maschinen und die Mechanisierung.“

Datenauswertung: “wie Einbringen der Ernte”

Die Einführung von Zählblättchen und Zählkarte eröffnete der preußischen Verwaltung außerdem die Möglichkeit, die Datenauswertung im Wortsinne auszulagern: Sie wurde zu einer typisch weiblichen Heimarbeit. „Die Daten mussten schnell ausgewertet werden, es war wie Saisonarbeit, wie das Einbringen der Ernte“, erklärt sie. „Daten kommen uns ja oft unphysisch vor.“ Doch als sich von Oertzen in die preußische Datenverarbeitungsgeschichte um 1900 vergrub, bekamen die Daten „Hände und Füße“, wie sie es nennt, und wurden fassbar: als Millionen von Kärtchen, die in Berlin zwischen dem Zensusbüro und ausgewählten Privatwohnungen hin- und hergeschickt wurden.

Was bedeuten diese Erkenntnisse aus der Wirtschaftsgeschichte für Big Data heute? „Natürlich interessiert uns die Frage nach Kontinuitäten beziehungsweise Brüchen“, sagt von Oertzen. Der Digitalisierung zum Trotz – auch bei Big Data heute, zu Beginn des 21. Jahrhunderts, sei viel menschliche Arbeit im Spiel: Um die Datenmassen kompatibel zu machen, zu pflegen und nutzbar zu halten. „Das sind Dinge, die wir heute so gern vergessen“, meint die Historikerin. Die Historikergruppe zweifelt an der vollständigen Erfassung der Realität durch Daten.

Big Data und Vollständigkeitsträume

Sie sprechen dabei von “Vollständigkeitsträumen”, die damals und heute im Lichte der Big Data vorherrsche. Historisch neu im Digitalzeitalter ist in den Augen der Wissenschaftshistoriker die Möglichkeit, Daten ganz aus ihrem ursprünglichen Kontext zu lösen. Einmal gesammelte und digitalisierte Informationen sind nicht mehr lokal verortet und können heute, völlig aus ihrem ursprünglichen Zusammenhang gelöst, weiter genutzt werden. (Max-Planck-Gesellschaft/iovolution.de)

VOLLTEXT ZUM BEITRAG
Der vorliegende Text enthält Textpassagen aus dem Beitrag “Daten zum Stapeln” (Autorin: Tina Heidborn) vom 7. April 2017.

Den vollständigen Text können Sie hier online lesen (ext.).

Hinterlasse jetzt einen Kommentar

Kommentar hinterlassen

E-Mail Adresse wird nicht veröffentlicht.


*


*