«Aus der Geschichte lernen, um die Zukunft zu gestalten». So lautet das vielzitierte Credo, mit dem man Fehler vermeiden kann. Doch was, wenn es noch keinen geschichtlichen Präzedenzfall gibt, aus dem man lernen könnte?
Wir leben in einer Welt, in der unsere kulturellen Leistungen in nie gekanntem Ausmass digital entstehen, digitalisiert und online verfügbar gemacht werden. Gerade dadurch sind diese Leistungen allerdings gefährdet, wie nie zuvor. Zwar bewegen wir uns nach wie vor physisch zur Arbeit, sprechen noch mit anderen Menschen und geniessen weiterhin einen Ausflug in den Herbstwald. Doch unser Leben, unsere Erfahrungen und Erinnerungen speichern wir heute zunehmend virtuell und digital. Die Fotos aus unserer Kindheit betrachten wir in den Alben unserer Eltern, diejenigen unserer Freunde auf Instagram, Snapchat oder Pinterest. Die gedruckten Enzyklopädien sind längst aus unseren Regalen verschwunden und das offizielle Kursbuch der SBB, einst ein Symbol der geordneten Information wird im kommenden Jahr eingestellt – 360 Millionen Fahrplananfragen verzeichnete die SBB im aktuellen Jahr online. Das Volumen des digital gespeicherten Datenbestands verdoppelt sich seit der Jahrtausendwende alle zwei Jahre. Die kulturelle Massenproduktion digitaler Objekte ist zu einem festen Bestandteil unserer Gesellschaft geworden.
Die International Data Corporation IDC schätzt, dass im aktuellen Jahr gut 10 Zetabytes an Daten in Form von Dokumenten, Emails, Fotos, Musik, Twitter-Posts oder Websiten erstellt, vervielfältigt und konsumiert wurden. Die digitale Kommunikation ermöglicht neue Formen des Arbeitens und erleichtert den weltweiten Zugang zu wissenschaftlichen und kulturellen Erzeugnissen. Der schnelle technische Wandel führt jedoch dazu, dass jahrelang etablierte Routinen zur Sicherung unserer Arbeit nicht mehr taugen. Die verbindliche Überprüfbarkeit von Informationen ist aber ein Teil des Fundaments, auf dem unser kulturelles Erbe aufbaut. Vor diesem Hintergrund führen Archive, Bibliotheken und Museen einen schwer zu gewinnenden Kampf gegen den digitalen Gedächtnisschwund.
Früher hatte das Erinnern einen klaren Ablauf: Wollte man sich beispielsweise einen Überblick über die Zeitungsnachrichten nach dem 11. September 2001 machen, dann half ein Gang in die Bibliothek. Dort suchte man verschiedene Zeitungstitel aus dem erwünschten Zeitraum zusammen und kopierte die Artikel. Das Vorgehen ist zeitaufwändig, aber grundsätzlich geregelt. Mit dem Erwerb der Publikation hat die Bibliothek auch die Rechte für eine zeitlich unbeschränkte Nutzung erhalten, und die für Kopien anfallende Urheberrechtsabgabe ist in den Kopierkosten enthalten. Neu erscheinende Zeitungen werden unmittelbar nach ihrem Eintreffen in der Bibliothek erfasst und bleiben in der Regel unverändert dort liegen. 50 Prozent relative Luftfeuchtigkeit, 18 Grad, lichtgeschützt. Das war bisher die Erfolgsformel für Generationen von Archiven und Bibliotheken.
Damit, wie diese Formel in Zukunft aussehen könnte, beschäftigt sich Georg Büchler, Archivar bei der Koor-dinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen KOST des Bundes. Er berät die staatlichen Archive bei ihrer Aufgabe, die Dokumente der Geschäfte von Bund, Kantonen und Gemeinden dauerhaft zu erhalten. Die Archivierung ist nach Gesetzgebung eine staatliche Aufgabe. Die Behörden sind somit verpflichtet, sämtliche Erzeugnisse den Archiven zu übergeben. Dazu gehören beispielsweise Personal- und Strafverfolgungsakten, Steuerdaten oder Korrespondenzen.
«Für viele Aspekte der digitalen Archivierung gelten dieselben Grundlagen wie für die analoge Archivierung», sagt Büchler. Im Kern geht es darum, aus der grossen Masse von Dokumenten, die in der Verwaltung produziert werden, diejenigen herauszusuchen, die für die Nachwelt von Bedeutung sein werden. Das sind am Schluss relativ wenig. Die Herausforderung liege vielmehr darin, wie man es schafft, die Information dauerhaft aufzubewahren. In der Papierwelt fallen laut Büchler bei einem Dokument drei Aspekte zusammen: Der Datenträger, den man physisch in die Hand nehmen kann, die Codierung der Information, also welche Buchstaben auf dem Dokument stehen und letztlich die Information im abstrakten Sinn, also das was ein Leser wahrnehmen und verstehen kann. «Wenn man einen Brief oder eine Urkunde richtig aufbewahrt hatte, dann hatte man auch die Information richtig aufbewahrt.»
In der digitalen Welt fallen diese drei Aspekte auseinander. Der Datenträger ist eine Festplatte oder ein Memorystick mit einer kurzen Lebenszeit von wenigen Jahren. Die Codierung im eigentlichen Sinn ist nicht zwingend an den Datenträger gebunden. Was uns eigentlich interessiert, ist die Information, die wir lesen und verstehen können, also die Übersetzung der Codierung in menschenlesbare Information. Büchler betont: «Heute ist es nicht mehr möglich, allein durch die sachgerechte Aufbewahrung eines Objektes wie z.B. eines Datenträgers gleichzeitig auch diese Information zu erhalten. Das ist der fundamentale Unterschied, den man sich vor Augen führen muss, wenn man über digitale Archivierung spricht.»
Entgegen der weitverbreiteten Annahme liegt die Schwierigkeit der Aufbewahrung jedoch nicht in der Haltbarkeit der Speichermedien. «Die digitale Archivierung ist eigentlich kein technisches Problem. Es ist zuerst ein organisatorisches und strukturelles Problem, das man lösen muss. Es nützt mir wenig, wenn ich ein Archivformat definiert habe, aber in dem Moment, in dem ein System durch ein anderes abgelöst wird, nicht dabei bin und darum die alten Daten gelöscht werden.»
Während in den Archiven bereits daran gearbeitet wird, das Bewusstsein für die Archivierung auch bei digitalen Inhalten zu schärfen, ist man im Internet oft noch weit davon entfernt. Die hohe Aktualität, mit der Informationen dort verfügbar sind, gaukelt uns eine falsche Sicherheit vor. Stattdessen befindet sich das Internet in einer permanenten Gegenwart – flüchtig, vergänglich, instabil und unzuverlässig.
Die durchschnittliche Lebensdauer einer Website beträgt etwa hundert Tage. Das ist nicht sehr ermutigend, schliesslich glauben wir oft, das Netz vergesse nie. Man hat den Eindruck, dass die Sachen auf dem Internet für immer dort bleiben, ob wir das wollen oder nicht: das unvorteilhafte Foto, der mittelmässige Blog, die schlechte Kritik. Stattdessen stehen die Chancen gut, dass dem gar nicht so ist. 2006 sagte der spätere britische Premier David Cameron in einer Rede, dass Google dazu beitrage, die Welt zu demokratisieren. «Wenn mehr Menschen Zugang zu Informationen haben, dann gibt man ihnen mehr Macht» und damit «die Möglichkeit, diejenigen zur Verantwortung zu ziehen, die in der Vergangenheit das Gewaltmonopol hatten.» Sieben Jahre später nahmen die Torys zehn Jahre Redematerial von ihrer Website, inklusive das zitierte. Wen interessieren schon
die Aussagen und Wahlversprechen von gestern? Yahoo löschte im Jahr 2009 mit der Einstellung des Webhostingdienst Geocities mehrere Millionen benutzergenerierte Websites. Der Internetdienstleister hatte es nicht geschafft, die Seite ausreichend zu monetarisieren, und dies obwohl er zu gewissen Zeiten zu den drei meistgesuchten Webdiensten zählte. Dass mit 38 Millionen Websites auch ein Teil der gesellschaftlichen Identität des Internets verbunden war, kümmerte den Konzern nicht. Doch die Bedeutung von solchen Artefakten kann nicht genug betont werden. Die handgestrickten Webpages mit ihren allgegenwärtigen «Under construction»-Hinweisen und Besucherzählern waren ein Vorläufer zu den heutigen sozialen Netzwerken. Das heute allgegenwärtige Facebook existiert seit gerade mal gut zwölf Jahren – weniger lang als Geocities – doch wie lange noch?
Es kann sein, dass die heutige Zeit einmal als verlorene Generation oder als verlorenes Jahrhundert angesehen werden wird. «Wir schmeißen derzeit ganz nonchalant alle unsere Informationen in etwas, das sich einmal als ein schwarzes Loch herausstellen könnte», sagt ausgerechnet Vinton Cerf. Er gilt als einer der Pioniere des Internets und ist aktuell Vizepräsident des Internetgiganten Google, der von der Digitalisierung des Wissens so sehr profitiert wie kaum ein anderes Unternehmen. «Wir digitalisieren Dinge, weil wir davon ausgehen, dass wir sie damit erhalten können. Wenn wir aber keine weiteren Schritte unternehmen, dann geht es diesen digitalen Versionen nicht viel besser, vielleicht sogar schlechter, als den Artefakten, die wir digitalisiert haben.» Einen solchen zusätzlichen Schritt hat Twitter 2010 unternommen, als eine Zusammenarbeit zustande gekommen ist, nach der alle über den Dienst versandten Nachrichten in der Library of Congress archiviert und dort zu Forschungszwecken zur Verfügung sein werden.
Doch was passiert mit all den anderen gedanken- oder namenlosen Websites? Ein Bruchteil von Yahoo’s Geocities-Universum konnte dank den Anstrengungen des Archive Team, einer Gruppe um den Archiv-Aktivisten Jason Scott gerettet werden: «Das Archive Team tat was es konnte, gemeinsam mit anderen unabhängigen Gruppen auf der Welt, um einen Teil von Geocities zu retten. Wieviele? Das werden wir wohl nie erfahren.» Denn oft sind die Internetfirmen nicht fähig oder schlicht nicht daran interessiert, dass die Inhalte auch nur als Archiv weiterexistieren können. In der Schweiz hat die Schweizerische Nationalbibliothek 2003 damit begonnen, selektiv Teile des «schweizerischen Internets» aufzubewahren und auch in vielen anderen Ländern laufen ähnliche Bemühungen.
Als Pionier und Wegbereiter der digitalen Archive gilt ohne Zweifel auch Brewster Kahle. Der amerikanische Informatiker hatte früh erkannt, dass die kulturellen Leistungen des Internets archiviert werden müssen und mit der Gründung des Internet Archive 1996 einen ersten Grundstein für die Erhaltung davon gelegt. Seinen ersten Mitarbeitern überreichte er jeweils ein Buch mit dem Titel «Die verschwundene Bibliothek» über die Zerstörung der Bibliothek von Alexandria. Sie ist der Präzedenzfall, der sich nicht wiederholen soll. Das Ziel von Kahle ist, die Bibliothek von Alexandria 2 zu bauen.
Die «Wayback Machine», die das Internet Archive zur Verfügung stellt, hilft schliesslich auch bei der Recherche der eingangs erwähnten Zeitungsnachrichten vom 11. September 2001. Mit ihr lassen sich URL-Adressen von Zeitungen nach einem bestimmten Datum durchsuchen. Von der Website der New York Times nyt.com finden sich für den Tag nach dem 11. September über zehn sogenannte Snapshots der Website. Die Recherche dauerte insgesamt viel weniger lang als der bisherige Gang zur Bibliothek und zu dem dort archivierten Sammelband der Zeitung. Doch Lücken existieren auch hier: Möchte ich vergleichen, was die Britische Zeitung The Sun am selben Tag zu den Anschlägen auf das World Trade Center auf ihrer Website publiziert hatte, bekomme ich statt einer Auskunft den Hinweis «Page cannot be crawled or displayed due to robots.txt». Eine brauchbare Alternative zu dem Archiv gibt es nicht. Und es ist nicht anzunehmen, dass die Zeitung selbst eine fortlaufende und öffentlich zugängliche Archivierung ihrer Website vornimmt.
Es sind digitale Gedächtnislücken, die sich hier auftun. Lücken die letztlich auch unser kulturelles Erbe betreffen werden. Unvorstellbar, dass man den «Prozess» von Franz Kafka oder die Märchen der Gebrüder Grimm nach gut einem Vierteljahrhundert aus Gründen der Inkompatibilität des Papiers oder eines neuen Alphabets nicht mehr lesen könnte. Bei Websites ist dies jedoch oft nach wenigen Jahren bereits der Fall. Und auch bei Software sieht es nicht viel besser aus: Spieleklassiker wie «Legends of Zelda» oder «Monkey Island» kennen heute einige noch aus ihrer Erinnerung. Anders als bei einem Buch, ist es angesichts der vielen juristischen und praktischen Hürden jedoch fast nicht praktikabel, die dort erzählten Geschichten weiterzugeben. Viel wahrscheinlicher ist es, dass ein neuer Anbieter die alte Software unter neuem Namen frisch aufkocht.
Es gibt Forscher, die glauben, dass wir für einen bestimmten Bereich unserer Zeit eine schlechtere Überlieferungslage haben werden als für das Mittelalter. Das mag überspitzt erscheinen, aber in gewissen Bereichen klafft bereits heute eine grosse Lücke. Nun kann man sich auf den Standpunkt stellen, dass es keinen essentiellen Nutzen gibt, alle Netzinhalte zu dokumentieren, wichtig sei ja vor allem die Selektion. Doch wie bei allen Archiven ist eine solche oft erst mit ausreichender zeit-lichen Distanz möglich. Die Gefahr besteht, dass wir vor lauter 24h-Datenproduktion die zeitliche Dimension aus den Augen verlieren. Wir aktualisieren laufend unsere Profile und bilden uns ein, die Timeline sei ein kontinuierliches Archiv. Stattdessen leben wir nur noch in einer ewigen Gegenwart.