In sentimentalen Momenten beschleicht mich die Lust, mir die Veränderung meiner Webpräsenz im Laufe der Jahre anzusehen. Ich tippe dann die Adresse meines alten Blogs in die «WaybackMachine» des Internet Archives ein und bekomme eine Reihe von Daten angezeigt, aus denen ich auswählen kann: 74 Snapshots wurden im Laufe der letzten sieben Jahre von der Seite angelegt, die ihren Zustand zu dieser Zeit abbilden. Jede Designänderung ist bewahrt und kann nachvollzogen werden; das Archiv hat ohne meine Aufforderung Änderungen gespeichert, die sonst verloren wären.
Was in diesem Beispiel eine reine Spielerei ist, ist in anderen Fällen der Zugriff auf eine längst verschüttete Information, die verloren zu gehen droht: Für mein zweites Buch habe ich eine aufwändige Webseite erstellt, deren Abo ich versehentlich auslaufen ließ. Die Informationen wurden gelöscht, sie stehen nicht mehr im Netz – ausser bei der WaybackMachine, auf deren Archivinhalt direkt verlinkt werden kann.
Findet man eigene Inhalte im Archiv, ist das eine Erleichterung, eine Hilfestellung. Bei fremden fühlt es sich manchmal an wie ein Triumph: 2012 gaben zwei Schweizer Fussballer ein entlarvendes Interview. Sie hatten in eine Firma investiert, konnten aber nicht erklären, wie ihr Geschäftsmodell funktioniert. Auf Druck eines Anwalts musste das Interview im Netz gelöscht werden – im Archiv fand sich aber eine Kopie, die in den sozialen Netzwerken Verbreitung fand. Darin besteht die subversive Kraft des Archivs: Es widersteht dem Druck der Mächtigen und Reichen, indem es Informationen bewahrt.
Das Internet-Archiv funktioniert in dieser Darstellung als Werkzeug für das Recht auf Erinnern an frühere Versionen von Webseiten, an gelöschte Informationen, an verschüttetes Wissen. Dagegen müssen zwei Einwände stark gemacht werden: Wie verhält sich denn erstens dieses Recht auf Erinnern zum Recht auf Vergessen? Ist es zweitens möglich, einen subjektiven Vorgang wie das Erinnern mit neutraler Technologie zu unterstützen?
Das Recht auf Vergessen meint eigentlich ein Recht auf Vergessenwerden. Auf der Webseite des Datenschutzbeauftragten des Bundes heisst es dazu:
«Das Recht auf Vergessen im Internet bezeichnet die Möglichkeit, über die eigenen digitalen Spuren und das eigene Online-Leben (privat oder öffentlich) zu bestimmen. Angesichts der immer leistungsstärkeren Such- und Analyseprogramme wird das Vergessen – im Sinn einer vollständigen und endgültigen Löschung – oft illusorisch.»
Gemeint ist in diesem Sinne, dass Menschen ein Recht auf Kontrolle von Daten haben, die auf sie persönlich bezogen sind. Der Journalist, welcher die Fussballer interviewt und das Interview später gelöscht hat, geniesst demnach das Recht, den Text zu verbergen oder zu vernichten. Das Internet-Archiv greift in dieses Recht ein, wenn es den Text speichert und weiter zugänglich macht. Oft geschieht das unbewusst: Wer eine Webseite betreibt, vergisst oft, dass sie ausserhalb des eigenen Servers archiviert wird. (Selbstverständlich ist das Internet Archive kein rechtsfreier Raum: Die Möglichkeit besteht, auch da Inhalte löschen oder gar nicht erst archivieren zu lassen.) Das Recht auf Erinnern wird im Gegenzug als Reaktion auf das Recht auf Vergessen (werden) in journalistischen Beiträgen gefordert. Es taucht auch in der Bewältigung trauma-tischer historischer Erfahrungen auf (z.B. bei der Erinnerung an den Holocaust); hat aber in diesem Sinne keine rechtliche Bedeutung, mehr eine individuelle oder ethische.
Nur: Das gleichzeitige Bestehen des Rechts auf Erinnern oder des Rechts auf Vergessen(-werden) eröffnet ein Dilemma. Geht man davon aus, Daten könnten einer einzelnen Person zugeordnet werden, welche das Recht auf autonome Kontrolle darüber hat, vereinfacht man Zusammenhänge stark. So wird verschleiert, dass viele Informationen in Beziehungen entstehen. Das Fussballer-Interview betrifft seinen Autor, die Interviewten, die Unternehmer, die diskutiert werden – und die Öffentlichkeit, die ein Interesse an diesen Vorgängen hat. Sie alle können unterschiedliche Absichten und Wünsche haben. Ist Erinnern wichtiger als Vergessen? Speichern besser als Löschen?
Die Antwort lautet wahrscheinlich wie so oft: Kommt darauf an. Worauf? Zum Beispiel darauf, was und wie archiviert wird. Die eingangs genannten Beispiele waren von geringer Komplexität: Es ging jeweils nur um einen HTML-Code, der zusammen mit einigen Bilddateien mit wenig Aufwand gespeichert werden kann. Viele Webseiten enthalten aber heute Videos oder interaktive Elemente, die auch gespeichert werden können, aber in vielen Snapshots nicht enthalten sind. Grundsätzlich lässt sich jede Form digitaler Daten übers Netz publizieren und damit auch im Netz archivieren. Die Vorstellung, das gesamte Internet oder alle Daten liessen sich ohne Selektion archivieren, ist aber naiv. Entsprechend braucht es Selektionsprinzipien, Kriterien. Diese wiederum sind stark mit Ideologien und mit Macht verbunden. Ein harmloses Beispiel: Weil Brewster Kahle, der Gründer des Internet Archivs, die Band The Grateful Dead mag, gibt es von ihr über 20’000 Items im Archiv. Ein weniger harmloses: Anders als z.B. bei Wikipedia, wo die Gründe für eine Änderung oder eine Löschung dokumentiert werden und so nachvollziehbar bleiben, sind diese beim Internet Archive weder mitgespeichert noch einsehbar. Ob Informationen gelöscht wurden, weil sie falsch waren, oder weil eine Form von Zensur stattfand, lässt sich im Archiv nicht rekonstruieren.
Wenn wir also scheinbar eine objektive Erinnerung im Archiv suchen, ist es die Erinnerung aus einer spezifischen Perspektive der westlichen digitalen Elite. Oder knapper: «The Internet Archive» ist nicht das Internet Archiv, sondern ein Internet Archiv.
Diesen Gedanken hat die ehemalige Archivmitarbeiterin Amelia Abreu hat in einem Essay begründet. Sie analysiert darin die Archivierung von Daten, die Plattformen sammeln. Die Interaktion mit digitalen Interfaces führt zu Spuren, deren Existenz uns selten bewusst ist: Wie wir den Cursor bewegen, wo wir ein Display berühren, wie wir durch eine Seite navigieren, welche Profile wir wie lange ansehen – all das hinterlässt Daten, die von den Unternehmen hinter den Plattformen archiviert werden. Der Grund für die Archivierung: Neue Algorithmen beziehen in ihre Berechnungen oft andere Daten ein. Entsprechend gleichen sich, so Abreu, die Algorithmen und der Prozess der Archivierung: Beide versuchen zwar, möglichst genaue Daten in ihrem Kontext zu erheben, müssen
diese aber für die Benutzung neu ordnen und schaffen so neue Zusammenhänge. Dieser Vorgang ist nie neutral.
Das lässt sich an einem aktuellen Beispiel zeigen. Seit ein paar Wochen ist die neue Version der Wayback Machine verfügbar: Sie verfügt über eine Suchfunktion, mit der im Archiv nach Seiten gesucht werden kann, deren URL uns nicht bekannt ist. Konnte das Werkzeug bisher Inhalte mit bekannten Adressen rekonstruieren, ermöglicht das neue Interface einen komplett anderen Zugang zu den Archivinhalten.
Internet Archive und Algorithmen sind keine blosse Spielerei. Die Archive der Zukunft sind eng mit Algorithmen verbunden. Wer erinnern kann und wer über Vergessen bestimmen darf, muss gesellschaftlich ausgehandelt werden, gerade weil Menschen immer stärker vermessen werden. Denkt man an die Briefe bekannter Autorinnen und Autoren, die nach dem Ablauf einer bestimmten Frist veröffentlicht werden und dann Einblick in private Gedanken ermöglichen, so ist ihre Entsprechung heute die Hinterbühne unser Netzaktivitäten: All die privaten Nachrichten, die gelöschten Suchverläufe, die peinlichen Aktivitäten, von denen wir niemandem erzählen. Sie werden unbemerkt archiviert und genutzt – und in den Archiven der Zukunft vielleicht auch publiziert.
Die Verbindung zwischen Archiven und maschinellen Verfahren lässt sich noch eine Stufe weiterdenken: Längst wird das Netz von Crawlern archiviert, also von automatisierten Programmen. Je intelligenter diese Programme werden, desto stärker ersetzen sie menschliche Entscheidungen. Die erwähnte Selektion bei der Auswahl der archivierten Inhalte und bei ihrer Präsentation in Interfaces ist dann kein von bewusst handelnden Fachpersonen angestossener Prozess, sondern ein automatisierter.
Daran lässt sich ablesen, dass die Vorstellung, den Archivierungsprozess transparent zu machen oder zu kontrollieren, genauso naiv ist wie die Idee, es fände lediglich eine neutrale Speicherung des Vorhandenen statt. Tröstlich ist dabei lediglich die Einsicht, dass sich Vergessen und Erinnern noch nie haben steuern lassen und entsprechend formulierte Rechte Prothesen sind, welche die menschliche Unzulänglichkeit und die Zufälligkeit vieler Prozesse unzureichend maskieren. Richtiger wäre wohl, von einer Sehnsucht nach einem Recht auf Vergessenwerden oder Erinnern zu sprechen.
Individuell oder existenziell gesehen mag das beruhigen. Die Orientierung an einer Vergangenheit hat aber auch eine soziale Bedeutung – der Bezug auf archivierte Informationen und Objekte spielt dabei eine grosse Rolle. Auch wenn man davon ausgeht, dass Fakten konstruiert werden, handelt es sich um Informationsbündel, denen Gesellschaften viel Vertrauen entgegenbringen. Eine zunehmende Automatisierung der Archivierung, eine Steigerung der Komplexität in diesen Vorgängen und die Möglichkeit der Manipulation digitaler Daten – die ja nicht wie ein materielles Objekt untersucht werden können – stellen diese gesellschaftliche Funktion von Archiven im digitalen Raum zumindest infrage. Ein international verbindlicher rechtlicher Rahmen für und Aufklärung über die Archivierung und Bearbeitung von Netzinhalten könnten erste Schritte bei einer Verständigung darüber darstellen.