Einst bewahrten wir unsere Fotos und Erinnerungsstücke in Schuhkartons auf dem Dachboden auf, heute speichern wir sie online. Damit vertrauen wir unsere Sachen Firmen an, die sich vielleicht irgendwann entscheiden, sie wegzuwerfen – es sei denn, Jason Scott und das Archive Team kommen ihnen zuvor.
Bis 2011 lagerten auf Poetry.com über 14 Millionen Gedichte von Online-Poeten, die ältesten davon stammten aus den tiefen Neunzigerjahren. Die Seite war gewinn-orientiert. Ihr Geld machte sie mit Anzeigen, aber auch mit Sammelbänden, die sie für 60 Dollar aufstrebenden Dichtern verkaufte, die danach dursteten, ihr Werk gedruckt zu sehen. Für ihre Community war die Seite freilich viel mehr als einfach ein Geschäft. Es war ein Notizbuch, ein Schatzkasten für wertvolle persönliche Andenken. Vielleicht waren die Nutzer naiv in ihrem Glauben, die Seite würde für immer da sein. Am 14. April 2011 informierten die Betreiber über den bevorstehenden Verkauf der Seite. Bis zum 4. Mai würden alle Gedichte gelöscht. «Liebe Dichter», mahnte ein E-Mail die rund sieben Millionen Nutzer, «bitte speichert eure Daten lokal ab und stellt die Kontakte untereinander offsite sicher.» Nutzer, welche die Ankündigung sahen, verbreiteten die Botschaft unter ihren Dichterkolleginnen und -kollegen, die sich teils vor Monaten zuletzt eingeloggt hatten. Um 00.01 des 4. Mai verschwanden alle 14 Millionen Gedichte aus dem Auge der Öffentlichkeit. «Eure Gedichte sind WEG», schrieb User 1VICTOR. «Die scheren sich nicht um die Seele der Poesie. Sondern um ihre Klickrate.»
Die poetischen Kostbarkeiten wären vielleicht für immer verloren gewesen, wäre nicht Jason Scott aufgekreuzt. Scott ist der leitende Impresario des Archive Team, ein lose organisierter Verbund digitaler Schatzsucher, die untergehende Seiten entern, um zu retten, was zu retten ist. Nachdem das Archive Team vom bevorstehenden Aus von Peotry.com Wind bekommen hatte, beschlossen 25 Freiwillige der Gruppe via Internet Relay Chat (IRC) einen Rettungsplan. «Wir sagten uns: Scheiss drauf!», erinnert sich Scott. «Wenn Websites Nutzerdaten hosten und dann plötzlich dicht machen, ist das wie wenn jemand eine Bibliothek aufmacht, dann findet es sei doch nicht
so das Wahre … und einfach die Bibliothek abfackelt.»
Scott und das Archive Team fragen nicht, bevor sie sich die Daten holen. Aber nach einem ungeschriebenen Gesetz machen sie nur Jagd auf öffentlich zugängliche Inhalte. Und laut Scott hätten sich bislang die wenigsten der geplünderten Seiten beschwert. Für die Operation Poetry.com schrieb das Team ein Programm, das die Gedichte auf gespendetem Serverplatz in London, Ägypten oder New York kopiert. Die Archive Team Crew teilte die Gedichte in Blöcke von 100 000 bis eine Million Files auf. In erster Priorität retteten die Schatzsucher mit Pseudonymen wie Teaspoon oder DoubleJ die besten Arbeiten, also jene mit den höchsten Zustimmungsraten und den meisten Auszeichnungen. Von dort aus gruben sie sich durch die Bestände.
Anders als bei anderen Operationen, stiessen sie auf Widerstand. «Poetry.com arbeitete Schritt für Schritt gegen uns», sagt Archive Team-Aktivist Alex Buie, ein High-School Senior aus Woodbridge, Virginia. Jemand von Poetry.com habe sich per E-mail beschwert, Archive Team verunsichere mit der Aktion den Käufer. Einigen Aktivisten sperrte man gar die IP-Adresse, so Buie weiter. Doch die Gruppe liess nicht locker. Als bei Poetry.com die Lichter löschten, hatte das Team etwa zwanzig
Prozent der Gedichte gerettet. Heute ist die Seite eine digitale Einöde mit unheimlichen Foren voller Spam und dem Versprechen des neuen Inhabers, die Gedichte irgendwann mal wieder aufzuschalten.
Das Ende ausgetrickst
Viele Leute glauben ja, Webseitenbetreiber würden ihre Daten auf immer und ewig aufbewahren. Dabei vertrauen sie den von anonymen Administratoren verwalteten Servern so viel mehr an als nur ihre Gedichte. Terabytes vertraulicher Geschäftsunterlagen, E-mail-Korrespondenz und unersetzliche Fotos werden hochgeladen. Dies obgleich schon massenhaft Nutzerdaten verloren sind, weil solche Dienste eingestellt wurden, aufgrund Besitzerwechsels, plötzlicher Seitenschliessungen oder Hacker-angriffen. Als Yahoo 2009 wegen zu hoher Hosting-Kosten entschied, GeoCities abzuschalten, immerhin einst die drittmeist genutzte Seite weltweit, verloren Userinnen und User 38 Millionen selbstgemachte Webseiten. Genau für solche Fälle führt das Archive Team einen Katalog der Verblichenen, den «Deathwatch». Darunter finden sich auch AOL Hometown, Flip.com (eine Sammelalbum-Seite für Teenie-Mädchen mit einst 300’000 Userinnen) und Friendster. «Wie oft wollen wir das noch zulassen?», schrieb ein aufgebrachter Scott nach der Schliessung von AOL Hometown in seinem Blog. Er verglich die verlorenen User-Homepages mit «der Kinderzeichnung eines Truthahns» oder einer «Schneekugel-Sammlung, die auf ein erfülltes Leben verweist ».
Es ist die zutiefst persönliche Art der Daten, die Scott antreibt. In seinen Augen trägt jede gerettete Seite eine einzigartige Handschrift. Unter den geretteten Files von Petsburgh etwa, eine Haustieren gewidmete GeoCities-Unterdomäne, findet sich etwa das digitale Andenken an den Shar-Pei Woodro. Der Hund verlor am 5. Januar 1998 den Kampf gegen den Lungenkrebs. Woodrow mochte wohl den Sänger Jimmy Buffett gern, und so würdigten seine Besitzer sein Leben mit dem Song «Lovely Cruise». Zu Zehntausenden rettet das Archive Team solche Momentaufnahmen aus dem alltäglichen Leben vieler Menschen, die sich zu einem bestimmten Zeitpunkt, an einem bestimmten Ort ausdrückten.
Schon als Kind entdeckte Scott seine Liebe für Elektronik und frühe PCs und als in den 1980er- und 1990er-Jahren das Zeitalter der digitalen Mailbox-Systeme anbrach, war sein Technologie-Fimmel nicht mehr zu bremsen. In den 1990er-Jahren schuf er mit einem Freund das Multiplayer-Abenteuer-Game TinyTIM, heute das älteste noch gespielte Game dieser Art. Zehn Jahre später gründete Scott Textfiles.com, um Textfiles aus den 1980er-Jahren zu erhalten, und damit «die Welt, wie sie damals war mit digitalen schwarzen Brettern und dergleichen». 2009 rief er das Archive Team ins Leben, und seit 2011 ist er offiziell angestellt bei Internet Archive in San Francisco, der Nonprofit-Organisation hinter der Wayback Machine, Open Library und weiteren Initiativen zum Schutz von Online-Medien. Das Archive Team handelt weiterhin unabhängig und hat auch keine rechtlichen Verbindungen zu Internet Archive. Dennoch landen die geretteten Daten ab und zu bei Internet Archive. «Ich wollte den Mann nicht verbürokratisieren», meint Internet Archive-Gründer Brewster Kahle, der Scott geheuert hat. «Uns geht es darum, wie wir eine Freiwilligenorganisation einbinden können, ohne ihre Initiative zu ersticken oder ihr Angst einzujagen.»
Scotts Doppelrolle erlaubt Internet Archive die aggressiveren Methoden von Archive Team punktuell zu nutzen, aber immer mit sicherer Distanz. Die Icons, die neben den jeweiligen URLs im Browser erscheinen, bringen die Unterschiede zwischen den Gruppen auf den Punkt: Beim Internet Archive ist es ein klassischer Tempel, beim Archive Team zeigt eine animierte Hand dem Besucher den Vogel.
Scott wollte für die Recherchen zu diesem Artikel nicht mit mir reden, warum wollte er nicht sagen. Als sich eine weitere Reporterin von Technology Review bei ihm meldete, machte er jedoch in E-mails und Telefongesprächen ausführliche Angaben zu seinem Leben und seiner Arbeit. Jason Scott Sadofsky, wie er mit vollem Namen heisst, ist 41 Jahre alt und geschieden. Er lebt bei der Familie seines Bruders etwa 70 Meilen nördlich von New York City in Hopewell Junction, nahe dem Hudson River. Im «Information Cube», einem Lagercontainer im Hinterhof, stapeln sich seine umfangreichen Sammlungen ausgedienter elektronischer Geräte, Computer-Magazinen und Floppy Discs – quasi die Mitgift seiner Berufung als unabhängiger Computer-Historiker.
2005 produzierte Scott eine fünfstündige Dokumentation über frühe Bulletin Board-Dienste, 2009 sammelte er 26’000 Dollar Spendengeld für die Rettung digitaler Geschichte. Seinen zweiten Dokumentarfilm brachte er 2010 heraus: Get Lamp handelte von textbasierten Computer Games aus den 1980er-Jahren. Gerne verkündet Scott das Wort des Datenerhalts auch an Tech-Konferenzen, wo seine Garderobe sein Retroflair verrät: Seine Präsentationen gibt er in Steampunk-Kostümen, mit Fliegerbrille, Samtjacke und Zylinder. Sein grösstes Publikum findet er bei den 1.5 Millionen Followern seines Twitter Feeds @sockington. Den schreibt er als seine Katze Sockington, die so scheinheilig naïve Kätzchen-Sticheleien absetzt wie: «#occupylitterbox» and «crunked on nip.» Sein Mitstreiter Buie sagt: «Er ist ein 19-Jähriger im Körper eines 40-Jährigen.»
Mit seinem Enthusiasmus für altertümliche Technologien wirkt Scott wie eine Erscheinung aus dem frühen Internetzeitalter, als leidenschaftliche Amateure auf dem WELL plänkelten oder mit den Profis aus Verwaltung und Akademie die technischen Spezifikationen des neuen Mediums in kollaborativen Forschungsarbeiten verhandelten. Die Online-Community war noch klein und gegenkulturell. Das Internet war noch zu unausgereift, um branchenferne Grossinvestoren auf den Plan zu rufen, und so war das Medium in den 1980er-Jahren geprägt von Leuten wie Jason Scott. Der Reiz einer Freiwilligenaktion wie Archive Team liegt darin, dass sie eine Art Zeitmaschine bereit stellt, die einen zurück in eine Online-Welt transportiert, in der es weniger um Geld und mehr um Spass ging.
Kritzeleien und Andenken
Um die Daten auf eingehenden Seiten abzusaugen, benutzt das Archive Team in der Regel ein Webcrawler-Programm wie GNU Wget, das das schnelle Kopieren öffentlich zugänglicher Files ermöglicht. Diese werden dann an Internet Archive zur Aufbewahrung weitergegeben oder auf den gespendeten Servern abgelegt. Der Knackpunkt bei der Sache sei, so Scott, zu wissen wann und wo eine Seite ohne weitere Vorwarnung verschwinden wird. Dies gelang etwa im Fall von Muammar el-Qaddafis Webseite während der Lybischen Revolution. «Es ist eine Kunstform, keine technische Fertigkeit», sagt Scott. Team-Mitglied «Alard» schaffte es, die Seite des verstorbenen Machthabers zu kopieren, inklusive aller Video- und Audio-
files. Dieses Material ist heute für alle frei zugänglich.
Als in Italien Spinder.com die Schliessung der Seite ankündigte, waren mehr als eine halbe Million Seiten in Gefahr. Scott erfuhr durch die Buschtrommeln seines Aktivistennetzes vom bevorstehenden Aus – seine Leute schicken ihm jeweils E-Mails oder Twitter-Nachrichten, oder aber melden die Untergangskandidaten direkt via Archive Team-Wiki. «Die Leute setzten ein Bat-Signal ab», sagt Scott, einen Notruf. Dieser erreichte ihn am 24. November 2011. Gut ein Dutzend Archive Team-Leute schritten ein, «mit rauchenden Kanonen», wie Scott sagt, um möglichst viele der 55 Millionen Seiten zu retten. Zwei Mal brach die Seite während des Überfalls zusammen. Schliesslich gab Splinder dem Druck der wütenden Nutzer nach und vertagte die Schliessung bis zum 31. Januar 2011.
Die nächste Phase einer Archive Team-Mission ist weit weniger prickelnd, als das Ausplündern einer eingehenden Seite – aber genauso wichtig, wenn die ganze Übung einen Nutzen haben soll. Archivaren prüfen, ob die heruntergeladenen Daten intakt sind und verteilen sie zur Ablage. Grössere Sammlungen werden als Torrents via Peer-to-Peer-Dienst BitTorrent zum Download zur Verfügung gestellt, etwa auf thepiratebay.org. Das Archiv von GeoCities war so gigantisch, dass Scott dazu aufrief, ihm alle verfügbaren Terabyte-Harddrives per Post zuzusenden. Nach Gebrauch würde er sie natürlich zurückschicken. Über ein Dutzend Geräte kamen zusammen, um die GeoCities-Daten zu retten.
Um bei Archive Team mitzumachen, brauche es Persönlichkeiten, «die so waghalsig wie methodisch sind », sagt Duncan B. Smith, der als «chronomex» dabei ist. «Die Leute leben für die grossen Kisten, bei denen es darum geht, möglichst breit zu mobilisieren und auf Teufel komm raus aus Websites zu downloaden, die von Arschlöchern betrieben werden. Wenn der Überfall vorbei ist, musst du aufräumen, die Beute einlagern. Du musst deine Daten auf ein zentrales Archiv hochladen, damit sie sortiert werden können. Und je nach dem noch herausfinden, warum deine Daten leicht beschädigt sind. Das ist der langweilige Teil.»
Zur Frage, ob das ungefragte Kopieren von Webseiten-Inhalten legal ist, haben die amerikanischen Gerichte noch keine klare Haltung. Für Andy Sellars, Jurist beim Citizen Media Law Project, zählt es zum «fairen Gebrauch» im Rahmen der bestehenden Urheberrechtsgesetze. Dass die Torrents von Archive Team allerdings keinen Mechanismus vorsehen, der es erlaubt, einzelne Inhalte von der Veröffentlichung auszuklammern, schwäche diese Argumentation, so Sellars. Jonathan Zittrain, Co-Direktor des Harvard’s Berkman Center for Internet and Society, pflichtet ihm bei: «Nimmt man es mit Wortlaut des Urheberrechtsgesetzes genau, dann ist es ein Grenzfall.» Weil das Archive Team jedoch seit Jahren solche Aktionen durchführe, so Zittrain, «wäre es für ein Gericht heute ein radikaler Schritt, dies nun plötzlich zu verbieten. Bald wird es gängige Praxis sein.»
Der Datenschatz
Scotts Aussage, wonach vordergründig alberne oder wertlose Daten ungeahnten kulturellen Wert haben können, lässt sich am ehesten mit den geretteten GeoCities-Seiten untermauern. Das 2010 von Archive Team gerettete Material steht heute frei zur Verfügung. Zu den beeindruckendsten Fundstücken gehört DeletedCity, ein geisterhaftes Videointerface zur Erkundung von GeoCities-Unterkategorien und –inhalten. Auf Mikroebene schaffte es das Archive Team, Inhalte einzelner GeoCities-Nutzer zu bergen, etwa das Fotoarchiv eines Veteranen aus dem Zweiten Weltkrieg. Die Archive Team-Aktivisten speicherten die alten Bilder auf einen USB-Stick und schickten sie der Witwe zu. Phil Forget, ein 26-jähriger Programmierer aus New York, nutzte den GeoCities-Torrent, um seine digitalen Teenie-Erinnerungen zu sichern: Bilder aus dem japanischen Animé Dragonball Z und animierte Karikaturen seiner High School-Lehrer. Sicher, räumt er ein, habe solches Material für ihn keine so wichtige Bedeutung wie die Kriegsfotografien für die Witwe. Völlig trivial sei es aber auch nicht, wie Forget sagt: «Es ist, als ob du bei Mama zu Hause die Kritzeleien auf deinen Schulheften aus der vierten Klasse wiederentdeckst. Du gerätst in diesen Strom der Erinnerungen».
Nach Scotts Ausführungen zur Wichtigkeit eines kollektiven «digitalen Kulturerbes» fühlt sich der Verlust von Seiten wie GeoCities so tragisch an wie der Brand der Bibliothek von Alexandria, ein riesiges Archiv antiker Texte, viele davon einzigartig. (Archive Team führt die Bibliothek scherzhaft im «Deathwatch»: unter URL steht «keine», unter Projektstatus «zerstört».) Über die Haltung, dass die Verse auf Poetry.com gar nicht schützenswert seien, kann Scott nur den Kopf schütteln. Die New York Public Library bewahre schliesslich auch nicht nur wertvolle Bücher auf, sondern auch alte Speisekarten. «Und das hinterfragt niemand», wundert er sich.
Gleich in zwei Datensätzen sieht Scott einen heiligen Gral. Einmal die Archive von Compuserve, eine der grössten Online-Dienstleisterinnen des Dial-Up-Zeitalters, heute längst in AOL aufgegangen. Dann eine frühe Inkarna-tion von MP3.com, wo einst Independent-Musiker ihre Arbeit veröffentlichten. «Ich dreh’ durch, wenn so relevante Kultur einfach weggewischt wird», sagt er. Die Archive von Compuserve und MP3.com liegen wohl irgendwo in Scotts Container und setzen auf Magnetbandspulen Staub an. Manchmal erscheint er mit seiner störrischen Weigerung anzuerkennen, dass Zeit nun mal vergeht und Information durch Entropie abgelöst wird, wie Peter Pan. Dass nun mal nicht alle Daten gerettet werden können, ist für ihn ein so ketzerischer Gedanke, wie dass es vielleicht tatsächlich Daten gibt, die es sich einfach nicht zu speichern lohnt.
Den heutigen Multimillionen-Dollar-Speichern von Nutzerdaten wie Facebook, Google oder Flickr begegnet Scott mit grösster Skepsis. Die Schwesterseite von Archive Teams Deathwatch heisst «Alive …or are they?», und macht überaus deutlich, dass Mark Zuckerberg, Larry Page und Co. bezüglich ihrer Datenethik unter scharfer Beobachtung stehen. Facebook schätzt das
Archive Team als «derzeit stabil» ein, während man hinsichtlich Google argwöhnt: «Die machen dich glauben, sie würden für immer da sein.» Einige Wiki-Einträge bei Archive Team kritisieren Google bereits für die Schlies-sung von Google Labs, einst ein Teil der Seite für experimentelle Projekte. Und auch Googles Vorwarnung, man werde vielleicht nicht alle der hochgeladenen Videos ewig hosten, war schon Thema. «Vertrau nicht darauf, dass dein Zeug in der Cloud sicher ist.»
«Ich kann da sehr gereizt reagieren», sagt Scott. Etwa wenn er dieses Google Ad sieht: «Da speichert eine Familie ihre Videos auf YouTube und ihre Fotos auf Picasa und freut sich darauf, die Erinnerungen eines Tages mit den Kleinen zu teilen. Na ja … nicht wenn du deine Daten bei Google aufbewahrst. Die erwecken zwar den Eindruck, man könne sein Zeug dort ewig lassen. Tatsächlich aber gilt dies nur für beschränkte Zeit.»
Buie, der High-School Senior, gibt zu bedenken, dass das Aufbewahren von alten Daten seinen Zweck erfülle, egal ob jemand sie heute nutzt. «Nimm zum Beispiel das Zeug auf Friendster», sagt er. «Vielleicht guckt sich das bis 2250 keiner an. Aber das ist für mich nicht der Punkt. Worauf es mir ankommt ist, dass Wissen verfügbar ist.» Buie fand beim Archive Team seine Berufung als Hardware-Historiker. Im ganzen Land durchforstete er die «zu gut, um sie wegzuschmeissen»-Deponien nach frühen Computern für seine Sammlung. Nachdem er einen Apple II aufgetrieben hatte, suchte er im Netz nach Ersatzteilen und fand dabei einen Verweis auf die erloschene GeoCities-Seite – so landete er beim GeoCities-Projekt des Archive Team. Nun arbeitet er zusammen mit Scott an der Lösung eines grösseren kulturellen Problems auf dem Internet: «Der Blick ist zu wenig in die Vergangenheit gerichtet », sagt er. «Und wenn du die Vergangenheit vergisst, wird die Zukunft bedeutungslos, weil du nicht mehr weisst, wie du an den Punkt gekommen bist, an dem du gerade stehst.»
Während Scott noch mit maximalem Pomp seine Botschaft verkündet, scheinen sich die grössten Player des Internets bereits in seine Richtung zu bewegen. Als Google das soziale Netzwerk Google+ lancierte, verfügte der Dienst bereits über eine Takeout-Funktion, die Posts verpackt und exportiert. Gmail erlaubte bereits zuvor das Exportieren der Kontakte, was einen allfälligen Host-Wechsel für die Nutzer vereinfacht. «Ich werde nicht ruhen, bis jeder hinterletzte Fötzel deiner Daten über Takeout erhältlich ist», sagt Brian Fitzpatrick, Engeneering Manager bei Google und das personifizierte Bestreben um Datenfreiheit bei der Firma. Google müsse ein ureigenes Interesse daran haben, vertrauenswürdig zu sein, sagt er. «Wir tun das nicht, weil wir nett sind.» Facebook wollte für diesen Text keinen Kommentar abgeben. Doch das Netzwerk bietet nun auch eine dem Takeout ähnliche Funktion an: Mit «Download a Copy» können Fotos, Nachrichten und andere Inhalte einfach anderweitig gespeichert werden.
Scotts Blick ist weiter in die Zukunft gerichtet. Bereits plant er für den Tag, an dem seine wichtigsten Metadaten – das Wissen in seinen Sammlungen – erlischt. «Sterblichkeit», sagt er. «Meine Server sind weit verteilt. Alles, was ich kriege, teile ich so breit wie möglich. Nichts lagert auf einem Harddrive, der im Haus eines einzelnen Typen rumliegt.»
Von Matt Schwartz, Mitarbeit: Eva Talmadge
Aus dem Englischen übersetzt von Yvonne Kunz