In den letzten drei Wochen hat die neue US-Regierung unter Donald J. Trump Tausende von Regierungsseiten im Internet zu Themen wie öffentliche Gesundheit, Environmental Justice und Forschung vom Netz genommen. Die massenhaften Sperrungen gehen auf den offiziellen Plan der Biden-Nachfolgeadministration zurück, staatliche Veröffentlichungen zu Themen wie Diversity und, wie die Regierung sagt, „Gender-Ideologie“ zu löschen. Dazu gehört auch eine Überprüfung der aktuellen Praxis zahlreicher staatlicher Stellen auf dem Gebiet DEI (Diversity, Equity, Inclusion).

„So etwas haben wir noch nie erlebt“

Beispielsweise wurde die Website der Entwicklungshilfeorganisation USAID abgeschaltet. Das gilt auch für verwandte Websites wie „childreninadversity.gov“ sowie für Tausende von Seiten der amerikanischen Statistikbehörde, der Seuchenschutzbehörde Centers for Disease Control and Prevention (CDC) und des sogenannten Office of Justice Programs. „So etwas haben wir noch nie erlebt“, meint David Kaye, Rechtsprofessor an der University of California in Irvine und ehemaliger UN-Sonderberichterstatter für Meinungs- und Äußerungsfreiheit. „Ich glaube nicht, dass irgendjemand wirklich genau weiß, was hier gerade passiert. Was wir öffentlich sehen, ist, dass bestehende Regierungswebsites abgeschaltet werden, darunter Datenbanken von wesentlichem öffentlichem Interesse. Eben auch die gesamte Website von USAID.“

Doch während die Internetangebote von Regierungsbehörden verschwinden, versuchen verschiedene Organisationen im Hintergrund, so viele Daten und Informationen wie möglich zu archivieren, bevor sie endgültig zerstört werden. Die Hoffnung ist dabei, eine Aufzeichnung der verloren gegangenen Daten zumindest für Forscher:innen und Historiker:innen zu erstellen, die diese dann in Zukunft nutzen könnten. Die Archivierung von Daten gilt im Allgemeinen als ein Thema von überparteilichem Interesse, egal ob bei der demokratischen oder der republikanischen Partei. Aber die jüngsten Maßnahmen der Trump-Regierung hätten Beobachter:innen auf beiden Seiten geschockt, hieß es. „Ich betrachte das Vorgehen der derzeitigen Regierung als Angriff auf den gesamten Wissenschaftsbetrieb“, sagt etwa Margaret Hedstrom, emeritierte Professorin für Informationswissenschaften an der University of Michigan.

Aktivisten versuchen jetzt, so viele Daten zu retten wie möglich. Eines der größten Projekte ist das End of Term Web Archive (EoT), ein überparteilicher Zusammenschluss verschiedenster Organisationen, der sich zum Ziel gesetzt hat, am Ende jeder Amtszeit eines US-Präsidenten eine Kopie möglichst aller öffentlichen Regierungsdaten zu erstellen. Das EoT-Archiv ermöglicht es Einzelpersonen zudem, bestimmte Websites oder Datenbanken für die Erhaltung vorzuschlagen.

Nach der Löschung durch die US-Regierung: So viel wie möglich speichern

„Alles, was wir tun können, ist, zu sammeln, was veröffentlicht wurde, es zu archivieren und dafür zu sorgen, dass es für die Zukunft öffentlich zugänglich bleibt“, sagt James Jacobs, Bibliothekar mit Spezialgebiet Regierungsdaten an der Stanford University, die das EoT-Archiv mitbetreibt. Andere Organisationen gehen bei der Datenerfassung einen anderen Weg. So versucht beispielsweise das Open Environmental Data Project (OEDP), Daten im Zusammenhang mit Klimawissenschaft und Environmental Justice zu erfassen. „Wir versuchen zu verfolgen, was gelöscht wird“, sagt Katie Hoeberling, Direktorin für politische Initiativen des OEDP. „Ich kann nicht mit Sicherheit sagen, wie viel von dem, was früher online war, immer noch online ist, aber wir sehen, besonders in den letzten Wochen, dass immer mehr Daten gelöscht werden.“

Das OEDP verfolgt nicht nur, was passiert, sondern sichert auch aktiv relevante Daten. Mit diesem Prozess wurde bereits im November begonnen, um die vorhandenen Informationen zum Ende der Amtszeit des ehemaligen Präsidenten Biden zu erfassen. In den letzten Wochen wurden die Bemühungen intensiviert. „Vor der Amtseinführung war alles viel ruhiger“, sagt Cathy Richards, technische Expertin beim OEDP. „Am zweiten Tag der neuen Regierung fiel eine erste zuvor vorhandene Plattform aus. In diesem Moment wurde allen klar: Oh nein, wir müssen weitermachen, und wir müssen durch die Liste der Datensätze arbeiten.“

„Unersetzliche Bestände an wichtigen Klimainformationen“

Dieser Job ist wichtig, sagt Richards, denn die US-Regierung verfüge über unschätzbar wertvolle internationale und nationale Daten zum Thema Klima. „Es handelt sich um unersetzliche Bestände an wichtigen Klimainformationen“, meint auch Lauren Kurtz, Geschäftsführerin des Climate Science Legal Defense Fund. „Wenn man daran herumfuhrwerkt oder sie gar löscht, bedeutet das den unersetzlichen Verlust von wichtigen Informationen. Das ist wirklich tragisch.“

Wie die OEDP versucht auch die Catalyst Cooperative sicherzustellen, dass Daten zu den Themen Klima und Energie gespeichert werden und für Forscher:innen zugänglich bleiben. Beide Projekte gehören zu den Public Environmental Data Partners, einem Zusammenschluss von Organisationen, die sich für den Erhalt von Umweltdaten auf US-Bundesebene einsetzen. „Wir haben versucht, jene Datensätze zu identifizieren, von denen wir wissen, dass unsere Community sie nutzt, um Entscheidungen darüber zu treffen, wo Strom herkommen sollte, oder um Entscheidungen bei der Widerstandsfähigkeit in unserer Infrastrukturplanung zu treffen“, sagt Christina Gosnell, Mitbegründerin und Präsidentin von Catalyst Cooperative.

Die Archivierung ist eine schwierige Aufgabe. Es gibt keine einfache Möglichkeit, einfach alle Daten der US-Regierung zu speichern. „Verschiedene Bundesbehörden handhaben die Aufbewahrung und Archivierung auf unterschiedlichste Weise“, weiß Gosnell. Es gibt auch niemanden, der eine vollständige Liste aller existierenden Regierungswebsites besitzt. Dieses Sammelsurium bedeutet, dass Archivare neben dem Einsatz von Webcrawlern, also schlichten Tools zur Erfassung von Momentaufnahmen von Websites und Daten, oft noch manuell Daten abrufen müssen. Außerdem ist ein Datensatz manchmal hinter einer Anmeldemaske oder einem Captcha-Schutz gegen Roboter versteckt, um zu verhindern, dass Scraper-Tools die Daten auslesen – dabei ist das zur Rettung unerlässlich. Solche Scraper übersehen manchmal auch wichtige Funktionen einer Website. Zum Beispiel haben diese oft viele Links zu anderen Informationen, die nicht erfasst werden. Oder das Scrapen funktioniert einfach nicht, weil es mit der Struktur der Website zu tun hat. Daher ist die Anwesenheit einer Person, die die Arbeit der Software nachprüft oder die Daten manuell nachträgt, oft die einzige Möglichkeit, um sicherzustellen, dass alle Informationen korrekt erfasst werden.

Und es stellt sich die Frage, ob das Scrapen der Daten wirklich ausreichen wird. Die Wiederherstellung von Websites mit komplexen Datensätzen ist oft kein einfacher Prozess. „Es wird außerordentlich schwierig und kostspielig, alle Daten zu retten und zu bergen“, sagt Hedstrom. „Es ist so, als würde man einen Körper ausbluten lassen und erwarten, dass er weiter funktioniert. Reparatur- und Wiederherstellungsversuche sind manchmal unmöglich, wenn wir kontinuierlich Daten auslesen müssten.“

All diese Archivierungsarbeiten sind ein vorübergehendes „Pflaster“, meint Gosnell. „Wenn Informationen einmal entfernt sind und nicht mehr aktualisiert werden, werden unsere archivierten Daten mit der Zeit immer veralteter und damit ineffektiver für die Entscheidungsfindung.“ Diese Auswirkungen können lang anhaltend sein. „Man wird die Auswirkungen erst in zehn Jahren spüren, wenn man feststellt, dass vier Jahre an Daten fehlen“, sagt Jacobs vom EoT-Archiv.

Viele der digitalen Archivaktivisten betonen, wie wichtig es ist, die Vergangenheit zu verstehen. „Wir können da an unsere eigenen Familienfotos denken, die an uns weitergegeben wurden, und daran, wie wichtig diese und andere Dokumente sind“, sagt Trevor Owens, Chief Research Officer am American Institute of Physics und ehemaliger Direktor für digitale Dienste an der Library of Congress. Diese Verbindungskette zur Vergangenheit sei wirklich wichtig. „Es ist unsere Bibliothek, es ist unsere Geschichte“, sagt Richards. „Und die Informationen wurden von uns Steuerzahlern finanziert, also wollen wir auf keinen Fall, dass dieses Wissen verloren geht, obwohl wir es aufbewahren, speichern, potenziell etwas damit machen und weiter daraus lernen könnten.“

Dieser Artikel stammt von Scott J Mulligan. Er ist KI-Reporter bei der US-amerikanischen Ausgabe von MIT Technology Review und schreibt über die Bereiche Politik, Regulierung und die technischen Grundlagen.

