Bevor es Twitterthreads, Redditforen und Facebookgruppen gab, gab es das Usenet. Ein Internet noch vor dem World Wide Web, wo Nutzer sich – ähnlich heutiger Messageboards – zu bestimmten Themen austauschen konnten. Gelauncht wurde das Usenet 1980 – dahinter steckten zwei Studierende der Duke University. Für sie war das Projekt ein Weg, zwischen dezentralisierten, lokalen Servern zu kommunizieren. Es ist bis heute aktiv. Usenet-User unterhalten sich dort über alles Mögliche: Nanotechnologie, Trash-TV, Wein und Außerirdische. Jozef Jorosciak, der Entwickler hinter dem Usenet-Archiv, kam erstmals 2000 damit in Berührung – er fand über eine dort geschaltete Stellenanzeige einen Job.
Hintergrund
Anfang Oktober hat Jarosciak unter usenetarchives.com 2,1 Millionen der ältesten Usenet-Posts erstmal durchsuchbar gemacht. Sie entstammen Henry Spencers Utzoo-Netnews-Archiv. Während seiner Tätigkeit an der Universität Toronto betrieb Spencer, Informatiker und Regex-Erfinder, 1981 die erste aktive Usenet-Site außerhalb der USA. Die rund 2,1 Millionen Posts entstanden zwischen 1981 und 1991. Erstellt wurden sie größtenteils von Universitätsangestellten – Menschen, die zu dieser Zeit bereits Zugang zum Internet genossen.
Um sie für die Nachwelt zu erhalten, speicherte Spencer deren Inhalte auf 141 Magnetbändern. Zusammen mit enthusiastischen Mitstreitern konvertierte er deren Inhalte später zu einem Format namens .TAR, um sie einem breiteren Publikum zugänglich zu machen.
Von Magnetbändern zur PostgreSQL-Database
Jorosciak fand einen Weg, das gesamte Utzoo-Netnews-Archiv zu downloaden. In einem Blogpost beschreibt er, wie er die Sammlung mithilfe von Python 3.8 anschließend zu einer durchsuchbaren PostgreSQL-Datenbank konvertierte, zu finden unter usenetarchives.com. Neben den Parsern für das Utzoo-Magnetbandarchiv entwickelte er dabei auch gleich Konverter in PHP, JavaScript, Java und Python, zu finden über sein GitHub-Nutzerprofil.
Der Entwickler beschreibt die Website als eine Alternative zu Google Groups, wo ebenfalls Newsgroups wie das Usenet archiviert sind. Das Utzoo-Netnews-Archiv ist dabei nur ein Teil des viel größeren Projekts. Zum jetzigen Zeitpunkt beinhaltet das Archiv nach eigenen Angaben bereits 317 Millionen Post aus 10.000 Usenet-Newsgruppen, diese Zahl könnte laut Jarosciak auf bis zu eine Milliarde anwachsen.
Fenster in die Frühzeit des Internets
Mit dem Projekt wollte der Entwickler diesen Schatz an historischen Inhalten aus den frühen Tagen des Internets einer größeren Allgemeinheit zugänglich machen. Dem Magazin Vice sagte er: „Es macht einfach Spaß, diese Posts zu lesen. Und noch viel wichtiger: Sie sind ein Zugang zur Gedankenwelt der frühen Internetnutzer und den Anfangstagen des Internets selbst.“