Wie ein Schwede 10.000 Wikipedia-Artikel am Tag schreibt
Besonders fleißig ist er beim Katalogisieren obskurer Tierarten, darunter Schmetterlinge und Käfer und bei Porträts von Städten auf den Philippinen. Etwa ein Drittel seiner Einträge stellt er auf der schwedischsprachigen Variante von Wikipedia ein, den Rest in zwei Versionen von Filipino – eine davon die Muttersprache seiner Frau. Der Verwaltungsbeamte kann Abschlüsse in Linguistik, Bauingenieurwesen, Wirtschaft und Teilchenphysik vorweisen. Er sei schon lange am „Ursprung von so ziemlich allem“ interessiert, berichtet er.„Es gibt eine lautstarke Minderheit, denen das nicht gefällt.“
Doch mit seinen Methoden hat er sich bei Wikipedia-Puristen unbeliebt gemacht. Denn der Großteil seiner Einträge wurde von einem automatisierten Softwareprogramm, einem sogenannten Bot, verfasst. Kritiker monieren, dass Bots die Kreativität verdrängen, zu der nur Menschen fähig sind.
Johanssons Programm durchforstet Datenbanken und andere digitale Informationsquellen und baut daraus Artikel. An einem guten Tag könne sein „Lsjbot“ bis zu 10.000 neue Einträge verfassen. Jeder registrierte Nutzer darf auf Wikipedia Artikel verfassen. Johansson muss daher nur eine verlässliche Datenquelle finden, ein passendes Muster für das Thema anlegen und dann seinen Bot starten. Die Software sucht nach den Informationen und veröffentlicht sie dann auf Wikipedia.
Bots werden schon lange eingesetzt, um Wikipedia-Artikel zu verfassen und zu bearbeiten. Doch seit einiger Zeit stammen immer mehr neue Einträge aus der Feder dieser Programme. Ihr Einsatz wird von einer Nutzergruppe, der „Bot Approvals Group“, überwacht.
Johansson und weitere Bot-Anhänger stoßen aber immer wieder auf Ablehnung in der Wikipedia-Gemeinde. „Es gibt eine lautstarke Minderheit, denen das nicht gefällt“, sagte Johansson kürzlich bei einem Vortrag. Trotzdem kämpft er weiter.
Umstrittene Hilfsprogramme
„Ich tue das, um im Internet absolute Demokratie zu schaffen“, sagt er beim Interview in seinem Büro an der Universität von Dalarna. Wikipedia solle irgendwann einmal jedem die Informationen über alles liefern können. Sein Bot, an dem er Monate gearbeitet hat, sei ein Schritt in diese Richtung – selbst wenn dieser nur rudimentäre Kurzeinträge, sogenannte Stubs, verfasst.
Achim Raschka ist einer der Gegner von Johansson. Der 41-jährige Deutsche schreibt oft tagelang an Artikeln über eine einzelne Pflanzenart. „Ich bin im Allgemeinen gegen die Produktion von botgenerierten Stubs“, sagt er. Johanssons Programm stelle Quantität über Qualität und „hilft den Lesern und Nutzern der Wikipedia nicht“.
Raschka sagt, die Einträge „enthalten nur mehr oder weniger korrekte taxonomische Informationen, nicht wie das Tier aussieht und andere wichtige Dinge“. Andere äußern sich in öffentlichen Foren ähnlich. Sie vergleichen Johansson mit dem „Rambot“, ein automatisiertes Programm, das rudimentäre Informationen zu US-Städten und Landkreisen in Artikel verpackt.
Wikiepedia ist eine von ihren Nutzern in Gemeinschaftsarbeit verfasste Online-Enzyklopädie. Hinter ihr steckt die gemeinnützige Wikimedia-Stiftung. Die 30 Millionen Artikel in 287 Sprachen wurden allesamt von Freiwilligen geschrieben. Ein Vertreter der Stiftung antwortete nicht auf Kommentaranfragen.
Johansson gibt zu, dass die Artikel seines Lsjbot langweilig sein können. Dennoch seien sie wertvoll. Ein Beispiel sei der schwedische Eintrag für Basey, eine Stadt mit 44.000 Einwohnern auf den Philippinen. Er enthält Koordinaten, Angaben zur Bevölkerung und andere Details. Oben auf der Seite steht ein Hinweis, dass der Artikel mit Hilfe von Lsjbot verfasst wurde.
Tet-Offensive statt Tolkien
Als der Taifun Yolanda im vergangenen Jahr über Südostasien wütete, war in Zeitungsartikeln zu lesen, dass es in Basey Tote gab. Dank der Artikel von Johansson gab es Informationen zur Lage, Anfahrt und Bilder der Stadt. Außerdem, so sagt Johansson, könnten andere Autoren, die über mehr Fachwissen verfügen, später zusätzliche Informationen hinzufügen.„Ich habe nichts gegen Tolkien und kenne mich mehr mit der Schlacht gegen Sauron als mit der Tet-Offensive aus. Aber ist das eine ausgewogene Enzyklopädie?“
Bots sind zwar schnell und weitgehend genau – aber Fehler können trotzdem passieren, sagt Johansson. Zum Beispiel verarbeite seine Software nur Informationen in lateinischen Buchstaben. Als für ein Projekt Bilder von Vögeln benötigt wurden, griff der Bot auf die russische Version der Bilddatenbank Wikimedia Commons zu. Weil der Lsjbot damals aber kein Russisch sprach, machte er Fehler. Später änderte Johansson die Programmierung, um das zu verhindern.
Aktuell kommen die dankbarsten Themen für Bots aus dem technischen Bereich, von chemischen Elementen bis hin zu astronomischen Körpern. Helfen können sie auch bei einer Ausweitung eines Themas, etwa im Tierreich. Denn während es zahlreiche Artikel zu Tigern und Elefanten gibt, sind Würmer und Insekten unterrepräsentiert, erklärt Johansson.
Mit der Dokumentation vergleichsweise obskurer Fakten will er eines der seiner Ansicht nach größten Probleme von Wikipedia angehen. Viele Artikel seien von männlichen, weißen „Nerds“ verfasst. Auf der schwedischen Wikipedia zum Beispiel gebe es über 150 Artikel über Figuren aus dem „Herrn der Ringe“, aber weniger als zehn über Persönlichkeiten aus dem Vietnamkrieg. „Ich habe nichts gegen Tolkien, und ich kenne mich auch mehr mit der Schlacht gegen Sauron als mit der Tet-Offensive aus. Aber ist das wirklich eine ausgewogene Enzyklopädie?“
Johansson glaubt, sein Bot könne künftigen Autoren als Inspiration dienen, die über mehr Wissen als die üblichen Wikipedia-Nutzer verfügten. Ein Computerprogramm könne nicht über alles schreiben. „Wikipedia braucht auch Autoren, die Stimmungen beschreiben, literarische Qualität, diese Dinge – mein Bot wird das niemals können.“
Es gibt durchaus auch Leute, die seine Mission schätzen. Lennart Gulbrandsson, Wikipedia-Vertreter in Schweden sagt: „Sverkers Arbeit hat ihren Wert bewiesen.“ Viele Skeptiker seien bekehrt worden. Doch Johansson macht es immer noch traurig, dass er weiter kritisiert wird. „Es betrübt mich, dass einige LSJbot nicht als würdigen Autoren betrachten. Ich bin eine Person, ich habe den Bot geschaffen. Ohne meine Arbeit hätten all diese Artikel nie existiert.“
Mehr Technologie-News auf wsj.deVon Ellen Emmerentze Jervell
Ursprünglich publiziert bei wsj.de.
Kritik ist ja schön und gut, aber den Punkt sollten Leute, die die mangelnde Kreativität oder aber Bot-generierten Content „aus Prinzip“ ablehnen eventuell etwas offener betrachten:
„Außerdem, so sagt Johansson, könnten andere Autoren, die über mehr Fachwissen verfügen, später zusätzliche Informationen hinzufügen.“
Was spricht denn dagegen Bot-generierte Stubs die einem nicht gefallen einfach mit „Leben“ zu füllen? Abschnitte die einem nicht passen zu überarbeiten? Oder einfach ein Thema „von Grund auf neu“ schreiben, wenn einem die Stubs nicht passen/die eigene Kreativität einschränken?
Menschen nicht unter die Kraft, schreiben 10.000 Artikel in den Tag. Der bot kann.
Für mich ist der entscheidende Punkt der bereits angesprochene: Vorhandene Stubs sind für Wikipedia Laien, aber eben mit entsprechenden Kenntnissen deutlich leichter zu bearbeiten, d.h. zu ergänzen, als sich komplett neue Artikel anlegen lassen, die dann auch noch mehrfach geprüft werden – So machen QS und die Prüfung auf mögliche Redundanzen so manche mehrstündige Arbeit zu Nicht.
Alter Schwede ;-) die Mühe wird nicht belohnt.
Ich finde auch, dass so ein Bot sehr gut die Grundlagen zu einem noch nicht existierenden Artikel erstellen kann. Das Finetuning kann dann weiterhin von begabten und engagierten Schreibern erfolgen.
Wo ist da das Problem?
Ich habe normalerweise Bedenken hinsichtlich (halb-)automatisch erzeugter Inhalte. Aber faktisch korrekte Stubs sind doch gerade für technisch weniger versierte Anwender ein hervorragender Ausgangspunkt.
Dass das aber einem deutschen Mod/Autor nicht passt, entspricht meinem Bild von de.wikipedia.org. Da sitzen (vorsichtig formuliert) ein paar Leute auf sehr hohen Rössern. Relevanz ist alles, und neue Autoren und Artikel werden gerne schnell wieder herausgekegelt. Man bleibt offensichtlich gerne unter sich. Ich mache da seit Jahren nichts mehr außer dem Korrigieren von Rechtschreibfehlern. Man fühlt sich als Depp, wenn man zum Beispiel einen Artikel über eine beliebte Textverarbeitung für OS X geschrieben hat und die 24 Stunden später spurlos verschwunden ist, weil der Zuständige sie nicht auf seinem Radar hat.