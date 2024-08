KI-Modelle werden gerne an der Wikipedia trainiert – doch was sind die Folgen? (Symbolbild: Midjourney / t3n)

Selena Deckelmann hatte noch nie Angst vor Menschen im Internet. Mit einem Fernsehmechaniker und CB-Funk-Enthusiasten als Großvater und einem Rohrschlosser als Stiefvater wuchs sie mit Problemlösungen durch Gespräche und Basteleien auf. Als Studentin entdeckte sie in den 1990ern mit Linux eines der ersten Open-Source-Betriebssysteme für sich. Sie fühlte sich in der Online-Community gleich zu Hause und wechselte ihr Hauptfach von Chemie zu Informatik.

Anzeige Anzeige

Heute, nach fast drei Jahrzehnten in der Open-Source-Szene, ist Deckelmann Chief Product and Technology Officer (CPTO) bei der Wikimedia Foundation, jener gemeinnützigen Organisation, die Wikipedia hostet und verwaltet. Dort managt sie nicht nur eine der meistgenutzten Informationsquellen der Welt. Sie betreut auch eine riesige Gemeinschaft von „Wikipedianern“: Hunderttausende Menschen, die ihre Freizeit mit dem Schreiben, Bearbeiten und Diskutieren von Einträgen in mehr als 300 Sprachen verbringen. Sie haben Wikipedia zu dem gemacht, was es heute ist.

Dieser Text ist zuerst in der Ausgabe 4/2024 von MIT Technology Review erschienen. Darin beschäftigen wir uns damit, wie wir uns besser für Katastrophen wappnen können. Hier könnt ihr die TR 4/2024 bestellen.

Wikipedia als ergiebige Quelle für Sprachmodelle

Als sie im Sommer 2022 die neu geschaffene Stelle des CPTO antrat, ahnte Deckelmann nicht, dass sich der Wettlauf um die Entwicklung generativer KI nur wenige Monate später rasant beschleunigen würde. Mit OpenAIs ChatGPT und anderen großen Sprachmodellen sowie milliardenschweren finanziellen Förderungen wurde 2023 zum Jahr der Chatbots. Und da diese Modelle haufenweise billige (vorzugsweise sogar kostenlose) Inhalte benötigen, um zu funktionieren, nutzten sie zig Millionen Wikipedia-Artikel als ergiebige Quelle.

Anzeige Anzeige

Wer sich mit dem Internet beschäftigt, weiß natürlich, dass Bots und Bot-Entwickler Wikipedia nutzen, um ihre Wissenssammlungen zu erweitern. In den 23 Jahren ihres Bestehens ist Wikipedia zu einer der vertrauenswürdigsten Informationsquellen geworden. Doch seit sich KI-generierte Texte und Bilder im Internet verbreiten, muss sich Deckelmann mit einer existenziellen Frage für Wikipedia auseinandersetzen: Wie kann das Open-Source-Ethos der Seite die kommende Contentflut überleben?

Fokus Mensch und Nachhaltigkeit

Deckelmann argumentiert, dass Wikipedia eine noch wertvollere Ressource werden wird, da differenzierte, menschliche Perspektiven online immer schwerer zu finden seien. Bei der Wikimedia Foundation ist alles – von der langfristigen Ausrichtung des Produkts bis hin zu den Details der ersten Neugestaltung seit Jahrzehnten – offen für das öffentliche Feedback der riesigen und lautstarken Wikipedia-Gemeinschaft. Daher sei es erforderlich, sich auf das Herzstück von Wikipedia zu konzentrieren: die Wikipedianer, die ehrenamtlich ihre Zeit und Sorgfalt einsetzen, um die Informationen auf dem neuesten Stand zu halten – unter anderem ganz altmodisch durch den Austausch miteinander und durch die Herumbastelei am Artikel.

Anzeige Anzeige

Deckelmann und ihr Team haben sich einer KI-Strategie verschrieben, bei der die Entwicklung von Werkzeugen für Mitwirkende, Redakteure und Moderatoren im Vordergrund steht, um ihre Arbeit schneller und einfacher zu machen. Zugleich experimentieren sie außerhalb der Plattform mit KI und holen dazu laufend Rückmeldungen aus der Community ein. „Meine Aufgabe ist es, das Augenmerk auf die Nachhaltigkeit und die Menschen zu richten“, sagt Deckelmann. „Wie machen wir ihr Leben tatsächlich besser, wenn wir mit einer coolen Technologie herumspielen?“

„Nachhaltigkeit“ ist Deckelmann ein dringendes Anliegen im Open-Source-Bereich. Wenn komplexe Dienste oder ganze Plattformen wie Wikipedia von Freiwilligen mit begrenztem Zeitbudget abhängen, erhalten diese möglicherweise nicht die Unterstützung, die sie brauchen, um weiterzumachen und diese Projekte am Leben zu erhalten. Der Aufbau nachhaltiger Systeme, die hier weiterhelfen, ist seit Jahren Deckelmanns persönliche Leidenschaft.

Anzeige Anzeige

Motivation ist der Schlüssel

Und Deckelmann sieht in der KI-Entwicklung ein Nachhaltigkeitsproblem: Die Trainingsmethode für Modelle besteht meist darin, Inhalte von Websites wie Wikipedia zu ziehen, die oft von Open-Source-Autoren ohne Entlohnung oder manchmal sogar ohne das Bewusstsein, wie ihre Arbeit verwendet wird, erstellt werden. „Wenn die Leute nicht mehr motiviert sind“, warnt sie, „entweder weil sie denken, dass diese Modelle nichts zurückgeben, oder weil sie einen großen Wert für eine sehr kleine Anzahl von Leuten schaffen – dann ist das nicht nachhaltig.“

Mit ihrer KI-Strategie möchte Deckelmann die Mitwirkenden nun durch die neue Technologie gezielt unterstützen, anstatt sie zu ersetzen. Die Teams für maschinelles Lernen und Produkte arbeiten an der Einführung neuer Funktionen, die zum Beispiel ausführliche Debatten auf den „Talk“-Seiten eines Wikis automatisiert zusammenfassen – mit Diskussionen, die bis zu 20 Jahre in der Vergangenheit liegen können. Oder sie schlagen verwandte Links vor, wenn Redakteure Seiten aktualisieren. „Wir suchen neue Möglichkeiten, wie wir Freiwilligen viel Zeit sparen können, indem wir Texte zusammenfassen, Vandalismus erkennen oder auf verschiedene Arten von Bedrohungen reagieren“, sagt sie.

Leser:innen auf Wikipedia halten

Die Produkt- und Technikteams bereiten sich aber auch auf eine mögliche Zukunft vor, in der Wikipedia seine Leser angesichts der aktuellen Trends möglicherweise anderswo im Internet treffen muss. Zwar haben sich die Besucherzahlen von Wikipedia während des kometenhaften Aufstiegs von ChatGPT nicht wesentlich verändert. Doch die Seite verzeichnete in den letzten zehn Jahren einen allgemeinen Rückgang der Besucherzahlen, der auf die ständigen Such-Updates von Google und auf das Onlineverhalten jüngerer Generationen zurückzuführen ist.

Anzeige Anzeige

Deckelmanns Team untersucht in einem Projekt, wie die Wikimedia Foundation ihre Wissensdatenbank als Service für andere Plattformen anbieten könnte – und startete im Juli 2023 ein KI-Experiment: ein Plug-in für die ChatGPT-Plattform, das es dem Chatbot ermöglicht, die aktuellsten Informationen aus Wikipedia zu nutzen und zusammenzufassen. Die Ergebnisse werden gerade ausgewertet. Laut Deckelmann ist allerdings noch lange nicht klar, ob und – wenn ja – wie die Nutzer von Wikipedia außerhalb der Plattform interagieren wollen. Sie hat mehrere Treffen mit führenden Vertretern aus den Bereichen Open-Source-Technologie, Forschung, Wissenschaft und Industrie anberaumt, um Möglichkeiten der nachhaltigen Zusammenarbeit mit KI und Lösungen für heikle Fragen zu diskutieren. Ein erstes Gespräch fand bereits im Februar statt.

Während die Tech-Industrie aus dem KI-Hype Kapital schlagen will, ist es Deckelmanns Ziel, Wikipedia auf den neuesten Stand zu bringen und gleichzeitig das komplexe menschliche Ökosystem zu unterstützen, das es so besonders macht. „Ich möchte dazu beitragen, dass Wikipedia noch eine lange Zeit bestehen kann.“ Für den Rest, glaubt sie, werden die Menschen im Internet schon sorgen.

Autorin dieses Textes ist die US-Journalistin Rebecca Ackermann aus San Francisco.