Suchmaschinen im Umbruch: Warum KI neue Spielregeln erfordert

MIT Technology Review Kommentar

Firmen wie OpenAI wollen mittels großer Sprachmodelle die Online-Suchmaschinen umkrempeln. Das Problem neben Halluzinationen: das Ende zentraler Geschäftsmodelle. Aber es könnte auch zur Chance werden, den Inhaltevertrieb neu zu regeln, sagt unser Autor.

Von MIT Technology Review Online

09.11.2024, 06:30 Uhr • 8 Min.

Suchmaschinen im Umbruch: Warum KI neue Spielregeln erfordert — Stephanie Arnett/MIT Technology Review

Ende Oktober reichte das Medienunternehmen News Corp eine Klage gegen die Firma Perplexity AI ein, eine der beliebtesten KI-Suchmaschinen. Auf den ersten Blick mag der Rechtsstreit wenig spannend erscheinen, schließlich reiht sich die Klage in mehr als zwei Dutzend ähnliche Fälle ein, in denen Inhalteanbieter für die Nutzung ihrer Daten entschädigt werden möchten. Doch dieser spezielle KI-Streit ist anders – und er könnte der bislang folgenreichste von allen sein.

Auf dem Spiel steht die Zukunft des Web, denn es geht um Chatbots, die Informationen aus dem gesamten Internet zusammenfassen. Wenn man von ihrer wachsenden Beliebtheit ausgeht, könnten diese KI-gestützten „Antwortmaschinen“ traditionelle Suchmaschinen als unseren Standardzugang zum Internet ersetzen. Während gewöhnliche Chatbots Informationen, die sie beim Training gelernt haben, – nicht selten unzuverlässig – reproduzieren, zielen KI-Suchwerkzeuge wie Perplexity, Googles AI Overviews oder das neue SearchGPT von OpenAI darauf ab, Informationen von Websites Dritter erst abzurufen und dann neu zu verpacken. Sie geben den Nutzern eine kurze Zusammenfassung mitsamt Links zu einer Handvoll Quellen zurück, die von Forschungsarbeiten über Wikipedia-Artikel bis hin zu YouTube-Transkripten reichen. Das KI-System übernimmt dabei das Lesen der Informationen und deren Beschreibung, aber die Informationen kommen von außerhalb.

Sprachmodelle bedrohen die digitale Wirtschaft

Im besten Fall kann eine solche KI-Suche die Absichten eines Benutzers besser ableiten, um qualitativ hochwertige Inhalte zu erweitern und Informationen aus verschiedenen Quellen zusammenzuführen. Sobald ein solches System basierend auf großen Sprachmodellen jedoch zu unserem primären Portal ins Netz wird, droht sie, eine sowieso schon prekäre digitale Wirtschaft zu zerstören. Die Produktion von Online-Inhalten hängt heute von einer Reihe erstaunlich fragiler Komponenten ab, die an den virtuellen Besucherverkehr gebunden sind: Anzeigen, Abonnements, Spenden, Verkäufe oder eine Markenpräsenz gehören dazu. Durch die Abschirmung der Angebote hinter einem allwissenden Chatbot könnte die KI-Suche den Urhebern die Besucher:innen bis hin zur gesamten Aufmerksamkeit entziehen, die sie zum Überleben benötigen.

Und wenn die KI-Suche dieses Ökosystem aufbricht, ist es unwahrscheinlich, dass das geltende Recht hilft. Viele Regierungen sind zwar bereits der Ansicht, dass Rechteinhaber den Kürzeren ziehen könnten – und versuchen, die Wertschöpfung im Netz auf andere Weise zu regulieren. Das Problem: Die drohenden Maßnahmen sind vermutlich unwirksam, kommen nur wenigen zugute und behindern den freien Fluss der Ideen im Netz. Entsprechend sollten die KI-Firmen selbst dieses enge Zeitfenster nutzen, um einen intelligenteren Marktplatz für Inhalte aufzubauen.

Urheberrecht ist keine Lösung für die Zerstörung durch die KI-Suche

News Corp, dem etwa das Wall Street Journal, die Times of London oder die Sun gehört, argumentiert, dass die Verwendung seiner Inhalte zur Gewinnung von Informationen für die KI-Suche eine Urheberrechtsverletzung darstellt, und behauptet in seiner Klage, dass Perplexity AI [mit uns] „um Leser konkurriert und gleichzeitig Trittbrettfahrer bei den Verlagen ist“. Diese Ansicht wird wohl auch von der New York Times geteilt, die Mitte Oktober ein Mahnschreiben mit der Aufforderung zur Unterlassung an Perplexity AI sandte.

Empfehlungen der Redaktion

MIT Technology Review Kommentar

KI-Suchmaschine: SearchGPT ist auch nur ein Bluff

News

ChatGPT Search startet: Wie die KI-Suchmaschine funktioniert und wie du sie nutzen kannst

MIT Technology Review Kommentar

Künstliche Intelligenz und Kernenergie: Warum wir den Hype um KI kritisch hinterfragen sollten

In mancher Hinsicht sind die Argumente gegen die KI-Suche stichhaltiger als das Klagen gegen das KI-Training an sich. Beim Training haben Inhalte den größten Einfluss, wenn sie nicht herausstechen und eher repetitiv sind; ein KI-Modell lernt verallgemeinerbare Verhaltensweisen, indem es wiederkehrende Muster in riesigen Datensätzen erkennt. Der Beitrag einzelner Inhalte ist somit begrenzt. Bei der KI-Suche haben Originalinhalte hingegen den größten Einfluss, wenn sie neu oder unverwechselbar sind oder wenn der Ersteller eine einzigartige Autorität auf einem Gebiet besitzt. Denn die KI-Suche zielt darauf ab, bestimmte Merkmale aus den zugrunde liegenden Daten zu reproduzieren, Referenzmaterial des Erstellers aufzurufen und das generative Ergebnis dann anstelle des Originalinhalts zu präsentieren.

Dennoch steht News Corp vor einem harten Kampf, zu beweisen, dass Perplexity AI seine Urheberrechte verletzt, wenn es Informationen verarbeitet und zusammenfasst. Denn mittels Copyright lassen sich weder bloße Fakten schützen, noch die kreative, journalistische und akademische Arbeit, die zu ihrer Erstellung erforderlich ist, sondern letztlich nur der Text selbst. US-Gerichte haben in der Vergangenheit Beklagten aus der Technologiebranche recht gegeben, die Inhalte für ausreichend transformative Zwecke nutzten. Dieses Muster wird sich wahrscheinlich fortsetzen. Hätte News Corp wiederum wirklich Erfolg, würden die Auswirkungen weit über Perplexity AI hinausschießen. Die Beschränkung der Nutzung informationshaltiger Inhalte auf nichtkreative oder wenig ausdrucksstarke Zwecke könnte den Zugang zu umfangreichen, vielfältigen und hochwertigen Daten einschränken und Bemühungen zur Verbesserung der Sicherheit und Zuverlässigkeit von KI-Systemen behindern.

Regierungen könnten lernen, die Online-Wertschöpfung zu regulieren

Wenn das geltende Recht nicht in der Lage ist, diese Herausforderungen zu bewältigen, könnten Regierungen neue Gesetze in Betracht ziehen. Angespornt durch die jüngsten Auseinandersetzungen mit traditionellen Suchmaschinen und Social-Media-Plattformen könnten sie sogar aggressive Reformen anstreben, die sich an den in Australien und Kanada erlassenen oder in Kalifornien und dem vom US-Kongress vorgeschlagenen Verhandlungskodizes zum Umgang mit Medien orientieren. Diese Reformen verpflichten Plattformen dazu, bestimmte Medienorganisationen für die Anzeige ihrer Inhalte zu bezahlen, zum Beispiel, wenn sie Nachrichtenausschnitte nutzen – in Deutschland ist dies über das Leistungsschutzrecht geregelt. Die EU hat durch eigene Reformen des Urheberrechts Konzernen ähnliche Verpflichtungen auferlegt, während das Vereinigte Königreich weitreichende Befugnisse im Bereich Wettbewerbsrechts eingeführt hat, die zur Durchsetzung in Verhandlungen zwischen Netzriesen und Medien genutzt werden könnten.

Kurz gesagt haben die Politiker gezeigt, dass sie bereit sind, die Wertschöpfung zwischen den Produzenten von Inhalten und den Aggregatoren derselben zu regulieren, und ihre traditionelle Zurückhaltung, sich in das Internet einzumischen, aufgegeben. Ein Zwang zu Verhandlungen ist jedoch ein stumpfes Schwert bei der Lösung eines komplexen Problems. Denn die Reformen begünstigen oft nur eine kleine Gruppe von Medienkonzernen, die davon ausgehen, dass Plattformen wie Google und Meta sie ausbeuten. In der Praxis ist unklar, wie viel ihres Plattform-Traffics tatsächlich auf Nachrichten zurückzuführen ist. Schätzungen zufolge liegt der Anteil der Suchanfragen zwischen zwei Prozent (laut Google) oder 35 Prozent (laut Forscher:innen) – und der Anteil aus Social-Media-Feeds bei nur drei Prozent, was aber auch daran liegt, dass Facebook und Instagram an ihren Algorithmen geschraubt haben. Gleichzeitig bieten Plattformen den Verlegern Vorteile, indem sie ihre Inhalte verbreiten – und es gibt kaum Einigkeit über die faire Aufteilung dieser beiderseitigen Wertschöpfung.

Umstritten ist, für was Geld zu zahlen ist – die Indexierung oder Verlinkung von Nachrichteninhalten? Deren bloße Reproduktion? Dies bedroht gegebenenfalls die Möglichkeit zur freien Verlinkung, die das Internet untermauert. Darüber hinaus ignorieren Regeln, die sich auf traditionelle Medien konzentrieren – nur 1.400 Publikationen in Kanada, 1.500 in der EU und 62 Organisationen in Australien – unzählige andere Schöpfer von Inhalten. Darunter sind auch ganz normale Nutzer:innen, die Beiträge, Blogs, Bilder, Videos, Podcasts und Kommentare beisteuern, die den Traffic auf den Plattformen antreiben.

Empfehlungen der Redaktion

News

Google-Konkurrenz? Meta soll an KI-Suchmaschine arbeiten – aber die dürfte etwas anders sein

News

SearchGPT fordert Google heraus: Diese 3 KI-Suchmaschinen konnten dem Tech-Giganten nicht gefährlich werden

MIT Technology Review Infografik

Statistik der Woche: Welche Branchen besonders auf KI setzen

Die Branche hat nur noch ein enges Zeitfenster

Doch trotz all ihrer Tücken könnten verbindliche Verhandlungen eine gute Antwort auf das Problem mit der KI-Suche sein. Im Gegensatz zur herkömmlichen Internetsuche, bei der Quellen indiziert, verlinkt und kurze Auszüge daraus angezeigt werden, um Benutzer:innen die Entscheidung zu erleichtern, ob man weiterklickt, fällt dies hier schlimmstenfalls weg. Perplexity AI, SearchGPT & Co. nehmen das zugrunde liegende Quellenmaterial und ersetzen es direkt durch generierte Zusammenfassungen, wodurch die Besucherzahlen und die Sichtbarkeit nachgelagerter Websites beeinträchtigt werden können. Schon jetzt endet mehr als ein Drittel der Google-Sitzungen ohne einen Klick nach außen, weil Google immer mehr Inhalte – vom Wetter bis zu den Öffnungszeiten – auf der Ergebnisseite präsentiert. Dieser Anteil dürfte bei der KI-Suche noch deutlich höher liegen. Immerhin vereinfacht sie auch die wirtschaftliche Kalkulation: Da nur wenige Quellen zu jeder Antwort beitragen, könnten Plattformen – und Vermittler – genauer verfolgen, wie viel Engagement und Umsatz bestimmte Urheber generieren.

Letztlich steckt der Teufel im Detail. Gut gemeinte, aber schlecht konzipierte verbindliche Verhandlungsregeln könnten wenig zur Lösung des Problems beitragen, nur einige wenige Personenkreise schützen und den freien Informationsaustausch im Internet möglicherweise lähmen. Allein die Androhung einer Intervention kann eine größere Wirkung haben als eine tatsächliche Reform. KI-Unternehmen erkennen stillschweigend das Risiko an, dass Rechtsstreitigkeiten zu Regulierungsmaßnahmen eskalieren. So schließen beispielsweise Perplexity AI, OpenAI und Google bereits Verträge mit Verlegern und Content-Plattformen ab, von denen einige das KI-Training und andere die KI-Suche betreffen. Man möchte sich rechtlich absichern. Aber wie bei den ersten Tarifgesetzen in den USA vor vielen Jahren könnten diese Vereinbarungen nur einer Handvoll Firmen zugutekommen. Ein Beispiel ist die Diskussionsplattform Reddit, die einfach die Inhalte der Kunden an KI-Firmen zum Training und zu anderen Zwecken verkauft, ohne den Usern einen Cent zu zahlen.

Einige große Player selektiv zu besänftigen, ist unhaltbar. Das vernachlässigt die große Mehrheit der Online-Urheber, die sich nicht ohne Weiteres aus der KI-Suche ausklinken können und nicht über die Verhandlungsmacht eines traditionellen Verlegers verfügen. Sie nimmt der Reform die Dringlichkeit, indem sie die lautesten Kritiker beschwichtigt. Sie legitimiert einige KI-Firmen durch vertrauliche wie komplexe Verträge, was es für neue Marktteilnehmer schwierig macht, gleiche Bedingungen (oder gleiche Gelder) zu erhalten. Eine neue Welle von Suchmonopolisten könnte folgen. Langfristig könnte das für KI-Firmen perverse Anreize schaffen, kostengünstige und qualitativ minderwertige Quellen gegenüber hochwertigen, aber teureren Nachrichten oder anderen Inhalten zu bevorzugen – und dabei eine Kultur des unkritischen Informationskonsums fördern.

KI-Branche muss investieren

Statt so vorzugehen, sollte die KI-Branche in Rahmenbedingungen investieren, die Urheber aller Art für die Weitergabe wertvoller Inhalte belohnen. Von YouTube über TikTok bis hin zu X haben Technologieplattformen bewiesen, dass sie auf komplexen Content-Marktplätzen neuartige Finanzierungsoptionen für dezentrale Urheber verwalten können. Tatsächlich ist die gerechtere Monetarisierung alltäglicher Inhalte ein zentrales Ziel der von Risikokapitalgebern einst gefeierten „Web3“-Bewegung. Die gleiche Argumentation lässt sich auf die KI-Suche übertragen. Wenn Anfragen an solche Suchmaschinen zu lukrativen Interaktionen führen, die Geld bringen sollten, die Nutzer:innen aber nicht zu den Quellen weiterklicken, müssen kommerzielle KI-Suchplattformen Wege finden, diese Wertschöpfung mit den Urhebern zu teilen.

Natürlich ist es denkbar, dass unsere digitale Wirtschaft von Anfang an dysfunktional war – und es weiter ist. Die Finanzierung von Inhalten mithilfe geringer Werbeeinnahmen ist womöglich einfach nicht nachhaltig. Der Trend zur Aufmerksamkeitsökonomie hat der Privatsphäre, der Integrität und der Demokratie im Internet echten Schaden zugefügt. Die Unterstützung hochwertiger Nachrichten und anderer Inhalte erfordert möglicherweise ganz andere Formen von Investitionen oder Anreizen.

Aber wir sollten die Aussicht auf eine gerechtere digitale Wirtschaft nicht aufgeben. Wenn überhaupt, dann macht die KI-Suche den funktionierenden Handel mit Inhalten dringlicher, aber auch praktikabler als je zuvor. KI-Pioniere sollten diese Gelegenheit nutzen, um den Grundstein für ein intelligentes, gerechtes und skalierbares Finanzierungssystem zu legen. Sollte das nicht passieren, kommt es zu einer Regulierung, die womöglich niemandem schmeckt.

Benjamin Brooks ist Fellow am Berkman Klein Center in Harvard und erforscht die regulatorischen und legislativen Aspekte von KI. Er kommt selbst aus der Branche: Zuvor leitete er den Bereich Public Policy bei Stability AI, einem Entwickler offener Modelle für die Bild-, Sprach-, Audio- und Videogenerierung. Seine Ansichten geben nicht unbedingt die Meinung seiner Organisation wieder.

Mehr zu diesem Thema

MIT Technology Review Künstliche Intelligenz Open AI

Verpasse keine News zu Software & Entwicklung 💌

Hinweis zum Newsletter & Datenschutz

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren