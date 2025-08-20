Anzeige
Die wahren Quellen der KI: Wie Reddit und Wikipedia die Antworten von morgen formen

Googles neue KI-Suche und ChatGPT wirken oft souverän. Ein Blick auf die meistgenutzten Quellen zeigt aber eine unerwartete Schlagseite mit weitreichenden Folgen für die Verlässlichkeit ihrer Antworten.

Von Hannah Klaiber
2 Min.
KI scheint ihre Quellen mit recht wenig kritischer Distanz zu wählen – um es vorsichtig auszudrücken. (KI-generiertes Bild: Midjourney / t3n) 

Eine umfangreiche Analyse der Marketing-Plattform Semrush aus San Mateo im US-Bundesstaat Kalifornien hat erstmals detailliert offengelegt, auf welche Websites große Sprachmodelle (LLMs) bei ihren Antworten am häufigsten verweisen. Die Ergebnisse, die das kanadische Datenportal Visual Capitalist aufbereitet hat, sind für alle, die auf verlässliche KI-Antworten hoffen, mindestens ernüchternd. An der Spitze der meistzitierten Quellen stehen nämlich nicht etablierte Nachrichtenmedien oder Fachportale.

Es sind nutzergenerierte Inhalte, die das Bild dominieren. Die Community-Plattform Reddit führt die Liste mit einer Zitierhäufigkeit von über 40 Prozent an, gefolgt von der Online-Enzyklopädie Wikipedia mit rund 26 Prozent. Auch Videoplattformen wie Youtube und Bewertungsportale wie Yelp oder Tripadvisor finden sich in den Top-Positionen wieder.

Reddit und Wikipedia als Top-Quellen

Diese starke Abhängigkeit von Inhalten, die von anonymen Nutzer:innen erstellt und kuratiert werden, wirft fundamentale Fragen zur Zuverlässigkeit auf. Die Stärke dieser Plattformen – eine riesige Menge an menschlichen Erfahrungen und Nischenwissen – ist gleichzeitig ihre größte Schwäche. Denn eine redaktionelle Prüfung oder die Verifikation durch Expert:innen findet in den meisten Fällen nicht statt.

Die Konsequenzen sind bereits sichtbar. So haben Nutzer:innen berichtet, dass KI-Modelle auf Basis solcher Informationen potenziell gefährliche Ratschläge gaben, etwa Wasser mit Bleichmittel zu reinigen. Die Gefahr der Verstärkung von Echokammern, in denen populäre, aber unbestätigte Narrative überhandnehmen, ist ebenso real wie die Verbreitung von gezielten Fehlinformationen.

Was das für SEO und die Content-Strategie bedeutet

Die Untersuchung von Semrush, für die über 150.000 KI-Zitate analysiert wurden, liefert auch eine Erklärung für dieses Phänomen. Es besteht demnach eine sehr starke Korrelation zwischen einer hohen Platzierung in den traditionellen Google-Suchergebnissen und der Häufigkeit der Nennung in KI-Antworten. Domains, die bei Google gut ranken, werden also mit hoher Wahrscheinlichkeit auch von der KI als Quelle herangezogen.

Für Unternehmen und Content-Ersteller:innen bedeutet dies zweierlei. Zum einen bleibt die klassische Suchmaschinenoptimierung für die eigene Website ein entscheidender Faktor, um als vertrauenswürdige Quelle wahrgenommen zu werden, wie wir es auch im Kontext von Googles Search Generative Experience bereits beobachten konnten. Zum anderen wird eine aktive Präsenz und Strategie für Plattformen wie Reddit unumgänglich.

Der Grund dafür ist, dass die KI nicht immer nur auf die Startseite oder einen Übersichtsartikel einer Domain verweist. Vielmehr suchen die Modelle oft tief in den Strukturen einer Website nach spezifischen Antworten, die sie dann in Blog-Beiträgen oder eben in Diskussions-Threads finden.

Ein gutes Ranking bei Google etabliert also die Autorität eurer Domain für die KI. Für eine Detailfrage kann das System dann aber eine Quelle außerhalb eurer Domain vorziehen – etwa einen Reddit-Thread, in dem euer Produkt oder ein Inhalt eurer Website ausführlich diskutiert wird.

Die Entwicklung zeigt einen Paradigmenwechsel. Während die Autorität einer Domain wichtig bleibt, gewinnt die granulare, kontextbezogene Information an Bedeutung – unabhängig davon, ob sie von eine:r Redakteur:in oder einer anonymen Nutzer:in stammt. Für uns alle bedeutet das, die von einer KI gelieferten Antworten auch in Zukunft mit einer gesunden Portion Skepsis zu betrachten und die genannten Quellen kritisch zu prüfen.

