ChatGPT, Perplexity und You.com im Praxistest: Kann KI die Google-Suche ersetzen?
Seit Anfang November 2024 bietet ChatGPT zumindest zahlenden Kund:innen die Möglichkeit, direkt über den Chatbot das Web zu durchsuchen. Damit mach OpenAI nicht nur bestehenden KI-Suchanbietern wie Perplexity und You.com Konkurrenz – sondern auch der klassischen Google-Suche.
Aber können die KI-Anbieter wirklich mit Google mithalten, wenn es darum geht, aktuelle und vor allem korrekte Informationen aus dem Web zu erhalten? Wir haben es ausprobiert und dabei deutliche Unterschiede festgestellt.
Google gegen ChatGPT Search & Co.: Wie aktuell sind die Inhalte?
Ein nicht unerheblicher Teil aller Websuchen betreffen aktuelle Ereignisse. Google stellt diese Inhalte in aller Regel als Schlagzeilen-Box über den eigentlichen Suchergebnissen an und bietet so einen Überblick über passende Meldungen verschiedener Publikationen an.
Um zu überprüfen, ob die ChatGPT-Suche, Perplexity und You.com damit mithalten können, haben wir auf allen drei Angeboten die Frage gestellt, ob die USA der Ukraine den Einsatz von Raketen mit großer Reichweite auf russisches Territorium erlaubt. Etwa fünf Stunden vor unserer Suche hatte beispielsweise Tagesschau.de berichtet, dass US-Präsident Biden genau das jetzt erlaubt.
Die Suche von ChatGPT beantwortet unsere Frage korrekt und ist entsprechend über die Entscheidung aus Washington informiert. Als Quellen werden Welt, die US-Version von Business Insider und Politico angegeben. Die Quellenauswahl ist nicht zufällig. Alle drei Publikationen stammen aus dem Portfolio des Axel-Springer-Verlags. Mit dem hatte sich ChatGPT-Betreiber OpenAI schon Ende 2023 auf einen umfangreichen Deal zur Nutzung von Inhalten geeinigt. Davon profitiert jetzt die ChatGPT-Suche, die mit aktuellen Nachrichten versorgt wird.
Auch die KI-gestützte Suchmaschine You.com beantwortet unsere Frage korrekt – und wie ChatGPT in Form von drei kurzen Absätzen. Auch werden hier erneut drei Quellen im Text verlinkt. Bei You.com sind das Tagesschau.de, Welt und der ORF.
Während ChatGPT und You.com schon auf dem aktuellen nachrichtlichen Stand sind, hinkt Perplexity zu diesem Zeitpunkt hingegen noch hinterher. Von einer Erlaubnis Bidens zum Raketeneinsatz weiß die KI-Suche nichts. Als Beleg werden einigermaßen aktuelle Quellen verlinkt, bei denen das Thema allerdings nur eine untergeordnete Rolle spielt.
Damit bleibt Perplexity der einzige Anbieter in unserem Versuch, der die veränderte Nachrichtenlage nicht korrekt abbildet. Denn auch Googles KI-Chatbot Gemini weiß zu dem Zeitpunkt von der Biden-Entscheidung und liefert die korrekte Antwort inklusive Quellenlink.
Wie richtig sind die Ergebnisse der KI-Suchmaschinen?
Große Sprachmodelle neigen leider nach wie vor mitunter zu Halluzination. Darunter versteht man das Problem, dass KI-Modelle bisweilen Antworten erzeugen, die so einfach nicht stimmen. Das Problem kann bedauerlicherweise auch bei KI-gestützten Suchmaschinen auftreten.
Bei einem unserer früheren Versuche mit Perplexity gab die KI-Suchmaschine beispielsweise fälschlicherweise an, dass einer unserer Autoren für ein US-amerikanisches C64-Magazin schreiben würde. Als Quelle für die Behauptung diente ein Wikipedia-Eintrag, der wiederum als Beleg für eine Aussage auf einen Text des Autors auf Spiegel Online verlinkte. Aber weder der Wikipedia-Eintrag noch der Spiegel-Artikel lieferten einen Beleg für die Behauptung von Perplexity. Dort tauchten lediglich der Name des Autors und die US-Publikation gemeinsam auf.
Fehler wie dieser fallen nur dann auf, wenn Nutzer:innen die verlinkten Quellen auch selbst prüfen. Allerdings dürften die meisten von ihnen die KI-Alternativen zu Google deswegen einsetzen, um sich diese Arbeit zu sparen.
Aber selbst wenn die KI-Suche die Angaben aus ihrer Quelle korrekt abbildet, heißt das nicht zwangsläufig, dass die Angaben so stimmen. Das führte in unserem kleinen Experiment beispielsweise zu dem bizarren Ergebnis, dass wir auf die Frage „Wie viele Länder beginnen mit dem Buchstaben V?“ gleich drei unterschiedliche Antworten von den verschiedenen KI-Tools erhalten haben.
Die Suche von ChatGPT war sich mit Perplexity einig, dass die Antwort sieben lautet. Beide zählten dementsprechend die Staaten Vanuatu, Vatikanstadt, Venezuela, Vereinigte Arabische Emirate, Vereinigte Staaten von Amerika, Vereinigtes Königreich und Vietnam auf. ChatGPT lieferte dafür eine Quelle, die sich wiederum auch unter den drei gelisteten Quellen von Perplexity fand.
Gemini wollte sich nicht festlegen, wie viele Länder mit dem Buchstaben V es geben könnte. Stattdessen teilte uns Googles KI-Chatbot mit, dass mehrere solcher Länder existieren würden und lieferte im Anschluss sechs Beispiele. Im Vergleich zu Perplexity und ChatGPT fehlte das Vereinigte Königreich – und die Nennung einer Quelle.
Nach Zählart von You.com – beziehungsweise der von der KI herangezogenen Quelle – gibt es derweil nur vier solcher Länder. Google liefert derweil mit dem ersten Suchergebnis eine Quelle, die wie ChatGPT sieben solcher Länder ausmacht.
KI oder Google?
Für viele Suchanfragen können KI-Suchmaschinen durchaus eine sinnvolle Alternative zur klassischen Google-Suche darstellen. Wer etwa einfach nur ein paar Restaurantempfehlungen zu einer Stadt wissen möchte, der kann getrost auch ChatGPT, Gemini, Perplexity oder You.com fragen. In dem Fall würden wir allerdings zu ChatGPT oder Gemini raten, weil die genau wie die klassische Google-Suche auch gleich eine Karte mit den Ergebnissen mitliefern.
Auch bei Fragen zu tagesaktuellen Meldungen machen die meisten KI-Suchmaschinen mittlerweile eine gute Figur. Am Ende lösen aber auch die KI-Tools nicht das Problem, dass ihr bei der Suche nach möglichst genauen, verifizierbaren Daten und Fakten eine Vielzahl von Quellen selbst prüfen solltet, um peinliche Fehler zu vermeiden – genau wie bei der klassischen Google-Suche.
Abhängig davon, was ihr wissen wollt, solltet ihr die KI-Suchmaschinen daher besser als Ergänzung einer klassischen Websuche verstehen. Zumal die ihre Ergebnisse immer noch deutlich schneller ausspuckt.