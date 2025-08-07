Anzeige
Datenklau-Vorwurf: Wie Perplexity angeblich Website-Sperren für KI-Bots umgeht

Cloudflare wirft Perplexity vor, sich mithilfe von sogenannten „Schatten-Crawlern“ Zugriff auf eigentlich für KI-Bots blockierte Website-Inhalte zu verschaffen. Perplexity streitet das ab.

Von Jörn Brien
Perplexity KI-Scraping

KI-Scraping: Perplexity soll Regeln des Internets brechen. (Bild: Shutterstock/ Collagery)

Der Internet-Infrastruktur-Anbieter Cloudflare und die KI-Branche werden wohl keine besten Freund:innen mehr. Im Sommer 2024 hatte Cloudflare ein Gratis-Tool vorgestellt, mit dem sich KI-Bots identifizieren und blockieren lassen sollen.

Anfang Juli 2025 folgte die Ankündigung eines Marktplatzes, auf dem Website-Betreiber:innen KI-Firmen zur Kasse bitten können sollen, wenn die versuchen, auf ihre Website-Inhalte zuzugreifen. KI zerstöre das Geschäftsmodell des Internets, insbesondere jenes von Publishern, warnte Cloudflare-CEO Matthew Prince.

Jetzt wirft Cloudflare dem kalifornischen KI-Unternehmen Perplexity vor, absichtlich Sperren zu umgehen, um heimlich an Daten von eigentlich für KI-Bots gesperrten Websites zu gelangen. Perplexity ignoriere nicht nur in der robots.txt-Datei aufgestellte Verbote, sondern verstecke auch noch seine Crawling- und Scraping-Aktivitäten, so der Vorwurf.

Cloudflare testet Perplexity-Crawling

Cloudflare zufolge hätten Kund:innen dem Unternehmen gemeldet, dass Perplexity entsprechende Vorgaben in der robots.txt-Datei sowie anschließende Sperren der bekannten Crawler per Firewall ignoriert beziehungsweise umgangen habe. Sicherheitsexpert:innen des Infrastruktur-Anbieters haben daraufhin spezielle Testumgebungen geschaffen, die das Vorgehen nachvollziehen sollten.

Demnach soll Perplexity zunächst über einen offiziellen Crawler testen, ob die Website ihre Inhalte zur Verfügung stellt. Ist das nicht der Fall, wird ein „Schatten-Crawler“ aktiviert, der seine Herkunft verschleiert und sich als gewöhnlicher Webbrowser tarnt.

Empfohlene redaktionelle Inhalte

Hier findest du externe Inhalte von TargetVideo GmbH, die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte von TargetVideo GmbH auf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden.

Hinweis zum Datenschutz

Perplexity widerspricht Scraping-Vorwurf

Das Ganze sei kein Versehen, so Cloudflare, sondern, so der Vorwurf, ein absichtliches Vorgehen. Perplexity hat dem Ganzen gegenüber dem US-Publisher Techcrunch widersprochen. Die von Cloudflare angeführten Bots seien nicht von Perplexity ausgeschickt worden. Cloudflare hält aber an dem Vorwurf fest. Man habe die Herkunft per Machine Learning und Netzwerk-Signale identifizieren können.

Googles neue KI-Suche geht nach hinten los Quelle: (Bild: Koshiro K/Shutterstock)

Es ist übrigens nicht das erste Mal, dass Perplexity vorgeworfen wird, sich unrechtmäßig Zugriff auf Webseite-Inhalte zu verschaffen, um seine KI zu trainieren. Im Juni 2024 hatten verschiedene große News-Plattformen wie Forbes und Wired beschuldigt, unerlaubt Daten zu scrapen.

Perplexity-Konkurrenz hält sich an die Regeln

Andere KI-Firmen nimmt Cloudflare übrigens explizit von den Vorwürfen aus. ChatGPT und andere KI-Agents oder Drittanbieter-Bots würden sich an die von den Website-Betreiber:innen per robots.txt-Datei aufgestellten Regeln halten.

