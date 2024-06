Hat sich Perplexity nicht an die Vorgaben von Amazon gehalten? (Foto: rafapress / Shutterstock)

Amazon hat eine Untersuchung gegen Perplexity eingeleitet. Diese soll herausfinden, ob das KI-Startup gegen die Richtlinien von AWS verstoßen hat. Dabei handelt es sich um die Cloud-Dienste Amazon Web Services, über die auch die Perplexity-KI betrieben wird.

Warum Perplexity gegen Amazons Richtlinien verstoßen haben könnte

Wie aus Berichten von Insidern hervorgeht, soll Perplexity gegen das sogenannte Robots Exclusion Protocol verstoßen haben, wie Wired berichtet. Über eine Textdatei können Websites festlegen, welche URL ihrer Domain nicht von Crawlern und Bots gescannt werden dürfen. Diese Liste zu ignorieren, ist nicht illegal. Allerdings legt Amazon in den Richtlinien von AWS Wert darauf, dass sich alle Dienste daran halten, die auf den Servern des Tech-Riesen gehostet werden.

Perplexity soll Seiten gescannt haben, die durch das Robots Exclusion Protocol ausgeschlossen wurden. Genauer gesagt wird der KI vorgeworfen, mehrere News-Websites wie Wired, New York Times und Forbes genutzt zu haben – obwohl diese durch das Protokoll geschützt sein sollten. Der Chatbot von Perplexity ist unter anderem in der Lage, lange Artikel zusammenzufassen. Zuletzt geriet das Unternehmen in die Kritik, weil diese Zusammenfassungen häufig falsch sind.

In einer Stellungnahme verriet eine Sprecherin von Perplexity, dass die KI tatsächlich gelegentlich das Protokoll ignoriert. Allerdings soll das nur vorkommen, wenn ein Prompt eine bestimmte URL nutzt. Die KI könnte dann die entsprechende Seite aufrufen. Allerdings wäre dies kein Scan oder Crawl im herkömmlichen Sinne. Stattdessen würde dieses Vorgehen einem User entsprechen, der auf die Seite geht und den Text einfach in die KI kopiert.

Dabei würde es sich zudem um wenige Einzelfälle handeln, die nur unregelmäßig auftreten. Wired selbst hat bereits eigene Untersuchungen gestartet und IP-Adressen im System entdeckt, die mehrere Artikel der News-Website gescannt haben. Diese IP-Adresse ließ sich zu einem Dienst zurückführen, der von Perplexity auf den Amazon-Servern gehostet wird. Welche Erkenntnisse die Amazon-Untersuchung hervorbringt, bleibt abzuwarten.

