
Über die vergangenen 18 Jahre hat die Foren-Plattform Reddit einen wahren Schatz an menschlichen Interaktionen und Unterhaltungen gesammelt. Der ist natürlichsprachlich und deckt die unterschiedlichsten Themenbereiche ab.
Damit eignet er sich hervorragend, um große Sprachmodelle wie die der sich schnell verbessernden KI-Chatbots zu trainieren. Dieses Potenzial will Reddit nun monetarisieren.
Das scheint nachvollziehbar, denn immerhin handelt es sich nicht um kleine, finanziell schwache Unternehmen, die die API zum Trainieren von KI-Chatbots nutzen. Auch Branchengrößen wie Google und OpenAI nutzen Reddit für das Training ihrer LLM-Sprachmodelle.
Dem begegnet Reddit nun mit der Einführung eines „neuen Premium-Zugangspunkts für Dritte“, wie es das Unternehmen in einer offiziellen Ankündigung nennt. Preise hat Reddit nicht kommuniziert.
Reddit hat indes bestätigt, dass es ein gestaffeltes Preismodell geben wird, vermutlich in Abhängigkeit von der Größe des Unternehmens oder dem Umfang des Datenzugriffs. Bislang nennt die Social-Media-Plattform unterschiedliche Nutzungsrechte und -möglichkeiten als Unterscheidungsmerkmale zwischen den Stufen.
„Der Datenbestand von Reddit ist wirklich wertvoll“, zeigte sich Steve Huffman, Gründer und Geschäftsführer von Reddit, gegenüber der New York Times überzeugt. „Und wir müssen nicht all diesen Wert einigen der größten Unternehmen der Welt kostenlos zur Verfügung stellen.“
Große Sprachmodelle werden natürlich nicht ausschließlich mit Reddit-Daten trainiert. Auch Daten-Scraper wie Common Crawl spielen eine bedeutende Rolle. Sie ziehen und bereiten indes hauptsächlich quantitative Daten auf, liefern also wichtige Masse für den Trainingsprozess. Wichtiger sind am Ende jedoch die gesprächsartigen Reddit-Daten, weil nur sie echte Kommunikation zwischen Menschen nachbilden.
Dass Reddit ausgerechnet jetzt mit der Monetarisierung seines Datenbestandes beginnt, dürfte damit zu tun haben, dass der Plattformbetreiber wohl noch in diesem Jahr an die Börse gehen möchte. Da ist die Schaffung einer neuen Einnahmequelle bekanntlich nie eine schlechte Idee.
Bitte beachte unsere Community-Richtlinien
Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.
Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.
Dein t3n-Team