Erst Ende Februar hatte Meta sein Large Language Model Meta AI angekündigt. „Llama“ wurde entwickelt, um von Forschern und Regierungen im Betatest ausprobiert zu werden, für die breite öffentliche Nutzung war es nicht gedacht. Durch die wenigen Zugangsberechtigungen sollte auch Missbrauch verhindert werden. Das hat jedoch nicht funktioniert.
Am Donnerstagabend hat der Nutzer „llamanon“ auf dem Technologie-Board von 4Chan die 7B- und 65B-Modelle von Llama per Torrent veröffentlicht. Das Modell wurde im AI Chatbot General Megathread gepostet. Mit der Veröffentlichung dieses Torrents ist das Modell für alle im Internet zugänglich.
Meta geht noch nicht gegen Leak vor
Einen Fehler hat der Leaker jedoch gemacht: Er nahm seinen eindeutigen Identifikationscode in das durchgesickerte Modell auf. Dieser Code wurde speziell implementiert, um Leaks aufzuspüren, wodurch die persönlichen Daten des Benutzers gefährdet werden.
Es scheint jedoch, dass Meta in den letzten Tagen nichts unternommen hat, da der Torrent immer noch zugänglich und zum Download verfügbar ist.
Meta plant in Zukunft ohnehin die uneingeschränkte Veröffentlichung des Tools und will den Zugang zu großen Sprachmodellen wie Llama demokratisieren.
„Trotz all der jüngsten Fortschritte bei großen Sprachmodellen bleibt der vollständige Forschungszugang zu ihnen aufgrund der Ressourcen, die zum Trainieren und Ausführen solch großer Modelle erforderlich sind, begrenzt“, heißt es in der Ankündigung von Meta.
„Dieser eingeschränkte Zugang hat die Fähigkeit der Forscher eingeschränkt, zu verstehen, wie und warum diese großen Sprachmodelle funktionieren, und behindert den Fortschritt bei den Bemühungen, ihre Robustheit zu verbessern und bekannte Probleme wie Voreingenommenheit, Toxizität und das Potenzial zur Erzeugung von Fehlinformationen zu mindern.“ Jetzt ist ihnen ein Leak zuvorgekommen.