Apple bringt großes Sprachmodell heimlich als Open-Source-Code an den Start
Im Oktober veröffentlichte Apple überraschend ein großes, multimodales Sprachmodell namens Ferret als Open-Source-Code. Dieser Schritt blieb lange Zeit sogar von vielen Mitgliedern der Open-Source-KI-Community unbemerkt.
Ferret beinhaltet den vollständigen Code, darf jedoch aufgrund fehlender kommerzieller Lizenz nur für Forschungszwecke genutzt werden. Es ist dennoch überraschend, dass Apple den Code so offen teilt. Das Unternehmen ist sonst für seine strenge Geheimhaltung bekannt.
Das kann Ferret
Ferret wurde auf dem Preprint-Server ArXiv veröffentlicht. Es hat die Fähigkeit, Bild und Text zu verbinden und gemeinsam zu interpretieren. Das bedeutet, Ferret kann genau beschreiben und erkennen, wo sich bestimmte Objekte in einem Bild befinden.
Für das Training wurde ein speziell zusammengestellter Datensatz namens GRIT verwendet. Die Forscher heben hervor, dass Ferret in klassischen Referenzierungs- und Verortungsaufgaben hervorragende Ergebnisse zeigt und bestehende Modelle bei auf Regionen basierenden und lokalisationserfordernden multimodalen Chats deutlich übertrifft.
Apple will mit Open-Source-Ansatz mithalten können
Es stellt sich die Frage, warum Apple gerade jetzt beginnt, seine Forschung öffentlich zu machen. Ein Artikel von Venture Beat liefert dazu eine mögliche Erklärung.
Demnach soll Apple das Sprachmodell als Open-Source-Code veröffentlicht haben, um mit Konkurrenten wie ChatGPT von OpenAI mithalten zu können. Laut dem Bericht müssen Unternehmen entweder ein Hyperscaler sein oder mit einem solchen zusammenarbeiten, um in diesem Bereich erfolgreich zu sein.
Apple verfügt jedoch nicht über die notwendige Infrastruktur, um ein großes Sprachmodell in großem Umfang zu betreiben. Daher könnte die Open-Source-Community für das Unternehmen eine Alternative darstellen, um die Entwicklung des Modells voranzutreiben.