Databricks will es offenbar wissen: Nachdem das Unternehmen 2023 als Reaktion auf ChatGPT bereits das große Sprachmodell Dolly veröffentlicht hat, legte es im Oktober nach und übernahm für 1,6 Milliarden US-Dollar das KI-Startup MosaicML. Mit Hilfe des zugekauften Teams hat Databricks mit DBRX jetzt ein weiteres KI-Modell veröffentlicht. Und das soll es in sich haben.
Laut den vom Unternehmen selbst veröffentlichten Benchmark-Ergebnissen schlägt DBRX die quelloffenen Konkurrenzmodelle wie Metas Llama 2, Mistrals Mixtra und Elon Musks Grok-1 teilweise deutlich.
In einigen spezifischen Nutzungsszenarien soll DBRX auch OpenAIs GPT-3.5 Turbo schlagen. An GPT-4 reichen die Ergebnisse derzeit aber noch nicht heran. Außerdem soll DBRX konkurrenzfähig zu Googles Gemini 1.0 Pro sein.
DBRX ist Open Source – zu einem gewissen Grad
DBRX steht auf GitHub und der KI-Plattform Hugging Face zum Download bereit. Allerdings scheint sich Databricks an anderen „Open-Source“-Modellen wie Metas Llama zu orientieren. Auch das Modell kann zwar frei genutzt werden, allerdings fehlen wichtige Informationen zum Training, sodass das Modell – im Gegensatz zu klassischer Open-Source-Software – nicht einfach nachgebaut werden kann.
Wie bei Facebook gibt es außerdem auch bei Databricks eine Obergrenze für Unternehmen: Wer mehr als 700 Millionen aktive Nutzer:innen hat, darf DBRX nicht frei einsetzen.
DBRX-Training hat „nur“ 10 Millionen Dollar gekostet
Laut einem Bericht der US-Publikation Techcrunch dauerte das Training von DBRX insgesamt zwei Monate und hat etwa zehn Millionen Dollar gekostet. Das wäre vergleichsweise wenig Geld. Nach Angaben von OpenAI-Chef Sam Altman hat das Training von GPT-4 mehr als das Zehnfache gekostet.