Nach Deepseek-Erfolg: Auch OpenAI kündigt ein Open-Weight-Modell an – das steckt dahinter

News

Nach Deepseek-Erfolg: Auch OpenAI kündigt ein Open-Weight-Modell an – das steckt dahinter

Wurde der Druck zu groß? Nach dem Überraschungserfolg von Deepseek R1 und der Popularität von Metas Llama zieht OpenAI mit einem eigenen Open-Weight-Modell nach – was das bedeutet und warum es relevant ist.

Von Dieter Petereit

01.04.2025, 11:22 Uhr • 5 Min.

Nach Deepseek-Erfolg: Auch OpenAI kündigt ein Open-Weight-Modell an – das steckt dahinter — OpenAI-Chef Sam Altman hat ein offenes KI-Modell angekündigt. (Foto: Rokas Tenys/Shutterstock)

OpenAI-Chef Sam Altman hat es offiziell gemacht: Sein KI-Unternehmen will im Sommer 2025 ein eigenes Open-Weight-Sprachmodell veröffentlichen. Das kündigte Altman kürzlich auf dem Ex-Twitter X an.

OpenAI reagiert auf den Wettbewerb

Dabei werde es sich um ein leistungsstarkes neues Sprachmodell handeln, das sich durch besondere Fähigkeiten im logischen Denken auszeichne – und dessen Gewichtungen (Weights) öffentlich zugänglich gemacht werden, so der OpenAI-Chef.

Empfehlungen der Redaktion

Briefing

Aufholjagd: Wie freie KI-Suche mit Perplexity und OpenAI mithalten soll

Ratgeber

ChatGPT, Claude & Co: Wer bietet die besten Gratis-Features?

Ratgeber

Per KI zu Superman: Dein eigenes Bild in Flux nutzen – so geht’s

Der Schritt darf als bemerkenswert bezeichnet werden, denn bislang galt OpenAI eher als Verfechter eines geschlossenen Modells: Wer GPT-4 nutzen will, benötigt Zugang über ChatGPT oder die API – die internen Parameter des Modells bleiben verborgen.

Mit dem geplanten Open-Weight-Modell will OpenAI offenbar neue Nutzergruppen ansprechen, dem wachsenden Open-Source-Druck begegnen – und zeigen, dass das Unternehmen ebenfalls in der Lage ist, Modelle zu erstellen, die sich effizient und kostengünstig trainieren lassen.

Was ist ein Open-Weight-Modell?

Open-Weight-Modelle sind KI-Modelle, bei denen nicht nur die Oberfläche oder API offen ist – sondern auch die Weights, also die gelernten Parameter des neuronalen Netzes. Das bedeutet: Nutzer:innen können das komplette Modell herunterladen, lokal ausführen, analysieren oder für eigene Zwecke weiter trainieren.

Im Gegensatz dazu stehen sogenannte Closed-Weight-Modelle wie GPT-4, Claude oder Gemini, bei denen die Modelle nur über Plattformen oder APIs zugänglich sind – die eigentlichen Parameter bleiben geheim.

Open Weights bieten viele Vorteile: Sie ermöglichen volle Kontrolle, senken wegen nicht vorhandener API-Kosten die Betriebskosten, lassen sich für spezielle Anwendungsfälle wie Datenschutz oder Edge-Computing anpassen – und bieten außerdem eine wichtige Grundlage für transparente Forschung.

Der Druck wächst – auch aus China

OpenAIs Open-Weight-Ankündigung wirkt weniger wie ein Teil eines langfristig vorbereiteten Strategiewechsels, sondern vielmehr wie eine Reaktion auf den wachsenden Wettbewerb im Bereich offener KI-Modelle. Vor allem das chinesische Unternehmen Deepseek sorgt mit seinem Open-Weight-Modell R1 international für Aufsehen.

Es wurde angeblich zu einem Bruchteil der Kosten westlicher Konkurrenzprodukte trainiert – und beeindruckt viele Entwickler:innen primär durch seine Performance. Die tatsächliche Offenheit des Modells wird allerdings hinterfragt, da weder Trainingsdaten noch Details zur Entstehung vollständig transparent gemacht wurden. Die KI ist auch bereits von einigen Ländern, etwa Italien, der Grenzen verwiesen worden.

Auch der Facebook-Mutterkonzern Meta verfolgt seit dem Sommer 2023 mit der Veröffentlichung von Llama (Large Language Model Meta AI) einen vergleichsweise offenen Kurs. Allerdings steht Llama unter einer Lizenz, die die kommerzielle Nutzung durch andere Unternehmen einschränkt – und die Trainingsdaten sind nicht vollständig öffentlich.

Lokale KI: Mit diesen 6 Tools kein Problem Quelle: Midjourny / t3n

Huggingface: „Fantastische Neuigkeiten“

Die Open-Source-Community reagiert positiv: Clément Delangue, Mitgründer und Chef des Open-Source-Plattformbetreibers HuggingFace aus der US-Metropole New York City, kommentierte die Ankündigung gegenüber Wired mit den Worten: „Das sind fantastische Neuigkeiten. Mit Deepseek wird vielen erst richtig bewusst, wie mächtig Open Weights sein können.“

Auch technisch zeigt sich, dass Open-Weight-Modelle längst mehr als Experimente sind: Viele lassen sich bereits auf handelsüblicher Hardware betreiben, sind frei verteilbar und können an individuelle Anforderungen angepasst werden – ein Vorteil, den besonders Unternehmen mit sensiblen Daten schätzen.

Frühzugang für Entwickler:innen geplant

OpenAI hat parallel zur Ankündigung eine Webseite freigeschaltet, auf der sich Entwickler:innen für einen Frühzugang zum Modell bewerben können. In den kommenden Wochen will das Unternehmen erste Events mit Prototypen veranstalten. Zielgruppe dieser Events sind Entwickler:innen, die sich frühzeitig mit dem neuen Modell vertraut machen wollen.

Steven Heidel, Entwickler bei OpenAI, bestätigte auf X jedenfalls, dass das Modell auch lokal einsetzbar sein wird: „Wir bringen dieses Jahr ein Modell heraus, das auf der eigenen Hardware betrieben werden kann.“

Weitere technische Details, etwa zur Architektur oder zum Umfang des Modells, hat OpenAI allerdings bislang nicht genannt. Auch die Lizenzfrage ist offen – ob das Modell vollständig quelloffen sein wird oder ähnlich wie Llama unter Einschränkungen steht, bleibt abzuwarten.

Positiv betrachtet, öffnet sich OpenAI – zumindest teilweise – und reagiert damit auf den wachsenden Druck aus der Open-Source-Szene. Wenn das angekündigte Modell hält, was Altman verspricht, könnte es ein wichtiger Schritt in Richtung offenerer, fairer nutzbarer KI werden. Entscheidend wird sein, wie offen das Modell am Ende wirklich ist – technisch wie rechtlich.

Diese Open-Weight-Modelle solltest du kennen

Immer mehr KI-Modelle stehen nicht nur über APIs zur Verfügung, sondern werden als vollständige Open-Weight-Modelle veröffentlicht – inklusive der Parameter, die sie im Training gelernt haben. Der folgende Überblick zeigt, wie unterschiedlich Offenheit in der Praxis aussehen kann.

Meta LLaMA (USA)

Llama (Large Language Model Meta AI) wurde von Meta entwickelt und erstmals im Juli 2023 veröffentlicht. Die Modelle stehen in mehreren Varianten zur Verfügung. Sie werden insbesondere in Forschung und Entwicklung eingesetzt. Zwar sind die Weights frei zugänglich, allerdings schränkt die Lizenz die kommerzielle Nutzung durch Dritte ein. Auch die zugrunde liegenden Trainingsdaten wurden bislang nicht offengelegt.

Mistral (Frankreich)

Das Start-up Mistral mit Sitz in Paris hat mit Mistral 7B und Mixtral zwei Open-Weight-Modelle veröffentlicht, die ohne kommerzielle Einschränkungen genutzt werden dürfen. Beide Modelle setzen auf vergleichsweise kompakte Architekturen, die schnelle Inferenzzeiten ermöglichen sollen. Die Trainingsdaten sind nicht vollständig dokumentiert, die Lizenzierung erlaubt jedoch die breite Weiterverwendung.

Deepseek R1 (China)

Das R1-Modell wurde vom chinesischen Unternehmen Deepseek entwickelt. Es soll laut Unternehmensangaben zu deutlich geringeren Kosten trainiert worden sein als westliche Vergleichsmodelle. Die Weights sind frei zugänglich, und eine kommerzielle Nutzung ist möglich. Da keine Informationen zu den verwendeten Trainingsdaten oder zur Trainingsumgebung veröffentlicht wurden, ist die tatsächliche Offenheit des Modells Gegenstand von Diskussionen.

Falcon (VAE)

Falcon ist ein Open-Weight-Modell des Technology Innovation Institute mit Sitz in Abu Dhabi. Es wurde in mehreren Varianten veröffentlicht und richtet sich insbesondere an Forschungseinrichtungen. Die Modelle sind unter einer offenen Lizenz verfügbar, die auch die kommerzielle Nutzung erlaubt. Da die Trainingsdaten nicht vollständig offengelegt wurden, lässt sich nur schwer beurteilen, auf welchen Quellen das Modell basiert und welche Verzerrungen es möglicherweise enthält.

BLOOM (international)

Das Modell BLOOM entstand im Rahmen des internationalen Bigscience-Projekts unter Federführung von HuggingFace und weiteren Partnern. Ziel war es, ein mehrsprachiges, transparentes Sprachmodell zu schaffen, das vollständig offen zugänglich ist – einschließlich der Trainingsdaten und der begleitenden Dokumentation. BLOOM gilt als eines der transparentesten Open-Weight-Modelle am Markt. Wegen seines hohen Ressourcenbedarfs ist es allerdings für viele praktische Einsatzszenarien nur eingeschränkt nutzbar.

GPT-Neo und GPT-J (USA)

Diese Modelle wurden von der Initiative EleutherAI mit dem Ziel entwickelt, frei verfügbare Alternativen zu GPT-3 zu schaffen. Sie sind quelloffen, dürfen kommerziell genutzt werden und wurden mit öffentlich zugänglichen Daten trainiert. Aufgrund ihrer geringeren Größe gelten sie eher als Einstieg in die Arbeit mit großen Sprachmodellen und finden hauptsächlich in der Forschung und im Bildungsbereich Anwendung.

Bildergalerie ansehen

Mehr zu diesem Thema

MIT Technology Review Deepseek China Meta Open AI

Verpasse keine News zu Software & Entwicklung 💌

Hinweis zum Newsletter & Datenschutz

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Brands

Themen

Magazine

Skills

Nach Deepseek-Erfolg: Auch OpenAI kündigt ein Open-Weight-Modell an – das steckt dahinter

OpenAI reagiert auf den Wettbewerb

Was ist ein Open-Weight-Modell?

Der Druck wächst – auch aus China

Huggingface: „Fantastische Neuigkeiten“

Frühzugang für Entwickler:innen geplant

Diese Open-Weight-Modelle solltest du kennen

Meta LLaMA (USA)

Mistral (Frankreich)

Deepseek R1 (China)

Falcon (VAE)

BLOOM (international)

GPT-Neo und GPT-J (USA)