Anzeige
Anzeige
MIT Technology Review Analyse

Warum Deepseek R1 nicht das Ende von OpenAI und Meta bedeutet

Das chinesische KI-Modell R1 schockiert die großen US-Konzerne. Doch das Rennen um die technologische Vorherrschaft in Sachen KI haben die Chinesen damit nicht gewonnen.

Von Wolfgang Stieler
3 Min.
Artikel merken
Anzeige
Anzeige

 (Foto: Mojahid Mottakin / Shutterstock.com)

Für die US-Öffentlichkeit ist die Veröffentlichung des chinesischen KI-Modells R1 ein Déjà-vu der unangenehmen Art. Es erinnert an die Demütigung durch die Sowjetunion 1957, die ihre technische Überlegenheit über die USA mit dem Flug des ersten Weltraum-Satelliten demonstrierte. Denn R1 ist nicht nur ähnlich gut wie o1 von OpenAI, es ist auch viel effizienter, hat nur einen Bruchteil für das Training gekostet – es ist auch komplett Open Source.

Anzeige
Anzeige

Panik und Verleugnung bringen nicht weiter

Die ersten Reaktionen auf das Modell reichen von nackter Panik – die Aktien von KI-Chiphersteller Nvidia gingen in den Keller – über Fatalismus – die Chinesen haben das KI-Rennen gewonnen, die US-Ausfuhrbeschränkungen waren sinnlos – bis hin zur Leugnung der Realität. So verbreitet beispielsweise der Tech-Investor Neal Khosla, die Veröffentlichung von R1 sei nur eine Operation der psychologischen Kriegsführung der Chinesen, mit dem Ziel, die US-Wirtschaft zu destabilisieren. Ein nüchterner Blick auf die technischen Hintergründe zeigt aber, dass Deepseeks R1 alleine nicht das Ende des Silicon Valley einläuten wird. Dafür gibt es mehrere Gründe.

Deepseek ist technisch gut gemacht, aber kein Durchbruch

Das Paper, das zu dem Modell veröffentlicht wurde, ist von Fachleuten gelobt worden. Auf der technischen Ebene enthält es aber keine grundsätzlichen Neuerungen. Alle Technologien, die darin verwendet werden, sind bereits bekannt.

Anzeige
Anzeige

R1 ist ein Reasoning-Modell, in dessen Kern ein großes Sprachmodell steckt. Das zerlegt Aufgaben in kleinere Teilaufgaben, die es der Reihe nach Punkt für Punkt abarbeitet – in einer gedanklichen Kette (Chain of Thought). Anschließend sucht die Software die beste/genaueste/schnellste Kette und veröffentlicht ihr Ergebnis als Antwort. Um zu lernen, welches die jeweils beste Gedankenkette ist, wurden der Software wiederum im Training viele Beispiele „guter“ Gedankenketten präsentiert.

Gehortete KI-Chips halfen beim Training

Die Effizienz beim Training und der Ausführung des Modells ist vermutlich das Ergebnis von Vorläufer-Arbeiten, bei denen weniger effiziente große Modelle heuristische Verfahren und Trainingsdaten erzeugen, mit denen dann kleinere Modelle effizient trainiert werden können. Ähnlich ist Meta bei seinen Llama-Modelle vorgegangen.

Anzeige
Anzeige

Das war nur möglich, weil das Training der Deepseek-Modelle bereits begonnen hatte, als die Ausfuhrbeschränkungen für KI-Chips noch relativ weich waren. Zahlreiche chinesische Unternehmen – so auch Deepseek – hatten sich zu dieser Zeit noch mit großen Mengen der leistungsstarken A100-Chips von Nvidia eingedeckt.

Sanktionen erhöhen Innovationsdruck

Man kann also aus der Veröffentlichung von R1 nicht schließen, dass die US-Exportbeschränkungen nichts gebracht hätten. Solche Maßnahmen wirken immer nur mit einer gewissen Zeitverzögerung. Andererseits zeigt das Modell, dass der Sanktionsdruck auch als Beschleuniger technischer Entwicklung dient. Der Mangel an leistungsfähiger Hardware schafft einen enormen Anreiz, sich andere Lösungen auszudenken.

Anzeige
Anzeige

Offenheit wird nicht bleiben

Dass Deepseek das Modell jetzt komplett frei veröffentlicht hat, ist vermutlich tatsächlich eine politische Entscheidung gewesen, die OpenAI schwächen soll. Außerdem setzt die chinesische Regierung darauf, dass eine schnelle KI-Entwicklung innerhalb des Landes zu einem Produktivitätsschub führen wird. In China gibt es allerdings ein Phänomen, das die Politik dort prägt und damit auch die Bevölkerung ebenso wie die Wirtschaft: Fang-Shou, abgeleitet von den beiden Verben Fang (erholen) und Shou (anspannen). Sinngemäß also: Auf eine Phase der Öffnung und Lockerung folgt immer eine Phase Anspannung oder verstärkten Kontrolle – und umgekehrt. Nachdem die chinesische Regierung generativer KI zunächst sehr misstrauisch gegenüberstand und sie stark regulieren wollte, setzt man zurzeit eher auf Dynamik. Langfristig, argumentiert aber auch der ehemalige OpenAI-Entwickler Miles Brundage wird die chinesische Regierung kein Interesse daran haben, dass es eine Art KI-Wildwest in China gibt. Auch mit der Offenheit wird es also früher oder später wieder vorbei sein.

Erneuter Erfolg von Deepseek zunächst unwahrscheinlich

Auch wenn der Bedarf an Rechenpower bei Reasoning-Modellen viel höher ist als bei normalen Sprachmodellen, scheint die derzeit bei Deepseek vorhandene Menge an KI-Chips erst mal zu reichen, um das Modell online zu halten. Das ist ein enormer Prestige-Erfolg für die chinesische KI-Szene und tut den US-Unternehmen weh, die mit KI Geld verdienen wollen.

Das muss aber nicht so bleiben, schreibt der auf KI in China spezialisierte Online-Dienst China Talk. Denn wenn das Modell wirklich nützlich ist, wird der Bedarf danach nicht nur im Ausland sondern auch im Inland stark steigen. Dann muss irgendjemand priosieren: Wird die vorhandene Rechenkapazität genutzt, um neue Modelle zu trainieren, oder alte Modelle verstärkt zu nutzen?

Anzeige
Anzeige

Der Mangel an leistungsfähigen KI-Chips wird die chinesische KI-Szene auf absehbare Zeit also weiter ausbremsen und behindern. Wenn die Sanktionen bestehen bleiben oder sogar – wie geplant – noch weiter verschärft werden – braucht die chinesische KI-Wirtschaft den einen oder anderen grundsätzlichen technischen Durchbruch, um den Erfolg von R1 noch einmal zu wiederholen. Ob und wenn ja wann der kommt, weiß im Moment aber noch niemand.

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Kommentare (1)

Community-Richtlinien

Peter Bordych

Wenn das „Chain of Thought“-Schema sowie die anderen funktionalen Bausteine ja schon „lange bekannt“ waren oder sind (und ansonsten hier die Leistung chinesischer Experten kein „Durchbruch“ ist), frage ich mich, warum dann ein solches Modell nicht längst von amerikanischen Experten implementiert wurde. Warum fällt es t3n so schwer, einen wirklichen Fortschritt als solchen anzuerkennen? Und übrigens: Forschung und Entwicklung stehen in China schon längst nicht mehr unter der dirigistischen Knute, wie man es sich im Westen gerne einredet. Auch dort gibt es eine Vielzahl engagierter heller Köpfe, die auch intrinsisch motiviert arbeiten. Willkommen im multpolaren Zeitalter.

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Kommentar abgeben

Melde dich an, um Kommentare schreiben und mit anderen Leser:innen und unseren Autor:innen diskutieren zu können.

Anmelden und kommentieren

Du hast noch keinen t3n-Account? Hier registrieren

Anzeige
Anzeige