Nvidia hat mit Nemotron-Nano-9B-v2 ein neues, quelloffenes Sprachmodell veröffentlicht. Es gehört zur Klasse der sogenannten kleinen Sprachmodelle (SLM) und zielt darauf ab, eine Balance zwischen hoher Leistung und effizientem Betrieb zu schaffen.

Die Besonderheit liegt in einer Funktion, die Entwickler:innen eine direkte Kontrolle über das Antwortverhalten der KI gibt. Mit einfachen Befehlen lässt sich das logische Denken, das „Reasoning“, des Modells zur Laufzeit aktivieren oder deaktivieren, um je nach Anwendungsfall zwischen maximaler Genauigkeit und minimaler Latenz zu wählen.

Hybrid-Architektur für mehr Effizienz

Technisch basiert Nemotron-Nano auf einer hybriden Architektur, die klassische Transformer-Elemente mit sogenannten Mamba-State-Space-Modellen (SSM) kombiniert. Dieses von Forscher:innen der Carnegie Mellon University in Pittsburgh und der Princeton University in New Jersey entwickelte Verfahren verarbeitet lange Kontexte deutlich ressourcenschonender als reine Transformer-Modelle.

Das Ergebnis ist eine erhebliche Effizienzsteigerung. Laut Nvidia wurde das Modell von ursprünglich zwölf auf neun Milliarden Parameter reduziert, um gezielt auf einer einzigen der weitverbreiteten A10G-GPUs lauffähig zu sein. Wie Oleksii Kuchiaev, Director of AI Model Post-Training bei Nvidia, laut Venturebeat erklärte, erlaube die Hybrid-Architektur eine Verarbeitung größerer Stapelgrößen und sei „bis zu 6x schneller als ähnlich große Transformer-Modelle”.

Offenheit als Strategie

Nvidia stellt das Modell unter seiner eigenen „Open Model License“ zur Verfügung. Diese ist explizit für die kommerzielle Nutzung freigegeben und erlaubt die Erstellung und Verbreitung abgeleiteter Modelle, ohne dass dafür umsatz- oder größenabhängige Lizenzgebühren anfallen.

Überdies geht das Unternehmen einen für die Branche bemerkenswerten Schritt. Es veröffentlicht nicht nur das Modell, sondern auch den Großteil der zum Training verwendeten Daten. Über die Plattform Hugging Face wird ein Datensatz von 6,6 Billionen Tokens zugänglich gemacht, der unter anderem Web-Crawls, Code und synthetisch erzeugte Frage-Antwort-Paare umfasst. Diese Transparenz ist ein wesentlicher Beitrag zur Nachvollziehbarkeit in der Entwicklung von KI-Modellen.

Einordnung und potenzielle Hürden

Mit Nemotron-Nano positioniert sich Nvidia klar im wachsenden Markt für effiziente, anpassbare KI-Modelle und tritt in direkte Konkurrenz zu Modellen wie Qwen3–8B von Alibaba. Die Kombination aus steuerbarem Reasoning, einer effizienten Architektur und einer unternehmensfreundlichen Lizenz ist ein starkes Angebot für die Praxis.

Potenzielle Hürden liegen jedoch in den Lizenzbedingungen selbst. So verpflichtet die Lizenz Nutzer:innen, eingebaute Sicherheitsmechanismen nicht ohne vergleichbaren Ersatz zu entfernen. Zudem enthält sie eine Klausel, die die Lizenz automatisch beendet, sollte ein:e Nutzer:in ein Patent- oder Urheberrechtsverfahren gegen eine andere Partei wegen einer durch das Modell verursachten Verletzung einleiten. Unternehmen müssen diese rechtlichen Rahmenbedingungen vor der Implementierung sorgfältig prüfen.

