Beim Wettstreit um die besten KI-Modelle geht es längst nicht mehr nur um die reine Leistungsfähigkeit. Auch die Effizienz spielt eine immer wichtigere Rolle. Dabei geht es der Branche nicht zuletzt darum, auch direkt auf dem Smartphone möglichst mächtige KI-Werkzeuge anbieten zu können.

Aus Sicht der Nutzer:innen ist das vor allem im Hinblick auf den Datenschutz von Vorteil. Wenn E-Mails oder andere Dokumente direkt auf dem eigenen Smartphone ausgewertet werden, können sie auch nicht in falsche Hände gelangen. Außerdem funktioniert das Ganze auch dann, wenn die Internetverbindung gerade mal weniger stabil ist.

Aber auch die Smartphone-Branche erhofft sich eines von lokalen KI-Modellen. Immerhin sind die Zeiten der wirklich spannenden Handy-Neuerungen längst vorbei. Es braucht einen neuen Kaufanreiz für immer schnellere Smartphones – und genau den könnte lokale KI-Features liefern.

Nicht nur Apple setzte im Marketing der vergangenen Jahre auf seine – weiterhin unfertigen – KI-Features. Auch Google setzt auf diesen Bereich und hat Anfang 2024 mit Gemma erstmals eine abgespeckte Version des Gemini-Modells unter dem Namen Gemma veröffentlicht.

Im Rahmen der hauseigenen Entwickler:innen-Konferenz Google I/O hat der Konzern jetzt nachgelegt und mit Gemma 3n die neuste Version des Modells vorgestellt.

Wie Gemma 3n die optimale Leistung auf eurem Smartphone bringen soll

Google setzt auf eine Reihe von Techniken, damit Gemma 3n auch auf der vergleichsweise schwachen Hardware von Smartphones möglichst gute Ergebnisse liefert. Eins davon erlaubt es dem Modell, abhängig von dem verwendeten Gerät mit einer reduzierten Parameteranzahl zu starten.

Die Anzahl der Parameter eines KI-Modells steht in einem direkten Verhältnis zum Rechenaufwand – und der Genauigkeit der Ergebnisse. Während die große Variante des Gemma-3n-Modells standardmäßig mehr als fünf Milliarden Parameter hat, kann das Modell auf schwächeren Geräten Parameter überspringen. Auf die Art kann das Modell auch mit effektiv nur rund 2 Milliarden Parametern ausgeführt werden. Dementsprechend kann dieselbe Modellvariante auf unterschiedlich starken Smartphones eingesetzt werden. Wird dann aber eben auch unterschiedlich gute Ergebnisse liefern.

Obendrein kann Gemma 3n auf nicht benötigte Parameter verzichten, um den Speicherbedarf zu senken. Wenn eine Aufgabe also beispielsweise keine Bilderkennung erfordert, dann werden die entsprechenden Parameter gar nicht erst geladen.

Gemma 3n ausprobiert: Standardaufgaben sind kein Problem

Anders als bei Googles großen Gemini-Modellen legt der Konzern die Gemma-Modelle grundsätzlich offen. Das steht im Fall von Gemma 3n allerdings noch aus. Außerdem fehlt der aktuellen Vorschauversion noch die Fähigkeit, Audioeingaben zu verarbeiten.

Immerhin lässt sich das Modell in begrenztem Umfang aber schon in Googles AI Studio ausprobieren. Das lässt zwar keine Rückschlüsse auf die Effizienz auf schwächerer Hardware zu, erlaubt aber immerhin einen Einblick in die Qualität der Antworten auf gängige Prompts.

In unseren Versuchen hatte Gemma 3n keine nennenswerten Probleme mit der Erzeugung kleiner Skripte oder der Aufbereitung von Daten im JSON-Format. Auch gestellte Matheaufgaben löste das Modell zufriedenstellend. Erst als wir eigentlich korrekte Antworten als falsch moniert haben, kam Gemma 3n doch etwas ins Schleudern.

Generell neigen große Sprachmodelle dazu, Nutzer:innen in allem Recht zu geben. Anfang Mai 2025 hatte deswegen etwa OpenAI ein Update von GPT-4o zurückgezogen, weil das zu „unterwürfig“ reagiert habe. Auch Gemma 3n entschuldigt sich in unserem Versuch für den Fehler, der keiner ist, und liefert eine neue Lösung. Die ist zwar mathematisch richtig, dazu hat das Modell dann aber die Zahlen verändert.

Zum Vergleich: Die aktuelle Vorschauversion von Gemini 2.5 Pro entschuldigt sich auf dieselbe Prompt-Kombination zwar auch, liefert im Anschluss aber unverändert die von vorneherein richtige Lösung.

Dass Gemma 3n nicht in jeder Hinsicht mit Spitzenmodellen wie Gemini 2.5 Pro oder GPT-4o mithalten kann, ist aber weder überraschend noch wirklich wichtig. Am Ende zeigt Gemma 3n durchaus eindrucksvoll, wie viel auch kleinere Modelle mittlerweile leisten können. Für eine Vielzahl von Aufgaben auf dem Smartphone, wie das Verfassen oder Zusammenfassen von E-Mails ist das Modell mehr als ausreichend gerüstet.