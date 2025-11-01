In der Wirtschaft arbeitet nicht eine große KI, sondern mehrere kleine KI Hand in Hand. (Bild: Midjourney / t3n)

Während medial über Künstliche Allgemeine Intelligenz (AGI) und die kognitiven Höchstleistungen von „Frontier Models” diskutiert wird, verfolgen Unternehmen in der Praxis eine deutlich pragmatischere Strategie. Modelle von OpenAI, Anthropic, oder Google brechen zwar Rekorde in Tests, doch für den produktiven Einsatz im Unternehmensalltag erweisen sie sich oft als zu groß, zu langsam und zu teuer.

Die eigentliche Arbeit übernehmen stattdessen zunehmend „Small Language Models“ (SLMs).

Die „KI-Wissensfabrik“

Der Schlüssel zum Erfolg liegt offenbar nicht im Einsatz eines einzigen, riesigen Universalgenies. Wie das Wall Street Journal (WSJ) berichtet, bauen erfolgreiche Unternehmen sogenannte „KI-Wissensfabriken“.

Stellt euch das weniger wie ein einzelnes Gehirn vor, sondern eher wie ein digitales Fließband. Ein komplexer Prozess wird dabei in viele kleine, spezialisierte Aufgaben zerlegt. Jede Station an diesem Fließband wird von einem eigenen, kleinen KI-Modell (einem „Agenten“) bedient, das nur diese eine Aufgabe beherrscht, und genau deshalb extrem schnell und kostengünstig arbeitet.

Orchestrierung statt Generalisierung

Ein Beispiel für diese Orchestrierung liefert das in Tel Aviv ansässige Sales-Software-Unternehmen Gong. Fragt ein:e Nutzer:in „Warum verliere ich Deals?“, nutzt Gong laut WSJ zunächst ein teures „Frontier Model“ von OpenAI, um einen Plan für die Beantwortung der Anfrage zu erstellen.

Die Schwerstarbeit – das Durchsuchen und Analysieren von Zehntausenden aufgezeichneten Verkaufsgesprächen – übernehmen dann aber schnelle, billige SLMs. Sie filtern irrelevante Gespräche heraus und fassen die relevanten zusammen. Erst das aufbereitete Ergebnis wird wieder an das große Modell übergeben, das den finalen Bericht formuliert.

Auch Facebook-Mutter Meta aus Menlo Park in Kalifornien nutzt diesen Ansatz. Finanzchefin Susan Li erklärte, dass Meta für die Auslieferung von Werbung keine der größten KI-Modelle einsetzt. Dies sei „cost prohibitive“, also schlicht zu teuer. Stattdessen nutzt Meta große Modelle, um das notwendige Wissen an kleinere, hochspezialisierte Modelle zu „transferieren“, die dann die effiziente Auslieferung im operativen Geschäft übernehmen.

Kosten, Geschwindigkeit und Kontrolle

Die Vorteile dieser Strategie sind für IT-Entscheider:innen offensichtlich. Die Kostenunterschiede sind immens. Das WSJ nennt beispielhaft einen Unterschied von 10 US-Cent für ein kleines Modell gegenüber 3,44 US-Dollar für ein großes Modell pro Million verarbeiteter Tokens.

Hinzu kommen die Faktoren Geschwindigkeit und Datenschutz. SLMs sind nicht nur schneller in der Antwortfindung (geringere Latenz), sie lassen sich auch gezielter trainieren. Wie Analyst:innen von IBM betonen, bieten sie eine bessere Kontrolle und Genauigkeit für spezifische Aufgaben.

Dieser Kontrollaspekt ist besonders für den europäischen Markt relevant. Während große API-Modelle in der Cloud laufen, können SLMs oft lokal (On-Premise) oder auf Edge-Geräten betrieben werden. Dies erleichtert nicht zuletzt die Einhaltung der Datenschutz-Grundverordnung (DSGVO), wie Microsoft erläutert.

Leistungsfähige Open-Source-Modelle wie Llama oder Mistral, die Unternehmen selbst hosten und feinabstimmen können, beschleunigen diesen Trend.

Der kritische Blick: Experten mit Tunnelblick

Dieser pragmatische Ansatz hat jedoch auch Einschränkungen. SLMs sind Spezialisten, gewissermaßen „Experten mit Tunnelblick“. Ihnen fehlt das breite Weltwissen und die Fähigkeit zum komplexen logischen Schlussfolgern, die große “Frontier Models” auszeichnen.

Zudem ist der Aufbau einer solchen „KI-Fabrik“ kein triviales Unterfangen. Die Orchestrierung der verschiedenen kleinen Agenten und die Definition der Daten-Pipelines erfordern hohes technisches Know-how in der Softwareentwicklung. Es ist keine Lösung, die sich „out of the box“ einkaufen lässt.

Die Strategie für Unternehmen ist daher selten ein „Entweder-oder“. Vielmehr zeichnet sich ein hybrider Ansatz ab: Große Modelle dienen der Planung und kreativen Generierung, während spezialisierte SLMs die repetitive Detailarbeit im Hintergrund erledigen.