Wenn Apple neue Software veröffentlicht, dann meistens im großen Rahmen als automatisches Update für Millionen iPhones, iPads und Macs. Abseits vom Tagesgeschäft um iOS und macOS arbeitet das Unternehmen aber viel an neuen KI-Funktionen. Erst vergangenes Jahr veröffentlichte das Unternehmen ein großes Sprachmodell als Open-Source-Code. Mit MGIE folgt nun eine generative Bild-KI.

Sprachbefehl statt Zauberstab

Die Besonderheit: Mithilfe der KI können Nutzer:innen Fotos abseits jeder Bildbearbeitungssoftware nach Belieben anpassen. Doch wie geht das? Die Abkürzung MGIE steht für MLLM-Guided Image Editing. MLLM bedeutet ausgeschrieben wiederum Multimodal Large Language Model. Solche Modelle sind in der Lage, Spracheingaben und Bilder zu verstehen. Laut Venturebeat setzt MGIE zwei dieser Modelle auf zwei Arten ein. Mithilfe des ersten Modells leitet es klare Anweisungen aus den Eingaben der Nutzer:innen ab, mit dem zweiten kann es sich das Ergebnis quasi „vorstellen“.

Als Beispiel führen die Forscher:innen etwa eine Pizza an. Auf den Befehl „Lass sie gesünder aussehen“ fügte die KI etwas Gemüse zum Belag hinzu. Mit MGIE ist aber weit mehr möglich. Nutzer:innen können damit Photoshop-ähnliche Aktionen ausführen (lassen) und Bilder auf diese Weise drehen, spiegeln, zuschneiden oder mit Filtern versehen. Außerdem kann MGIE den Hintergrund verändern, Helligkeit, Schärfe und Kontrast anpassen oder Gesichter und Augen nachbearbeiten.

Neben den Aufgaben können Nutzer:innen MGIE auch Feedback geben, um Bilder weiter anzupassen. Zwar gibt es mit Firefly von Adobe und ähnlichen Angeboten bereits KI-Modelle, die Bilder bearbeiten können. MGIE wird von Venturebeat aber als Durchbruch im Bereich der anweisungsbasierten Bildbearbeitung beschrieben. In einem Betriebssystem ist MGIE noch nicht integriert, Apple stellt das Modell via GitHub zur Verfügung. Offen ist, ob die KI Teil von kommenden Updates wie iOS 18 wird.

Apple hat MGIE nicht allein gemacht

Das Unternehmen ist nicht allein für das Projekt verantwortlich. Es ist aus der Zusammenarbeit mit der University of California, Santa Barbara, entstanden. Es passt aber zu Apples KI-Plänen. Die hatte Apple-Chef Tim Cook erst Anfang Februar bei der Bekanntgabe der Quartalsberichte angerissen. Demnach wolle das Unternehmen später in diesem Jahr weitere Details folgen lassen. Gut möglich also, dass Apple erste Ergebnisse schon zur WWDC 2024 präsentiert. Die Entwicklerkonferenz findet voraussichtlich Anfang Juni statt.

