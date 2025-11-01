Anzeige
News
„Pico-Banana-400K“: Apple verschenkt riesigen Datensatz – erstellt mit Google-KI

Forscher:innen bei Apple haben einen Datensatz mit mehr als 400.000 Bildern veröffentlicht. Mit diesem sollen künftige KI-Modelle trainiert werden. Für die Hauptarbeit an dem Set wurde interessanterweise eine KI der Konkurrenz genutzt.

Von Marvin Fuhrmann
2 Min.
Artikel merken
„Pico-Banana-400K“: Apple verschenkt riesigen Datensatz – erstellt mit Google-KI
Apples KI-Datenset umfasst 400.000 Bilder. (Bild: t3n / Midjourney)

Um eine Künstliche Intelligenz zu trainieren, benötigt es eine große Menge an Daten. Gelegentlich werden diese von KI-Forscher:innen in Datensets zusammengetragen und anderen für ihre Arbeit frei zur Verfügung gestellt. So macht es jetzt auch Apple mit „Pico-Banana-400K“. In dem Datensatz stecken 400.000 Bilder, die allesamt durch eine KI kuratiert wurden. Sie sollen dabei helfen, dass Nachfolger von Modellen wie Googles Nano Banana noch besser beim Bearbeiten von Bildern werden.

Apples Pico-Banana-400K: Entstehung und Zweck des Datensatzes

Für das Datenset haben die Apple-Forscher:innen zunächst Bilder von der Plattform Open Images heruntergeladen. Diese umfassen Szenen mit Menschen, Objekten, aber auch Bilder mit überwiegend Text. Im Anschluss haben sie 35 verschiedene Befehle über Gemini-2.5-Flash erstellt, die potenzielle KI-User:innen einem Modell stellen könnten, um Änderungen an den Bildern vorzunehmen. Dazu zählt etwa das Hinzufügen eines Filters oder das Anwenden des Stils von bestimmten Künstler:innen. Aber auch Anpassungen wie das Ändern von Gesichtsausdrücken, der Beleuchtung oder Textpassagen wurden inkludiert.

Die daraus resultierenden Bilder-und-Prompt-Pärchen wurden im Anschluss in Nano Banana hochgeladen, um die Bearbeitungen durchzuführen. Nachdem die KI alle Prompts in den Bildern umgesetzt hatte, haben die Apple-Forscher:innen die Ergebnisse Gemini-2.5-Pro vorgelegt. Das Google-Modell sollte die Bearbeitungen anhand der Prompts beurteilen und feststellen, ob sie auch wirklich gelungen sind.

Aus diesem Ablauf sind jetzt 257.000 Beispiele entstanden, bei denen ein Prompt für eine erfolgreiche Bildbearbeitung gereicht hat. Dazu kommen 72.000 Bildbearbeitungen, bei denen mehrere Prompts nötig waren, um ein zufriedenstellendes Ergebnis zu erreichen. Zu guter Letzt gibt es 56.000 Fälle, in denen die KI-Bearbeitung fehlgeschlagen ist. Die Bilder mitsamt Prompts und der Einschätzung der KI sind jetzt im Datenset gebündelt. Ein KI-Modell, das mit den Daten trainiert wird, kann sich die Bilder und Ergebnisse anschauen und nicht nur aus den erfolgreichen Fällen, sondern auch aus den Fehlschlägen lernen.

In ihrem zugehörigen Paper schreiben die Apple-Forscher:innen dazu: „Da wir Gemini-2.5-Flash für Bearbeitungsanweisungen, Nano Banana für Bildbearbeitung und Gemini-2.5-Pro für die Verifizierung kombinieren, bietet unsere Arbeit ein skalierbares Grundgerüst für die Produktion von hochqualitativen Bildbearbeitungen“. Das Datenset kann ohne Kosten auf GitHub heruntergeladen werden. Sämtliche Trainingsdaten fallen dabei unter die „Non-Commercial-Research-License“. Das bedeutet, dass die Trainingsdaten zwar für Forschungszwecke genutzt werden dürfen, aber keine kommerziellen KI-Modelle damit erstellt werden dürfen.

MIT Technology Review Künstliche Intelligenz Apple
