Anzeige
Anzeige
News

Googles Whisk: So einfach kombiniert die KI Bilder und erschafft einzigartige Kunstwerke

Whisk heißt das neue KI-Tool von Google, das jetzt in einer Alpha verfügbar ist. Wir haben uns das Programm genauer angeschaut und getestet, welche Ergebnisse die Bildkombinationen hervorbringen.

4 Min.
Artikel merken
Anzeige
Anzeige
Ein t3n-Kuscheltier im Büro? Mit Googles Whisk kein Problem. (Bild: t3n/Google Whisk)

Google hat zum Ende des Jahres noch einen großen KI-Rundumschlag im Gepäck. Neben der Ankündigung der Video-KI Veo 2 startet das Unternehmen ab sofort auch ein KI-Tool, das Bildgenerierung auch ohne lange Prompts ermöglichen soll. Das Programm von Google trägt den Namen Whisk und kombiniert Bilder miteinander, um ein KI-Bild für euch zu erstellen.

Anzeige
Anzeige

Whisk: So erstellt ihr euch ein Objekt für euer KI-Bild

Whisk – was im Deutschen Schneebesen oder verquirlen bedeutet – kann mehrere Bilder miteinander kombinieren, die ihr dem Programm vorgebt. Sei es durch einen Prompt oder indem ihr einfach Bilder hochladet. Dabei könnt ihr drei Elemente genauer bestimmen: das Thema, also, was ihr in eurem Bild primär zeigen wollt sowie die Szene, in der das Ganze stattfinden soll und der Stil, in dem das Bild gehalten wird.

Um Google Whisk auszuprobieren, müsst ihr hierzulande noch auf ein VPN zurückgreifen. Zu Beginn begrüßt euch das KI-Tool mit einer Vorauswahl. Ihr sollt ein Bild hochladen, um ein Kuscheltier zu erstellen. Also haben wir uns kurzerhand das t3n-Logo geschnappt und einen ersten Entwurf generieren lassen. Das Ergebnis: ein knallrotes t3n-Kuscheltier mit Knopfaugen.

Anzeige
Anzeige

Google Whisk hat mit dem t3n-Logo und der Vorgabe eines Kuscheltiers dieses Bild erstellt. (Bild: t3n/Google Whisk)

Dieses Ergebnis ist aber nicht alles. Denn nach diesem Tutorial können wir in den Editor wechseln und alle Funktionen von Googles Whisk frei nutzen. Der erste Entwurf war schon recht gelungen. Die Farbe des Logos hat das KI-Tool für das Kuscheltier übernommen und auch den Text erkannt und korrekt wiedergegeben. Allerdings war uns das Kuscheltier auf einem weißen Hintergrund zu langweilig. Also wechselten wir zum Bereich für die Szene und einem Text-Prompt.

Der nächste Schritt in Whisk: Szene und Stil anpassen

Das Besondere bei Google Whisk ist, dass ihr schon anhand der Prompts in den Kategorien Thema, Szene und Stil eigene Bilder generiert bekommt. Diese könnt ihr jederzeit anpassen, herunterladen oder einfach neu generieren, wenn sie euch nicht gefallen. Sie alle beeinflussen am Ende das Ergebnis. Im Übrigen müssen alle Eingaben dabei auf Englisch erfolgen. Auch wenn die Oberfläche von Whisk trotz VPN auf Deutsch angezeigt wird, scheitern Eingaben auf Deutsch und werden nicht generiert.

Anzeige
Anzeige

Ein t3n-Kuscheltier als Zauberer? Mit Googles Whisk kein Problem. (Bild: t3n/Google Whisk)

Wir haben uns zunächst dazu entschieden, den kuscheligen t3n-Kumpel ins Büro zu verfrachten. Die KI erstellte uns anhand des Prompts „sitting in an office“ zunächst einen Business-Mann, der am Schreibtisch sitzt und auf einen Computer-Monitor schaut. Der Prompt von Whisk umfasste dann aber noch weitere Details wie seine Kleidung, seine körperlichen Merkmale und Details zu seiner Arbeitsumgebung. Der kurze Prompt wird also verlängert. Kurzerhand haben wir den Mann im Prompt gegen unser Kuscheltier ausgetauscht und das oben stehende Ergebnis erhalten.

Den Stil konnte Whisk bis zu diesem Punkt noch komplett allein bestimmen. Um ein für die Jahreszeit passendes Bild zu generieren, haben wir als Thema zunächst das t3n-Kuscheltier vorgegeben, dann in der Szene einen Weihnachtsmann beschrieben, der vor dem Weihnachtsbaum sitzt – umringt von Keksen, Milch und Geschenken. Als Stil wählten wir einen Comic-Stil der 80er-Jahre mit knalligen Farben, dicken Konturlinien und den typischen Benday-Dots. Das Ergebnis kann sich sehen lassen:

Anzeige
Anzeige

So sieht das t3n-Kuscheltier im Comic-Stil zu Weihnachten aus. (Bild: t3n/Google Whisk)

Welche Probleme hat Whisk noch?

Beim Ausprobieren von Googles Whisk sind uns aber noch ein paar Fehler aufgefallen. Diese sind aber auch zu erwarten. Schließlich zeichnet Google das KI-Tool noch als Alpha aus. In den kommenden Monaten dürften einige dieser Punkte vermutlich behoben werden. Einer der gravierendsten Punkte betrifft die Konsistenz zwischen den einzelnen Bildern. Wie ihr seht, hat sich das Kuscheltier auch innerhalb kurzer Zeit gewandelt und wurde deutlich runder.

Zudem hat Google Whisk nach einigen Prompts Probleme mit dem Schriftzug bekommen. Wir vermuten, dass das an der Anzahl der steigenden Prompts lag, die das KI-Tool berücksichtigen musste. Denn als wir eine neue Kreation begonnen oder das KI-Tool an die richtige Schreibweise erinnert haben, funktionierte die Text-Generierung wieder zuverlässiger. Ansonsten plagen Whisk die üblichen KI-Probleme. Dazu zählen etwa zusätzliche oder ineinander verschmelzende Gliedmaßen bei Menschen sowie Gegenstände, die eigentlich nicht ins Bild gehören. In einer Variante des Weihnachtskuscheltiers hing etwa ein Stück Pizza am Baum.

Über das Optimieren-Feature haben wir zunächst eine Weihnachtsmütze hinzugefügt und dann den t3n-Schriftzug berichtigt. (Bild: t3n/Google Whisk)

Dennoch bietet Whisk in seiner aktuellen Form schon ein interessantes und vor allem spaßiges Konzept. Nutzer:innen können hier auch ohne Prompt-Vorkenntnisse schnell gute Ergebnisse erzielen. Und wer an den Prompts von Whisk herumdoktert, kann der KI noch präzisere Ergebnisse entlocken. Für deutsche User:innen bleibt deshalb nur zu hoffen, dass sich Whisk künftig auch ohne Umwege hierzulande nutzen lassen kann.

Anzeige
Anzeige

In diesen KI-Gemälden verstecken sich berühmte Persönlichkeiten

Hidden Portraits Quelle:

 

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Kommentare

Community-Richtlinien

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Kommentar abgeben

Melde dich an, um Kommentare schreiben und mit anderen Leser:innen und unseren Autor:innen diskutieren zu können.

Anmelden und kommentieren

Du hast noch keinen t3n-Account? Hier registrieren

Anzeige
Anzeige