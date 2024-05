Am 13. Mai hat OpenAI mit dem neuen Modell GPT-4o vorgelegt. Der Termin einen Tag vor der Google I/O war sicherlich nicht zufällig gewählt. Sehr wahrscheinlich wollte das Unternehmen dem Suchmaschinenanbieter vor dessen Entwicklerkonferenz den Wind aus den Segeln nehmen. Spannend war also zu sehen, wie Googles Antwort aussah. Los ging es in Apple-Manier – mit einem lustigen Jahresrückblick. Google ließ die in den vergangenen zwölf Monaten vorgestellten KI-Funktionen Revue passieren, bevor Google-Chef Sundar Pichai die Bühne betrat. Nach einer kurzen Eröffnungsrede ging es in die Vollen. Ein Begriff fiel dabei besonders häufig: Gemini.

Anzeige Anzeige

Gemini wird größerer Teil der Google-Dienste

Als frühes Beispiel bei der Veranstaltung nannte Pichai die Suche nach dem eigenen Nummernschild am Auto in Google Fotos. Vorher hätten Nutzer:innen im besten Fall nach Bildern ihres Autos suchen können. Gemini könne nun aber anhand der Bilder automatisch herausfinden, welches Fahrzeug das eure ist und euch Bilder vom Nummernschild anzeigen.

In Workspace-Apps wie Gmail, Google Kalender oder Google Docs hilft künftig Gemini 1.5 Pro in der Randspalte. In Gmail soll der Chatbot dazu in der Lage sein, E-Mails zu einem bestimmten Thema zu suchen und zusammenzufassen. Gleiches funktioniert auch mit Aufzeichnungen aus Google Meet, die per Mail mit euch geteilt wurden.

Anzeige Anzeige

Wer die Gmail-App auf dem Smartphone nutzt, kann künftig E-Mail-Threads zusammenfassen. Wer die Zusammenfassung seiner ungelesen E-Mails vor sich hat, muss darauf bald gar nicht mehr selbst antworten. Gemini produziert kontextbasiert gleich mehrere Antworten für euch, aus denen ihr auswählen könnt. Findet ihr nicht die richtige Option, mit der Gemini helfen kann? Dann könnt ihr selbst einen Prompt eingaben. Eine entsprechende Box wird Google in die Gmail-App integrieren.

In Google Chat kann Gemini kann auch als virtueller Mitarbeiter auftreten. Ähnlich wie ein Slackbot 2.0 ist dieser Assistent in jedem Chat in Google Chat vertreten. So kann er alle Unterhaltungen durchsuchen und dadurch Fragen zu anstehenden oder zum Fortschritt von Projekten beantworten, zusammenfassen und in ein Dokument kopieren.

Anzeige Anzeige

All die Neuerungen gibt es jedoch nicht sofort. Zunächst steht Gemini in Workspace-Anwendungen nur Labs-Nutzer:innen und Workspace-Alpha-Anwender:innen zur Verfügung. Erst im kommenden Monat gibt es die Neuheiten für Business-Kund:innen und Abonnent:innen des „Google One AI Premium“-Abos (rund 20 Euro im Monat).

Gemini-Zukunft für den Alltag

Neben der Arbeit soll Gemini auch im Alltag zur echten Hilfe werden. Zum Beispiel beim Shopping. Wer zum Beispiel Kleidung gekauft hat und feststellt, dass die Größe nicht passt, soll sie einfach fotografieren können. Gemini tritt hier als sogenannter Agent auf, sucht die Bestellnummer aus dem Postfach und koordiniert die Abholung. Bis das im echten Leben funktioniert, dürfte es aber noch einige Zeit dauern.

Anzeige Anzeige

Einen Konter auf GPT-4o gab es auch. Künftig soll Gemini innerhalb der gleichnamigen App als Gesprächspartner dienen, den Nutzer:innen sogar ganz rüde unterbrechen können soll. Zu tief ging Google nicht ins Detail. Nur so viel: Zunächst brauchen Nutzer:innen ein Gemini-Advanced-Abo.

Ein weiterer Seitenhieb Richtung OpenAI: Ähnlich wie bei den Custom-GPTs von OpenAI werden Nutzer:innen bald auch in der Lage sein, Gemini mithilfe sogenannter Gems auf die eigenen Bedürfnisse anzupassen. Der digitale Assistent kann dann Geschichten erzählen oder passgenaue Rezepte liefern.

Empfohlene redaktionelle Inhalte Hier findest du externe Inhalte von X Corp., die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte von X Corp. auf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden.

Inhalte anzeigen Hier findest du externe Inhalte von, die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte vonauf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden. Hinweis zum Datenschutz Leider ist etwas schief gelaufen... An dieser Stelle findest du normalerweise externe Inhalte von X Corp., jedoch konnten wir deine Consent-Einstellungen nicht abrufen.

Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.

Datenschutzeinstellungen verwalten An dieser Stelle findest du normalerweise externe Inhalte von, jedoch konnten wir deine Consent-Einstellungen nicht abrufen.Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.

Googles neue KI-Suche

Außerdem sprach Google auch über die Zukunft der Suche. Auch hier soll eine Abwandlung von Gemini zum zentralen Element werden. Für das Unternehmen eine knifflige Sache. Orientiert man sich zu sehr an Bing und Copilot von Microsoft, riskiert man, künftig weniger Geld durch Werbeanzeigen einzunehmen. Denn wie die Suche die Antwort schon liefert, warum sollte man dann auf Links klicken?

Anzeige Anzeige

Die Antwort liefert Google mit den neuen AI Overviews. Wer eine Frage eintippt, bekommt künftig die richtige Antwort präsentiert. Erweiterte Informationen liefert die Suche in Form von Links auf die Quellen. Spannend: Laut Google habe das dazu geführt, dass diese Links häufiger geklickt wurden, als bei einer normalen Suche. Das klingt so, als müsste man seine eigenen Inhalte künftig besser auf dieses KI-Feature optimieren.

Nutzer:innen können bald außerdem komplexere Fragen stellen, etwa nach den besten Yogastudios in der Stadt und deren aktuellen Angeboten. Außerdem soll es bald möglich sein, auszuwählen, wie Google antworten soll. In einfacher Sprache oder als Zusammenfassung.

Empfohlene redaktionelle Inhalte Hier findest du externe Inhalte von YouTube Video, die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte von YouTube Video auf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden.

Inhalte anzeigen Hier findest du externe Inhalte von, die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte vonauf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden. Hinweis zum Datenschutz Leider ist etwas schief gelaufen... An dieser Stelle findest du normalerweise externe Inhalte von YouTube Video, jedoch konnten wir deine Consent-Einstellungen nicht abrufen.

Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.

Datenschutzeinstellungen verwalten An dieser Stelle findest du normalerweise externe Inhalte von, jedoch konnten wir deine Consent-Einstellungen nicht abrufen.Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.

Spannender sind neue Funktionen. So zeigte Google, dass es bald möglich ist, vorauszuplanen. Als Beispiel ließen die Verantwortlichen auf der Bühne die Suche einen Plan für Mahlzeiten zusammenstellen, der sich nach Belieben bearbeiten ließ. Das Ergebnis könnt ihr im Anschluss in Gmail oder Google Docs abspeichern. Ebenfalls neu ist die Möglichkeit, die KI-Suche fürs Brainstorming zu nutzen. Seid ihr auf der Suche nach einer Lokalität, um den Jahrestag zu feiern, gebt ihr einfach Anlass und Ort in die Suche. Eine KI-Übersichtsseite zeigt dann passende Orte samt Öffnungszeiten, Guides und weitere Details an.

Anzeige Anzeige

Einen kleinen Wow-Effekt gab es bei der neuen Videosuche. Habt ihr ein Problem, könnt ihr bald einfach ein Video vom Sachverhalt aufnehmen und Google über die Google-App etwa fragen, warum der Plattenspieler nicht funktioniert. Nach kurzer Analyse soll die Suche dann eine Schritt-für-Schritt-Anleitung und hilfreiche Links einblenden, um das Problem zu lösen.

Empfohlene redaktionelle Inhalte Hier findest du externe Inhalte von X Corp., die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte von X Corp. auf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden.

Inhalte anzeigen Hier findest du externe Inhalte von, die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte vonauf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden. Hinweis zum Datenschutz Leider ist etwas schief gelaufen... An dieser Stelle findest du normalerweise externe Inhalte von X Corp., jedoch konnten wir deine Consent-Einstellungen nicht abrufen.

Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.

Datenschutzeinstellungen verwalten An dieser Stelle findest du normalerweise externe Inhalte von, jedoch konnten wir deine Consent-Einstellungen nicht abrufen.Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.

Aber nicht zu früh freuen: Alle genannten Neuerungen stehen zunächst nur US-Nutzer:innen zur Verfügung und selbst die müssen sich zum Teil noch bei Google Labs anmelden, weil es sich um Experimente im frühen Stadium handelt. Bis der Rest der Welt einen Blick darauf werfen kann, kann es also noch dauern.

In der Anwendung Notebook LM kann Gemini Pro aus hochgeladenen Dokumenten nicht nur einfache Audiodateien erstellen. Stattdessen kann das Modell eine Unterhaltung mit zwei Stimmen erstellen, die die Inhalte in einem Gespräch wiedergeben. Nutzer:innen haben dann sogar die Möglichkeit, zwischendrin Fragen zu stellen. Google demonstrierte das anhand von Schulaufgaben.

Anzeige Anzeige

Quasi eine aufgebohrte Version von Gemini zeigte Google mit Project Astra. Auch hier ist das Modell der Kernpunkt. Es handelt sich dabei um eine Anwendung, die die Welt um sich herum durch eine Smartphone-Kamera erkennen und erklären kann.

Mit Gemini 1.5 Flash gab Google zudem einen Ausblick auf ein Modell, das alle Fähigkeiten von Gemini 1.5 Pro bietet, aber deutlich schneller funktionieren soll. Allerdings ist dieses Modell zunächst nicht für den breiten Markt, sondern vor allem für Entwickler:innen gedacht und funktioniert vorerst nur in Google AI Studio.

Mit Veo liefert Google zudem eine Antwort auf OpenAIs Sora. Die Video-KI ist dazu in der Lage, Videos in Full-HD-Auflösung zu generieren, die länger als eine Minute sein können. Es soll alle Eigenheiten des Prompts genau einfangen und auch filmische Fachbegriffe erkennen und umsetzen. Laut Google gehören dazu Zeitraffer-Effekte und Luftaufnahmen. Google stellt sich Veo als Tool für erfahrene Filmemacher:innen vor, aber auch für Lehrer:innen, die ihr Wissen weitergeben wollen. Zunächst profitieren davon – wie bei Sora – ausgewählte Kreative. Interessierte können sich aber auf eine Warteliste setzen lassen.

Anzeige Anzeige

Außerdem stellte Google viele KI-Neuerungen für Android vor, die wir euch in einem separaten Artikel zusammengefasst haben.