Anzeige
Anzeige
News

Google greift an: Das kann Gemini 2.0, was ChatGPT nicht kann

Google macht Gemini leistungsfähiger denn je: Du kannst bei Gemini Live im Gespräch Bilder, Dateien und Videos integrieren, mit nur einem Prompt verschiedene Apps bedienen und Aufgaben erledigen und die KI-Assistenz noch leichter aufrufen.

4 Min.
Artikel merken
Anzeige
Anzeige

Die neue Funktion von Google Gemini Live ermöglicht es Nutzern, Bilder, Dateien und Videos in Echtzeit-Konversationen einzubinden.  (Bild: Shutterstock/mundissima)

Gemini Live ist Googles Antwort auf den Advanced Voice Mode von ChatGPT. Beide Optionen kannst du inzwischen in Deutschland nutzen. Im Herbst stellte Google Gemini Live für Android-User in über 40 Sprachen – darunter auch Deutsch – zur Verfügung. User der kostenfreien Gemini-Version können ebenfalls darauf zugreifen.

Anzeige
Anzeige

Jetzt gibt es noch deutlich mehr Möglichkeiten, um mit Gemini Aufgaben zu erledigen, zielführend Brainstorming zu betreiben, Kommunikation zu betreiben und Gedanken digital zu sortieren – und vieles davon können Android-User mit nur einem Prompt neuerdings sogar gleichzeitig bewerkstelligen. Auf dem Samsung Galaxy Unpacked Event stellte Google die jüngsten Updates für Gemini und Gemini Live vor. Dabei steht vor allem eine Simultannutzung von Apps dank der AI-Assistenz im Fokus, mit der du Zeit sparen kannst.

Bilder im Gespräch, Fragen zu Videos und Dateien: Gemini Live wird zu wissenden Gegenüber

Mit Gemini Live kannst du im Gespräch mit Googles KI deinen Ideen freien Lauf lassen, dich über Aktuelles informieren oder auch einfach nur eine Unterhaltung führen. Neuerdings können die User der Android-App von Gemini aber ebenso Bilder, Videos und Dateien in diese Konversationen integrieren. Sissie Hsiao, Googles Vice President und General Manager für die Gemini App und Speech, erklärt im Blog-Post, dass die Option die Chance bietet, von einem Arbeitsprozess auf dem Smartphone schnell zur Konversation mit Gemini Live zu wechseln, um Erklärungen, Hintergründe oder zusätzliche Unterstützung zu erhalten.

Anzeige
Anzeige

„Da Gemini Live für Android entwickelt wurde, können Sie ganz einfach von dem, was Sie gerade auf Ihrem Telefon tun, zu einer Unterhaltung darüber übergehen. Und ab heute wird Gemini Live noch vielseitiger und ermöglicht es Ihnen, Bilder, Dateien und YouTube-Videos in die Konversation einzufügen“,

schreibt Hsiao. Damit können die Nutzer:innen unter anderem ihre Fotografieeinstellungen auf einem Bild bewerten lassen oder eine Frage zu einem für sie relevanten YouTube-Video stellen.

Diese Funktion kommt zunächst für das Samsung Galaxy S24 und die S25-Serie, sowie Google Pixel 9-Geräte. In den kommenden Wochen wird sie für weitere Geräte ausgerollt. Und in den nächsten Monaten werden Android-Geräte mit der Gemini App und das Samsung Galaxy S25 mit der Option versehen, auf Project Astra zuzugreifen. Im Rahmen von Project Astra können User über Android-Phones die KI nutzen, um Konversationen in diversen Sprachen (auch gemixt) führen zu lassen, Produkte wie Lens, Maps und Search einzubeziehen, Konversationen zu erinnern und mit geringerer Latenz Antworten der KI zu erhalten. Wie derlei Möglichkeiten bei der Entdeckung Londons aussehen könnten, zeigt Google in einem Video:

Anzeige
Anzeige

Extensions machen App-Nutzung noch leichter – zwei Fliegen mit einer Klappe oder: Zwei Aktionen mit einem Prompt

Seit dem Frühjahr 2024 ermöglicht Googles Gemini, via Extensions mit anderen Apps wie Google Maps, Youtube oder Google Drive verbunden zu werden und dienst übergreifend Ausgaben auszuführen. Neu ist die Option, mit einem einzigen Prompt verschiedene dieser Extensions einzubeziehen. Wie das funktionieren kann, erklärt Sissie Hsiao in ihrem Text:

„[…] Wenn Sie zum Beispiel nach einer Liste mit proteinreichen Ideen für Ihr Mittagessen suchen, können Sie Gemini nach Rezepten fragen und diese dann ganz einfach in einer Notiz direkt in Samsung Notes oder Google Keep speichern.“

Du kannst beispielsweise auch nach einer spezifischen Location auf Google Maps suchen und die Ergebnisse mit dem gleichen Prompt an einen Kontakt schicken (lassen). Wie das aussieht, zeigt ein X-Post von Android eindrücklich.
Diese sogenannten Multi-Extension-Prompts sind für alle Gemini User im Web, auf Android und iOS verfügbar. Beschränkt auf Samsung Galaxy S25-Geräte ist indes die Option, einfach mit einem Gedrückthalten des Side Buttons die Gemini App direkt auf dem Screen aufzurufen, ohne zu dieser navigieren zu müssen.

Anzeige
Anzeige

Noch mehr Updates für Google User: Circle to search mit AI Overviews, Now Bar und Deep Research

Das Team von Google hat auf dem Samsung Galaxy Unpacked Event noch eine Reihe weiterer Features vorgestellt.
Dazu gehört unter anderem die neue Now Bar. Diese ist für User eines Samsung Galaxy S25 verfügbar und wird im Lock-Screen angezeigt. In dieser Bar können User aktuelle Sportergebnisse ihrer Lieblings-Teams oder auch Google Maps-Anweisungen auf dem gesperrten Gerät sehen.

Des Weiteren plant Google für die nächste Woche den Roll-out von Deep Research in der Gemini-App. Dank dieser Funktion erhalten Advanced-User zahlreiche Rechercheinformationen über die KI-Assistenz, was ihnen Zeit sparen soll; gerade in Recherchekontexten könnte das aber auch für Probleme sorgen, sofern sie ungefiltert übernommen werden.
Neben der Option, in den USA Smartphones mit Galaxy Watch7 LTE Smartwatches zu verbinden, dürften User insbesondere ein Update für die Suchfunktion Circle to Search freuen. Denn Google integriert bei dieser AI-Overviews, sodass Nutzer:innen zu den eingekreisten Bereichen KI-gestützte Suchergebnisse samt Informationen und weiterführenden Links sehen können.

Weiterhin sorgen One-Tap-Actions für bessere Bedienbarkeit bei den visuellen Suchen. Telefonnummern, Mail-Adressen oder URLs können direkt identifiziert und in Verbindung mit einem passenden CTA – wie anrufen oder die URL besuchen – eingesetzt werden.

Anzeige
Anzeige

Diverse KI-Updates von Google werden inzwischen von dem hochleistungsfähigen Modell Gemini 2.0 unterstützt, das du schon testen kannst. Dieses soll das bisher beste KI-Modell Googles darstellen und bietet multimodale Optionen mit nativem Audio- und Visual Input. CEO Sundar Pichai erklärte dazu:

„[…] Heute freuen wir uns, die nächste Ära von Modellen für dieses neue agentenbasierte Zeitalter vorzustellen: Gemini 2.0, unser bisher leistungsfähigstes Modell. Mit neuen Fortschritten bei der Multimodalität – wie der nativen Bild- und Audioausgabe – und der nativen Nutzung von Tools wird es uns ermöglichen, neue KI-Agenten zu entwickeln, die uns unserer Vision eines universellen Assistenten näher bringen […].“

Der Artikel stammt von Niklas Lewanczik aus der OnlineMarketing.de-Redaktion und wird im Rahmen einer Content-Kooperation auf t3n veröffentlicht.

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Kommentare

Community-Richtlinien

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Kommentar abgeben

Melde dich an, um Kommentare schreiben und mit anderen Leser:innen und unseren Autor:innen diskutieren zu können.

Anmelden und kommentieren

Du hast noch keinen t3n-Account? Hier registrieren

Anzeige
Anzeige