Wie Gemini die Arbeit mit PDFs auf deinem Smartphone erleichtert

Bereits im Mai wurde das neue Feature auf der Entwicklerkonferenz von Google angekündigt, nun ist es soweit: Wie unter anderem Android Police berichtet, ist es in der neuesten Version der Files-by-Google-App möglich, während der Ansicht eines PDFs Fragen zu der Datei zu stellen. Bislang half Gemini den Nutzer:innen mit den Features „Fragen zu diesem Bildschirm“ und „Fragen zu diesem Video“, beispielsweise Youtube-Videos zu scannen. Selbiges ist nach dem neuesten Rollout auf für PDFs möglich, sodass User:innen sich lange PDFs zusammenfassen und mehrere Dokumente schnell überprüfen können.
Voraussetzungen, um die neue KI-Funktion nutzen zu können, sind, dass Geräte mit Android 15 betrieben werden, ein Gemini-Advanced-Abonnement vorhanden und Gemini als Standardassistent festgelegt ist.
Arbeitserleichterung für PDFs dank Gemini
Mit Gemini macht Google anderen KIs wie ChatGPT Konkurrenz: Der Chatbot wird stets weiterentwickelt und ist unter anderem in der Lage, „schnell Informationen aus Gmail und Google Drive zu finden und zusammenzufassen, Bilder in Sekundenschnelle zu generieren sowie Text, Sprachbefehle, Fotos und Kamera zu nutzen, um Unterstützung zu erhalten.“
Das „Fragen zu diesem PDF“-Update der Google-Dateien-App erleichtert das Arbeiten mit langen und komplexen Dokumenten: User:innen können sich nicht nur den Inhalt zusammenfassen lassen, sondern auch gezielt Fragen zum Inhalt stellen und beantworten lassen oder neue Inhalte basierend auf dem PDF erstellen. Darüber hinaus bietet die Funktion die Möglichkeit, PDF-Dateien mit anderen Dateien zu kombinieren, um Informationen zusammenzuführen.
Gemini mit „Denkmodus“
Wie Google in einem Blogbeitrag außerdem schreibt, haben Nutzer:innen mit Zugang zu Google AI Studio oder direkter API-Anbindung die Möglichkeit, ein neues KI-Model aus der Gemini-Familie zu testen: Gemini 2.0 Flash Thinking Experimental, auf Deutsch Gemini 2.0 Flash-Denken, nennt sich das derzeit „experimentelle Modell“, wie Google betont.
Der Denkmodus von Gemini 2.0 Flash ist darauf trainiert, eine Art „Denkprozess“ zu durchlaufen, den das Modell als Teil seiner Antwort durchläuft. Die Wege der Thoughts/Gedanken sind für Gemini-User:innen im Antwortfenster nachprüfbar und mit dem Hinweis versehen, dass es sich um experimentelle Gedanken handle.
Damit soll die KI „stärkere Argumentationsfähigkeiten als das Basismodell Gemini 2.0 Flash“ nutzen und Fehler vermieden werden.
Googles neue KI-Suche geht nach hinten los