Gemini kann jetzt Texte aus Google Docs vorlesen. In einem Blogeintrag zur Einführung erklärt Google, dass sich die KI-Audioausgabe sogar mit verschiedenen Stimmen und Wiedergabegeschwindigkeiten anpassen lässt. So kannst du das neue Tool benutzen.

Anzeige Anzeige

Audio-Versionen verbessern die Zugänglichkeit

Moderne KI-Systeme wie Gemini verfügen über sogenannte multimodale Fähigkeiten. Das bedeutet, dass sie verschiedene Arten von Daten parallel verarbeiten und generieren können. Dadurch lassen sich unter anderem geschriebene Inhalte in gesprochene Sprache umwandeln – eine Funktion, die jetzt auch direkt in Google Docs integriert ist. Laut The Verge hatte Google schon im April angekündigt, dass sich Dokumente künftig in KI-Podcasts verwandeln lassen werden. Damit wird es für alle Nutzer:innen technisch möglich, Texte unkompliziert zu vertonen, ohne selbst am Mikrofon sitzen zu müssen.

Aber auch im beruflichen Alltag kann die neue Funktion von Vorteil sein. Für manche Menschen ist es zum Beispiel einfacher, Informationen akustisch aufzunehmen oder beim Zuhören Fehler im Text zu erkennen. Die Audiowiedergabe erleichtert daher die alternative Interaktion mit geschriebenen Inhalten und erhöht somit auch die Barrierefreiheit von Dokumenten. Das Feature steht dabei nicht nur jenen zur Verfügung, die das Dokument erstellt haben. Auch Mitarbeiter:innen und Leser:innen, die ebenfalls Zugriff haben, können auf die automatisch erzeugte Audio-Version eines geteilten Dokuments zugreifen.

Anzeige Anzeige

Das Feature ist zunächst nur eingeschränkt verfügbar

Die Audio-Version eines Google Docs lässt sich durch verschiedene Stimmen und Wiedergabegeschwindigkeiten individuell anpassen. Über den Reiter „Einfügen“ können Nutzer:innen den Menüpunkt „Audio Button“ auswählen und eine Schaltfläche direkt in das Dokument integrieren, wodurch die Wiedergabe mit nur einem Klick möglich wird. Auch hier können Beschriftung, Farbe und Größe verändert und an das Design des Google Docs angepasst werden.

Die vollständige Einführung des neuen Audio-Tools ist für den 25. August 2025 vorgesehen und erfolgt für Workspace-Kund:innen mit Business-, Enterprise- oder Education-Abos sowie für Nutzer:innen der Pakete AI Pro und Ultra. Zunächst ist die KI-Funktion allerdings nur auf englische Texte beschränkt und kann ausschließlich auf Desktop-Geräten genutzt werden.

Empfohlene redaktionelle Inhalte Hier findest du externe Inhalte von TargetVideo GmbH, die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte von TargetVideo GmbH auf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden.

Inhalte anzeigen Hier findest du externe Inhalte von, die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte vonauf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden. Hinweis zum Datenschutz Leider ist etwas schief gelaufen... An dieser Stelle findest du normalerweise externe Inhalte von TargetVideo GmbH, jedoch konnten wir deine Consent-Einstellungen nicht abrufen.

Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.

Datenschutzeinstellungen verwalten An dieser Stelle findest du normalerweise externe Inhalte von, jedoch konnten wir deine Consent-Einstellungen nicht abrufen.Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.