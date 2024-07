Bisher ist die Firma Elevenlabs vor allem durch ihre Text-to-Speech-Funktion bekannt. Dort kann man Text in den Editor kopieren, eine der vielen verfügbaren künstlichen Stimmen auswählen und nach Sekunden ist eine Audiodatei fertig. Wer möchte, kann auch seine eigene Stimme klonen und für Text-to-Speech nutzen.

Elevenlabs bietet seine KI in verschiedenen Sprachen an, unter anderem Englisch, Chinesisch, Französisch, Deutsch oder Japanisch, und erweitert sein Portfolio regelmäßig um neue Funktionen. So kann der Dienst inzwischen auch Videos in andere Sprachen synchronisieren, mit einem Prompt Geräusche erzeugen oder eine Stimme aus einer Aufnahme mit anderen Geräuschen herausfiltern.

Die neueste Kreation von Elevenlabs ist eine App mit dem simplen Namen Reader. Die Idee dahinter: Man nehme die verfügbaren KI-Stimmen und kombiniere sie mit einer Lesezeichenapp wie Pocket oder Instapaper. In die Reader-App kopiert man über das Teilen-Menü des Smartphones Artikel, PDFs, E-Books oder Newsletter. In der App werden die Texte dann auf dem Homescreen angezeigt und nach dem anklicken von einer digitalen Stimme der Wahl vorgelesen. Eigentlich ganz praktisch, wenn man ähnlich wie bei Podcasts zum Beispiel einen Text in der Bahn lieber hören als lesen möchte oder nebenbei kochen will.

Noch ist der Funktionsumfang ausbaufähig

Wir haben die kostenlose App heruntergeladen und ausprobiert. Bisher gibt es nur eine iOS-Version, an einer Version für Android arbeitet Elevenlabs aber bereits. Direkt nach der Installation fällt auf: Bisher funktioniert das Ganze nur mit englischen Texten, weitere Sprachen sollen aber folgen.

Ist ein Text, zum Beispiel von einer Website, in die App kopiert, dauert es nur wenige Sekunden, bis eine KI-Stimme beginnt, ihn vorzulesen – egal, wie lang der Text ist. Wie funktioniert das? Indem immer nur ein kleiner Teil des Textes vertont wird, nie direkt der gesamte Text. Das setzt allerdings auch eine durchgehende Internetverbindung voraus, da die Vertonung nicht lokal auf dem Gerät, sondern auf den Servern von Elevenlabs passiert. Aktuell ist es daher zum Beispiel auch nicht möglich, eine Audio zu erzeugen und dann später unterwegs ohne Internet anzuhören. Allerdings soll es in Zukunft möglich sein, Audiodateien auch zu speichern oder mit anderen zu teilen.

Bei unserem kurzen Test fällt ebenfalls auf, dass es manchmal zu Serverfehlern kommt, wahrscheinlich weil der Dienst überlastet ist. Wenn die App aber funktioniert, dann ist es sehr angenehm, den KI-Stimmen zuzuhören. Man merkt zwar, dass es sich um künstliche Stimmen handelt, aber Betonungen, Aussprache und Pausen sind so gut, dass es nicht stört. Insgesamt stehen aktuell elf Stimmen zur Auswahl. Wer möchte, der kann auch die Geschwindigkeit von 0,8- bis 2-fach anpassen.

Wünschen würden wir uns allerdings noch Funktionen wie Playlists, so wie sie aus Podcast-Apps bekannt sind. Schön wäre auch, wenn man die Reihenfolge der Texte verändern könnte, aktuell landen sie noch so in der App, wie man sie hinzufügt.

Fazit

Noch wirkt die App sehr rudimentär, man merkt aber schon gut, in welche Richtung es gehen könnte. Sollten weitere Sprachen und Funktionen folgen, könnte Reader eine gute Ergänzung zu Podcasts werden – immer dann, wenn man einen Text nicht selbst lesen möchte oder kann. Spannend zu sehen wird auch sein, ob die App in Zukunft Geld kostet, ähnlich wie die anderen Funktionen von Elevenlabs ja auch in einem kostenpflichtigen Abo enthalten sind.

