Wie Sprach-Interfaces Altershürden überwinden
Touch-Technologie funktioniert – im Vergleich zur Eingabe via Maus und Tastatur – direkter. Allerdings: Wer sich mit Technik nicht oder nur wenig auskennt und nicht mehr gut sieht, tut sich mitunter schwer, einen Touchscreen zu bedienen. Die optimale, (fast) altersunabhängige Schnittstelle ist hingegen das gesprochene Wort. Sprechen ist intuitiv. Über Sprache interagieren wir Menschen ganz natürlich – von klein auf bis ins hohe Alter. Und so richten sich Voice-Interfaces auch an all diejenigen Anwender, die auf anderen Wegen nicht kommunizieren können. Etwa, weil sie gesundheitlich eingeschränkt sind, stark zittern oder immer schlechter sehen. Auf der anderen Seite der Altersskala stehen kleine Kinder. Auch sie interagieren viel einfacher und problemloser mit Alexa, Siri und Co als mit einem Tablet. Vor allem, solange sie weder lesen noch schreiben können.
Per Sprachbefehl neue Zugänge schaffen – für die Kleinsten und die Ältesten
„Alexa, rufe Rosi an!“ oder „Alexa, erinnere mich um 18 Uhr an meine Medizin“ sind zwei von vielen Sprachbefehlen, die das Leben von Senioren erleichtern. Ohne ein komplexes technisches Gerät bedienen zu müssen, schicken sie einen einfachen Auftrag an das Sprach-Interface. Parallel konzentrieren sie sich auf das, was sie eigentlich gerade tun. Zum Beispiel einen Kuchen backen. Und so könnte die Anfrage des rüstigen Rentners, der seine Frau mit einem Kuchen überraschen will und gerade mit klebrigen Händen Zucker und Eier verrührt, lauten: „Alexa, wie viel Mehl brauche ich für den Marmorkuchen?“ Die Sprachinteraktion entlastet die Sinne und schont die Nerven. Via sprachgesteuertem Zugang zu Musik-, Literatur- und Streaming-Anwendungen spielen Senioren oder Kinder Lieder und Filme ab oder lauschen spannenden Hörspielen. Und das, ohne mit verstellten Radio- und TV-Sendern oder Fernbedienungen mit zu vielen und zu kleinen Knöpfen kämpfen zu müssen.
Während Senioren die Voice-Technologie in erster Linie als praktische Hilfestellung nutzen, steht für Kinder in der Regel eher der Zeitvertreib im Vordergrund. Per Sprachsteuerung können bereits kleine Kinder ihr Lieblingslied aufrufen und es – zum Leidwesen ihrer Eltern – auch lauter und auf Endlosschleife einstellen. Oder sich zur Unterhaltung Witze oder Geräusche vorspielen lassen. Auch Hörspiele, bei denen junge Zuhörer die teilnehmenden Akteure bestimmen oder den weiteren Verlauf der Geschichte beeinflussen, sind bei Kindern beliebt.
How to: Erfolgreiche altersspezifische Sprachanwendungen
Intuitiv nutzbar, altersspezifisch und idealerweise mit sinnvollem Mehrwert: Das sind die Kriterien für eine ideal konzipierte und entwickelte Sprachanwendung. Weiterhin sollten Unternehmen folgende Punkte beachten:
- Nutzungskontext und Inhalte definieren
Egal, ob es sich bei der Zielgruppe um Kinder oder Senioren handelt, ist die Frage nach den Vorteilen und dem Kontext entscheidend: Was will ich erreichen – Wissen vermitteln, unterhalten oder die Kreativität anregen? Je klarer Inhalt und Interaktionsmodus auf das entsprechende Ziel ausgerichtet sind, desto besser wird die Anwendung angenommen. - Personas und User-Journeys erstellen
Eine gründliche Recherche ist ein Muss, um Nutzer- und Botpersonas dezidiert ausarbeiten sowie User-Journeys entwickeln zu können. Bei den User-Journeys handelt es sich um Nutzungsszenarien, die den Kontext des Nutzers, dessen Gemütszustand und Ziele einbeziehen. Eine solche Journey variiert stark – je nachdem, ob eine Anwendung zum Beispiel ein Kind nach einem stressigen, reizüberflutenden Kindergartentag anspricht, oder eben ein gelangweiltes Kind dazu motivieren soll, sich zu bewegen. - Reaktionsverhalten und Wissensstand berücksichtigen
Auch ist es wichtig, wie eine Anwendung auf Nutzereingaben reagiert. Wenn Alexa die Antwort auf eine Quizfrage verrät, bevor der Ratende seine Lösung überhaupt formuliert hat, macht es schnell keinen Spaß mehr. Das gilt für Senioren wie für Kinder. Fragt ein Voice-Quiz-Skill etwa eine fünfjährige Nutzerin, welches der folgenden Tiere nicht auf dem Bauernhof lebt – A: Hund, B: Schwein, C: Elefant, muss als korrekte Antwort „Elefant“ reichen und das System darf nicht erwarten, dass das Kind mit „C“ antwortet. Genau genommen sollte noch früher angesetzt und die Fragen kindgerechter formuliert werden. Bei der Entwicklung altersgerechter Anwendungen sollten Unternehmen daher Erkenntnisse aus gängigen Lerntypen- und Entwicklungsmodellen als Orientierungshilfe einbeziehen. Dazu gehört etwa das klassische Modell der kognitiven Entwicklungsphasen von Kindern nach Piaget. Auch ein Blick auf die neuesten Marktforschungsergebnisse lohnt, um mit genügend Hintergrundwissen über die Mediennutzung und -vorlieben der jeweiligen Altersgruppe in ein Projekt zu starten. - Altersspezifische Sprachbesonderheiten miteinbeziehen
Ein dreijähriges Kind spricht Buchstaben oder Wörter mitunter falsch aus oder macht Fehler in der Grammatik oder der Syntax. Das ist ganz normal und entwicklungsbedingt. Spracheingabevarianten gilt es jedoch an diese altersspezifischen Besonderheiten anzupassen. Ein gelispeltes „Is will eine Gesiste hören“ muss das Natural-Language-Processing ebenso verarbeiten können wie ein vorgesungenes Lied anstelle des Songtitels. Anwendungen für ältere Nutzer sollten etwa falsch ausgesprochene Fremdwörter und Dialekt erkennen, damit die smarte Kaffeemaschine auf den Befehl „Bereite eine ‚Latte Matschiato‘ zu!“ nicht mit einer Fehlermeldung reagiert. - Sprachausgabe anpassen
Damit sowohl ganz junge, als auch sehr alte Anwender eine Sprachanwendung als „Gegenüber“ akzeptieren, sind Tempo, Stimme und Art der Wiedergabe entscheidend. Besonders kleinere Kinder lieben Wiederholungen und weichere, höhere Tonlagen. Die Aufmerksamkeitsspanne von Kindern ist relativ kurz. So führt eine langsame, monotone Sprachausgabe innerhalb kürzester Zeit dazu, dass sie das Interesse verlieren. Tiergeräusche, Kinderlieder, Wortspiele oder Witze kommen hingegen gut an und erhöhen die Verweildauer merklich. Bei einem Skill für Senioren müssen Alexa und Co entsprechend langsamer reden, damit sie es verstehen.
Voice-Technologie ist weder Allheilmittel noch Selbstläufer
Nicht jede Art von Information und Entertainment lässt sich in kleine, gut verdauliche Sprachhäppchen verpacken. Das trifft zum Beispiel auf Interaktionen zu, bei denen ein Bildschirm oder eine Tastatur sinnvoll sind (wie etwa beim Buchen einer Reise), oder auf solche, die eine höhere Informationsdichte und komplexe Zusammenhänge vermitteln – wie bei langen Inhaltsstoffe-Listen von Lebensmitteln oder Medikamenten-Beipackzettel. Für solche Anwendungsfälle können jedoch multimodale Sprach-Interfaces, sogenannte Smart Displays, zum Einsatz kommen. Diese lassen sich über Sprache bedienen, zeigen aber ausgewählte Inhalte auf dem Touch-Bildschirm an.
Die Nutzung von Sprach-Interfaces erfolgt intuitiv, trotzdem müssen Menschen an Voice-Anwendungen herangeführt werden. Senioren benötigen Hinweise, was genau eine Anwendung leisten kann. Begrüßt eine Anwendung den Nutzer mit den Worten „Was kann ich für Sie tun?“, handelt es sich um einen offenen Dialog, der durchaus hohen Erwartungen gerecht werden muss. Hilfreicher und zielführender wird es, wenn der Skill direkt darauf hinweist, dass man mit seiner Hilfe zum Beispiel den Backofen steuern und überwachen kann – und gleichzeitig noch ein paar Beispielbefehle anführt.
Unterstützt die Enkelin bei der Technik und verknüpft Alexa mit den Smarthome-Geräten in der Wohnung, kann ihre Oma in Zukunft sogar das Licht im Schlafzimmer vom Bett aus anschalten, und muss dadurch nicht mehr unsicher durch den dunklen Raum tasten. Was für die jüngere Generation einfach „convenient“ ist, bedeutet im Alter erhöhte Sicherheit und eine längere Eigenständigkeit.
Das oft fehlende Vertrauen in den Datenschutz ist ein gewichtiger Aspekt, der viele Menschen davon abhält, Sprachassistenten zu nutzen. Plattformhersteller müssen daher aufklären, während Anbieter von Sprachanwendungen für die nötige Transparenz sorgen sollten. Ist ein sinnstiftender Nutzen erkennbar, stellen Anwender ihre Bedenken bezüglich Datenschutz eher hinten an.
Eine Anwendung für alle?
Es gibt Anwendungen, die generationsübergreifend funktionieren, insbesondere im Bereich Kommunikation. Im Falle eines Sprach-Skills für einen Video-Anruf ist es daher kaum notwendig, altersspezifische Unterschiede zu machen. Das ist jedoch die Ausnahme. Im Allgemeinen gilt: Je spezifischer sich eine Zielgruppe angesprochen fühlt und je sinnhafter ein Voice-Skill für diese ist, desto besser wird er angenommen. Schließlich gibt es auch im Restaurant sowohl Schneewittchen- als auch Seniorenteller.