Du hast deinen AdBlocker an?

Es wäre ein Traum, wenn du ihn für t3n.de deaktivierst. Wir zeigen dir gerne, wie das geht. Und natürlich erklären wir dir auch, warum uns das so wichtig ist. Digitales High-five, deine t3n-Redaktion

Ratgeber

Skills für Voice-Interfaces: So geht‘s!

(Bild: Shutterstock)

Die Entwicklung neuer Technologien wie Voice-Interfaces schreitet so schnell voran, dass manchmal der Eindruck entsteht, niemand hätte jemals etwas von Nutzerfreundlichkeit gehört. Unser Gastautor hat sechs hilfreiche Tipps.

Fangen wir ganz vorne an. Wann ist ein Produkt nutzerfreundlich? Auf den Punkt gebracht hat das Don Norman die Antwort in seinem Klassiker „The Design of Everyday Things“:

  1. Die Nutzer müssen in der Lage sein, zu erkennen, welche Aktionen mit dem Produkt ausgeführt werden können und wie man sie ausübt (Discoverability).
  2. Die Nutzer müssen verstehen können, wie die Nutzung des Produktes gemeint ist und was die verschiedenen Features für einen Zweck haben (Understanding).

Ganz platt gesagt: Ich muss verstehen was, wie und warum. Bei Sprachinterfaces muss all das komplett über Sprache geschehen, da die Nutzer meist nicht viel sehen können. Dieser Artikel geht auf Aspekte der Semantik und der Kognitionspsychologie ein, die für Voice-Interaktion relevant sind und häufig nicht bedacht werden.

1. Der Skill-Name setzt den Erwartungsrahmen

Die meisten Geräte haben aktuell kein Display. Wichtig ist daher, dass bereits der Titel deines Voice-Skills Assoziationen auslöst. Nehmen wir das Beispiel „Kino Skill“. Klar ist, dass der Nutzer Informationen rund um das Thema Kino bekommt, vielleicht kann er auch Tickets kaufen. Der Name ist mehrdeutig: Bekommt man Kinotickets, Filmtipps, Hintergrundinformationen oder alles zusammen? Wenn der Skill mehrere Dinge erledigen kann, sollte das direkt am Anfang erklärt werden: „Willkommen beim Kino Skill. Mit mir kannst du Kinotickets kaufen oder das Kinoprogramm anhören. Was möchtest du tun?“. Sollte der Skill aber nur eins von beidem können, sollte dies bereits der Name klarmachen, damit keine falschen Erwartungen entstehen. In so einem Fall ist es also besser, den Skill „Kinotickets“ beziehungsweise „Kinotipps“ zu nennen. So setzt du einen Rahmen und Kontext, der den Interpretationsspielraum einschränkt.

2. So erklärst du die Möglichkeiten deines Skills

Viele Skills erklären zu Beginn erst einmal explizit die genauen Möglichkeiten, etwa so: „Wenn du einen Termin erstellen willst, sage <>“. Das klingt nicht nur unnatürlich, es ist zudem auch oft überflüssig. Es erklärt sich meistens von alleine, wenn stattdessen eingeleitet wird mit: „Du kannst Termine erstellen und Termine abrufen“. Explizit vorzusprechen, welche konkreten Befehle gegeben werden können, ergibt allerdings dann Sinn, wenn die Nutzer Hilfe benötigen. Das kann zum einen der Fall sein, wenn sie direkt nach Unterstützung fragen, also etwa fragen: „Kalender-Skill, wie erstelle ich einen Termin?“. Zum ist es sinnvoll, wenn Nutzer zu einem Zeitpunkt falsche oder dem Skill unbekannte Befehle geben. Dann kann es sehr hilfreich sein, den Nutzer darauf aufmerksam zu machen, wie eine korrekte Variante aussieht.

3. Fragen müssen eindeutig sein

Fragen müssen immer der eindeutige Hinweis für den Nutzer sein, jetzt sprechen zu können. Es muss daher klar sein, wann eine Frage abgeschlossen ist. Zu vermeiden ist unbedingt, nach einer Frage noch etwas nachzuschieben, wie etwa: „Möchtest du ein Kinoticket kaufen? ... Du kannst auch für mehrere Personen bestellen.“ Hier ist die Gefahr zu groß, dass die Nutzer zu früh anfangen, zu antworten. Wenn eure Nutzer aus einer Reihe von Möglichkeiten wählen können, achtet darauf, sie mit eurer Frage bereits richtig zu lenken. Zu offen gestellte Fragen wie zum Beispiel: "Wie groß soll deine Pizza sein?", sorgen häufig für Verwirrung, da nicht klar ist, welche Optionen zur Auswahl stehen. Auch eine Frage wie: "Möchtest du Pizza oder Lasagne?" wäre noch zu weit gefasst. Baue deine Fragen also möglichst so auf, dass ganz klar ist, wofür man sich entscheiden kann: "Wir haben Pizza und Lasagne. Was davon möchtest du haben?"

4. Listen richtig vorlesen

Wenn dein Skill sagt: „Auf deine Pizza kannst du Spinat, Pilze, Salami, Schinken, Artischocken, Feta, Zwiebeln, Sellerie, Peperoni, Paprika oder Rucola legen. Was möchtest du haben?“ gibt es ein Problem: Die Liste ist zu lang. Miller’s Law besagt, dass unser Kurzzeitgedächtnis nur 7 ± 2 Informationseinheiten präsent halten kann. Die Zahl wird davon beeinflusst, wie komplex oder abstrakt die einzelnen Einträge sind. Es wird meist empfohlen, Listen auf zwei bis fünf Elemente zu beschränken. Im Falle von Pizzabelägen können es ruhig fünf sein. Falls die Liste aus akademischen Fachaufsätzen mit ellenlangen Titeln besteht, sollten es dann vielleicht eher zwei oder drei Einträge sein. Müssen aber – wie bei den Pizzabelägen – zwingend mehr als fünf Einträge zur Auswahl stehen, kannst du dieses Problem lösen, indem du fragst: „Sollen noch weitere Pizzabeläge aufgezählt werden?“. Bei noch längeren Listen mit 30, 40 oder mehr Einträgen sollte man sich doch die Frage stellen, ob dieser Use-Case überhaupt für Voice-Interaktion geeignet ist.

5. So gehst du mit den Antworten um

Die große Herausforderung bei Sprachinterfaces ist, dass Nutzer auf viele Arten antworten können. Auf die Frage „Wie viele Kinotickets für Star Wars möchtest du kaufen?“ kann der User auch folgende Antworten geben: - „Zwei“ - „Ich möchte zwei Tickets kaufen“ - „Zwei Tickets“

Die modernen Entwicklungsumgebungen von Amazon oder Google bieten an, verschiedene Varianten anzulegen, die erkannt werden, sogenannte „Utterances“. Aber Nutzer antworten gelegentlich auch mit impliziten Aussagen: - „Für mich und meinen Mann“ - „Die beiden Plätze ganz vorne auf der Empore“

Hier kannst du natürlich nicht immer alles vorhersehen, was deine Nutzer antworten werden. Systeme, wie etwa Dialogflow von Google helfen dir aber bei diesem Problem. Häufig leiten Machine-Learning-Algorithmen automatisch ab, was der Nutzer wohl am wahrscheinlichsten gemeint hat. Wenn dies nicht möglich ist, dokumentieren die Systeme genau, an welcher Stelle welcher Befehl gegeben wurde, den dein Skill nicht interpretieren konnte. So hast du als Entwickler schnell die Möglichkeit, zu sehen, wo Verbesserungspotential besteht.

In jedem Fall solltest du dir überlegen, wie dein Skill reagieren soll, wenn der Nutzer etwas völlig Unvorhergesehenes sagt. Mach transparent, dass die Antwort nicht verstanden wurde und werde etwas konkreter, auf welche Art reagiert werden kann. Wenn auf die Frage nach der Anzahl der Kinotickets mit „Sellerie“ geantwortet wird, dann antworte mit etwas wie: „Das habe ich leider nicht verstanden. Sag mir am besten einfach die Anzahl der Kinotickets, die du kaufen möchtest.“

6. Bestätige die Antworten der User

Denke unbedingt immer daran, dass deine Nutzer keinerlei visuelles Feedback bekommen. Das heißt, sie können nicht sehen, ob das Voice-Interface das macht, was sie von ihm wollen. Also ist es notwendig, dass wichtige Informationen, die der Nutzer gegeben hat, vom Voice-Interface wiederholt werden. Statt „Okay alles klar!“ sollte es eher heißen: „Du möchtest eine große Peperonipizza mit extra Käse, richtig?“. Oder wenn ein Nutzer nach dem Wetter für Berlin am Sonntag fragt, sollte dein Skill nicht einfach antworten „23 Grad und Sonne“, sondern „Das Wetter in Berlin an diesem Sonntag wird wahrscheinlich sonnig bei 23 Grad sein.“

Fazit

Auch ohne in die Tiefen von Usability Guidelines vorzudringen, kannst du deine Nutzer mit der Einhaltung dieser Grundsätze vor großen Frustrationen bewahren. Denn eines ist klar: Die tollste neue Technologie ist nichts wert, wenn sie den Nutzer am Ende nur nervt.

Warum es höchste Zeit ist, dass UI Standards auch für die Entwicklung von Sprachinterfaces umgesetzt werden, erklären die Experten der eresult GmbH auf der Developer Week am 26. Juni 2018 in Nürnberg. Die Developer Week ist seit Jahren die Anlaufstelle für die deutschsprachige Entwickler-Szene und eine der größten, unabhängigen Entwickler-Konferenzen Europas mit über 130 Referenten und mehr als 170 Sessions in 30 Thementracks. Informationen und Anmeldung unter www.developer-week.de.

Bitte beachte unsere Community-Richtlinien

Schreib den ersten Kommentar!

Melde dich mit deinem t3n Account an oder fülle die unteren Felder aus.