Was können Chatbots im Facebook-Messenger wirklich? Wir haben drei Roboter getestet

Wetter abfragen, Klamotten bestellen, Nachrichten lesen – so schlagen sich Chatbots im Messenger

Facebook-Chatbots im Test: So schlagen sich CNN, Poncho und Spring. (Screenshot: t3n.de)
Bots for Messenger sind Teil der neuen Messenger-Plattform von Facebook. Die kleinen Roboter sollen im Nachrichtenfenster mit Nutzern interagieren und ihnen beispielsweise beim Einkaufen helfen, die Nachrichten des Tages aufbereiten, Informationen zum Wetter mitteilen oder aber auch Rechnungen und Lieferstatus-Meldungen übergeben – alles natürlich vollautomatisiert.
Für Facebook war es eine der großen Ankündigungen auf der diesjährigen F8-Konferenz in San Francisco. Zum Start haben die Verantwortlichen das Augenmerk vor allem auf die CNN-, Spring- und Poncho-Bots gerichtet, die alle für sich genommen coole Dienste liefern. CNN kuratiert aktuelle News, Spring ist ein Shopping- und Poncho ein Wetter-Service. Der grundsätzliche Nutzwert dieser Dienste ist hoch für den jeweiligen Anwender, aber funktionieren sie auch?
Wir haben uns für diesen Beitrag die drei „Vorzeige-Bots“ genauer angeschaut, um zu testen, wie gut sie sich wirklich im Alltag schlagen. Vorab: Unsere Ergebnisse lassen keine Freudensprünge zu, sind aber auch weit entfernt von einem Bullshit-Resultat. Doch lest selbst.
Der CNN-Bot für den Messenger fragt, über was du informiert werden willst

Der CNN-Bot im Messenger kuratiert Nachrichten anhand von Schlagworten. (Screenshot: t3n.de)
Der CNN-Bot hat sich grundsätzlich nicht schlecht geschlagen. Auf unser „Hi“ meldet er sich prompt zurück und übergibt floskellos drei Optionen, die uns auf den neuesten Stand bringen sollen. Auf „Hi there, let’s get started. I’ll send you top stories every day“ folgen die Kategorien „Top Stories“, „Stories for you“ und „Ask CNN“. Während die ersten beiden Angebote sich vor allem auf die Wichtigkeit, Aktualität und Popularität einzelner News stützen und somit kaum individuell auf den Nutzer eingehen können, kann mit „Ask CNN“ wesentlich mehr experimentiert werden.
Sobald die Option ausgewählt wird, antwortet der Bot mit „What’re you looking for? Use a few words to tell me what you want to know more about.“ Anwender können sich beispielsweise die letzten Artikel zu „Obama“, „Trump“, „Merkel“ oder „Syria“ anzeigen lassen. Das funktioniert ziemlich gut – solange ein Nutzer sich eben auf klar formulierte englische Schlagwörter konzentriert. Auf deutsche Wörter oder mehrere Begriffe geht der Bot nicht oder nur unzureichend ein – die Suche nach Artikeln zu „Flüchtlingen“, „AfD“ oder „Alternative für Deutschland“ geht völlig ins Leere.

Deutsche Begriffe bekommt der CNN-Bot nicht eingeordnet. (Screenshot: t3n.de)
Gelöst werden kann das Problem mittelfristig durch KI-Technologien, die die Anfragen als deutsche Begriffe identifizieren und sie übersetzen. Denn Artikel zur Flüchtlingskrise oder der AfD gibt es zu genüge auf CNN.
Poncho reagiert sogar auf Fragen wie: „Do I need an umbrella?“

Der Poncho-Bot setzt auf Smalltalk und Humor und antwortet im Kurztest sehr zufriedenstellend. (Screenshot: t3n.de)
Der Poncho-Bot hat sich ebenfalls gar nicht schlecht geschlagen. Auf unser „Hi“ meldet sich ein Katzen-Avatar, der versucht die Beziehung zum Anwender mit etwas Humor aufzulockern. Das gelingt auch, irgendwie – wenn man denn Lust auf diesen Smalltalk hat. Anschließend fragt Ponchos „Weathercat“ nach dem Aufenthaltsort des Nutzers. Der kann wiederum entweder mit einem GPS-Signal per Smartphone antworten oder aber mit dem Namen der Stadt, in der er sich aufhält. Was hier auffällt ist, dass Poncho das deutsche Wort „Hannover“ sofort erkennt und es in „Hanover“ übersetzt. Großartig!
Ebenfalls überrascht waren wir, dass der Bot auf Fragen wie „Do I need an umbrella today?“ klipp und klar mit einem „Nope, it’s not raining. Whew!“ antwortet. Die Frage muss allerdings in englischer Sprache eingegeben werden. Auf eine deutsche Anfrage antwortet Poncho mit „Excuse me?“, was wir aber verzeihen können, da dies zum jetzigen Zeitpunkt vielleicht auch etwas zu viel verlangt wäre.
Mit Fragen wie „When will the sun go down?“ kann Poncho hingegen nichts anfangen. Ist aber vielleicht auch gar nicht wichtig, wird der ein oder andere jetzt sagen. Ja vielleicht, aber in guten Wetter-Apps ist diese Information in der Regel irgendwo enthalten.
Der Spring-Bot reagiert gar nicht auf individuelle Anfragen

Der Spring-Bot verhält sich kaum wie ein Chatbot. So braucht der Shopping-Prozess viel Zeit. (Screenshot: t3n.de)
Der Spring-Bot arbeitet ganz anders als die vorherigen Bots. Denn im Gegensatz zu den anderen Chat-Robotern, will der von Spring sich gar nicht unterhalten – beziehungsweise lässt individuelle Anfragen überhaupt nicht zu. Auf unser „Hi“ antwortet er „Typing is cool, but to shop on Spring, please use the handy buttons above or type ‘Go Shopping‘.“ Aber auch danach kann ein Anwender sich nur über vorgefertigte Menü-Punkte an Produkte herantasten. Das ist langweilig.
Auf individuelle Aussagen und Fragen wie „I need shoes for under $75“ oder „I need a black shirt. Can you help me?“ reagiert Spring wieder nur mit der oben erwähnten Standard-Antwort. Das ist schade, denn Navigations-Elemente können Nutzer auch im Online-Shop anklicken – dafür braucht es keine Bots. Ein Test wie der Spring-Bot auf deutsche Begriffe reagiert, erübrigt sich insofern komplett.
Auch das präsentierte Angebot ist nicht besonders groß. Nachdem wir uns durch die Antwortmöglichkeiten geklickt haben und uns Schuhe für unter 75 US-Dollar anzeigen lassen wollten, bekamen wir lediglich fünf Paare präsentiert, die allesamt auch noch unterschiedlicher Art waren – unter anderem ein Laufschuhe, ein Slipper und ein Sneaker. Wer jetzt gehofft hat, das gesamte Angebot zu Sneakern vor sich ausgebreitet zu bekommen, wird enttäuscht. So dauert Shopping im Messenger leider ewig.
Fazit: Es gibt noch eine Menge zu tun!
Eines muss gesagt werden: So positiv wir auf die meisten Chatbots hier im Artikel blicken und umso faszinierender dieser erste Testlauf auch war, zeigt er dennoch an vielen Stellen, dass es noch viele technische Updates braucht. Oftmals sind die Chatbots nämlich nicht intuitiv genug, arbeiten bisweilen unflexibel und sehr statisch.
Die größte Herausforderung ist und bleibt vermutlich auch noch ein wenig, dass die Bots auf freie Texte intelligent reagieren. Dennoch, dass Bots im Messenger eine große Zukunft haben, daran besteht kein Zweifel. Die ersten Antworten von Sprachassistenten waren auch eher unbefriedigend – inzwischen sind die Ergebnisse aber viel besser geworden.
Die Evolution dieser Technologien ist in vollem Gange.
Übrigens, innovative Unternehmen können den Facebook-Messenger nicht nur mit Chatbots erobern. Wir haben noch weitere spannende Anwendungsszenarien gesammelt. Lies auch: „Chatbots, Sport-News und Taxi-Buchungen: Wie Unternehmen den Facebook-Messenger nutzen“ – es lohnt sich!
Ich war auch enttäuscht von dem Shopping-Bot, wir hatten uns etwas mehr erwartet. Vergleicht doch mal unsere Bots: FashSnap war unser erster Bot: http://telegram.me/fashsnapbot, der zweite war ein Bot ähnlich zu Spring und der Dritte ist chatShopper : http://telegram.me/chatshopperbot Beide werden bald auch auf Facebook zu finden sein, wurden direkt nach Launch des SDK´s bei Facebook eingereicht. Bin gespannt auf Euer Feedback!
wikipedia: Hanover
Allein in USA gibts 20 Hanovers (ohne Doppel-’nn‘)
Interessant sind schlaue Rückfragen und Oversight-Techniken.
D.h. 95% aller Anfragen werden nach einer Woche automatisiert erkannt (und ggf. per Rückfrage herausgefunden welches der 30-50 Hanover gemeint sein könnte) und den Rest bearbeiten Menschen und weil das automatisierte Templates sind, quasi-„lernt“ der Bot dazu.
Z.B. Aliasse oder Synonyme. Die Presse scheitert ja täglich bei Handy-Berichten daran, Flash und RAM auseinanderzuhalten: „Das Handy hat 3GByte Speicher und gibts mit 16, 32 und 64 GByte Speicher“. Gleiches für „Ertrag“ und „Erlös“ oder das vollkommen undeutliche „Mail“ (Was jetzt: Email oder Postbrief ? Ist für eine korrekte Reportage wohl nicht so wichtig.).
Wer Suchanfragen im Onlineshop beobachtet erkennt das viele Einträge viele Namen haben können… RAM/Speicher/… SSD/Festplatte CPU/AMD/Intel Mainboard/Hauptplatine/Motherboard/… usw.
Das beherrschten Shops schon ewig nicht. Vielleicht setzt es sich ja durch.
Viele Firmen haben kein Geld für gute Software weil teure Firmen mit vielen Volljuristen halt nicht so günstig sind wie freie Freedeom-Freiberufler welche man mit Softwarpatenten und Klagen ruhig stellen kann:
http://www.golem.de/news/aaron-swartz-vorwuerfe-gegen-staatsanwalt-und-mit-1301-96889.html
Linux sollte verboten oder Lizenzpflichtig gemacht werden. Auch OpenWRT soll aktuell verboten werden. Uber und Google-News haben in manchen Gegenden ja schon aufgegeben.
Wie gut viele deutsche Diplom/Master/Dr.-Firmen programmieren seht ihr an den Vorgängern der Bots: Den Fahrkartenautomaten…
Bots sind im Prinzip oft nicht viel anderes.
Schade das man in korrupten Diktaturen oder z.b. aus Aleppo als kleiner Programmierer keine BotChat-Standards quasi als Alternativen zu node.js oder vielen oft verwendeten anderen Zentral-Opensource-Projekten gründen kann ohne mit Existenzvernichtung rechnen zu müssen.
Schaut besser mal was Bill Gates Kinder und Politiker-Verwandte studieren bevor Ihr versehentlich Informatik studiert und mit 30 schon zu alt für den Markt seid. An den Autos Eurer Firma seht ihr die profitablen Jobs und folglich Studiengänge.
Die meisten Bots repräsentieren bald also wirklich auch nur die normale Software-Industrie und ihre Überlegenheit wie man an den vielen Apps und Bewertungen oder IT-Großprojekt-Erfolgsmeldungen oder deutschen Groß-Bau-Projekten (z.b. zur Fußball-WM in Brasilien) sehen kann.
Der Kunde wird sie genau so gut finden wie Windows, Apps und seine Betriebs-Software und die Bedienung seines SmarTVs und natürlich die allseits beliebten Fahrkarten-Automaten…
Denn warum sollte sich dort plötzlich nach Jahrzehnten bessere Software als überall sonst breit machen ? Die Boni-Manager benutzen ihre eigenen „Smart“TVs doch gar nicht. Die Googles kriegen immer das neueste Nexus und setzen fast alle Aufkäufe in den Sand. Auch Apple schwächelt usability-mäßig immer mehr.
Seit wann wurde Software immer besser ? Na also…
Guter Artikel zum Thema. Wer mit Messenger Bots ein wenig rumspielen will, dem kann ich Manychat (u.a. kostenlos) zum Testen empfehlen. Neben Manychat ist Chatfuel auch noch zu nennen. Allerdings schwöre ich auf Manychat. :) Wenn Du meinen Messenger Bot mal in Aktion sehen willst, dann kannst Du das hier machen: http://bit.ly/welcomesequence