Interview

Amazons Machine-Learning-Chef: „Programme mit Bewusstsein sind Fiktion“

Seite 2 / 2

Ich denke nicht. Ich kann es zwar aus eigener Erfahrung nur mit zwei Firmen vergleichen, aber als ich bei Microsoft und Facebook gearbeitet habe, war das zumindest nicht so. Da ging man entweder von technischen Herausforderungen oder von Geschäftsmodellen aus. Wir haben gelernt, dass neue Wissenschaftler, die von außen zu ­Amazon kommen, mehrere Monate brauchen, bis sie das kundenorientierte Forschen wirklich verinnerlicht haben.

t3n: Wie weit liegen diese fiktiven Anwendungen denn in der ­Zukunft?

Typischerweise drei Jahre. Darüber hinaus wird es schwer, Vorhersagen zu treffen, weil sich in dem Zeitraum technologisch wirklich sehr viel tun kann.

t3n: Zurückblickend auf die letzten Jahre: Welche Forschungsprobleme konnten sie überraschend schnell lösen und ­welche haben sich als besonders hartnäckig erwiesen?

Eine für mich überraschende Erfolgsgeschichte war das X-Ray-Feature auf dem Amazon Kindle. Es ging darum, Inhalte von E-Books automatisiert zu erkennen und zu strukturieren, genauer gesagt: Namen von Orten und Protagonisten semantisch auseinanderzuhalten. Das hatten wir auf Englisch bereits entwickelt und mussten es für andere Sprachen implementieren. ­Gerade für die asiatischen Sprachen ohne Interpunktion hatte ich damit gerechnet, dass wir dafür mehrere Jahre brauchen würden, aber wir haben es in unter sechs Monaten geschafft. Deutlich länger hingegen hat es gedauert, den Reifegrad von Früchten visuell erfassbar zu machen. Diese Aufgabe war 2014 vom Liefer­service Amazon Fresh an mich herangetragen worden. Es besteht ­allgemein das Problem, dass bis zu 50 Prozent aller Frischwaren auf dem Weg von der Ernte zur Küche verderben. Da es hier im Prinzip auch um Mustererkennung geht, hätte ich nicht damit gerechnet, dass wir am Ende dreieinhalb Jahre brauchen würden, um das ­Problem zu lösen. Angefangen haben wir damit, dass wir beim Supermarkt 56 Erdbeeren gekauft und dann regelmäßig fotografiert haben. Mit so einem kleinen Datensatz ließen sich aber noch keine Deep-Learning-Verfahren einsetzen, dafür brauchten wir erst ein System, um im großen Stil Bilder von Obst und Gemüse in verschiedenen Stadien zu erfassen.

t3n: Wie viel von der Entwicklungszeit wird an konkreten ­Algorithmen gearbeitet?

Das Erforschen der Algorithmen macht oft nur 30 Prozent der Projektdauer aus. Was dauert, ist die Integration der neuen ­Lösung in bestehenden Code und die Gewährleistung einer guten Kundenerfahrung. Wenn man eine praktisch-technische Lösung hat, die die Kunden aber nicht nutzen, muss man immer wieder in die Entwicklung zurückgehen und experimentelle Prototypen zusammen mit kleinen Nutzergruppen testen.

t3n: Fällt das dann überhaupt noch in Ihren Aufgabenbereich?

Ja, bis eine hinreichend große Kundenbasis ein neues Produkt auch wirklich benutzt, gilt ein Projekt nicht als Erfolg.

t3n: Bei textbasierten Suchmaschinen sehen Nutzer ­viele ­Ergebnisse auf einen Blick und können sich das für sie ­relevanteste heraussuchen. Stellen sie aber einem Sprach­assistenten wie Alexa eine Frage, erhalten sie nur eine einzige Antwort. Wie können Sie bei Sprach-­Interfaces abschätzen, mit welcher Wahrscheinlichkeit diese Antwort richtig ist?

Dieses Konzept ist für Kunden sehr schwierig intuitiv darzu­stellen. Zwar liefern fast alle Systeme im Hintergrund einen ­Confidence-Wert für jedes Ergebnis – der Algorithmus weiß also, wie sicher er sich seiner Sache ist. Eine solche Zahl ist auch für Statistiker verständlich, aber anderen Menschen schwer be­greifbar zu machen, und kann verwirren. Was heißt es, wenn mir gesagt wird, es wird morgen mit 60-prozentiger Wahrscheinlichkeit regnen? Wird es nun regnen oder nicht? Da braucht es noch mehr Forschung und zwar nicht im mathematischen Bereich, sondern vor allem im sprachlichen User-Interface-Design, um die richtigen ­Schwellenwerte der Abstufungen zwischen Formulierungen wie „ich bin mir nicht sicher“ und „ich bin mir sehr sicher“ zu finden.

t3n: Wird denn das Potenzial des maschinellen Lernens in der Öffentlichkeit über- oder unterschätzt?

Vielen Menschen ist nicht bewusst, wie riesig die Menge an ­Trainingsdaten ist, die ein System benötigt, um daraus zu ­lernen. Um eine Objektkategorie zu erlernen, braucht ein Algorithmus zwischen hundert- bis tausendmal mehr Lernbeispiele als ein Kind. Deswegen sind Programme, die sich selbst das Programmieren beibringen oder gar Bewusstsein entwickeln, ­heute reine ­Fiktion. Um Programmieren zu lernen und sich selbst ­fortzuschreiben, bräuchte ein Machine-Learning-­Algorithmus Millionen gleichartiger Programmierbeispiele, und die gibt es nicht. Was überschätzt wird, ist also die Möglichkeit einer ­generellen KI. Zugleich unterschätzen die meisten Leute, wie präzise ein Programm innerhalb eines engen Bereichs Muster erkennen kann, wenn es genügend Daten zur Verfügung hat. Das sehen wir intern zum Beispiel bei der Nachfragevorhersage – manche unserer Einkäufer denken regelmäßig, sie könnten das aufgrund ihrer Erfahrung besser als der Algorithmus. Aber es gibt einfach so viele Daten, die da einfließen, dass sie ein einzelner Mensch nicht mehr überblicken und erfassen kann. Das Gleiche gilt für Übersetzungssoftware. Kein Mensch kann zu Trainingszwecken sämtliche in zwei Sprachen verfügbaren Texte lesen – ein ­Algorithmus schon. Die Trainingsdaten sind der Schlüssel. Alles hängt davon ab, wie strukturiert, wie sauber und wie umfangreich sie sind.

t3n: Wenn Daten eine derart zentrale Rolle spielen: Haben die Big Five Google, Amazon, Facebook, Apple und Microsoft nicht schon einen uneinholbaren Vorteil in Sachen KI?

Sie haben natürlich eine ziemlich lange Geschichte an Daten in bestehenden Bereichen, aber bei neuen Produkten fängt man wieder von ganz vorne an. Dies sieht man zum Beispiel an neuen Diensten Airbnb, Uber oder ­Pinterest, die in anderen Bereichen unterwegs sind. Oder auch an Firmen wie Strava, die auf neuartige Sensoren wie Pulsmesser zurückgreifen können. Da bauen sich für jedes Unternehmen sehr schnell signifikante Datenmengen auf.

Bitte beachte unsere Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Schreib den ersten Kommentar!

Melde dich mit deinem t3n Account an oder fülle die unteren Felder aus.

Bitte schalte deinen Adblocker für t3n.de aus!

Hey du! Schön, dass du hier bist. 😊

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team bestehend aus 65 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Danke für deine Unterstützung.

Digitales High Five,
Stephan Dörner (Chefredakteur t3n.de) & das gesamte t3n-Team

Anleitung zur Deaktivierung