Jedes Jahr richtet Amazon seine Remars-Konferenz in Las Vegas aus. Der Fokus der Konferenz für künstliche Intelligenz liegt dabei auf maschinellem Lernen, Automation, Robotik und Space. Auch in diesem Jahr kündigte Amazons Senior Vice President und Head Scientist für Alexa, Rohit Prasad, spannende Neuerungen an.
Besonders ein vorgestelltes Szenario bedarf einer genaueren Betrachtung. Wie bei der Veranstaltung in einem kurzen Video gezeigt wurde, wird die Stimme eines verstorbenen Angehörigen, in diesem Fall der Großmutter, verwendet, um eine Gute-Nacht-Geschichte für ihren Enkel vorzulesen. In dem Clip fragt ein Junge: „Alexa, kann Oma mir den Zauberer von Oz zu Ende vorlesen?“ Der smarte Lautsprecher antwortet auf diese Frage mit seiner Standard-Stimme und wechselt dann zu einer menschlichen Stimme, um aus dem Kinderroman vorzulesen. Dafür verwendet das Unternehmen eine neue Technologie, die in der Lage ist, aus kurzen Audioclips längere Sequenzen zu generieren.
Generierte Sprache könnte menschliche Aussagen ersetzen
Details zu dieser Technologie gibt es aktuell noch nicht viele. Klar ist, dass Amazon Alexa beibringt, die Stimme von jemandem zu imitieren, ganz egal, ob tot oder lebendig, und dafür lediglich eine einminütige Aufnahme dieser Stimme benötigt. Alexas Fähigkeit, Stimmen nachzuahmen, ist eine Form von künstlicher Intelligenz, die Prasad als „generalisierbare Intelligenz“ bezeichnete. Sie würde sich demnach von der „allwissenden“ künstlichen Intelligenz unterscheiden, die darauf abzielt, menschliche Aufgaben zu übernehmen und unseren Intellekt zu adaptieren.
Der Einsatz von menschenähnlicher künstlicher Intelligenz wird immer wieder kontrovers diskutiert. Anfang des Monats behauptete ein Google-Entwickler sogar, dass ein Chatbot Gefühle entwickelt und sich seiner selbst bewusst geworden sei. In Deutschland nutzt RTL bereits synthetische Stimmen, um Texte in Sprache umzuwandeln, ohne dass der Moderator diese noch selbst einsprechen muss. Die künstlich erzeugte Stimme ist dabei nicht mehr vom menschlichen Original zu unterscheiden.
Wieder ein Beleg dafür, dass sich die Entwickler im Silicon Valley keine ethischen Grenzen setzen und einfach alles tun, was technisch möglich ist. Jetzt noch per DeepFake das Gesicht eines verstorbenen Menschen rekonstruieren und ab aufs Echo Show. Jetzt sind die Toten nicht mal mehr im Jenseits sicher vor der Profitgier einiger weniger.