Jedes Jahr richtet Amazon seine Remars-Konferenz in Las Vegas aus. Der Fokus der Konferenz für künstliche Intelligenz liegt dabei auf maschinellem Lernen, Automation, Robotik und Space. Auch in diesem Jahr kündigte Amazons Senior Vice President und Head Scientist für Alexa, Rohit Prasad, spannende Neuerungen an.
Besonders ein vorgestelltes Szenario bedarf einer genaueren Betrachtung. Wie bei der Veranstaltung in einem kurzen Video gezeigt wurde, wird die Stimme eines verstorbenen Angehörigen, in diesem Fall der Großmutter, verwendet, um eine Gute-Nacht-Geschichte für ihren Enkel vorzulesen. In dem Clip fragt ein Junge: „Alexa, kann Oma mir den Zauberer von Oz zu Ende vorlesen?“ Der smarte Lautsprecher antwortet auf diese Frage mit seiner Standard-Stimme und wechselt dann zu einer menschlichen Stimme, um aus dem Kinderroman vorzulesen. Dafür verwendet das Unternehmen eine neue Technologie, die in der Lage ist, aus kurzen Audioclips längere Sequenzen zu generieren.
Generierte Sprache könnte menschliche Aussagen ersetzen
Details zu dieser Technologie gibt es aktuell noch nicht viele. Klar ist, dass Amazon Alexa beibringt, die Stimme von jemandem zu imitieren, ganz egal, ob tot oder lebendig, und dafür lediglich eine einminütige Aufnahme dieser Stimme benötigt. Alexas Fähigkeit, Stimmen nachzuahmen, ist eine Form von künstlicher Intelligenz, die Prasad als „generalisierbare Intelligenz“ bezeichnete. Sie würde sich demnach von der „allwissenden“ künstlichen Intelligenz unterscheiden, die darauf abzielt, menschliche Aufgaben zu übernehmen und unseren Intellekt zu adaptieren.
Der Einsatz von menschenähnlicher künstlicher Intelligenz wird immer wieder kontrovers diskutiert. Anfang des Monats behauptete ein Google-Entwickler sogar, dass ein Chatbot Gefühle entwickelt und sich seiner selbst bewusst geworden sei. In Deutschland nutzt RTL bereits synthetische Stimmen, um Texte in Sprache umzuwandeln, ohne dass der Moderator diese noch selbst einsprechen muss. Die künstlich erzeugte Stimme ist dabei nicht mehr vom menschlichen Original zu unterscheiden.
Bitte beachte unsere Community-Richtlinien
Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.
Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.
Dein t3n-Team
Wieder ein Beleg dafür, dass sich die Entwickler im Silicon Valley keine ethischen Grenzen setzen und einfach alles tun, was technisch möglich ist. Jetzt noch per DeepFake das Gesicht eines verstorbenen Menschen rekonstruieren und ab aufs Echo Show. Jetzt sind die Toten nicht mal mehr im Jenseits sicher vor der Profitgier einiger weniger.