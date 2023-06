Sie heißen Sophie, Maya oder Ana. Ebenso wie ihre Namen muten sie menschlich an – mit stylischer Kleidung und zeitgemäßen Frisuren. Sie beantworten unsere Fragen und treten mit uns in einen Dialog. Die Antworten, die sie uns geben, variieren – je nachdem, wie die Gesprächspartner agieren oder reagieren.

Ihr allgemeines Wissen basiert auf Programmen wie ChatGPT, zudem sind sie oft mit weiteren Informationen zu bestimmten Themen angereichert. Im Gegensatz zu Chatbots erfolgt die Interaktion durch natürliche Sprache und Videos. Die Rede ist von Digital Humans, die durch eine immer ausgereiftere KI-Technologie schon bald in den Alltag vieler Menschen einziehen könnten.

Fortschritte in der 3D-Technologie haben die Entwicklung dieser hyperrealistischen Schnittstellen ebenso vorangetrieben wie generative künstliche Intelligenz, zu der auch GPT zählt. Mithilfe von Generative-KI-Technologien lassen sich Videos, Voice-over und Animationen kreieren. Rein von einem Skript-Text ausgehend erzeugen Tools wie Synthesia.io wiederum Videos mit sehr realistischen Avataren. Die Skript-Texte können beispielsweise mit ChatGPT zu einem Thema erstellt werden. Damit lassen sich etwa Lernvideos zu verschiedenen Inhalten schnell und kostengünstig anfertigen. Die so entstandenen Artefakte sind so unabhängig von menschlicher Kreativität.

Einer aktuellen Analyse von Emergen Research zufolge wird der globale Markt für Digital Humans im Jahr 2030 voraussichtlich knapp 530 Milliarden US-Dollar erreichen. Schon heute sind Metas sogenannte Codec-Avatare in ihrem Erscheinungsbild kaum noch vom menschlichen Original zu unterscheiden. Sie können sogar zwischen virtuellen Outfits wechseln und sind noch ausdrucksstärker. Einer der interessantesten Aspekte dieser virtuellen Avatare ist neben ihrer Dialogkompetenz die Möglichkeit, sich auf ein bestimmtes Thema zu fokussieren. Dadurch wird es einfacher, die zeitlichen Grenzen der übermittelten Informationen zu überwinden.

Von ChatGPT zu Digital Humans

Während ChatGPT nur auf Datensätze bis zum Jahr 2021 zurückgreift, liefert ein Digital Human in der Regel sehr viel korrektere Fakten zu einem bestimmten Thema, auf das er spezialisiert und trainiert wurde. Meist beantwortet der Avatar solche Fragen, die eine Bewertung oder ein Urteil erfordern, erst nach einer Denkpause und gibt dann diplomatische Antworten. Während der Digital Human zuhört, nickt er oder sie, lächelt, ahmt die Gesichtszüge und Bewegungen des Menschen nach, auch wenn die Abfolge der Ausdrücke zufällig ist. Im Ergebnis entsteht ein flüssiger Dialog.

Was auf den ersten Blick wie eine Spielerei anmutet, ist bereits vielerorts im Einsatz. Für den Finanzsektor hat das Startup Deepbrain AI zum Beispiel einen virtuellen Menschen entwickelt, der als lebensgroßes KI-Display im Foyer von physischen Bankfilialen Fragen der Kund:innen beantwortet und damit Wartezeiten überbrückt. Zudem gibt der Digital Human Hilfestellung bei einfachen Bankgeschäften wie beispielsweise der Registrierung von Kreditkarten. Diese Art Interactive Kiosk ließe sich auch im stationären Handel anwenden: Über einen holografischen Bildschirm und einen transparenten Touch-Display kann man sich lebensgroße Inhalte in 3D anzeigen lassen und mit ihnen interagieren, sie um Rat fragen oder ihren Empfehlungen folgen.

Noch mehr ist künftig denkbar: Zwar verschreibt ein Digital Human im Gesundheitswesen keine Medikamente, unterhält sich aber durchaus mit Patient:innen über Symptome und unterstützt so medizinisches Fachpersonal bei der Diagnose. Das ist im Zusammenhang mit dem Digital Twin einer Person besonders interessant, da man hier über Wearables auch Daten einer:eines Patient:in in Echtzeit mit einfließen lassen kann.

Im Moment sind die meisten Digital Humans noch blind, sie stützen ihre Interaktion ausschließlich auf das Hören. Folglich wäre das Sehvermögen der nächste Evolutionsschritt. Einmal damit ausgestattet, könnten sie uns Menschen umfassend helfen, indem sie uns quasi virtuell über die Schulter schauen, während wir eine Aufgabe erledigen oder den Gesichtsausdruck erkennen und empathischer auf unsere Stimmung eingehen.

In Kombination mit Generativer KI würden so Assistenten zur Verfügung stehen, die den Menschen begleiten und in der Lage sind, Informationen zu sammeln und für uns zu verarbeiten, um sie dann in unseren Dienst zu stellen. So wären Digital Humans durchaus dazu fähig, uns Menschen einige sich wiederholende und mühsame Aufgaben abzunehmen.

Die schöpferische Dimension ist weiterhin dem Menschen vorbehalten

Dass ein digitaler Mensch einen echten in naher Zukunft ersetzt, ist allerdings unwahrscheinlich. Es ist ein bisschen wie damals, als die Kamera erfunden wurde und viele Maler:innen fürchteten, dass sie ihnen die Arbeit wegnehmen würde. Das war nicht der Fall und ist es auch heute nicht. Schließlich verwendet KI nur Informationen aus der Vergangenheit und macht auch mal Fehler. Wenn innovative Lösungen gefordert sind, bleibt die menschliche Figur zentral.

Und dann wäre da noch die ethischen Komponenten, über die Unternehmen sich Gedanken machen müssen. Dabei muss beispielsweise der Daten- und Identitätsschutz gewährleistet sein. Ebenso gilt es, eine gute digitale Ethik mit entsprechend vorgegebenen Regeln einzuhalten.

Fest steht: Die für Digital Humans notwendigen Technologien sind nicht nur verfügbar, sondern kommen immer mehr zum Einsatz. Dieses Momentum gilt es für Unternehmen zu nutzen und die Vorteile und Mehrwerte der Digital Humans zu heben.

Rene Schulte

Rene Schulte ist Senior Manager sowie Head of 3D und Quantum Computing Practices bei Reply. Er ist kreativer Entwickler und Vordenker mit technischem Know-how in Bereichen wie Echtzeit-3D, VR/AR, Quantum Computing, Generative AI, Deep Learning und vielen mehr.



Thorben Fasching

Thorben Fasching ist Executive Partner von Reply und verantwortet sowohl die Agenturen, die unter dem Cluster „Reply Digital Experience“ am Markt auftreten, als auch die Startups innerhalb des Reply Netzwerks.



