Auch nach einigen Jahren mit Erfahrungen in Videokonferenzen bleibt doch eine Komponente der sozialen Interaktion im Virtuellen immer noch schwierig: der direkte Blickkontakt der Teilnehmenden. Entweder blickt der:die Sprechende sein Gegenüber im Dialogfenster in die Augen, dann besteht aber für das Gegenüber kein Blickkontakt. Oder als Sprecher:in schaue ich in meine Webcam und stelle sicher, dass die anderen Teilnehmenden das Gefühl von Blickkontakt haben, aber als Sprecher:in nehme ich dann die Gesichter der Anderen nicht gut wahr. Sicher gibt es kleine Tricks, wie etwa die Fenster der Teilnehmenden möglichst nah an die Webcam zu platzieren. Doch das ist in einer größeren Runde nicht möglich.

Hier könnte Software Abhilfe schaffen. Das 2020 gegründete Unternehmen Casablanca.AI bietet ein Programm, das digitalen Augenkontakt in Echtzeit erzeugen soll. Jetzt erscheint ein Enterprise-Produkt, das die Anwendung in Unternehmen vereinfachen soll, da für die Verwendung keine zusätzliche Grafikkarte und Hardware notwendig wäre.

In Videokonferenzen: Neuronale Netze berechnen das Gesicht



Die Idee, Blickbewegungen in Online-Meetings zu korrigieren, ist nicht neu. Auf dem Markt existieren weitere Tools mit ähnlicher Funktion, wie etwa Veed, das sich allerdings auf aufgenommene Videos und die Nachbearbeitung der Blickrichtung beschränkt, auch die Anwendung NVIDIA Broadcast bietet in seiner Version 1.4 den „Eye Contact Effect“ an.

Casablanca.AI nutzt ein GAN, um nicht nur die Blickbewegung, sondern auch den ganzen Kopf zur Kamera hin auszurichten. Ein GAN (Generative Adversarial Network) ist ein aus zwei neuronalen Netzen bestehender Lernalgorithmus, der auf Basis seiner Trainingsdaten neue realistisch aussehende Bilder erzeugt – zum Beispiel von Gesichtern. Die neuronalen Netze, Generator und Diskriminator, sind im Lernprozess für verschiedene Aufgaben zuständig: Der Generator versucht realistisch wirkende Daten zu erzeugen, wobei der Diskriminator versucht, diese von echten Daten zu unterscheiden. Je weiter das Training fortschreitet, desto realistischer werden die Bilder, die der Generator erzeugt. Dadurch wird es für den Diskriminator immer schwieriger, echte von künstlichen Darstellungen zu unterscheiden. So sollen sich durch die Technologie die Mimik und Gestik der Personen im Videocall durch das „künstliche“ Kopfdrehen auch nicht verändern. Durch die Eigenschaften der KI spielt die Technologie nicht zuletzt eine wesentliche Rolle in der Erstellung, aber auch bei der Detektion von Deepfakes.

Wendet der:die Nutzer:in allerdings ihren Blick weg vom Konferenzbildschirm, erkennt das die Software und korrigiert den Blickwinkel nicht. Damit soll zum einen die Videokonferenz authentisch bleiben, zum anderen soll den Nutzer:innen nicht die Möglichkeit gegeben werden, nebenbei etwas anderes zu tun.

Mit jedem Tool für Videokonferenzen anwendbar

Sobald die Software als virtuelle Kamera auf dem Computer installiert wurde, kann das System mit jedem beliebigen Videocall-Tool verwendet werden. Dabei verspricht Casablanca.AI vollen Datenschutz, da die Bilddaten auf dem Rechner der Nutzer:innen verarbeitet werden. Für private Nutzer:innen gibt es verschiedene Abo-Möglichkeiten, das Enterprise-Produkt ist für Unternehmen gedacht, die eine zentrale IT-Administration nutzen.

Das Startup will sein Enterprise-Produkt weiterentwickeln und auf diverse Bereiche der Arbeitswelt abstimmen. Namentlich nennen sie zum Beispiel das Recruiting und die Telemedizin als Bereiche, in denen direkter Blickkontakt entscheidend für den Vertrauensaufbau wäre.

