Bilder aus Geräuschen: Diese KI-Kamera hört ihre Umgebung

Als Menschen ist es uns in begrenztem Umfang möglich, beim Anblick eines Fotos die mutmaßlich zum Aufnahmezeitpunkt herrschende Geräuschkulisse zu imaginieren oder uns zumindest aus Erfahrungswerten vorzustellen, welche Geräusche es dort gegeben haben könnte. Was aber, wenn wir nur eine Geräuschkulisse hätten? Könnten wir uns dann das zugehörige Bild vorstellen und wenn ja, wie genau?
Diese Fragen sind der Schwerpunkt eines Projekts von Diego Trujillo Pisanty, das er Blind Camera nennt. Auf der Grundlage von in Mexiko-Stadt aufgenommenen Videodaten hat Pisanty ein mit Tensorflow 3 erstelltes neuronales Netzwerk auf einer RTX-3080-GPU von Nvidia trainiert.
Der verwendete Trainingsdatensatz enthielt Bilder aus diesen Videos, die mit einem Geräusch verbunden waren. Wenn dem so trainierten neuronalen Netzwerk nun ein Klangprofil präsentiert wird, versucht es, die Szene auf der Grundlage des Klangs unter Zuhilfenahme seines KI-Modells zu rekonstruieren.
Die gesamte erforderliche Mimik hat Pisanty so angepasst, dass sie auf einem einzelnen Raspberry-Pi-3B-Board läuft. Da das Modell nur die Sehenswürdigkeiten und Geräusche von Mexiko-Stadt kennt, wird das resultierende Bild immer als eine Zusammenstellung von Szenen aus dieser Stadt dargestellt.
Pisanty weiß natürlich um diese Limitierung und räumt ein: Für das Gerät ist alles eine Stadt. Positiv betrachtet können wir daraus die Erkenntnis ziehen, dass auch eine KI einen begrenzten Horizont hat, nicht nur wir Menschen.
Bitte beachte unsere Community-Richtlinien
Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.
Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.
Dein t3n-Team