Bilder aus Geräuschen: Diese KI-Kamera hört ihre Umgebung

Fundstück

Bilder aus Geräuschen: Diese KI-Kamera hört ihre Umgebung

Die „Blind Camera“ ist eine tragbare Kamera ohne Optik. Sie kann also keine Fotos machen. Stattdessen soll sie Bilder aus den Geräuschen der Aufnahmeumgebung erstellen können.

Von Dieter Petereit

13.06.2023, 14:00 Uhr • 1 Min.

Bilder aus Geräuschen: Diese KI-Kamera hört ihre Umgebung — Pisanty beim "Fotografieren". (Bild: Diego Pisanty)

Als Menschen ist es uns in begrenztem Umfang möglich, beim Anblick eines Fotos die mutmaßlich zum Aufnahmezeitpunkt herrschende Geräuschkulisse zu imaginieren oder uns zumindest aus Erfahrungswerten vorzustellen, welche Geräusche es dort gegeben haben könnte. Was aber, wenn wir nur eine Geräuschkulisse hätten? Könnten wir uns dann das zugehörige Bild vorstellen und wenn ja, wie genau?

KI-Kamera erstellt Bilder aus Klangprofilen

Diese Fragen sind der Schwerpunkt eines Projekts von Diego Trujillo Pisanty, das er Blind Camera nennt. Auf der Grundlage von in Mexiko-Stadt aufgenommenen Videodaten hat Pisanty ein mit Tensorflow 3 erstelltes neuronales Netzwerk auf einer RTX-3080-GPU von Nvidia trainiert.

Empfehlungen der Redaktion

News

Paragraphica: Diese KI-Cam erstellt einzigartige Bilder mit Standortdaten und Beschreibungen

Fundstück

Mit KI und Überwachungskameras auf Influencer-„Jagd“

Der verwendete Trainingsdatensatz enthielt Bilder aus diesen Videos, die mit einem Geräusch verbunden waren. Wenn dem so trainierten neuronalen Netzwerk nun ein Klangprofil präsentiert wird, versucht es, die Szene auf der Grundlage des Klangs unter Zuhilfenahme seines KI-Modells zu rekonstruieren.

Die gesamte erforderliche Mimik hat Pisanty so angepasst, dass sie auf einem einzelnen Raspberry-Pi-3B-Board läuft. Da das Modell nur die Sehenswürdigkeiten und Geräusche von Mexiko-Stadt kennt, wird das resultierende Bild immer als eine Zusammenstellung von Szenen aus dieser Stadt dargestellt.

Pisanty weiß natürlich um diese Limitierung und räumt ein: Für das Gerät ist alles eine Stadt. Positiv betrachtet können wir daraus die Erkenntnis ziehen, dass auch eine KI einen begrenzten Horizont hat, nicht nur wir Menschen.

Mehr zu diesem Thema

MIT Technology Review Künstliche Intelligenz

Verpasse keine News zu Software & Entwicklung 💌

Hinweis zum Newsletter & Datenschutz

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Bilder aus Geräuschen: Diese KI-Kamera hört ihre Umgebung

KI-Kamera erstellt Bilder aus Klangprofilen

Blind Camera hält alles für eine Stadt