Anzeige
Anzeige
News

Hören und Sehen: KI verwandelt Umgebungsgeräusche in überraschend präzise Bilder

Ob Straßenlärm oder Vogelzwitschern: Ein US-amerikanisches KI-Modell kann aus Geräuschen auf eine Umgebung schließen – und sogar Bilder davon anfertigen. Wie das funktioniert und welche Vorteile die Technik bringen könnte.

2 Min.
Artikel merken
Anzeige
Anzeige
Wie das klingt, können wir uns vorstellen – und KI auch. (Foto: Kichigin / Shutterstock.com)

Das Rauschen eines Bachs lässt uns Menschen an gänzlich andere Bilder denken, als das Brummen eines Verbrennermotors. Genau darauf haben Forscher:innen der University of Texas jetzt auch eine KI trainiert. Die analysiert Umgebungsgeräusche und erzeugen daraus Bilder, die der ursprünglichen Location möglichst stark ähneln sollen. Das hat bei den Experimenten der Forscher:innen teilweise auch bemerkenswert gut funktioniert.

Anzeige
Anzeige

„Unsere Studie hat ergeben, dass akustische Umgebungen genügend visuelle Hinweise enthalten, um Straßenbilder mit hohem Wiedererkennungswert zu erzeugen, die die verschiedenen Orte genau wiedergeben“, erklären die Forscher:innen in ihrem im Fachjournal Computers, Environment and Urban Systems veröffentlichten Paper.

KI kann Umgebungsgeräusche in Bilder umwandeln – so funktioniert es

Für das Training ihrer KI griffen die Forscher:innen auf Youtube zurück. Dort besorgten sie sich Videos von Orten in Nordamerika, Asien und Europa. Anschließend extrahierten sie jeweils zehnsekündige Audio-Clips und Standbilder dieser Orte.

Anzeige
Anzeige

Zur Überprüfung des Systems wurden immer wieder Bilder aus Umgebungsgeräuschen generiert und per Computer und von Menschen bewertet. Die Computer sollten dabei jeweils bestimmen, wie nah die Verteilung von Grünflächen, Gebäuden und Himmel an die echten Aufnahmen herankam. Die menschlichen Helfer:innen wiederum mussten wiederum KI-generierte Bilder den korrekten Umgebungsgeräuschen zuordnen. Das gelang im Experiment mit einer 80-prozentigen Erfolgsquote.

Interessanterweise konnte die KI oft auch anhand der Geräusche erkennen, zu welcher Tageszeit die Bilder aufgenommen wurden und das in den eigenen Bildern korrekt nachbilden. Diese Informationen könnte die KI aus den Geräuschen nachtaktiver Tiere und Insekten oder auch dem Verkehrsaufkommen entnommen haben, so die Forscher:innen.

Anzeige
Anzeige
Lokale KI: Mit diesen 6 Tools kein Problem Quelle: Midjourny / t3n

Kann die Forschung das Leben in Städten verbessern?

Während ihr Experiment vor allem zeigt, wie gut KI aus Geräuschen Informationen über Orte extrahieren kann, erhoffen sich die beteiligten Forscher:innen auch Rückschlüsse darauf, welche Faktoren dabei für Menschen eine Rolle spielen.

„Die Ergebnisse könnten unser Wissen über die Auswirkungen visueller und auditiver Wahrnehmungen auf die psychische Gesundheit des Menschen erweitern, eine Orientierungshilfe für die Gestaltung von Orten bieten und die Lebensqualität in Gemeinden insgesamt verbessern“, hoffen die Wissenschaftler:innen.

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Kommentare

Community-Richtlinien

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Kommentar abgeben

Melde dich an, um Kommentare schreiben und mit anderen Leser:innen und unseren Autor:innen diskutieren zu können.

Anmelden und kommentieren

Du hast noch keinen t3n-Account? Hier registrieren

Anzeige
Anzeige