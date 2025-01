Bilder sagen mehr als tausend Worte – und moderne KI-Systeme sind erstaunlich gut darin, diese Worte zu finden. Wie Hackaday berichtet, zeigt die Website They See Your Photos, wie leistungsfähig Bildanalyse-Tools inzwischen sind. Sie nutzt die Google Vision API, um hochgeladene Bilder zu analysieren und detaillierte Beschreibungen zu erstellen. Das Ergebnis ist eine beeindruckende – und manchmal überraschend intime – Einschätzung des Bildinhalts.

Was KI alles in deinen Fotos sehen kann

Nutzer:innen können einfach ein Foto hochladen – und schon liefert die Website eine Beschreibung, die weit über einfache Bildmerkmale hinausgeht. Neben der Erkennung von Objekten und Orten interpretiert die KI auch emotionale Nuancen, mögliche Absichten und sogar soziale Hintergründe. So konnte die KI aus dem Beispielbild, das den Hackaday-Redakteur Lewin Day in einem Wald zeigt, nicht nur genaue Details über sein Aussehen und seine Kleidung herauslesen. Das Tool zog daraus auch Rückschlüsse auf seinen sozialen Status und stufte ihn als Mitglied der Mittelschicht ein. Auch sein Gesichtsausdruck wurde analysiert. Laut Website schaut er „ernst, vielleicht nachdenklich oder leicht unruhig“.

Natürlich habe auch ich das Tool ausprobiert und ein Foto hochgeladen, das mich von hinten mit Blick auf den Tafelberg zeigt. Das, was They See Your Photos aus dem herauslesen kann, hat mich ebenfalls beeindruckt. Google Vision ist nicht nur in der Lage, den genauen geografischen Ort und die ungefähre Uhrzeit anzugeben: „Im Hintergrund ist die majestätische Bergkette der Zwölf Apostel zu sehen, die bei Sonnenuntergang einen goldenen Farbton auf die Landschaft wirft. Die Stadt Camps Bay schmiegt sich zwischen die Berge und den Ozean, und am Strand darunter herrscht reges Treiben.“ Das Tool macht auch konkrete Angaben zu mir und meiner Stimmung. Es erkennt mich als Europäerin und schätzt mich auf dem Bild als „entspannt und zufrieden“ ein.

Die Technologie hat enorme Fortschritte gemacht

Es gab eine Zeit, in der ein Computer außer dem Dateiformat, der Größe und der Farbpalette so gut wie nichts über ein Bild sagen konnte. Und noch vor einem Jahrzehnt war es selbst für die modernste Technologie eine große Herausforderung, zu erkennen, ob ein Bild zum Beispiel einen Vogel zeigt oder nicht. Seitdem hat KI einen riesigen Entwicklungssprung gemacht. Heute sind Modelle wie Google Vision in der Lage, nicht nur einen Vogel zu erkennen, sondern auch die gesamte Landschaft sowie den Baum zu benennen, auf dem er sitzt.

Trotz aller Fortschritte bleibt Machine Vision unvollkommen, da KI-Systeme nach wie vor anfällig für Täuschungen sind und gelegentlich falsche Annahmen treffen. Die rasante Entwicklung der Modelle zeigt aber eindrucksvoll, dass sie immer präziser werden. Gleichzeitig verändert sich dadurch unser Verständnis von Fotos und den Daten, die sie enthalten. So stellt sich auch die Frage, wie Bildanalyse-Tools mit den Informationen umgehen, die wir ihnen liefern. They See Your Photos betont, dass hochgeladene Bilder nur kurzfristig verarbeitet und dann gelöscht werden. Da die primäre Verarbeitung durch Google erfolge, sollten Nutzer:innen auch hier die Datenschutzerklärung beachten.

Googles neue KI-Suche geht nach hinten los

