Am 16. April 2025 hat OpenAI seine neuen KI-Modelle o3 und o4-mini veröffentlicht. Diese sollen nicht nur vor Antworten länger und tiefer nachdenken („Reasoning“), sondern auch mit Bildern denken, also visuelle Informationen in ihre Gedankenkette integrieren können.

Neue Superkraft von ChatGPT

In der Mitteilung beinahe etwas untergegangen ist eine neue Superkraft, die jetzt durch zahlreiche Erfahrungsberichte von Internetnutzer:innen viral geht. Dabei handelt es sich um die Fähigkeit, Standorte, an denen Fotos aufgenommen wurden, mit beeindruckender Präzision zu erkennen.

ChatGPT greift dabei nicht auf die Metadaten der ihm vorgelegten digitalen Bilder zurück, in denen die Standortdaten oft enthalten sind. Auch dürfte der KI-Chatbot keine Informationen aus mit den Nutzer:innen geführten früheren Konversationen nutzen, wie heise.de berichtet.

Bessere Analyse mit o3 und o4-mini

Stattdessen analysiert ChatGPT – auf Basis von o3 und o4-mini – die Bilder deutlich präziser als das bisher der Fall war. Denn die Standortbestimmung war auch in früheren Modellen möglich. Allerdings keineswegs so genau wie jetzt.

Denn mittlerweile nimmt der Chatbot einzelne Bildausschnitte unter die Lupe, vergrößert bestimmte Bereiche und analysiert auch Beschriftungen. So erkennt die KI bestimmte Gebäudetypen, Straßenschilder oder Speisekarten.

Relevante Infos aus Fotos extrahieren

ChatGPT kann bei der Suche nach dem Standort jetzt alle verfügbaren Werkzeuge nutzen und eigenständig kombinieren. Neben der integrierten Datenbank auch die Websuche sowie Bildanalyse. Ebenfalls neu: Auch aus unscharfen oder nicht perfekten Fotos kann die KI relevante Informationen wie dargestellten Text extrahieren.

Laut Tests von Nutzer:innen kann die KI mit den optimierten Fähigkeiten in vielen Fällen tatsächlich erstaunlich gut die Standorte erkennen, an denen die Fotos aufgenommen wurden. Allerdings zeigen sich auch noch zahlreiche Schwächen. Und falsche Ortsangaben kommen ebenso häufig vor – etwa, wenn im Inneren von Gebäuden architektonische Merkmale verwechselt werden.

Noch bessere Standortanalyse: Gute Idee?

Überhaupt ist fraglich, ob eine 100-prozentige Standorterkennung erstrebenswert ist. Schließlich lässt sich damit auch auf Aufenthaltsorte von Personen schließen, die das vielleicht gar nicht wollen.

Etwa, wenn es um Nutzer:innen auf Facebook oder Instagram geht. Umso wichtiger ist und bleibt, genau zu überlegen, welche Fotos und von wem und wo man im Internet veröffentlicht.