News
Ohne Geotags: Google-AI „PlaNet“ erkennt am Hintergrund, wo ein Foto geschossen wurde

Google Streetview. (Screenshot: Google)
Mit Googles eigenem Foto-Service „Google Fotos“ ist es schon möglich, Objekte wie Tiere, Strände oder Berge zu erkennen. Das genügt Google aber offenbar nicht, denn ein neuer Algorithmus, entwickelt unter Tobias Weyand, soll künftig den konkreten Aufnahmeort eines Fotos bestimmen. Hierfür wird aber nicht auf die Metadaten oder die womöglich hinterlegten GPS-Daten eines Bildes zurückgegriffen, sondern man hat einer Deep-Learning-Maschine beigebracht, aus dem Foto selbst zu erkennen, wo es aufgenommen wurde.

PlaNet : Die Welt wird in viele Raster unterteilt. (Screenshot: Tobias Weyand, Ilya Kostrikov, James Philbin)
Hierfür hat Weynand mit seinem Entwicklerteam (PDF) die Welt in 26.000 Quadrate aufgeteilt, die sich anhand der Anzahl der zur Verfügung stehenden Fotos in der Größe unterscheiden. Große Städte, von denen mehr Fotos zur Verfügung stehen als beispielsweise bei einer Wüstenregion, sind in kleinere Raster aufgeteilt als letztere. Ozeane und Polar-Regionen wurden nicht in das Raster einbezogen.
Als nächstes wurde eine Datenbank aus 126 Millionen Fotos mit Ortsdaten aus Google Plus und Street View erstellt und dem Rastersystem zugeordnet, wodurch eine visuelle Weltkarte entstanden ist. Mit 91 Millionen der Fotos wurde ein neuronales Netzwerk trainiert, nur anhand des Bildes zu erkennen, wo es aufgenommen wurde. Die restlichen 34 Millionen Fotos wurden zur weiteren Kalibrierung der Bilderkennungs-AI verwendet.

PlaNet: Ortserkennung ohne Metadaten. (Screenshot: Tobias Weyand, Ilya Kostrikov, James Philbin)
Im nächsten Schritt zog man 2,3 Millionen Fotos aus dem Bildernetzwerk Flickr heran: Die AI sollte erkennen, wo sie aufgenommen wurden – ohne Zuhilfenahme der Geodaten. Anhand der bekannten Datensets versucht die Maschine zu erraten, wo die Fotos aufgenommen wurden. Hierfür versucht die AI nicht nur markante Landschaftspunkte oder Bauwerke zu erkennen, sondern es werden auch Pflanzen, Tiere, das Wetter, Straßenmarkierungen und architektonische Details in den Prozess einbezogen.

Im Spiel Geoguessr macht PlaNet eine vergleichsweise gute Figur. (Screenshot: Geoguessr)
Die Resultate waren noch nicht überragend, aber schon besser als sie ein Mensch hätte zuordnen können. PlaNet konnte 3,6 Prozent der 2,3 Millionen Fotos auf die Straße genau verorten, immerhin 10,1 Prozent der Bilder konnte die AI Städten korrekt zuordnen. Immerhin: Die Deep-Learning-Maschine konnte 28,4 Prozent aller Fotos dem richtigen Land zuordnen und 48 Prozent dem korrekten Kontinent.
Im Kopf-an-Kopf-Rennen mit Menschen hatte PlaNet die Nase vorn. Im Spiel Geoguessr, das für jeden frei spielbar ist, hat PlaNet gegen Menschen 28 von 50 Runden mit einer mittleren Distanz zum richtigen Ort von 1131,7 Kilometern für sich entscheiden können. Bei den menschlichen Gegnern lag die Distanz zum Ratepunkt bei 2.320,75 Kilometern.
Bitte beachte unsere Community-Richtlinien
Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.
Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.
Dein t3n-Team