Project Astra: Googles KI sieht und erklärt die Welt – und funktioniert in smarten Brillen
Wenn es darum geht, Dinge zu erkennen, haben sich KI-Gadgets wie der Rabbit R1 oder Humane AI Pin in ersten Tests gründlich blamiert. Zu oft lagen sie daneben. Wie es künftig besser funktioneren könnte, zeigte Google auf der I/O mit Project Astra. Die Technik setzt auf das Gemini-Modell und kann etwa via Smartphone-Kamera die Welt um sich herum erkennen.
Google erkennt die Welt
Google zeigte es in einem Video mit Hilfe eines Smartphones. Die nötige App zeigte das Kamerabild an. Die Person hinter der Kamera stellte der KI fragen. „Zeige mir etwas, dass Geräusche macht“, war die erste Anfrage. Die KI erkannte einen Lautsprecher und konnte auf Nachfrage Details zum Lautsprecher erklären. Außerdem war sie dazu in der Lage Codezeilen zuzuordnen, Bilderrätsel zu lösen, sich lustige Bandnamen auszudenken oder den Standort nach einem Blick aus dem Fenster zu bestimmen.
Dabei reagiert die KI nicht nur auf die Fragen von Smartphone-Nutzer:innen. Es ist auch möglich, auf dem Bildschirm etwa Pfeile zu zeichnen, um das Modell auf bestimmte Dinge hinzuweisen. Was auffiel: Die Stimme klang ähnlich wie beim neuen GPT-4o-Modell erstaunlich menschlich. Die Antworten kamen außerdem ohne Wartezeit. Wohlgemerkt: Bei der Demonstration handelte es sich um ein vorab aufgenommenes Video. Ob sich die KI auch in anderen Szenarien so gut schlägt, lässt sich also nicht sagen.
Bekommt Google Glass einen Nachfolger?
Zum Abschluss hat Google noch ein kleines „One more thing“ im Stile von Apple angedeutet. Die Person hinter der Kamera fand mit Hilfe der KI ihre Brille wieder. Im weiteren Verlauf des Clips stellte sich heraus, dass es sich dabei um eine smarte Brille mit Headsup-Display handelte. Auch darauf lief die KI-Anwendung, konnte weiterhin die Welt erkennen und Fragen beantworten.
Um ein neues Produkt, das in den Startlöchern steht, handelt es sich dabei allerdings wohl nicht. Die Fähigkeiten von Project Astra will Google erst im Laufe des Jahres in die Gemini-App integrieren. Weitere Details zu einer möglichen Brille gab es vorerst nicht.
Dass so eine Bild-KI in einer Brille zumindest rudimentär funktionieren kann, zeigte zuletzt Meta. In den Smart Glasses ist bereits eine künstliche Intelligenz als Beta-Version verfügbar, die aber auch nicht immer richtig liegt.