Flugbuchungen und Einkäufe: Das soll Googles neuer KI-Agent Jarvis alles können
Der kalifornische Suchmaschinenbetreiber Google soll schon im Dezember eine Vorschau eines neuen KI-Agenten vorstellen wollen, der auf den Codenamen Project Jarvis hören soll. Das berichtet The Information.
Jarvis soll wohl googeln können und mehr
Bei Jarvis soll es sich den Angaben zufolge um einen „Computer-nutzenden Agenten“ handeln. Der soll einen Webbrowser bedienen können, um Nutzer:innen bei der Automatisierung alltäglicher Aufgaben zu helfen.
Von mit der Materie vertrauten Personen will The Information erfahren haben, dass das Unternehmen unter dem Codenamen Project Jarvis an einem „Computer-nutzenden Agenten“ arbeitet, der möglicherweise schon im Dezember als Vorschau verfügbar sein wird. Laut Quellen reagiere Jarvis „auf die Befehle einer Person, indem er häufig Screenshots von dem macht, was auf ihrem Computerbildschirm zu sehen ist, und die Aufnahmen interpretiert, bevor er Aktionen ausführt, wie das Klicken auf eine Schaltfläche oder das Eintippen in ein Textfeld“.
Zu erwarten steht wohl, dass Jarvis nur mit Webbrowsern, primär Chrome, wird arbeiten können. Der Agent solle bei allgemeinen Aufgaben wie Recherchen, Einkäufen und Flugbuchungen helfen, heißt es.
Der angenommene Zeitplan passt insofern gut, als zudem erwartet wird, dass Google seiner KI Gemini im Dezember das Modell der nächsten Generation unterlegen wird. Das berichtet The Verge.
Google macht Dampf bei der KI-Entwicklung
Google gab zuletzt ordentlich Gas in Sachen KI-Entwicklung. So wurde etwa Gemini Live, Googles KI-Chatbot, diesen Monat um Dutzende neue Sprachen erweitert. Zudem wurde die KI jüngst in Google Meet, Fotos und weitere Anwendungen integriert.
Erst vor wenigen Tagen hatte Anthropic ein ähnliches, aber vermutlich funktionsreicheres Feature für seine Claude-KI vorgestellt. Das soll dem Vernehmen nach über „Computerkenntnisse“ verfügen und so „eine Vielzahl von Standardwerkzeugen und Softwareprogrammen nutzen“ können, „die für Menschen entwickelt wurden“. Die neue Funktionalität kann im Rahmen einer öffentlichen Beta-Version getestet werden.