Vom Assistenten zum Agenten: Microsofts KI Copilot soll lernen, selbstständig in Windows 11 zu arbeiten
Microsoft testet, wie der KI-Assistent Copilot künftig Aufgaben mit lokalen Dateien übernehmen kann, die bisher allein Sache der Nutzer:innen waren. (Bild: Microsoft)
Der US-Softwarehersteller Microsoft hat einen weitreichenden Test für seinen KI-Assistenten Copilot angekündigt. Unter dem Namen „Copilot Actions“ soll die KI erstmals in der Lage sein, als autonomer Agent mehrstufige Aufgaben direkt mit lokalen Dateien auf einem Windows-11-PC auszuführen. Damit vollzieht Microsoft den strategischen Wandel vom reaktiven Assistenten zum proaktiven Agenten.
Die neue Funktion wird zunächst exklusiv für Teilnehmer:innen des Windows-Insider-Programms in den sogenannten „Copilot Labs“ ausgerollt. Die Idee ist, dass Nutzer:innen eine Aufgabe in natürlicher Sprache formulieren – etwa „Finde alle meine Urlaubsfotos aus dem Juli und verschiebe sie in einen neuen Ordner“ – und der Copilot-Agent diese Anweisung selbstständig umsetzt, indem er mit dem Dateisystem und den Anwendungen interagiert.
Sicherheit durch Isolation
Microsoft ist sich der potenziellen Sicherheitsrisiken bewusst und betont, dass die Funktion standardmäßig deaktiviert ist. Wird sie von den Nutzer:innen aktiviert, laufen die Aktionen in einer isolierten Umgebung, einem „contained environment“, das die Interaktionen vom restlichen System abschirmt.
Nutzer:innen können den Arbeitsprozess des Agenten live auf dem Bildschirm verfolgen und jederzeit eingreifen oder ihn stoppen. Yusuf Mehdi, Microsofts Executive Vice President und Consumer Chief Marketing Officer, räumt in einem Beitrag im offiziellen Windows-Blog ein, dass der Agent anfangs noch fehleranfällig sein wird: „Ihr werdet vielleicht sehen, dass der Agent Fehler macht oder auf Herausforderungen bei komplexen Schnittstellen stößt“. Gerade deshalb sei das Testen in der realen Welt entscheidend.
Copilot wird zur plattformübergreifenden Zentrale
Parallel zu den autonomen Agenten-Fähigkeiten erweitert Microsoft die Konnektivität des Copiloten erheblich. Mit den neuen „Copilot Connectors“ können Nutzer:innen ihre Konten von Drittanbietern direkt an die KI anbinden.
Besonders bemerkenswert ist, dass hier neben den hauseigenen Diensten wie Onedrive und Outlook auch explizit die Dienste von Google genannt werden, darunter Google Drive, Gmail und Google Calendar, oder auch Spotify, wo der Agent etwa automatisiert Playlists anlegen können soll. Copilot könnte damit zur zentralen, plattformübergreifenden Schnittstelle für persönliche Informationen werden.
Auch die direkte Interaktion wird vereinfacht. Mit dem Aktivierungswort „Hey Copilot“ lässt sich der Assistent künftig per Sprache starten. Die Funktion „Copilot Vision“, mit der die KI den Bildschirminhalt analysiert, wird zudem um eine Texteingabe erweitert, was die Nutzung ohne Mikrofon erleichtert.
Die Ankündigungen sind strategisch eng mit dem kürzlich beendeten Support für Windows 10 verknüpft. Die neuen, tief in das Betriebssystem integrierten KI-Funktionen sollen einen klaren Anreiz für den Umstieg auf Windows 11 und idealerweise auf neue „Copilot+ PCs“ mit dedizierter KI-Hardware schaffen. Auch wenn die Vision eines autonomen KI-Agenten auf dem eigenen PC vielversprechend klingt, wird der Erfolg maßgeblich von der Zuverlässigkeit und vor allem der Sicherheit der Implementierung abhängen.
Der Denkfehler von den „KI“ Firmen ist immer noch, dass die Leute ihre Geräte mit „Natürlicher Sprache“ bedienen wollen. Als Power User will man sich alles so leicht wie möglich machen und mit wenigen Schritten zum Ziel kommen. Wenn man erst noch einen Roman eintippen muss, dauert das viel länger als paar Klicks. Und die Spracheingabe wird in Großraumbüros nicht funktionieren.