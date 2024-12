KI-Assistenten, die auf großen Sprachmodellen basieren, werden immer leistungsfähiger. Sie sind nicht nur in der Lage, Benutzeroberflächen (GUI) wie Menschen zu verstehen, sondern können sie potenziell auch bedienen, indem sie beispielsweise auf Schaltflächen klicken, Formulare ausfüllen und zwischen Anwendungen navigieren.

Wie Venturebeat berichtet, wurde das Potenzial von einem Microsoft-Forschungsteam untersucht – und der Nutzen für Unternehmen könnte tatsächlich riesig sein. Für die Praxis würde das nämlich bedeuten, dass Benutzer:innen nicht mehr selbst komplexe Softwarebefehle lernen müssen. Stattdessen geben sie ihre Anfrage einfach in natürlicher Sprache an den GUI-Agenten weiter, der dann automatisch die notwendigen Aktionen ausführt.

Diese Tech-Firmen arbeiten an Lösungen

Große Tech-Konzerne arbeiten schon daran, diese Funktionen in ihre Produkte zu integrieren. In der Studie, an der Microsoft beteiligt war, wird natürlich die Rolle von Power Automate aufgegriffen: Die Cloud-basierte Software ermöglicht es Nutzer:innen, wiederkehrende Aufgaben zu automatisieren. Hier werden LLMs eingesetzt, um sie bei der Erstellung automatisierter Workflows in verschiedenen Anwendungen zu unterstützen. Und auch der KI-Copilot des Unternehmens kann Software direkt auf der Grundlage von Textbefehlen steuern. Microsoft ist aber bei Weitem nicht das einzige Unternehmen, das an solchen Funktionen arbeitet.

Das „Computer Use“-Feature ermöglicht es Claude AI, dem smarten Chatbot von Anthropic, mit Webschnittstellen zu interagieren und komplexe Aufgaben zu erledigen. Google arbeitet an einem ähnlichen Projekt namens Jarvis, das den Chrome-Browser nutzt, um webbasierte Aufgaben wie Recherchen, Einkäufe und Reisebuchungen durchzuführen. Dieses Projekt befindet sich jedoch noch in der Entwicklung und ist noch nicht öffentlich verfügbar.

Das Potenzial ist riesig – die Hürden ebenfalls

Laut den Analysten von BCC Research hat der Markt für KI-gestützte GUI-Automatisierung das Potenzial, bis 2028 einen Wert von 68,9 Milliarden US-Dollar zu erreichen. Dies ist auf den wachsenden Trend in Unternehmen zurückzuführen, repetitive Aufgaben zu automatisieren und Software auch für technisch weniger versierte Nutzer zugänglicher zu machen. Branchenexpert:innen gehen davon aus, dass bis 2025 rund 60 Prozent der großen Unternehmen solche Systeme einsetzen werden, was zu erheblichen Effizienzgewinnen führen könnte.

Bevor es zu einer breiten Anwendung dieser Technologie kommt, sind jedoch noch erhebliche Hindernisse zu überwinden. Dazu zählen zum Beispiel Datenschutzbedenken beim Umgang mit sensiblen Informationen sowie Einschränkungen bei der Rechenleistung. Unternehmen müssen die Auswirkungen auf Sicherheit und Infrastruktur sorgfältig prüfen, bevor sie LLM-basierte GUI-Agenten tatsächlich gewinnbringend einsetzen können. Und zumindest in Deutschland könnte das noch eine Weile dauern.

