Anzeige
Anzeige
News

Ist der „erste KI-Software-Ingenieur“ Devin nur ein Hochstapler?

Von seinen Entwicklern als weltbester Mitarbeiter und Angestellter angepriesen, waren die Erwartungen an Devin groß. Nun stellt sich die Frage, ob der KI-Ingenieur seine 500 US-Dollar pro Monat überhaupt verdient hat.

Von Hannah Klaiber
2 Min.
Artikel merken
Anzeige
Anzeige

In der "echten" Welt kann sich der gehypte KI-IT-Profi Devin wohl nicht behaupten. (Symbolbild: Shutterstock / DC Studio)

In der IT-Branche sorgt Devin aktuell für Aufsehen – allerdings nicht im positiven Sinne: Drei Datenwissenschaftler kamen zu dem Ergebnis, dass er nicht besonders viel von seinem Handwerk versteht.

Anzeige
Anzeige

Ein Hype mit wenig Substanz?

Vorgestellt wurde Devin im März 2024 von Cognition AI. Ab Dezember war er für alle Interessierten buchbar – zu Preisen ab 500 US-Dollar pro Monat.
Laut seinen Entwicklern sollte Devin Mittagessen über DoorDash bestellen, Apps von Grund auf erstellen und Fehler eigenständig beheben können. Doch die Realität scheint Devin nun als Hochstapler zu entlarven.

Erste Tests zeigen Devins Schwächen

Bereits frühe Testberichte zeigten Devins Schwächen auf: Ein von Cognition AI veröffentlichtes Werbevideo, das Devins Fähigkeit demonstrieren sollte, eigenständig Projekte auf der Freelancer-Plattform Upwork abzuschließen, wurde kurze Zeit später von dem Entwickler Carl Brown auf YouTube komplett auseinandergenommen. Dass Browns Kanal den Namen „Internet of Bugs“ trägt, ist dabei kein Zufall:

Anzeige
Anzeige

Ein weiterer Kritiker meldete schwerwiegende Sicherheitsprobleme in Devins System. Jetzt haben drei Datenwissenschaftler, die mit dem KI-Forschungslabor Answer.AI verbunden sind, Devin auf die Probe gestellt – mit ernüchternden Ergebnissen.

Anzeige
Anzeige

20 Aufgaben, 3 Erfolge – die Bilanz ist ernüchternd

Von 20 zugewiesenen Aufgaben erledigte Devin lediglich drei erfolgreich. Er glänzte zunächst mit kleineren Erfolgen, wie dem Export von Daten aus einer Notion-Datenbank in Google Sheets oder der Erstellung eines Planeten-Trackers.

Doch je komplexer die Aufgaben wurden, desto deutlicher zeigte sich Devins Schwachstelle: technische Sackgassen, überkomplizierte Lösungen und eine Tendenz, sich an unmöglichen Aufgaben festzubeißen.

Anzeige
Anzeige

Ein besonders absurdes Beispiel: Devin versuchte, mehrere Anwendungen auf der Plattform Railway bereitzustellen, ohne zu verstehen, dass dies technisch gar nicht möglich ist. Stattdessen verbrachte der Bot mehr als einen Tag damit, nicht existierende Funktionen zu „halluzinieren“.

Die Tester fällen ein hartes Urteil

Die Tester, Hamel Husain, Isaac Flath und Johno Whitaker, bezeichneten Devins Leistungen als frustrierend. „Wenn Devin funktionierte, war die Benutzererfahrung beeindruckend – aber das war selten der Fall“, schreiben sie. „Noch schlimmer: Es war unmöglich vorherzusagen, welche Aufgaben er tatsächlich meistern würde. Selbst vermeintlich einfache Aufgaben scheiterten auf überraschend komplexe Weise.“

Wenn Devin ein Vorgeschmack auf die Zukunft autonomer KI-Entwickler sein soll, steht uns noch ein langer Weg bevor…

Anzeige
Anzeige

Cognition AI hat sich bislang nicht zu den Testergebnissen geäußert.

Sora – Das sind die besten Clips von OpenAIs Video-KI

Sora: Das sind die besten Clips von OpenAIs Video-KI Quelle:

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Kommentare

Community-Richtlinien

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Kommentar abgeben

Melde dich an, um Kommentare schreiben und mit anderen Leser:innen und unseren Autor:innen diskutieren zu können.

Anmelden und kommentieren

Du hast noch keinen t3n-Account? Hier registrieren

Anzeige
Anzeige