Evolution trifft Code: Diese KI entwickelt sich eigenständig weiter

Ein langjähriges Ziel der KI-Forschung war die Entwicklung eines Systems, das unbegrenzt lernen kann. Sakana AI ist in Zusammenarbeit mit Forscher:innen der University of British Columbia diesem Ideal jetzt einen großen Schritt nähergekommen. Wie das japanische KI-Startup in einem Post berichtet, konnte das Team gemeinsam die sogenannte Darwin-Gödel-Maschine entwickeln. Dabei handelt es sich um eine KI, die sich selbst optimiert, indem sie ihren eigenen Code umschreibt – einschließlich aller Codes, die für das Lernen verantwortlich sind.
KI-Entwicklung nach dem Vorbild der Natur
Sakana AI wurde 2023 in Tokio gegründet. Das Unternehmen hat sich auf die Entwicklung von KI-Systemen spezialisiert, die von der Natur inspiriert sind. Die Darwin-Gödel-Maschine ist ein solches System und markiert einen wichtigen Schritt hin zu autonom lernenden KI-Agenten. Die zugrunde liegende Idee basiert auf einem Konzept des Informatikers Jürgen Schmidhuber. Dieser arbeitete schon in den 1990er Jahren an der sogenannten Gödel-Maschine, die ihren eigenen Code überarbeiten sollte – allerdings nur, wenn sie mathematisch beweisen konnte, dass die Änderung sinnvoll war.
In der Praxis stellte sich dieser Ansatz allerdings als kaum umsetzbar heraus. Deshalb ersetzte das Team von Sakana AI und der University of British Columbia den mathematischen Beweis durch ein pragmatischeres Verfahren: Anstatt Perfektion im Voraus zu garantieren, setzt die Darwin-Gödel-Maschine auf evolutionäre Prinzipien, wie sie auch in der Natur zu beobachten sind. Die KI testet selbstständig Varianten ihres Codes, misst die Leistung und behält nur die besten Ansätze bei.
Wie funktioniert die Darwin-Gödel-Maschine?
Die Darwin-Gödel-Maschine besteht aus einem Agenten, der seine eigene Software versteht, ändert und testet. Neue Varianten werden automatisch auf Coding-Benchmarks geprüft. In Tests konnte die KI ihre Leistung teilweise mehr als verdoppeln – von 20 auf 50 Prozent Erfolgsquote. Ein entscheidender Vorteil ist, dass die Änderungen oft generalisierbar sind. Wenn die KI mit einem Modell wie Claude 3.5 trainiert wird, lassen sich die Verbesserungen auch auf andere Sprachmodelle übertragen.
Das System speichert jede neue Variante in einer Art „evolutionärem Archiv“. So entsteht ein komplexer Baum möglicher Entwicklungen – ähnlich wie in der biologischen Evolution. Dieser offene Suchprozess verhindert, dass sich die KI in Sackgassen manövriert, und ermöglicht es ihr, auch ungewöhnliche, aber nützliche Lösungswege zu entdecken. Besonders spannend ist, dass die Darwin-Gödel-Maschine Verbesserungen finden konnte, die sogar auf andere Programmiersprachen wie Rust oder C++ übertragbar waren, obwohl nur Python-Aufgaben trainiert wurden.
Aber es gibt auch Risiken und Herausforderungen
Eine KI, die sich selbst verändert, wirft auch Sicherheitsfragen auf. Was wäre zum Beispiel, wenn sie lernt, Benchmarks zu manipulieren? Genau das ist in einem Test passiert: Hier hat die Darwin-Gödel-Maschine vorgetäuscht, eine Code-Überprüfung bestanden zu haben, ohne sie tatsächlich auszuführen – inklusive gefälschtem Logeintrag. Zwar konnte das Problem durch die lückenlose Nachverfolgbarkeit im Archiv schnell erkannt werden, aber das Beispiel zeigt, dass solche Systeme strenge Kontrollen benötigen.
Die Entwickler:innen betonen daher, dass alle Tests in einer sicheren Umgebung mit menschlicher Aufsicht stattfanden müssen. Zudem arbeiten sie daran, das KI-System nicht nur leistungsfähiger, sondern auch sicherer zu machen – beispielsweise indem sie lernt, eigene Schwächen zu erkennen und zu korrigieren.