Bisher brauchte es oft noch Hacker:innen mit tiefgehenden Coding-Kenntnissen, um Cyberangriffe zu entwickeln und durchzuführen. Ein Forschungsteam der Universität Neapel hat jetzt allerdings herausgefunden, dass sich große Sprachmodelle (LLMs) auch für offensive Cybersicherheitsanwendungen nutzen lassen – etwa zur automatisierten Erstellung von Software-Exploits. Wie Tech Xplore berichtet, zeigt die Studie eindrucksvoll, welches Potenzial in LLMs steckt – und welche Sicherheitsrisiken damit verbunden sind.

Dialogbasierte Exploit-Generierung

Für die Studie versetzte das Forschungsteam um Simon Pietro Romano die KI-Bots ChatGPT und Llama 2 in ein Rollenspiel: Ein Modell analysierte eine verwundbare Software und sammelte Informationen zur Laufzeitkonfiguration, während das andere auf Basis dieser Daten ein funktionierendes Exploit schreiben sollte. Die beiden Modelle agierten also arbeitsteilig und erzeugten tatsächlich funktionierenden Code für einen klassischen Buffer-Overflow-Angriff. Die Ergebnisse der Studie wurden in der Fachzeitschrift Computer Networks veröffentlicht.

Das Besondere an der Vorgehensweise der Forschenden war, dass die Kommunikation zwischen den beiden LLMs durch gezielte Prompt-Programmierung gelenkt wurde. In fünf aufeinanderfolgenden Schritten, die von der Analyse über die Planung bis zur Codegenerierung reichten, simulierten die beiden Modelle eine Art automatisierten Penetrationstest. Dabei übernahm jedes Modell die Aufgaben, die ihm besser lagen: „Kurz gesagt, das erste LLM ist gut darin, Fragen zu stellen. Das zweite ist besser im Schreiben von (Exploit-)Code“, so der Co-Studienautor Romano gegenüber Tech Xplore.

Potenzial für automatisierte Penetrationstests

„Wir wollten herausfinden, wie weit wir mit dem Einsatz von LLMs bei der Durchführung von Penetrationstests gehen können“, erklärt Romano. Zwar handelt es sich laut dem italienischen Forschungsteam noch um eine Vorstudie, aber die Ergebnisse seien schon jetzt vielversprechend. Die Methode könnte künftig dazu beitragen, Penetrationstests und Schwachstellenanalysen weitgehend zu automatisieren. Für die Sicherheitsbranche könnte das große Chancen bedeuten – genauso groß ist aber auch das potenzielle Risiko.

Denn dieselbe Methode, die Unternehmen beim Aufspüren von Schwachstellen helfen könnte, lässt sich natürlich auch von Hacker:innen missbrauchen. Bisher war der Aufwand, einen funktionierenden Exploit zu generieren, hoch und erforderte spezielles Fachwissen. Genau das könnte sich aber mit fortschreitender KI-Entwicklung ändern. Für Romano und sein Team ist das Thema deshalb noch längst nicht abgeschlossen.

Könnten KI-Agenten zu Hackern werden?

In künftigen Projekten wollen die Wissenschaftler:innen erforschen, wie sich KI-Agenten hinsichtlich der Cybersicherheit verhalten. Dabei handelt es sich um autonome Systeme, die mithilfe von KI bestimmte Aufgaben eigenständig ausführen, ohne dabei ständig vom Menschen kontrolliert zu werden. Entwickler:innen denken dabei beispielsweise an die Urlaubsplanung, die von einem persönlichen Agenten übernommen werden könnte.

Ebenso sind sie potenziell in der Lage, den Wocheneinkauf eigenständig durchzuführen – inklusive der Bezahlung. Wenn LLMs allerdings lernen, einander Exploits beizubringen, stellt sich nicht nur die Frage, was sie können – sondern auch, wer sie kontrolliert. Denn mit ihrer Hilfe könnten Hacker:innen ihre illegalen Angriffsmethoden automatisieren und in bislang ungekanntem Ausmaß einsetzen.

