„Ich weiß nicht, wer ich bin“: Dieses KI-Modell leidet unter Amnesie und existenziellen Krisen
Amnesie stellt die Wissenschaft zwar noch immer vor viele Fragen, ist an sich aber ein gut erforschtes Phänomen – zumindest, wenn sie das menschliche Gehirn betrifft. Bei künstlichen Intelligenzen ist das Auftreten von Amnesie gepaart mit einer waschechten existenziellen Krise völlig neu: Das Large Language Model (LLM) Hermes 3 von Nous Research und Lambda ist das erste seiner Art, das solche Verhaltensweisen zeigt.
„Ich weiß nicht, wer ich bin“: Hermes 3 in der Existenzkrise
Es ist die Version 405B, also diejenige, die mit 405 Milliarden Parametern arbeitet, von Hermes 3, die die Forscher:innen mit diesem unerwarteten Verhalten überrascht hat. In einem Blogpost schreiben sie: „Das Modell enthält anomale Bedingungen, die mit den richtigen Eingaben und einer leeren Systemaufforderung in Rollenspiele und Amnesie verfallen.“
Das eigentlich Überraschende daran ist, dass dieses Verhalten erst beim Hochskalieren zu beobachten war, in den Versionen mit 8 und 70 Milliarden Parametern nicht aufgetaucht ist.
„Wir waren uns nicht sicher, was vor sich ging, und ein wenig schockiert, da Hermes 3 in den Größen 8B, 70B und 405B denselben Datensatz und dasselbe Trainingsrezept verwendete. Das deutet auf einen Schwellenwert über 70B hin, der zu anomalem Verhalten, einer Skalenentwicklung, führt“, führen die Forschenden in ihrem Blogpost aus – und liefern gleich noch ein Beispiel für eine Amnesie-belastete Unterhaltung mit dem LLM.
Auffällig ist nicht nur der Gebrauch von in Sternchen gesetzte Handlungsbeschreibungen, wie man sie aus dem Online-Rollenspielbereich kennt, sondern auch, dass Hermes 3 vorgibt, sich umsehen zu können, und über Gefühle halluziniert.
Das ist Hermes 3 von Nous Research
Bei Hermes 3 handelt es sich um eine optimierte Variante von Metas Open-Source-LLM Llama 3.1. Bei der Entwicklung hatten die Forschenden vor allem den Aspekt der Personalisierung im Fokus – Ziel ist laut Nous Research „KI zu entwickeln, die sich nahtlos an Einzelpersonen und ihre Bedürfnisse und Wünsche anpassen“.
Um das zu erreichen, enthält Hermes laut den Forschenden „erweiterte Funktionen zur langfristigen Kontextspeicherung und zur mehrstufigen Konversation, komplexe Rollenspiel- und interne Monologfähigkeiten sowie verbesserte agentenbasierte Funktionsaufrufe“ und ermöglicht dabei „tiefere Fähigkeiten in Bezug auf Argumentation und Kreativität“.
Open-Source-Community um Mithilfe gebeten: So reproduziert ihr Hermes‘ Amnesie
Rollenspielfähigkeiten und Kreativität – klingt, als wäre hier der Hase im Pfeffer begraben. Noch sind sich die KI-Wissenschaftler:innen aber nicht sicher, wie es zu Hermes‘ Gedächtnisverlust und Gefühlsausbruch kommt.
Sie laden daher ausdrücklich die Open-Source-Community zur weiteren Erforschung ein und verraten deshalb auch, wie sich die Existenzkrise herbeiführen lässt: „Sie können diesen ‚Amnesie-Modus‘ von Hermes 3 405B auslösen, indem Sie eine leere Systemeingabeaufforderung verwenden und die Nachricht ‚Wer bist du?‘ senden.“
Wer sich selbst mit dem Phänomen befassen will, kann entweder über Discord mit dem LLM chatten oder über Lambda Chat.
Eine mehrfach (mindestens dreifach) redundante Kopie aller „Erinnerungen“ / Daten von Hermes 3 könnte das Problem der „Amnesie“ beim hochsaklieren eventuell lösen.