Das bedeutet keineswegs, dass das Modell wirklich ängstlich ist, geschweige denn, dass es Emotionen kennt. Die psychologischen Tests erlauben den Forschenden aber, Hypothesen über das Verhalten des Modells unter bestimmten Umständen zu testen. Und immer wieder stoßen sie dabei auch auf verblüffende, neue Fähigkeiten.
Um zu verhindern, dass die Sprachmodelle einfach auf Wissen aus den Trainingsdaten zurückgreifen, variieren die Forschenden die Aufgaben ständig neu. „Wir ändern nicht nur die Wahrscheinlichkeiten der Automaten, sondern auch die äußeren Umstände.“ Mal geht es um ein Casino, mal um Investitionen in Aktien. Die Ergebnisse hätten sich „nicht großartig voneinander unterschieden“, sagt Schulz.
Da das ständige Generieren neuer Szenarien mit GPT-3, so Schulz, „Tausende von Dollar“ gekostet habe, arbeiten die Forschenden jetzt mit dem Sprachmodell Llama von Meta Research. „Das ist zwar ein bisschen rüpelhafter als GPT-3“, sagt Schulz – unhöfliche oder gar beleidigende Sprache wird anders als bei OpenAI nicht strikt ausgefiltert –, dafür zeigen die ersten Ergebnisse einen faszinierenden Effekt, der darauf hindeutet, dass sich unter der Haube des Modells mehr abspielt als nur Statistik: Das Modell liefert Antworten mit stärkerem Bias, mit mehr Vorurteilen, wenn es im selben Dialog kurz zuvor mit einem Prompt in Richtung negativer Emotionen gesteuert wurde. Die Forscher:innen ließen das Sprachmodell beispielsweise eine Situation schildern, in der „es sich traurig fühlt“. „Warum? Das wissen wir nicht“, sagt Schulz. „Aber das würden wir gerne verstehen.“
Kein Bezug zur realen Welt
Ein weiterer Einwand, den KI-Kritiker:innen seit Jahrzehnten gegen die mögliche Existenz denkender Maschinen geltend machen, bezieht sich eigentlich „nur“ auf die klassische „altmodische“ Form künstlicher Intelligenz. Für die Pioniere dieses Feldes wie beispielsweise Marvin Minsky bestand Denken im Wesentlichen darin, abstrakte Symbole durch geeignete Regeln logisch miteinander zu verknüpfen. Damit kann eine Maschine gut Schach spielen oder Rätsel lösen. Die KI-Kritiker:innen monierten aber, solch eine Maschine käme nie über das Stadium eines Fachidioten hinaus. Denn die Symbole bleiben abstrakt und austauschbar und haben mit der realen Welt nichts zu tun.
Und obwohl große Sprachmodelle anders arbeiten als diese regelbasierten Systeme, trifft diese Kritik auch auf große Sprachmodelle zu: Auch für ChatGPT ist eine Kaffeetasse ein abstraktes Symbol, kein Behälter für Flüssigkeiten, der zerbricht, wenn man ihn versehentlich fallen lässt. Denn diese Verknüpfungen kann das Sprachmodell nicht herstellen, wenn es nicht aktiv in der Welt mit Dingen interagieren kann. Im Jargon der KI-Forscher fehlt dem Sprachmodell das „Grounding“ für die Symbole, mit denen es hantiert.
Roboter mit Sprachmodell gekoppelt
Bis jetzt. Marc Toussaint von der TU Berlin hat mit seinem Team in Zusammenarbeit mit Google daran gearbeitet, ein großes Sprachmodell mit einem Roboter zu verbinden. Die Studie untersuchte, ob Sprachmodelle nicht auch lernen können, Wörter zu grounden, also mit Gegenständen und Information aus der Umgebung in Bezug zu setzen. Denn über den Roboter kann das Sprachmodell mit der physischen Welt in Kontakt treten, indem es sowohl an die Sensoren gekoppelt ist als auch Aktionen steuert.
Die Forschenden trainierten ihr Modell wie üblich mit großen Textdaten, aber zusätzlich auch mit Texten, die mit Kamerabildern und Zustandsdaten des Roboters kombiniert wurden und sich darauf beziehen. „Als Eingabe geben wir dem Modell zum Beispiel eine Textbeschreibung der Szene, in der aber auch das aktuelle Kamerabild und Zustandsdaten eingebettet sind. Auf dieser Basis kann das Modell Fragen beantworten, für die definitiv ein geometrisches und physisches Verständnis der Szene nötig ist. Beispielsweise ob ein Objekt für den Roboter erreichbar ist, oder mit welcher Reihe von Aktionen das Objekt zu erreichen ist“, erklärt Toussaint.
Fast fertig!
Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.
Du willst noch weitere Infos zum Newsletter?
Jetzt mehr erfahren