KI, hilf mir bei der Urlaubsplanung: MIT-Forscher entwickeln „Problemlöser“ für Sprachmodelle

(Foto: Song_about_summer / Shutterstock)
Künstliche Intelligenz hat das Potenzial, die Art und Weise, wie wir künftig verreisen, gehörig zu verändern. Das versprechen jedenfalls unzählige Apps, Websites und Tools, mit denen die Urlaubs- und Reiseplanung einfacher werden soll. Doch beim genaueren Hinsehen zeigt sich, dass die meisten davon noch ein ganzes Stück weit davon entfernt sind, um etwa einen Urlaub eigenständig zu planen.
Die Probleme kennen auch die Forscherinnen und Forscher des MIT-IBM Watson AI Lab in Cambridge, Massachusetts. Reiseplanung sei komplex, sagt die Wissenschaftlerin Chuchu Fan, „es gibt unterschiedliche Bedürfnisse, Anforderungen, Beschränkungen und reale Informationen, die man zusammentragen muss.“
Je mehr es davon gibt, desto schwieriger haben es große Sprachmodelle (LLM) wie ChatGPT, Gemini oder Claude. Zwar können sie problemlos eine grobe Reiseroute planen, inklusive Sehenswürdigkeiten und Tipps für Restaurants auf der Strecke. Doch wenn man das Ganze noch mit Flügen, Mietwagen, gewünschten Hotelkategorien und konkreten Daten anreichert, kommen die virtuellen Reiseplaner schnell an ihre Grenzen.
Das Team des MIT-IBM Watson AI Lab will zeigen, wie es möglicherweise besser geht. In einer Vorab-Studie stellen sie ein Framework vor, das als KI-Reisevermittler eingesetzt werden kann. Die Besonderheit: Zusätzlich zu einem großen Sprachmodell kommt ein sogenannter SMT-Solver (Satisfiability Modulo Theories) zum Einsatz. So heißen Computerprogramme, die entscheiden, ob eine logische Formel erfüllbar ist. Oder ob, im Fall einer Reiseplanung, alle im Input der Nutzer:innen formulierten Bedürfnisse formal umgesetzt werden können.
Sprachmodell trifft Problemlöser
„Das LLM schlägt uns nicht direkt einen Reiseplan vor. Stattdessen fungiert es hier als Übersetzer, um eine natürlichsprachliche Problembeschreibung in ein Problem zu übersetzen, mit dem ein Solver umgehen kann“, erklärt Fan.
Was kompliziert klingt, ist vom Systemaufbau her vergleichsweise simpel. Nutzer:innen bitten ein KI-Sprachmodell zunächst um die Planung einer Reise, zum Beispiel so: „Bitte hilf mir bei der Planung einer dreitägigen Reise von Berlin nach Paris vom 16. bis 18. September 2025. Die Reise sollte für eine einzelne Person mit einem Budget von 500 Euro geplant werden. An jedem Tag sollen drei bekannte Sehenswürdigkeiten besichtigt werden. Unterkünfte sollen mindestens vier Sterne haben.“
Sprachinput in Python-Code
Anstatt nun sofort mit dem Output zu beginnen, aktiviert das Sprachmodell zunächst den SMT-Solver. Dafür übersetzt es den sprachlichen Input in Python-Code, den der Problemlöser interpretieren kann. Dieser beginnt dann, die Formeln auf ihre Durchführbarkeit zu testen; er versucht vereinfacht gesagt, verschiedene Mathe-Probleme zu lösen. Das Programm checkt etwa, ob es an den Tagen überhaupt noch Flüge von Berlin nach Paris gibt oder ob das Budget von 500 Euro ausreicht, um den Flug und die Übernachtungen in einem 4-Sterne-Hotel abzudecken.
Stößt der Solver auf Probleme, spielt er diese inklusive von Lösungsvorschlägen wieder an das Sprachmodell zurück, das den User um zusätzlichen Input bittet: „Für 500 Euro ist es leider nicht möglich, Flug und Hotel abzudecken. Ich empfehle, das Budget zu erhöhen oder eine niedrigere Hotelkategorie zu wählen.“ Nehmen die User:innen den Vorschlag an, beginnt das Ganze von vorne bis am Ende schließlich ein vom SMT-Solver geprüfter, formell durchführbarer Reiseplan entsteht.
Dem Thema „Urlaub und Reisen“ widmen wir einen Schwerpunkt im Heft von MIT Technology Review. Darin blicken wir auf die Zukunft des Reisens und die Herausforderungen, die Massentourismus mit sich bringt – und wie Technologie dabei helfen kann, diesen zu begegnen. Hier könnt ihr die TR 2/2025 bestellen.
Kombi-System kann besser mit Einschränkungen umgehen
Um dessen Effektivität zu testen, hat das Team des MIT-IBM Watson AI Lab einen Benchmark namens TravelPlanner verwendet, mit dem sich die Planungsfähigkeiten von Sprachagenten in realen Szenarien bewerten lassen. Anhand verschiedener Kennzahlen haben sie ihr Kombi-System mit dem Output alleinstehender Sprachmodelle verglichen. In mehr als 90 Prozent der Anfragen lieferte ihr System Lösungen, die alle im Prompt formulierten Einschränkungen aufgriffen. Das beste eigenständige Sprachmodell kam lediglich auf zehn Prozent.
Die Forschenden sehen darin die Bestätigung, dass eine Kombination aus KI-Sprachmodell und einem formalen Problemlöser dabei helfen kann, komplexe Planungsaufgaben besser zu meistern. Das Sprachmodell erlaube es, über natürliche Sprache mit dem Solver zu interagieren. Der Solver wiederum ist in der Lage, die Einschränkungen, die in einem User-Prompt enthalten sind, auf ihre Machbarkeit hin zu überprüfen und gegebenenfalls zu optimieren.
Es gibt also doch noch Hoffnung, dass die Reiseplanung mit künstlicher Intelligenz eines Tages wirklich hilfreich oder zumindest hilfreicher sein wird. Für die anstehenden Sommerferien sollte man sich aber noch nicht auf die Tools verlassen.