Mit dem Prompt "A robot that is completely overwhelmed" kann KI mehr anfangen, als mit der simplen Aufgabe, Anführungszeichen zu tauschen. (KI-generiertes Bild: Midjourney / t3n)

Als Journalist habe ich, nach anfänglicher Skepsis, inzwischen einige Dinge gefunden, bei denen mir Künstliche Intelligenz, vorwiegend in Form von LLMs, wirklich die Arbeit erleichtern können. Nicht, um mir von ihnen Texte schreiben zu lassen. Da ist mir nicht nur die Qualität deutlich zu schlecht. Auch sehe ich es als problematisch, diesen wichtigen Teil des Journalismus einer KI zu überlassen.

Doch wenn ich mir etwa zu Beginn einer Recherche einen Überblick über die Studienlage machen möchte, kann der „Deep Research“-Modus von ChatGPT oder Google Gemini wirklich hilfreich sein. Die Suche nach Studien – die leider oftmals nicht sonderlich gut verschlagwortet sind – wird so deutlich einfacher. Lesen und exzerpieren werde ich sie aber weiterhin selbst.

NotebookLM ist sehr praktisch, wenn ich etwa eine Sprachaufnahme, die ich selbst gemacht habe, transkribieren lassen will. Mit dem richtigen Prompt gibt die KI Timestamps an, ordnet die Aussagen verschiedener Sprecher zu – oder erstellt sogar Zusammenfassungen von dem Gesagten. Außerdem kann ich der KI spezifische Fragen stellen, die sie dann anhand der Aussagen in der Sprachaufnahme beantwortet.

Komplexe Aufgaben können gehen …

Das alles mache ich aber nur bei Aufnahmen von Gesprächen, die ich selbst geführt habe. Bei denen ich also genau weiß, was gesagt wurde. Denn auch diese KI, wie jede andere, halluziniert gerne mal; denkt sich Aussagen aus und weist nicht darauf hin, dass es sich von der eigentlichen Quelle entfernt hat. Immerhin entschuldigt sich die KI, wenn ich sie darauf hinweise:

Es sind also eher die komplexeren Aufgaben, bei denen ich mir von der KI helfen lasse. Und Dinge, bei denen ich selbst kontrollieren kann (und muss), ob das Ergebnis valide ist. Doch leider habe ich erlebt, dass KI gerade bei den eigentlich simplen Aufgaben noch immer oft versagt. Gerade da, wo es wirklich darum ginge, nervige und monotone Arbeiten zu erledigen.

Das fängt etwa bei Apple Intelligence an, dessen Funktion für Mail-Zusammenfassungen bei einem etwas längeren Nachrichtenverlauf alles durcheinanderbringt. Geht mit Gemini in Google Docs weiter, das kaum fähig ist, meine Formatierungswünsche umzusetzen. Und zuletzt endete es in einer fast schon surrealen Erfahrung, als ich einfach nur andere Anführungszeichen haben wollte.

… simple Aufgaben eher nicht

Egal, ob unter Windows oder macOS: Guillemets, also die französischen Anführungszeichen » «, sind beim Schreiben ziemlich umständlich zu gebrauchen. Jedes Mal die spezifische Tastenkombination zu drücken, reißt zumindest mich oft aus dem Schreibfluss raus. Und so oft brauche ich sie zum Glück auch nicht.

Nun hatte ich aber kürzlich den Fall, dass ich einen langen Text mit recht vielen Anführungszeichen geschrieben hatte – und die Anführungszeichen durch Guillemets ersetzen musste. Aus der Vergangenheit wusste ich schon, dass man die „Ersetzen“-Funktion von Word dabei schlichtweg vergessen kann. Aber KI kann diese simple Aufgabe doch sicher erledigen, oder?

Dachte ich auch und schrieb dem in Word integrierten (wenn man das Abo zahlt) Copilot den Prompt, alle Anführungszeichen durch Guillemets zu ersetzen. Als Antwort bekomme ich, dass Copilot „leider keine Änderungen direkt in [meinem] Dokument vornehmen“ kann. Schade. Also steuere ich Copilot direkt über die Cloud an, lade das Dokument hoch und prompte erneut.

Wie ein Loriot-Sketch

Es entspinnt sich daraufhin ein Dialog wie in einem Sketch von Loriot. Die KI erstellt mir auf meinen genauen Prompt eine neue Datei, in der alle Anführungszeichen ausgetauscht sein sollen. Ich öffne sie und sehe, dass das nicht der Fall ist – dafür aber mehr als die Hälfte des Textes fehlt. Nachdem ich die KI darauf hingewiesen und um eine Korrektur gebeten habe, erstellt sie eine neue Datei. Dieses Mal sind die Guillemets drin. Allerdings teilweise zusätzlich zu den einfachen Anführungszeichen. Und wieder fehlt ein Großteil des Textes. Das geht einige Zeit so weiter.

Immer wieder schreibe ich Prompts, in denen ich Copilot genaue Anweisungen gebe, was es tun soll. Immer wieder entschuldigt sich die KI und erstellt neue Dateien, in denen dieses Mal wirklich alles korrekt sein soll. Sie fängt sogar an, ihre Antworten zu fetten, um ganz deutlich zu machen, dass jetzt wirklich alles vollständig ist.

Ich bekomme nie eine Datei von Copilot, in der sowohl die Guillemets richtig gesetzt sind, als auch mein Text vollständig in der Word-Datei enthalten ist. Vielmehr wird der Text im Laufe des „Dialogs“ sogar immer kürzer. Wieso das so ist, kann mir die KI selbst nicht sagen. Am Ende bitte ich Copilot, aus der gesamten Konversation ein pdf zu erstellen. Leider fehlt dann aber, ihr ahnt es, mehr als die Hälfte des Textes.

GPT-5 hat schließlich erbarmen

Ich wechsle zu Gemini. Kopiere den Text in ein Google Doc, lade das in den Chatbot hoch und prompte erneut, die Anführungszeichen durch Guillemets zu ersetzen. Eine, das möchte ich hier noch einmal betonen, wirklich simple Aufgabe. Gemini entscheidet sich daraufhin dafür, einfach jeden Satz in französische Anführungszeichen zu setzen. Also kopiere ich meinen Text direkt in das Eingabefeld des Chatbots. Jede Formatierung mit Zwischenüberschriften, Fettungen oder ähnlichem geht damit flöten.

Diesmal tauscht Gemini tatsächlich die Anführungszeichen aus. Zunächst in gänzlich falsche Guillemets, die so eigentlich nie genutzt werden: » ». Nach etwas gutem Zureden bekomme ich die KI aber schließlich dazu, einen großen Teil der Anführungszeichen durch die korrekten Guillemets zu ersetzen. Eine Google-Doc-Datei kann mir Gemini dann aber nicht erstellen, da gebe es „keine Möglichkeit“. So viel zu den KI-Workflows.

Schließlich teste ich noch GPT-5, das neueste Modell von Open AI. Und tatsächlich erlebe ich zum ersten Mal, dass eine Künstliche Intelligenz diese simple Aufgabe fast auf Anhieb hinbekommt.

Um das zu erreichen, habe ich drei Pro-Versionen von KI-Modellen durchtesten müssen, die allesamt Geld kosten. Habe Zeit investieren müssen, immer wieder neue, noch genauere Prompts zu schreiben – für eine Aufgabe, die selbst mit der simpelsten Anweisung möglich sein sollte. Gerade wenn KI doch angepriesen wird als die große Arbeitserleichterung.

Wahrscheinlich ist es schlussendlich doch einfacher, eine Tastatur oder Maus per Software so zu programmieren, dass eine Taste automatisch Guillemets in einen Text einfügt. Das ist dann nicht ganz so futuristisch. Aber funktioniert immerhin einigermaßen zuverlässig.