ChatGPT o1: Revolutionär oder enttäuschend? Einfache Aufgaben bringen KI ins Straucheln
Das neue ChatGPT-Modell o1 von OpenAI soll auch anspruchsvolle Aufgaben meistern können. Doch erste Tester bemerkten schnell, dass es weiterhin mit einfachen Aufgaben zu kämpfen hat. Dafür gibt es eine Erklärung.
Auch das neue GPT-Modell macht noch einfache Fehler. (Foto: PixieMe / Shutterstock)
Mitte September hatte OpenAI das neues KI-Modell o1-Preview veröffentlicht, das zuvor unter dem Codenamen Strawberry bekannt war. Es soll in der Lage sein, ähnlich wie ein Mensch zu denken und auch anspruchsvolle Aufgaben in den Bereichen Physik, Chemie oder Biologie zu bewältigen.
Anzeige
Anzeige
In der Ankündigung erklärte OpenAI sogar, dass das Modell bei herausfordernden Benchmark-Tests ähnlich gut wie ein Doktorand abschneide. Bei simplen Aufgaben kommt es aber noch immer ins Straucheln. Das berichten erste Tester.
Auch o1 macht noch simple Fehler
Demnach macht auch die neue Version von ChatGPT simple Fehler. Der Forscher Mathieu Acher von der Insa Rennes in Frankreich berichtet auf X zum Beispiel, dass das Modell in Schachpuzzles irreguläre Züge vorschlägt. Ihm zufolge sei das ein Fehler, den GPT4o und GPT 3.5 bereits gemacht haben.
Anzeige
Anzeige
Empfohlene redaktionelle Inhalte
Hier findest du externe Inhalte von X Corp.,
die unser redaktionelles Angebot auf t3n.de ergänzen.
Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden,
dass wir dir jetzt und in Zukunft Inhalte von X Corp. auf unseren Seiten anzeigen dürfen.
Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden.
An dieser Stelle findest du normalerweise externe Inhalte von X Corp.,
jedoch konnten wir deine Consent-Einstellungen nicht abrufen.
Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.
Colin Fraser, ein Forscher von Meta-AI, teilt eine Reihe von Screenshots, die zeigen, wie das neue GPT-Modell ein einfaches Logikrätsel lösen soll. Dabei geht es darum, wie viele Überfahrten ein Schäfer braucht, um seine drei Schafe über den Fluss zu transportieren. GPTo1 gibt die falsche Antwort.
Empfohlene redaktionelle Inhalte
Hier findest du externe Inhalte von X Corp.,
die unser redaktionelles Angebot auf t3n.de ergänzen.
Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden,
dass wir dir jetzt und in Zukunft Inhalte von X Corp. auf unseren Seiten anzeigen dürfen.
Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden.
An dieser Stelle findest du normalerweise externe Inhalte von X Corp.,
jedoch konnten wir deine Consent-Einstellungen nicht abrufen.
Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.
Der KI-Entwickler Navid Moghaddam hat außerdem noch einen Fehler gefunden, den bereits ChatGPT4o und andere Modelle gemacht haben. Fragt man das Modell, wie oft der Buchstabe „R” in dem Wort Strawberry vorkommt, gibt es auch nach kurzem Überlegen manchmal noch die falsche Antwort. Das ist ein Satz, mit dem viele künstliche Intelligenzen immer wieder Probleme haben.
Empfohlene redaktionelle Inhalte
Hier findest du externe Inhalte von TargetVideo GmbH,
die unser redaktionelles Angebot auf t3n.de ergänzen.
Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden,
dass wir dir jetzt und in Zukunft Inhalte von TargetVideo GmbH auf unseren Seiten anzeigen dürfen.
Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden.
An dieser Stelle findest du normalerweise externe Inhalte von TargetVideo GmbH,
jedoch konnten wir deine Consent-Einstellungen nicht abrufen.
Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.
Empfohlene redaktionelle Inhalte
Hier findest du externe Inhalte von X Corp.,
die unser redaktionelles Angebot auf t3n.de ergänzen.
Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden,
dass wir dir jetzt und in Zukunft Inhalte von X Corp. auf unseren Seiten anzeigen dürfen.
Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden.
An dieser Stelle findest du normalerweise externe Inhalte von X Corp.,
jedoch konnten wir deine Consent-Einstellungen nicht abrufen.
Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.
Das neue Modell ist nicht perfekt
Momentan handelt es sich bei GPT-o1 noch um eine Preview-Version, die nur für zahlende Nutzer verfügbar ist. OpenAI selbst gab auch zu, dass es noch eine frühe Phase für das Modell ist und noch einige Funktionen fehlen, die in GPT4o bereits integriert sind. So habe das neue Modell eben Schwächen bei der Texterstellung und Bildverarbeitung sowie bei Fragen nach aktuellen Ereignissen.
OpenAI verspricht regelmäßige Updates für das neue Modell und deutliche Verbesserungen bei zukünftigen Versionen. Laut Futurism soll der Denkprozess des Modells noch verlängert werden.
Anzeige
Anzeige
Der KI-Forscher Noam Brown schreibt, dass künftige Versionen des Modells sogar für Tage oder Wochen nachdenken könnten, dann aber möglicherweise revolutionäre Antworten entstehen, die zu wissenschaftlichen Durchbrüchen führen.
Das wird von einigen KI-Forschern wie Gary Marcus allerdings kritisch gesehen und auch die oben genannten Patzer weisen darauf hin, dass das Modell noch viel lernen muss, bevor es zu Durchbrüchen kommt.
Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.
Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen,
aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere
Finanzierung sehr wichtig.
Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌
Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.
Community-Richtlinien
Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht.
Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung
von
Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird.
Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.
Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer.
Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.
Dein t3n-Team
Kommentar abgeben
Melde dich an, um Kommentare schreiben und mit anderen Leser:innen und unseren Autor:innen diskutieren zu können.