Für die Entwicklung von KI-Agenten: OpenAI zeigt neue API – was sie besser machen soll

OpenAI stellt Entwickler:innen neue API-Tools zur Verfügung. (Foto: Varavin88 / Shutterstock)
Über die API von OpenAI können Entwickler:innen auf die Tools des KI-Unternehmens zugreifen, um ihre eigenen Anwendungen damit zu erstellen. Jetzt hat OpenAI ein neues Tool-Set für Entwickler:innen angekündigt. Die neue API namens Responses ist dabei die Weiterentwicklung der Chat-Completions-API und bringt einige Verbesserungen mit sich.
OpenAI: Was die Responses-API besser machen soll
Wie Fast Company berichtet, war es bei der Completions-API zuvor nur möglich, einzelne Anfragen zu senden. Nach jeder Anfrage hat die API erst eine Antwort ausgegeben, bevor eine neue Anfrage gestellt werden konnte. Mit Responses konzentriert sich OpenAI auf einen reibungslosen Arbeitsablauf und erlaubt jetzt mehrere Anfragen und Code-Zeilen gleichzeitig.
Dabei soll Responses laut OpenAI auch einen Mix aus verschiedenen Anfragen verstehen. So können Entwickler:innen Bilder und künftig auch Audio und Sprache in ihre Anfragen mischen, ohne den Arbeitsablauf der API zu stören. Zudem können Entwickler:innen gleichzeitig auf neue Tools zurückgreifen. Dazu zählen eine Websuche, eine Dateisuche und ein Tool zum Schreiben und zur Analyse von Code.
Laut OpenAI wurde die Websuche schon in ersten Tests genutzt, um Shopping-Assistenten sowie KI-Agenten zur Buchung von Reisen und zu Forschungszwecken zu bauen. Die Dateisuche kann hingegen KI-Agenten im Kundensupport helfen, auf die FAQs zuzugreifen oder einen Coding-KI-Agenten befähigen, die notwendigen technischen Dokumentationen zu öffnen. Ferner erlaubt Responses auch den Zugriff auf Operator und dessen Fertigkeit, den Browser zu steuern.
Zunächst steht die Responses-API ausgewählten Entwickler:innen in den Usage-Tiers 3-5 zur Verfügung. Für eine Million Input-Token zahlen Entwickler:innen drei US-Dollar, während dieselbe Anzahl an Output-Token zwölf Dollar kostet. Entwickler:innen, die weiterhin auf die Chat-Completions-API setzen wollen, werden nicht zum Wechsel gezwungen. Laut OpenAI soll die API auch künftig noch den Zugang zu neuen KI-Modellen mit sich bringen. Für neue Anwendungen empfiehlt das Unternehmen aber einen Neustart mit Responses.
Ein Tool, um mehrere KI-Agenten zu koordinieren
Neben der neuen API hat OpenAI auch noch ein neues Software-Development-Kit (SDK) angekündigt. Dieses Open-Source-Toolkit soll es Entwickler:innen erleichtern, mehrere KI-Agenten gleichzeitig zu nutzen und deren Abläufe zu koordinieren. Das SDK ist dabei eine Weiterentwicklung von Swarm, einem experimentellen Kit, das OpenAI 2024 veröffentlicht hatte.
Zu den Verbesserungen im Vergleich zum ersten Test gehören unter anderem Observability-Tools, über die die Abläufe zwischen den KI-Agenten besser nachvollzogen werden können. Dadurch sollen Entwickler:innen in der Lage sein, mögliche Probleme aufzuspüren, zu beheben und dadurch die Performance in der kompletten Anwendung zu verbessern.
Als Beispiel, wie das SDK genutzt werden kann, nennt OpenAI ein Finanzunternehmen mit einem eigenen KI-Agenten. Dieser soll dann auf die Dienste von Box, einem Anbieter einer KI-gestützten Cloud, zurückgreifen. Das SDK kann genutzt werden, um die Abläufe zwischen den beiden künstlichen Intelligenzen zu optimieren. Das Software-Development-Kit funktioniert dabei nicht nur mit Responses und Chat Completion von OpenAI. Auch andere APIs können genutzt werden, solang sie einen Endpoint im Stil von Chat Completion anbieten.