OpenAI hat eine neue macOS-Anwendung für sein Codex-Codierungstool gestartet, die Agentenpraktiken integriert, die es KI-Agenten ermöglichen, Codierungsaufgaben unabhängig zu erledigen. Diese Version folgt dem Trend der Agenten-Softwareentwicklung, der in Tools wie Claude Code und Cowork zu beobachten ist, wo Schwärme von Agenten und Subagenten einen Großteil der Programmierarbeit erledigen.

Das Unternehmen führte Codex erstmals im April als Befehlszeilenschnittstelle ein, einen Monat später folgte eine Webschnittstelle. Die am Montag vorgestellte macOS-App unterstützt die parallele Ausführung mehrerer Agenten. Es integriert Agentenfähigkeiten und erweiterte Arbeitsabläufe, die im letzten Jahr an Popularität gewonnen haben.

Der Start erfolgt weniger als zwei Monate nach der Veröffentlichung des GPT-5.2-Codex durch OpenAI, der als sein leistungsstärkstes Codierungsmodell beschrieben wird. OpenAI zielt darauf ab, mit dieser Kombination Nutzer von Konkurrenten wie Claude Code anzulocken.

CEO Sam Altman ging während eines Pressegesprächs auf die Fähigkeiten des Modells ein. „Wenn Sie wirklich anspruchsvolle Arbeiten an etwas Komplexem durchführen möchten, ist 5.2 das mit Abstand stärkste Modell“, sagte er. „Allerdings war es schwieriger zu bedienen, daher denken wir, dass es von großer Bedeutung sein wird, dieses Maß an Modellfähigkeit zu nutzen und es in eine flexiblere Schnittstelle zu integrieren.“

Coding-Benchmarks zeichnen ein gemischtes Bild. GPT-5.2 belegt den Spitzenplatz bei TerminalBench, das die KI-Leistung bei Befehlszeilen-Programmieraufgaben bewertet. Allerdings sind die Ergebnisse von Gemini 3 und Claude Opus niedriger, liegen aber innerhalb der Fehlertoleranz des Benchmarks. Beim SWE-Bench, der die Fähigkeit der KI testet, reale Softwarefehler zu beheben, zeigen die Ergebnisse keinen klaren Vorteil für GPT-5.2.

Es bleibt schwierig, Agenten-Anwendungsfälle genau zu vergleichen. Die Benutzererfahrungen mit modernen Modellen können erheblich variieren.

Die Codex macOS-App führt mehrere neue Funktionen ein. Es ermöglicht Hintergrundautomatisierungen, die nach einem Zeitplan ausgeführt werden, wobei die Ergebnisse bei der Rückkehr zur Überprüfung durch den Benutzer in die Warteschlange gestellt werden. Benutzer können Agentenpersönlichkeiten auswählen, die von pragmatisch bis einfühlsam reichen und zu ihrem Arbeitsstil passen.

Altman betonte die Entwicklungsgeschwindigkeit der App. „Damit kann man aus einem völlig neuen Blatt Papier in wenigen Stunden ein wirklich recht anspruchsvolles Stück Software erstellen“, erklärte er. „So schnell ich neue Ideen eintippen kann, ist das die Grenze dessen, was gebaut werden kann.“


Quelle des hervorgehobenen Bildes