OpenAI führt ChatGPT Images 2.0 mit Argumentation der O-Serie ein

Nach der Veröffentlichung von GPT-Image-1.5 im Dezember 2025 hat OpenAI ChatGPT Images 2.0 offiziell eingeführt und damit seine Fähigkeiten zur KI-Bildgenerierung deutlich verbessert. Das neue Modell, das auf LM Arena AI getestet wurde, kann detaillierte Bilder mit langen Textblöcken, realistischen Benutzeroberflächen generieren und sogar reale Figuren, darunter Sam Altman, nachbilden.

Dieses Update stellt einen wesentlichen Fortschritt in der Art und Weise dar, wie OpenAI mit visuellen Medien umgeht. ChatGPT Images 2.0 kann Grundrisse, Bildraster und Charaktermodelle erstellen und Funktionen auf von Benutzern hochgeladene Bilder anwenden, was einen Wandel von der bloßen Betrachtung von Bildern hin zum Verständnis als eine Form der Sprache anzeigt.

OpenAI lieferte keine Benchmark-Vergleiche für das neue Modell, gibt jedoch an, dass die Leistung mit den „modernsten“ Fähigkeiten übereinstimmt, insbesondere im Vergleich zu Googles kürzlich veröffentlichtem Nano Banana 2-Modell, das auch Textintegration in Bildern bietet. Berichten zufolge könnte ChatGPT Images 2.0 es in Bezug auf Wiedergabetreue und Reproduktionen der Benutzeroberfläche übertreffen.

Im Rahmen seines Engagements für Sicherheit wird OpenAI Metadaten-Tagging in KI-generierte Bilder integrieren und damit auf die zunehmende Besorgnis über den möglichen Missbrauch von KI-Technologie in politischen Kontexten reagieren. In einem aktuellen Briefing betonte Adele Li, Produktleiterin von OpenAI, die proaktiven Maßnahmen des Unternehmens zur Verhinderung politischer Einflussnahme durch fortschrittliche Sicherheitsprotokolle.

Das aktualisierte Modell verfügt über Argumentationsfunktionen der „O-Serie“, die es ihm ermöglichen, Layouts vor der Generierung von Bildern zu recherchieren und zu prüfen und so seine Fähigkeit zu verbessern, kohärente visuelle Storytelling-Assets zu erstellen. Demonstrationen zeigten, dass das Modell komplexe Dokumente synthetisieren und Karten genau reproduzieren konnte, was einen Funktionssprung gegenüber früheren Iterationen darstellt.

Die Funktionen von Images 2.0 wurden so strukturiert, dass sie High-Fidelity-Typografie und mehrsprachige Textgenerierung unterstützen und seit langem bestehende Probleme bei KI-generierten Bildern angehen. Diese Iteration kann kohärenten Text über nicht-lateinische Schriften hinweg erzeugen und bietet so eine verbesserte Zugänglichkeit für weltweite Benutzer.

OpenAI hat für den Rollout ein klares abgestuftes Zugriffssystem skizziert. Kostenlose Benutzer haben Standardzugriff auf das Basismodell, während Plus- und Pro-Benutzer Zugriff auf erweiterte Funktionen erhalten, darunter KI-gestütztes Denken und die Möglichkeit, mehrere Bilder zu generieren, wobei die Kontinuität von einer einzigen Eingabeaufforderung aus gewährleistet ist.

Die Preisstruktur für API-Entwickler hat sich im Vergleich zum Vorgängermodell verringert. Die Bilderzeugung kostet 8,00 $ pro Eingabe und 30,00 $ pro Ausgabe, während die Texterstellung 5,00 $ für Eingaben und 10,00 $ für Ausgaben kostet. Die Umstellung auf ChatGPT Images 2.0 zeigt, dass der Ansatz von OpenAI auf die Einführung in Unternehmen ausgerichtet ist und komplexere kreative Aufgaben ermöglicht, die eine höhere Produktivität ermöglichen können.

Als Reaktion auf den wachsenden Wettbewerb und den technologischen Fortschritt konzentriert sich OpenAI weiterhin darauf, die Sicherheit und Zufriedenheit der Benutzer zu verbessern und gleichzeitig modernste KI-Tools bereitzustellen. Während sich die Funktionalität von ChatGPT Images 2.0 weiterentwickelt, möchte das Unternehmen die Absichtslücke bei der Erstellung von KI-Kunstwerken schließen und sicherstellen, dass sowohl Benutzerbedürfnisse als auch ethische Standards erfüllt werden.

Quelle des hervorgehobenen Bildes

OpenAI führt ChatGPT Images 2.0 mit Argumentation der O-Serie ein

Related Stories

Google führt Video Remix für KI-Nutzer ein, um Clips in Sekundenschnelle umzuwandeln

Amazon plant einen stärkeren Alexa-Assistenten, um mit KI-Agenten zu konkurrieren

ChatGPT Voice erhält Vollduplex-GPT-Live-Modelle

Von Anthropic unterstützte Studie testet modulare Zugangskontrolle für KI-Modelle