OpenAI präsentiert den „denkenden“ Bildgenerator ChatGPT Images 2.0

OpenAI hat den „denkenden“ Bildgenerator ChatGPT Images 2.0 veröffentlicht – „ein fortschrittliches Modell, das in der Lage ist, komplexe visuelle Aufgaben zu lösen und präzise, sofort einsatzbereite Ergebnisse zu liefern“.
Wir stellen ChatGPT Images 2.0 vor.
Ein fortschrittliches Bildgebungsmodell, das komplexe visuelle Aufgaben übernimmt und präzise, sofort einsatzbereite Grafiken mit genauerer Bearbeitung, reichhaltigeren Layouts und „denkender“ Intelligenz erzeugt.
Video erstellt mit ChatGPT Images pic.twitter.com/3aWfXakrcR
– OpenAI (@OpenAI) 21. April 2026
Das Unternehmen stellte einen „qualitativen Sprung“ bei der Befolgung von Anweisungen, der genauen Platzierung und dem Verhältnis von Objekten sowie bei der Visualisierung von dichtem Text fest.
Das Modell arbeitet zuverlässig in mehreren Sprachen und ergänzt die Suchanfrage selbstständig anhand visueller und allgemeiner Kontextinformationen. Dadurch erhält der Nutzer das gewünschte Ergebnis mit weniger Rückfragen.
Präzision und Kontrolle
ChatGPT Images 2.0 nimmt komplexe Konzepte und setzt sie visuell präzise um.
Das Modell befolgt die Anweisungen, bewahrt vorgegebene Details und bildet kleine Elemente in Auflösungen bis zu 2K ab.
Höhere Präzision und Kontrolle
ChatGPT Images 2.0 kann komplexere Bilder konzipieren und diese Vision dann effektiv zum Leben erwecken.
Es kann Anweisungen befolgen, gewünschte Details beibehalten und kleine Elemente rendern, die Bilder oft „zerstören“… pic.twitter.com/n29165pV9Q
– OpenAI (@OpenAI) 21. April 2026
Arbeiten mit Stilen
ChatGPT Images 2.0 erfasst die Merkmale von Fotografien, Filmsequenzen, Pixelgrafiken, Mangas und anderen visuellen Stilen präziser. LLM sorgt für hohe Konsistenz in Texturen, Beleuchtung, Komposition und Details.
Diese Präzision wird sich als nützlich erweisen bei der Erstellung von Spielprototypen, der Entwicklung von Storyboards , der Vorbereitung von Marketingmaterialien und der Schaffung von Werken in einem bestimmten Medienformat oder Genre.
Denkfähig
ChatGPT Images 2.0 ist das erste Bildmodell von OpenAI, das vor der Generierung denken kann.
In Verbindung mit ChatGPT kann das Modell in Echtzeit im Internet nach Informationen suchen, mehrere Optionen für eine einzelne Eingabeaufforderung erstellen, Ergebnisse überprüfen und funktionierende QR-Codes generieren.
„Dadurch kann das Modell einen Großteil der Arbeit zwischen Idee und Bild übernehmen, insbesondere wenn Genauigkeit, Relevanz, Konsistenz und visuelle Integrität von größter Bedeutung sind“, so OpenAI.
Das Modell unterstützt Seitenverhältnisse von 3:1 (Breite) bis 1:3 (Höhe). Es steht Nutzern von ChatGPT und Codex zur Verfügung.
Die Funktion „Bilder mit Denkfunktion“ ist in den ChatGPT Plus-, Pro- und Business-Tarifen verfügbar.
Erinnern wir uns daran, dass OpenAI im April einer begrenzten Anzahl von Nutzern Zugang zum neuen KI-Modell GPT-5.4-Cyber gewährte.
