OpenAI präsentiert den „denkenden“ Bildgenerator ChatGPT Images 2.0

OpenAI hat den „denkenden“ Bildgenerator ChatGPT Images 2.0 veröffentlicht – „ein fortschrittliches Modell, das in der Lage ist, komplexe visuelle Aufgaben zu lösen und präzise, sofort einsatzbereite Ergebnisse zu liefern“.

Das Unternehmen stellte einen „qualitativen Sprung“ bei der Befolgung von Anweisungen, der genauen Platzierung und dem Verhältnis von Objekten sowie bei der Visualisierung von dichtem Text fest.

Das Modell arbeitet zuverlässig in mehreren Sprachen und ergänzt die Suchanfrage selbstständig anhand visueller und allgemeiner Kontextinformationen. Dadurch erhält der Nutzer das gewünschte Ergebnis mit weniger Rückfragen.

Präzision und Kontrolle

ChatGPT Images 2.0 nimmt komplexe Konzepte und setzt sie visuell präzise um.

Das Modell befolgt die Anweisungen, bewahrt vorgegebene Details und bildet kleine Elemente in Auflösungen bis zu 2K ab.

Arbeiten mit Stilen

ChatGPT Images 2.0 erfasst die Merkmale von Fotografien, Filmsequenzen, Pixelgrafiken, Mangas und anderen visuellen Stilen präziser. LLM sorgt für hohe Konsistenz in Texturen, Beleuchtung, Komposition und Details.

Diese Präzision wird sich als nützlich erweisen bei der Erstellung von Spielprototypen, der Entwicklung von Storyboards , der Vorbereitung von Marketingmaterialien und der Schaffung von Werken in einem bestimmten Medienformat oder Genre.

Denkfähig

ChatGPT Images 2.0 ist das erste Bildmodell von OpenAI, das vor der Generierung denken kann.

In Verbindung mit ChatGPT kann das Modell in Echtzeit im Internet nach Informationen suchen, mehrere Optionen für eine einzelne Eingabeaufforderung erstellen, Ergebnisse überprüfen und funktionierende QR-Codes generieren.

„Dadurch kann das Modell einen Großteil der Arbeit zwischen Idee und Bild übernehmen, insbesondere wenn Genauigkeit, Relevanz, Konsistenz und visuelle Integrität von größter Bedeutung sind“, so OpenAI.

Das Modell unterstützt Seitenverhältnisse von 3:1 (Breite) bis 1:3 (Höhe). Es steht Nutzern von ChatGPT und Codex zur Verfügung.

Die Funktion „Bilder mit Denkfunktion“ ist in den ChatGPT Plus-, Pro- und Business-Tarifen verfügbar.

Erinnern wir uns daran, dass OpenAI im April einer begrenzten Anzahl von Nutzern Zugang zum neuen KI-Modell GPT-5.4-Cyber gewährte.

No votes yet.
Please wait...

Leave a Reply

Your email address will not be published. Required fields are marked *