OpenAI hat sein Flaggschiff-KI-Modell GPT-5.5 vorgestellt.

OpenAI hat GPT-5.5 veröffentlicht. Das Modell wird als „ein neues Niveau an Intelligenz für reale Aufgaben und das Agentenmanagement“ positioniert.

Ein neuronales Netzwerk ist darauf ausgelegt, „komplexe Aufgaben zu verstehen, Werkzeuge einzusetzen, Arbeitsergebnisse zu überprüfen und weitere Aufgaben zu erledigen“.

Das Modell kann die Absichten des Nutzers verstehen, selbstständig Arbeitsabläufe planen und Aufgaben zum Endergebnis führen. GPT-5.5 leistet hervorragende Arbeit beim Schreiben und Debuggen von Code, bei der Informationssuche im Internet, bei der Datenanalyse, beim Erstellen von Dokumenten und Tabellen, bei der Softwareverwaltung und beim Wechseln zwischen verschiedenen Tools.

„Anstatt jeden einzelnen Schritt sorgfältig zu kontrollieren, können Sie GPT-5.5 eine komplexe, mehrstufige Aufgabe anvertrauen und darauf vertrauen, dass es plant, Werkzeuge anwendet, seine Arbeit überprüft, Unklarheiten beseitigt und weiterarbeitet“, heißt es in der Ankündigung.

Bild

GPT-5.5-Tests in verschiedenen Benchmarks. Quelle: OpenAI.

OpenAI stellte fest, dass das neue Modell besonders effektiv bei der Agentenprogrammierung, der Computersteuerung, intelligenter Arbeit und der frühen wissenschaftlichen Forschung ist – Bereiche, in denen es wichtig ist, lange Ketten von Schlussfolgerungen und Aktionen aufzubauen.

„GPT-5.5 bietet einen Quantensprung in der Intelligenz, ohne dabei an Geschwindigkeit einzubüßen. Größere und leistungsfähigere Modelle sind oft langsamer, aber GPT-5.5 erreicht die gleiche Latenz pro Token in der Praxis wie GPT-5.4 und weist gleichzeitig ein deutlich höheres Maß an Intelligenz auf“, so das Startup.

Das neuronale Netzwerk benötigt beim Ausführen im Codex-Modus „deutlich weniger“ Token.

OpenAI gab an, vor der Veröffentlichung in Zusammenarbeit mit internen und externen Experten die „robustesten“ Sicherheitsmaßnahmen implementiert zu haben.

Zugänglichkeit

GPT-5.5 funktioniert in ChatGPT und Codex für Nutzer der Tarife Plus, Pro, Business und Enterprise. Eine separate Version von GPT-5.5 Pro ist für Pro, Business und Enterprise verfügbar.

Beide Varianten werden in Kürze über die API verfügbar sein. Der Preis beträgt 5 Millionen US-Dollar für 1 Million eingehende Token und 30 Millionen US-Dollar für ausgehende Token. Kontextfenster: 1 Million Token.

Codex GPT-5.5 ist für die Tarife Plus, Pro, Business, Enterprise, Edu und Go mit einem Kontextfenster von 400.000 verfügbar. GPT-5.5 wird im Schnellmodus angeboten, der Token 1,5-mal schneller, aber 2,5-mal so teuer generiert.

GPT-5.5 ist teurer als GPT-5.4. Dies liegt an der höheren Effizienz der Tokennutzung.

GPT-5.5-Fähigkeiten

Das neue Modell verbraucht weniger Token und versucht weniger oft, Probleme zu lösen, und im Artificial Analysis Programming Index liefert es „fortschrittliche Intelligenz“ zu halben Kosten im Vergleich zu seinen Konkurrenten.

Bild

Quelle: OpenAI.

GPT-5.5 ist die leistungsstärkste Agentenprogrammierungslösung des Unternehmens. In Terminal-Bench 2.0, das komplexe Befehlszeilenszenarien testet, liegt die Genauigkeit bei 82,7 %.

In SWE‐Bench Pro lag das Ergebnis bei 58,6 %, in Expert‐SWE übertraf das neuronale Netzwerk GPT‐5.4.

In allen drei Vergleichswerten übertraf das neue Produkt seinen Vorgänger und verbrauchte dabei weniger Token.

Bild

Quelle: OpenAI.

„Die Stärken des Modells in der Programmierung kommen besonders bei Codex zum Tragen, wo es in der Lage ist, Engineering-Aufgaben auszuführen – von der Implementierung und dem Refactoring bis hin zum Debuggen, Testen und Validieren“, heißt es im Blog des Unternehmens.

GPT‐5.5 versteht das System besser: warum etwas nicht funktioniert, wo es behoben werden muss und welche Teile des Codes davon betroffen sind.

Das Modell übertrifft GPT-5.4 und Claude Opus 4.7 in Bezug auf logisches Denken und Autonomie deutlich: Es erkennt Probleme im Voraus und sagt den Test- und Überprüfungsbedarf ohne explizite Hinweise voraus.

Im GDPval-Test, der die Fähigkeit von Agenten prüft, klar definierte intellektuelle Aufgaben in 44 Berufen zu lösen, erzielt GPT-5.5 84,9 %. Im OSWorld-Verified-Test sind es 78,7 % und im Tau2-Benchmark-Test 98 %.

Bild

Quelle: OpenAI.

GPT-5.5 erzielt auch in anderen Tests hohe Ergebnisse: 60 % in FinanceAgent, 88,5 % bei internen Investmentbanking-Modellierungsaufgaben und 54,1 % in OfficeQA Pro.

Bild

Quelle: OpenAI.

Arbeiten mit Informationen

GPT-5.5 ist ein „leistungsfähiges Werkzeug für alltägliche Computeraufgaben“. Das Modell versteht die Absicht des Benutzers besser und navigiert souveräner durch den gesamten Informationsverarbeitungszyklus: Suchen, Analysieren, Verwenden von Werkzeugen, Validieren und Umwandeln der Eingabedaten in ein fertiges Ergebnis.

Im Codex übertrifft GPT-5.5 GPT-5.4 bei der Erstellung von Dokumenten, Tabellenkalkulationen und Präsentationsfolien.

Über 85 % der Mitarbeiter in den verschiedenen Abteilungen von OpenAI nutzen Codex jede Woche, darunter Softwareentwicklung, Finanzen, Kommunikation, Marketing, Datenanalyse und Produktmanagement.

Wissenschaftliche Forschung

GPT-5.5 erzielt auch in wissenschaftlichen und technischen Arbeitsabläufen bessere Ergebnisse. Dabei handelt es sich um Aufgaben, die über die Beantwortung einer spezifischen Frage hinausgehen: Das Modell ist in der Lage, eine Idee systematisch zu erforschen, Beweise zu sammeln, eine Hypothese zu testen und die Daten zu interpretieren.

Bild

Quelle: OpenAI.

GPT-5.5 weist auf GeneBench, einer Plattform für die mehrstufige Analyse wissenschaftlicher Daten in der Genetik und quantitativen Biologie, Verbesserungen gegenüber GPT-5.4 auf.

Auch im BixBench-Test übertraf das neue Modell seinen Vorgänger.

Bild

Quelle: OpenAI.

Zur Erinnerung: Im April führte OpenAI in ChatGPT „Workspace-Agenten“ ein. Teams können kollaborative Assistenten erstellen, um komplexe Aufgaben und zeitaufwändige Prozesse zu lösen.

No votes yet.
Please wait...

Leave a Reply

Your email address will not be published. Required fields are marked *