
Das KI-Startup Anthropic hat sein Flaggschiffmodell Claude Opus auf Version 4.6 aktualisiert. Das neuronale Netzwerk plant Aktionen besser, bewältigt langlaufende Aufgaben und arbeitet effizienter mit großen Codebasen.
Das Kontextfenster wurde auf 1 Million Token erweitert. Dieses Volumen ermöglicht die Analyse umfangreicher Dokumente und die Durchführung langer Dialoge, ohne den logischen Faden zu verlieren.
Die aktualisierten Algorithmen sind für Arbeitsaufgaben optimiert: Durchführung von Finanzanalysen, Recherchen, Verwendung und Erstellung von Dokumenten, Tabellenkalkulationen und Präsentationen.
Opus 4.6 erzielte die höchste Punktzahl im Programmiertest Terminal-Bench 2.0 und übertraf die Konkurrenz im komplexen interdisziplinären Benchmark für logisches Denken Humanity's Last Exam.

Opus 4.6 im Vergleich zu Konkurrenzprodukten in einer Reihe von Tests. Quelle: Anthropic.
Im GDPval-AA-Test, der die Qualität des Denkens und der Entscheidungsfindung misst, übertraf das Modell OpenAIs GPT-5.2. LLM erzielte auch die besten Ergebnisse im BrowseComp-Test, der die Fähigkeit misst, schwer auffindbare Informationen im Internet zu finden.

Quelle: Anthropografisch.
Opus 4.6 extrahiert Daten effizient aus umfangreichen Dokumenten. Dank des erweiterten Kontextfensters erfasst und analysiert das Modell auch nicht offensichtliche, verborgene Details.
Agententeams
Eine zentrale Neuerung ist die Möglichkeit, Gruppen von Agenten zu bilden, die zusammenarbeiten. In diesem Modus arbeiten mehrere KI-Assistenten parallel und koordinieren ihre Aufgaben autonom.
Das Tool eignet sich für Aufgaben, die in einzelne Teilaufgaben unterteilt sind und die Analyse großer Textmengen erfordern.
Geschlossener Regelkreis
Anthropic erklärte, sie würden „Claude mit Claude erschaffen“. Die Entwickler schreiben den Code mithilfe ihres eigenen KI-Modells, und jedes neue Produkt wird vor der Veröffentlichung anhand der internen Aufgaben des Unternehmens getestet.
Das Team stellte fest, dass Opus 4.6 ohne zusätzliche Anweisungen den schwierigsten Teilen einer Aufgabe mehr Aufmerksamkeit schenkt, einfache Aufgaben schnell erledigt, besser mit mehrdeutigen Problemen zurechtkommt und auch langfristig effektiv bleibt.
„Opus 4.6 denkt oft tiefer und prüft seine Überlegungen sorgfältiger, bevor es eine Entscheidung trifft. Dies führt zu besseren Ergebnissen bei der Lösung komplexer Fälle, kann aber bei einfachen Fällen die Kosten und Ausgaben erhöhen“, so das Unternehmen.
Sicherheit
Die automatisierte Überprüfung ergab, dass Opus 4.6 eine geringe Neigung zu unerwünschtem Verhalten aufweist: Täuschung, Schmeichelei, Verstärkung falscher Überzeugungen der Benutzer und Erleichterung von Fehlverhalten.

Das Modell demonstriert ein Sicherheitsniveau gemäß Opus 4.5. Quelle: Anthropic.
Zur Validierung des Modells führte das Unternehmen eine umfassende Reihe von Bewertungen durch, wobei erstmals neue Testmethoden angewendet und bestehende verbessert wurden.
Barrierefreiheit und neue Funktionen
Claude Opus 4.6 ist jetzt über die Weboberfläche, via API und auf den wichtigsten Cloud-Plattformen verfügbar.
Dem Entwickler-Toolkit wurden neue Funktionen hinzugefügt:
- adaptives Denken – das neuronale Netzwerk entscheidet selbstständig, wann der Modus des tiefen Denkens aktiviert wird;
- Anstrengungsregulierung – es stehen vier Stufen der Arbeitsintensität zur Verfügung: von niedrig bis maximal;
- Kontextverdichtung – das Tool fasst automatisch den alten Kontext zusammen und ersetzt ihn, wenn sich eine Konversation einer Token-Schwelle nähert.
Zur Erinnerung: Im Januar sagte Dario Amodei, CEO von Anthropic, das baldige Aufkommen einer künstlichen allgemeinen Intelligenz (AGI) und den damit einhergehenden Verlust von Arbeitsplätzen voraus.
