Claude 4.6 stellt die nächste Generation von Claude-Modellen dar und bringt erhebliche neue Funktionen und API-Verbesserungen mit sich. Diese Seite fasst alle neuen Funktionen zusammen, die beim Start verfügbar sind.
| Modell | API-Modell-ID | Beschreibung |
|---|---|---|
| Claude Opus 4.6 | claude-opus-4-6 | Unser intelligentestes Modell zum Erstellen von Agenten und zum Programmieren |
Claude Opus 4.6 unterstützt ein Kontextfenster von 200K (mit 1M-Token-Kontextfenster verfügbar in Beta), 128K maximale Ausgabe-Token, erweitertes Denken und alle bestehenden Claude-API-Funktionen.
Für vollständige Preise und Spezifikationen siehe Modellübersicht.
Adaptives Denken (thinking: {type: "adaptive"}) ist der empfohlene Thinking-Modus für Opus 4.6. Claude entscheidet dynamisch, wann und wie viel gedacht werden soll. Auf der Standard-Anstrengungsstufe (high) wird Claude fast immer denken. Bei niedrigeren Anstrengungsstufen kann es das Denken bei einfacheren Problemen überspringen.
thinking: {type: "enabled"} und budget_tokens sind veraltet auf Opus 4.6. Sie bleiben funktionsfähig, werden aber in einer zukünftigen Modellversion entfernt. Verwenden Sie stattdessen adaptives Denken und den Anstrengungsparameter, um die Denktiefe zu steuern. Adaptives Denken aktiviert auch automatisch verschachteltes Denken.
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[{"role": "user", "content": "Solve this complex problem..."}]
)Der Anstrengungsparameter ist jetzt allgemein verfügbar (kein Beta-Header erforderlich). Eine neue max-Anstrengungsstufe bietet die absolut höchste Leistung auf Opus 4.6. Kombinieren Sie Anstrengung mit adaptivem Denken für optimale Kosten-Qualitäts-Kompromisse.
Kompaktierung bietet automatische, serverseitige Kontextzusammenfassung und ermöglicht effektiv unendliche Gespräche. Wenn sich der Kontext dem Fenster-Limit nähert, fasst die API automatisch frühere Teile des Gesprächs zusammen.
Feingranulares Tool-Streaming ist jetzt allgemein verfügbar auf allen Modellen und Plattformen. Kein Beta-Header ist erforderlich.
Opus 4.6 unterstützt bis zu 128K Ausgabe-Token und verdoppelt damit das vorherige 64K-Limit. Dies ermöglicht längere Denk-Budgets und umfassendere Antworten. Die SDKs erfordern Streaming für Anfragen mit großen max_tokens-Werten, um HTTP-Timeouts zu vermeiden. Wenn Sie Ereignisse nicht inkrementell verarbeiten müssen, verwenden Sie .stream() mit .get_final_message(), um die vollständige Antwort zu erhalten — siehe Streaming Messages für Details.
Datenresidenz-Kontrollen ermöglichen es Ihnen, anzugeben, wo die Modell-Inferenz mit dem Parameter inference_geo ausgeführt wird. Sie können pro Anfrage "global" (Standard) oder "us"-Routing wählen. Nur US-Inferenz wird auf Claude Opus 4.6 und neueren Modellen mit 1,1x berechnet.
type: "enabled" und budget_tokensthinking: {type: "enabled", budget_tokens: N} ist veraltet auf Opus 4.6. Es bleibt funktionsfähig, wird aber in einer zukünftigen Modellversion entfernt. Migrieren Sie zu thinking: {type: "adaptive"} mit dem Anstrengungsparameter.
interleaved-thinking-2025-05-14 Beta-HeaderDer interleaved-thinking-2025-05-14 Beta-Header ist veraltet auf Opus 4.6. Er wird sicher ignoriert, falls enthalten, ist aber nicht mehr erforderlich. Adaptives Denken aktiviert automatisch verschachteltes Denken. Entfernen Sie betas=["interleaved-thinking-2025-05-14"] aus Ihren Anfragen bei Verwendung von Opus 4.6.
output_formatDer Parameter output_format für strukturierte Ausgaben wurde zu output_config.format verschoben. Der alte Parameter bleibt funktionsfähig, ist aber veraltet und wird in einer zukünftigen Modellversion entfernt.
# Before
response = client.messages.create(
output_format={"type": "json_schema", "schema": {...}},
...
)
# After
response = client.messages.create(
output_config={"format": {"type": "json_schema", "schema": {...}}},
...
)Das Vorausfüllen von Assistenten-Nachrichten (Last-Assistant-Turn-Prefills) wird nicht unterstützt auf Opus 4.6. Anfragen mit vorausgefüllten Assistenten-Nachrichten geben einen 400-Fehler zurück.
Alternativen:
output_config.format für JSON-AusgabeOpus 4.6 kann leicht unterschiedliche JSON-String-Escaping in Tool-Call-Argumenten erzeugen (z. B. unterschiedliche Behandlung von Unicode-Escapes oder Forward-Slash-Escaping). Standard-JSON-Parser handhaben diese Unterschiede automatisch. Wenn Sie Tool-Call-input als rohe Zeichenkette analysieren, anstatt json.loads() oder JSON.parse() zu verwenden, überprüfen Sie, ob Ihre Parsing-Logik noch funktioniert.
Für schrittweise Migrationsanweisungen siehe Migration zu Claude 4.6.
Erfahren Sie, wie Sie den adaptiven Thinking-Modus verwenden.
Vergleichen Sie alle Claude-Modelle.
Erkunden Sie serverseitige Kontext-Kompaktierung.
Schrittweise Migrationsanweisungen.
Was this page helpful?