Claude Opus 4.6 ist ein nahezu direkter Ersatz für Claude 4.5 mit einigen Breaking Changes, die Sie beachten sollten. Eine vollständige Liste der neuen Funktionen finden Sie unter Neuerungen in Claude 4.6.
# Opus-Migration
model = "claude-opus-4-5" # Vorher
model = "claude-opus-4-6" # NachherPrefill-Entfernung: Das Prefilling von Assistenten-Nachrichten führt zu einem 400-Fehler bei Claude 4.6-Modellen. Verwenden Sie stattdessen strukturierte Ausgaben, Systemaufforderungs-Anweisungen oder output_config.format.
Tool-Parameter-Anführungszeichen: Claude 4.6-Modelle können leicht unterschiedliche JSON-String-Escaping in Tool-Call-Argumenten erzeugen (z. B. unterschiedliche Behandlung von Unicode-Escapes oder Forward-Slash-Escaping). Wenn Sie Tool-Call-input als rohe Zeichenkette analysieren, anstatt einen JSON-Parser zu verwenden, überprüfen Sie Ihre Parsing-Logik. Standard-JSON-Parser (wie json.loads() oder JSON.parse()) handhaben diese Unterschiede automatisch.
Diese sind nicht erforderlich, verbessern aber Ihre Erfahrung:
Migration zu adaptivem Denken: thinking: {type: "enabled", budget_tokens: N} ist bei Claude 4.6-Modellen veraltet und wird in einer zukünftigen Modellversion entfernt. Wechseln Sie zu thinking: {type: "adaptive"} und verwenden Sie den Effort-Parameter, um die Denktiefe zu steuern. Siehe Adaptives Denken.
response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 32000},
betas=["interleaved-thinking-2025-05-14"],
messages=[...],
)Beachten Sie, dass die Migration auch von client.beta.messages.create zu client.messages.create wechselt. Adaptives Denken und Effort sind GA-Funktionen und erfordern nicht den Beta-SDK-Namespace oder Beta-Header.
Entfernen Sie den Effort-Beta-Header: Der Effort-Parameter ist jetzt GA. Entfernen Sie betas=["effort-2025-11-24"] aus Ihren Anfragen.
Entfernen Sie den Beta-Header für feingranulares Tool-Streaming: Feingranulares Tool-Streaming ist jetzt GA. Entfernen Sie betas=["fine-grained-tool-streaming-2025-05-14"] aus Ihren Anfragen.
Entfernen Sie den Beta-Header für verschachteltes Denken (nur Opus 4.6): Adaptives Denken aktiviert automatisch verschachteltes Denken auf Opus 4.6. Entfernen Sie betas=["interleaved-thinking-2025-05-14"] aus Ihren Opus 4.6-Anfragen. Hinweis: Sonnet 4.6 unterstützt diesen Beta-Header weiterhin mit manuellem erweitertem Denken.
Migration zu output_config.format: Wenn Sie strukturierte Ausgaben verwenden, aktualisieren Sie output_format={...} zu output_config={"format": {...}}. Der alte Parameter bleibt funktionsfähig, ist aber veraltet und wird in einer zukünftigen Modellversion entfernt.
Wenn Sie von Opus 4.1, Sonnet 4 oder früheren Modellen direkt zu Claude 4.6 migrieren, wenden Sie die oben genannten Claude 4.6 Breaking Changes sowie die zusätzlichen Änderungen in diesem Abschnitt an.
# Von Opus 4.1
model = "claude-opus-4-1-20250805" # Vorher
model = "claude-opus-4-6" # Nachher
# Von Sonnet 4
model = "claude-sonnet-4-20250514" # Vorher
model = "claude-opus-4-6" # Nachher
# Von Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Vorher
model = "claude-opus-4-6" # NachherAktualisieren Sie Sampling-Parameter
Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.
Verwenden Sie nur temperature ODER top_p, nicht beide:
# Vorher - Dies führt zu einem Fehler bei Claude 4+-Modellen
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # Kann nicht beide verwenden
# ...
)
# Nachher
response = client.messages.create(
model="claude-opus-4-6",
temperature=0.7, # Verwenden Sie temperature ODER top_p, nicht beide
# ...
)Aktualisieren Sie Tool-Versionen
Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.
Aktualisieren Sie auf die neuesten Tool-Versionen. Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet.
# Vorher
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# Nachher
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 und str_replace_based_edit_tool. Siehe Dokumentation des Text-Editor-Tools für Details.code_execution_20250825. Siehe Dokumentation des Code-Ausführungs-Tools für Migrationsanweisungen.Behandeln Sie den refusal-Stoppgrund
Aktualisieren Sie Ihre Anwendung, um Stoppgründe vom Typ refusal zu behandeln:
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Behandeln Sie die Ablehnung angemessen
passBehandeln Sie den model_context_window_exceeded-Stoppgrund
Claude 4.5+-Modelle geben einen model_context_window_exceeded-Stoppgrund zurück, wenn die Generierung aufgrund des Erreichens des Kontextfenster-Limits stoppt, anstatt des angeforderten max_tokens-Limits. Aktualisieren Sie Ihre Anwendung, um diesen neuen Stoppgrund zu behandeln:
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Behandeln Sie das Kontextfenster-Limit angemessen
passÜberprüfen Sie die Behandlung von Tool-Parametern (nachfolgende Zeilenumbrüche)
Claude 4.5+-Modelle bewahren nachfolgende Zeilenumbrüche in Tool-Call-String-Parametern, die zuvor entfernt wurden. Wenn Ihre Tools auf exakte String-Übereinstimmung mit Tool-Call-Parametern angewiesen sind, überprüfen Sie, ob Ihre Logik nachfolgende Zeilenumbrüche korrekt behandelt.
Aktualisieren Sie Ihre Aufforderungen für Verhaltensänderungen
Claude 4+-Modelle haben einen prägnanten, direkten Kommunikationsstil und erfordern explizite Anweisungen. Lesen Sie Best Practices für Aufforderungen für Optimierungsleitfaden.
token-efficient-tools-2025-02-19 und output-128k-2025-02-19. Alle Claude 4+-Modelle haben integrierte Token-effiziente Tool-Nutzung und diese Header haben keine Auswirkung.claude-opus-4-6output_config.formatthinking: {type: "enabled", budget_tokens: N} zu thinking: {type: "adaptive"} mit dem Effort-Parameter (budget_tokens ist veraltet und wird in einer zukünftigen Version entfernt)effort-2025-11-24-Beta-Header (Effort ist jetzt GA)fine-grained-tool-streaming-2025-05-14-Beta-Headerinterleaved-thinking-2025-05-14-Beta-Header (nur Opus 4.6; Sonnet 4.6 unterstützt ihn weiterhin)output_format zu output_config.format (falls zutreffend)temperature ODER top_p zu verwendentext_editor_20250728, code_execution_20250825)refusal-Stoppgrundmodel_context_window_exceeded-Stoppgrundtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Claude Sonnet 4.6 kombiniert starke Intelligenz mit schneller Leistung und bietet verbesserte agentengesteuerte Suchfunktionen und kostenlose Code-Ausführung bei Verwendung mit Web-Suche oder Web-Abruf. Es ist ideal für alltägliche Codierung, Analyse und Inhaltsaufgaben.
Eine vollständige Übersicht der Funktionen finden Sie unter Modellübersicht.
Die Preisgestaltung für Sonnet 4.6 beträgt $3 pro Million Eingabe-Token, $15 pro Million Ausgabe-Token. Siehe Claude-Preisgestaltung für Details.
Aktualisieren Sie Ihren Modellnamen:
# Von Sonnet 4.5
model = "claude-sonnet-4-5" # Vorher
model = "claude-sonnet-4-6" # Nachher
# Von Sonnet 4
model = "claude-sonnet-4-20250514" # Vorher
model = "claude-sonnet-4-6" # NachherPrefilling von Assistenten-Nachrichten wird nicht mehr unterstützt
Dies ist ein Breaking Change bei der Migration von Sonnet 4.5 oder früher.
Das Prefilling von Assistenten-Nachrichten gibt einen 400-Fehler bei Sonnet 4.6 zurück. Verwenden Sie strukturierte Ausgaben, Systemaufforderungs-Anweisungen oder output_config.format stattdessen.
Häufige Prefill-Anwendungsfälle und Migrationen:
Kontrolle der Ausgabeformatierung (Erzwingung von JSON/YAML-Ausgabe): Verwenden Sie strukturierte Ausgaben oder Tools mit Enum-Feldern für Klassifizierungsaufgaben.
Beseitigung von Präambeln (Entfernung von "Hier ist..."-Phrasen): Fügen Sie direkte Anweisungen in die Systemaufforderung ein: "Antworten Sie direkt ohne Präambel. Beginnen Sie nicht mit Phrasen wie 'Hier ist...', 'Basierend auf...', usw."
Vermeidung schlechter Ablehnungen: Claude ist jetzt viel besser bei angemessenen Ablehnungen. Klare Aufforderungen in der Benutzernachricht ohne Prefill sollten ausreichend sein.
Fortsetzungen (Fortsetzen unterbrochener Antworten): Verschieben Sie die Fortsetzung zur Benutzernachricht: "Ihre vorherige Antwort wurde unterbrochen und endete mit [previous_response]. Fahren Sie fort, wo Sie aufgehört haben."
Kontext-Hydration / Rollenkonsistenz (Auffrischung des Kontexts in langen Gesprächen): Injizieren Sie, was zuvor Prefilled-Assistenten-Erinnerungen waren, stattdessen in den Benutzerzug.
Tool-Parameter-JSON-Escaping kann unterschiedlich sein
Dies ist ein Breaking Change bei der Migration von Sonnet 4.5 oder früher.
JSON-String-Escaping in Tool-Parametern kann sich von früheren Modellen unterscheiden. Standard-JSON-Parser handhaben dies automatisch, aber benutzerdefiniertes String-basiertes Parsing kann Aktualisierungen benötigen.
Aktualisieren Sie Sampling-Parameter
Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.
Verwenden Sie nur temperature ODER top_p, nicht beide.
Aktualisieren Sie Tool-Versionen
Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.
Aktualisieren Sie auf die neuesten Tool-Versionen (text_editor_20250728, code_execution_20250825). Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet.
Behandeln Sie den refusal-Stoppgrund
Aktualisieren Sie Ihre Anwendung, um Stoppgründe vom Typ refusal zu behandeln.
Aktualisieren Sie Ihre Aufforderungen für Verhaltensänderungen
Claude 4-Modelle haben einen prägnanten, direkten Kommunikationsstil. Lesen Sie Best Practices für Aufforderungen für Optimierungsleitfaden.
fine-grained-tool-streaming-2025-05-14-Beta-Header — Feingranulares Tool-Streaming ist jetzt GA auf Sonnet 4.6 und erfordert keinen Beta-Header mehr.output_format zu output_config.format — Der output_format-Parameter ist veraltet. Verwenden Sie stattdessen output_config.format.Wir empfehlen dringend, von Sonnet 4.5 zu Sonnet 4.6 zu migrieren, das mehr Intelligenz zum gleichen Preis bietet.
Sonnet 4.6 hat standardmäßig ein Effort-Level von high, im Gegensatz zu Sonnet 4.5, das keinen Effort-Parameter hatte. Wir empfehlen, den Effort-Parameter anzupassen, während Sie von Sonnet 4.5 zu Sonnet 4.6 migrieren. Wenn nicht explizit gesetzt, können Sie mit dem Standard-Effort-Level eine höhere Latenz erleben.
Wenn Sie kein erweitertes Denken auf Sonnet 4.5 verwenden, können Sie auf Sonnet 4.6 ohne es fortfahren. Sie sollten den Effort explizit auf das für Ihren Anwendungsfall angemessene Level setzen. Bei low-Effort mit deaktiviertem Denken können Sie eine ähnliche oder bessere Leistung im Vergleich zu Sonnet 4.5 ohne erweitertes Denken erwarten.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
output_config={"effort": "low"},
messages=[{"role": "user", "content": "Your prompt here"}],
)Wenn Sie erweitertes Denken auf Sonnet 4.5 verwenden, wird es auf Sonnet 4.6 weiterhin unterstützt, ohne dass Änderungen an Ihrer Denk-Konfiguration erforderlich sind. Wir empfehlen, ein Denk-Budget von etwa 16k Token beizubehalten. In der Praxis verwenden die meisten Aufgaben nicht so viel, aber es bietet Spielraum für schwierigere Probleme ohne Risiko unkontrollierter Token-Nutzung.
Für agentengesteuerte Codierung, Frontend-Design, Tool-intensive Workflows und komplexe Enterprise-Workflows empfehlen wir, mit medium-Effort zu beginnen. Wenn Sie feststellen, dass die Latenz zu hoch ist, erwägen Sie, den Effort auf low zu reduzieren. Wenn Sie höhere Intelligenz benötigen, erwägen Sie, den Effort auf high zu erhöhen oder zu Opus 4.6 zu migrieren.
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)Für Chat, Inhaltsgenerierung, Suche, Klassifizierung und andere Nicht-Codierungs-Aufgaben empfehlen wir, mit low-Effort mit erweitertem Denken zu beginnen. Wenn Sie mehr Tiefe benötigen, erhöhen Sie den Effort auf medium.
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)Die oben genannten Migrationspfade verwenden erweitertes Denken mit budget_tokens für vorhersehbare Token-Nutzung. Wenn Ihre Workload einem der folgenden Muster entspricht, erwägen Sie, stattdessen adaptives Denken zu versuchen:
high-Effort. Wenn Latenz oder Token-Nutzung ein Problem darstellt, reduzieren Sie auf medium.Wenn Sie adaptives Denken verwenden, evaluieren Sie medium und high-Effort auf Ihren Aufgaben. Das richtige Level hängt vom Tradeoff Ihrer Workload zwischen Qualität, Latenz und Token-Nutzung ab.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "Your prompt here"}],
)Wenn Sie inkonsistentes Verhalten oder Qualitätsrückgänge mit adaptivem Denken sehen, wechseln Sie zu erweitertem Denken mit budget_tokens. Dies bietet vorhersehbarere Ergebnisse mit einer Obergrenze für Denk-Kosten.
claude-sonnet-4-6output_config.formattext_editor_20250728, code_execution_20250825); Legacy-Versionen werden nicht unterstützt (falls Migration von 3.x)undo_edit-Befehl verwendet (falls zutreffend)temperature ODER top_p zu verwenden, nicht beide (falls Migration von 3.x)refusal-Stoppgrund in Ihrer Anwendungfine-grained-tool-streaming-2025-05-14-Beta-Header (jetzt GA)output_format zu output_config.formatClaude Sonnet 4.5 kombiniert starke Intelligenz mit schneller Leistung und ist ideal für alltägliche Codierung, Analyse und Inhaltsaufgaben.
Eine vollständige Übersicht der Funktionen finden Sie unter Modellübersicht.
Die Preisgestaltung für Sonnet 4.5 beträgt $3 pro Million Eingabe-Token, $15 pro Million Ausgabe-Token. Siehe Claude-Preisgestaltung für Details.
Aktualisieren Sie Ihren Modellnamen:
# Von Sonnet 4
model = "claude-sonnet-4-20250514" # Vorher
model = "claude-sonnet-4-5-20250929" # Nachher
# Von Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Vorher
model = "claude-sonnet-4-5-20250929" # NachherDiese Breaking Changes gelten bei der Migration von Claude 3.x Sonnet-Modellen.
Aktualisieren Sie Sampling-Parameter
Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.
Verwenden Sie nur temperature ODER top_p, nicht beide.
Aktualisieren Sie Tool-Versionen
Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.
Aktualisieren Sie auf die neuesten Tool-Versionen (text_editor_20250728, code_execution_20250825). Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet.
Behandeln Sie den refusal-Stoppgrund
Aktualisieren Sie Ihre Anwendung, um Stoppgründe vom Typ refusal zu behandeln.
Aktualisieren Sie Ihre Aufforderungen für Verhaltensänderungen
Claude 4-Modelle haben einen prägnanten, direkten Kommunikationsstil. Lesen Sie Best Practices für Aufforderungen für Optimierungsleitfaden.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825); Legacy-Versionen werden nicht unterstützt (falls Migration von 3.x)undo_edit-Befehl verwendet (falls zutreffend)temperature ODER top_p zu verwenden, nicht beide (falls Migration von 3.x)refusal-Stoppgrund in Ihrer AnwendungClaude Haiku 4.5 ist das schnellste und intelligenteste Haiku-Modell mit nahezu Frontier-Leistung und bietet Premium-Modellqualität für interaktive Anwendungen und Hochvolumen-Verarbeitung.
Eine vollständige Übersicht der Funktionen finden Sie unter Modellübersicht.
Die Preisgestaltung für Haiku 4.5 beträgt $1 pro Million Eingabe-Token, $5 pro Million Ausgabe-Token. Siehe Claude-Preisgestaltung für Details.
Aktualisieren Sie Ihren Modellnamen:
# Von Haiku 3.5
model = "claude-3-5-haiku-20241022" # Vorher
model = "claude-haiku-4-5-20251001" # NachherÜberprüfen Sie neue Rate Limits: Haiku 4.5 hat separate Rate Limits von Haiku 3.5. Siehe Rate Limits-Dokumentation für Details.
Für erhebliche Leistungsverbesserungen bei Codierungs- und Denkaufgaben erwägen Sie, erweitertes Denken mit thinking: {type: "enabled", budget_tokens: N} zu aktivieren.
Erweitertes Denken wirkt sich auf die Effizienz des Prompt-Cachings aus.
Erweitertes Denken ist in Claude 4.6 oder neueren Modellen veraltet. Wenn Sie neuere Modelle verwenden, verwenden Sie stattdessen adaptives Denken.
Erkunden Sie neue Funktionen: Siehe Modellübersicht für Details zu Kontextbewusstsein, erhöhter Ausgabekapazität (64K Token), höherer Intelligenz und verbesserter Geschwindigkeit.
Diese Breaking Changes gelten bei der Migration von Claude 3.x Haiku-Modellen.
Aktualisieren Sie Sampling-Parameter
Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.
Verwenden Sie nur temperature ODER top_p, nicht beide.
Aktualisieren Sie Tool-Versionen
Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.
Aktualisieren Sie auf die neuesten Tool-Versionen (text_editor_20250728, code_execution_20250825). Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet.
Behandeln Sie den refusal-Stoppgrund
Aktualisieren Sie Ihre Anwendung, um Stoppgründe vom Typ refusal zu behandeln.
Aktualisieren Sie Ihre Aufforderungen für Verhaltensänderungen
Claude 4-Modelle haben einen prägnanten, direkten Kommunikationsstil. Lesen Sie Best Practices für Aufforderungen für Optimierungsleitfaden.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825); Legacy-Versionen werden nicht unterstütztundo_edit-Befehl verwendet (falls zutreffend)temperature ODER top_p zu verwenden, nicht beiderefusal-Stoppgrund in Ihrer AnwendungWas this page helpful?