Claude Sonnet 5 ist die nächste Generation der Sonnet-Modellfamilie von Anthropic. Es ist ein Drop-in-Upgrade für Claude Sonnet 4.6 mit drei Verhaltensänderungen: Adaptives Denken ist standardmäßig aktiviert, manuelles erweitertes Denken gibt jetzt einen 400-Fehler zurück (es wurde in Claude Sonnet 4.6 als veraltet markiert), und das Setzen von Sampling-Parametern (temperature, top_p, top_k) auf nicht standardmäßige Werte gibt einen 400-Fehler zurück. Diese Seite fasst alles Neue zum Launch zusammen, einschließlich eines neuen Tokenizers.
| Modell | API-Modell-ID | Beschreibung |
|---|---|---|
| Claude Sonnet 5 | claude-sonnet-5 | Die beste Kombination aus Geschwindigkeit und Intelligenz |
Claude Sonnet 5 unterstützt standardmäßig das 1M-Token-Kontextfenster (1M Token ist sowohl der Standard als auch das Maximum; es gibt keine kleinere Kontextvariante), 128k maximale Output-Token, adaptives Denken und denselben Satz an Tools und Plattformfunktionen wie Claude Sonnet 4.6, mit Ausnahme von Priority Tier, das für Claude Sonnet 5 nicht verfügbar ist.
Vollständige Preise und Spezifikationen findest du in der Modellübersicht.
Bei Claude Sonnet 4.6 werden Anfragen ohne thinking-Feld ohne Denken ausgeführt. Bei Claude Sonnet 5 werden dieselben Anfragen mit adaptivem Denken ausgeführt. Um das Denken auszuschalten, übergib thinking: {type: "disabled"}. Da max_tokens ein hartes Limit für die gesamte Ausgabe ist (Denken plus Antworttext), solltest du diesen Wert für Workloads überprüfen, die bei Claude Sonnet 4.6 ohne Denken liefen.
Das Setzen von temperature, top_p oder top_k auf einen nicht standardmäßigen Wert gibt einen 400-Fehler zurück. Entferne diese Parameter bei der Migration; der Standardwert (oder das Weglassen des Parameters) wird akzeptiert. Verwende Anweisungen im System-Prompt, um das Modellverhalten zu steuern. Dies ist neu für Modelle der Sonnet-Klasse; dieselbe Einschränkung wurde zuvor bei Claude Opus 4.7 eingeführt.
Manuelles erweitertes Denken (thinking: {type: "enabled", budget_tokens: N}) wurde in Claude Sonnet 4.6 als veraltet markiert; in Claude Sonnet 5 ist es entfernt und gibt einen 400-Fehler zurück, genauso wie bei Claude Opus 4.8 und Claude Opus 4.7. Verwende stattdessen adaptives Denken mit dem Effort-Parameter.
# Wird von Claude Sonnet 5 nicht unterstützt (gibt 400 zurück)
thinking = {"type": "enabled", "budget_tokens": 32000}
# Verwende stattdessen dies
thinking = {"type": "adaptive"}Claude Sonnet 5 verwendet einen neuen Tokenizer. Derselbe Eingabetext erzeugt etwa 30 % mehr Token als bei Claude Sonnet 4.6. Dies ist keine API-Änderung: Anfragen, Antworten und Streaming-Events behalten dieselbe Struktur, und es sind keine Code-Änderungen erforderlich.
Die Änderung betrifft alles, was du in Token misst oder budgetierst:
usage-Felder und Ergebnisse der Token-Zählung für denselben Text sind höher als bei Claude Sonnet 4.6. Verwende keine Zählungen wieder, die mit früheren Modellen gemessen wurden; zähle neu mit Claude Sonnet 5.max_tokens-Budgets: Ein für Claude Sonnet 4.6 abgestimmtes Output-Limit kann bei Claude Sonnet 5 eine gleichwertige Ausgabe abschneiden. Überprüfe Limits, die nahe an deiner erwarteten Ausgabelänge liegen.Diese Einschränkung ist gegenüber Claude Sonnet 4.6 unverändert. Abgesehen von den drei Verhaltensänderungen (siehe Migrationsleitfaden) benötigt Code, der bereits auf Claude Sonnet 4.6 läuft, keine weiteren Änderungen.
Das Vorausfüllen der Assistant-Nachricht gibt einen 400-Fehler zurück, unverändert gegenüber Claude Sonnet 4.6. Verwende stattdessen strukturierte Ausgaben, Anweisungen im System-Prompt oder output_config.format.
Claude Sonnet 5 ist ein Fähigkeits-Upgrade gegenüber Claude Sonnet 4.6 zum gleichen Preis. Es ist auch eine Option für Workloads, die mehr Leistung benötigen, als Claude Sonnet 4.6 bietet, ohne zu einem Modell der Opus-Klasse wechseln zu müssen.
Die größten Verbesserungen gegenüber Claude Sonnet 4.6 liegen bei Coding- und agentischen Aufgaben. Benchmark-Ergebnisse findest du im Transparency Hub von Anthropic.
Claude Sonnet 5 ist das erste Modell der Sonnet-Klasse mit Echtzeit-Cybersicherheits-Schutzmaßnahmen. Anfragen, die verbotene oder hochriskante Cybersicherheitsthemen betreffen, können abgelehnt werden. Ablehnungen werden als erfolgreiche HTTP-200-Antwort mit stop_reason: "refusal" zurückgegeben, nicht als Fehler. Hintergrundinformationen findest du unter Schutzmaßnahmen, Warnungen und Einsprüche.
Claude Sonnet 5 kostet 3 $ pro Million Input-Token und 15 $ pro Million Output-Token, unverändert gegenüber Claude Sonnet 4.6. Da der neue Tokenizer etwa 30 % mehr Token für denselben Text erzeugt, können die Kosten einer gleichwertigen Anfrage von Claude Sonnet 4.6 abweichen, obwohl die Preise pro Token unverändert sind.
Einführungspreise von 2 $/10 $ pro Million Input-/Output-Token gelten bis zum 31. August 2026, danach treten die Standardpreise von 3 $/15 $ pro Million Input-/Output-Token in Kraft.
Vollständige Preise, einschließlich der Tarife für Batch-Verarbeitung und Prompt-Caching, findest du unter Preise.
Zum Launch ist Claude Sonnet 5 verfügbar auf:
InvokeModel- und Converse-APIs).Claude Sonnet 5 unterstützt Zero Data Retention für Organisationen mit ZDR-Vereinbarungen.
Claude Sonnet 5 ist ein Drop-in-Ersatz für Claude Sonnet 4.6. Aktualisiere deine Modell-ID:
model = "claude-sonnet-4-6" # Before
model = "claude-sonnet-5" # AfterÜberprüfe dann Folgendes:
max_tokens-Limits, die nahe an deiner erwarteten Ausgabelänge liegen.budget_tokens setzt, migriere zu adaptivem Denken. Manuelles erweitertes Denken (thinking: {type: "enabled"}) wird nicht unterstützt und gibt einen 400-Fehler zurück.temperature, top_p, top_k) auf einen nicht standardmäßigen Wert setzen, geben einen 400-Fehler zurück; entferne sie bei der Migration. Tool-Definitionen und Antwortstrukturen sind unverändert, und das Vorausfüllen der Assistant-Nachricht wurde bereits bei Claude Sonnet 4.6 nicht unterstützt.Details findest du im Abschnitt zu Claude Sonnet 5 im Migrationsleitfaden.
Vollständige Spezifikationen und Preise für alle aktuellen Claude-Modelle.
Miss deine Prompts mit dem neuen Tokenizer, bevor du migrierst.
Der empfohlene Denkmodus bei Claude Sonnet 5.
Wie das 1M-Token-Kontextfenster funktioniert.
Vollständige Preise, einschließlich der Tarife für Batch-Verarbeitung und Prompt-Caching.
Was this page helpful?