Modelle & PreiseModelle

Was ist neu in Claude Sonnet 5

Überblick über neue Funktionen und Verhaltensänderungen in Claude Sonnet 5.

Claude Sonnet 5 ist die nächste Generation der Sonnet-Modellfamilie von Anthropic. Es ist ein Drop-in-Upgrade für Claude Sonnet 4.6 mit drei Verhaltensänderungen: Adaptives Denken ist standardmäßig aktiviert, manuelles erweitertes Denken gibt jetzt einen 400-Fehler zurück (es wurde in Claude Sonnet 4.6 als veraltet markiert), und das Setzen von Sampling-Parametern (temperature, top_p, top_k) auf nicht standardmäßige Werte gibt einen 400-Fehler zurück. Diese Seite fasst alles Neue zum Launch zusammen, einschließlich eines neuen Tokenizers.

Neues Modell

Modell	API-Modell-ID	Beschreibung
Claude Sonnet 5	`claude-sonnet-5`	Die beste Kombination aus Geschwindigkeit und Intelligenz

Claude Sonnet 5 unterstützt standardmäßig das 1M-Token-Kontextfenster (1M Token ist sowohl der Standard als auch das Maximum; es gibt keine kleinere Kontextvariante), 128k maximale Output-Token, adaptives Denken und denselben Satz an Tools und Plattformfunktionen wie Claude Sonnet 4.6, mit Ausnahme von Priority Tier, das für Claude Sonnet 5 nicht verfügbar ist.

Vollständige Preise und Spezifikationen findest du in der Modellübersicht.

Verhaltensänderungen

Adaptives Denken standardmäßig aktiviert

Bei Claude Sonnet 4.6 werden Anfragen ohne thinking-Feld ohne Denken ausgeführt. Bei Claude Sonnet 5 werden dieselben Anfragen mit adaptivem Denken ausgeführt. Um das Denken auszuschalten, übergib thinking: {type: "disabled"}. Da max_tokens ein hartes Limit für die gesamte Ausgabe ist (Denken plus Antworttext), solltest du diesen Wert für Workloads überprüfen, die bei Claude Sonnet 4.6 ohne Denken liefen.

Sampling-Parameter werden nicht akzeptiert

Das Setzen von temperature, top_p oder top_k auf einen nicht standardmäßigen Wert gibt einen 400-Fehler zurück. Entferne diese Parameter bei der Migration; der Standardwert (oder das Weglassen des Parameters) wird akzeptiert. Verwende Anweisungen im System-Prompt, um das Modellverhalten zu steuern. Dies ist neu für Modelle der Sonnet-Klasse; dieselbe Einschränkung wurde zuvor bei Claude Opus 4.7 eingeführt.

Manuelles erweitertes Denken entfernt

Manuelles erweitertes Denken (thinking: {type: "enabled", budget_tokens: N}) wurde in Claude Sonnet 4.6 als veraltet markiert; in Claude Sonnet 5 ist es entfernt und gibt einen 400-Fehler zurück, genauso wie bei Claude Opus 4.8 und Claude Opus 4.7. Verwende stattdessen adaptives Denken mit dem Effort-Parameter.

Python

# Wird von Claude Sonnet 5 nicht unterstützt (gibt 400 zurück)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Verwende stattdessen dies
thinking = {"type": "adaptive"}

Neuer Tokenizer

Claude Sonnet 5 verwendet einen neuen Tokenizer. Derselbe Eingabetext erzeugt etwa 30 % mehr Token als bei Claude Sonnet 4.6. Dies ist keine API-Änderung: Anfragen, Antworten und Streaming-Events behalten dieselbe Struktur, und es sind keine Code-Änderungen erforderlich.

Die Änderung betrifft alles, was du in Token misst oder budgetierst:

Token-Anzahl: usage-Felder und Ergebnisse der Token-Zählung für denselben Text sind höher als bei Claude Sonnet 4.6. Verwende keine Zählungen wieder, die mit früheren Modellen gemessen wurden; zähle neu mit Claude Sonnet 5.
Kontextfenster-Kapazität in Textmenge: Das Kontextfenster umfasst 1M Token, aber jedes Token deckt im Durchschnitt weniger Text ab, sodass dasselbe Fenster weniger Text aufnimmt als bei Claude Sonnet 4.6.
max_tokens-Budgets: Ein für Claude Sonnet 4.6 abgestimmtes Output-Limit kann bei Claude Sonnet 5 eine gleichwertige Ausgabe abschneiden. Überprüfe Limits, die nahe an deiner erwarteten Ausgabelänge liegen.
Kosten pro Anfrage: Die Preise pro Token sind unverändert (siehe Preise), aber da derselbe Text mehr Token erzeugt, können die Kosten einer gleichwertigen Anfrage von Claude Sonnet 4.6 abweichen.

Von Claude Sonnet 4.6 übernommene API-Einschränkungen

Diese Einschränkung ist gegenüber Claude Sonnet 4.6 unverändert. Abgesehen von den drei Verhaltensänderungen (siehe Migrationsleitfaden) benötigt Code, der bereits auf Claude Sonnet 4.6 läuft, keine weiteren Änderungen.

Vorausfüllen der Assistant-Nachricht nicht unterstützt

Das Vorausfüllen der Assistant-Nachricht gibt einen 400-Fehler zurück, unverändert gegenüber Claude Sonnet 4.6. Verwende stattdessen strukturierte Ausgaben, Anweisungen im System-Prompt oder output_config.format.

Verbesserungen der Fähigkeiten

Claude Sonnet 5 ist ein Fähigkeits-Upgrade gegenüber Claude Sonnet 4.6 zum gleichen Preis. Es ist auch eine Option für Workloads, die mehr Leistung benötigen, als Claude Sonnet 4.6 bietet, ohne zu einem Modell der Opus-Klasse wechseln zu müssen.

Die größten Verbesserungen gegenüber Claude Sonnet 4.6 liegen bei Coding- und agentischen Aufgaben. Benchmark-Ergebnisse findest du im Transparency Hub von Anthropic.

Cybersicherheits-Schutzmaßnahmen

Claude Sonnet 5 ist das erste Modell der Sonnet-Klasse mit Echtzeit-Cybersicherheits-Schutzmaßnahmen. Anfragen, die verbotene oder hochriskante Cybersicherheitsthemen betreffen, können abgelehnt werden. Ablehnungen werden als erfolgreiche HTTP-200-Antwort mit stop_reason: "refusal" zurückgegeben, nicht als Fehler. Hintergrundinformationen findest du unter Schutzmaßnahmen, Warnungen und Einsprüche.

Preise

Claude Sonnet 5 kostet 3 $ pro Million Input-Token und 15 $ pro Million Output-Token, unverändert gegenüber Claude Sonnet 4.6. Da der neue Tokenizer etwa 30 % mehr Token für denselben Text erzeugt, können die Kosten einer gleichwertigen Anfrage von Claude Sonnet 4.6 abweichen, obwohl die Preise pro Token unverändert sind.

Einführungspreise von 2 $/10 $ pro Million Input-/Output-Token gelten bis zum 31. August 2026, danach treten die Standardpreise von 3 $/15 $ pro Million Input-/Output-Token in Kraft.

Vollständige Preise, einschließlich der Tarife für Batch-Verarbeitung und Prompt-Caching, findest du unter Preise.

Verfügbarkeit

Zum Launch ist Claude Sonnet 5 verfügbar auf:

Claude API: verfügbar für alle Kunden.
AWS: verfügbar über Claude in Amazon Bedrock und Claude Platform on AWS. Claude Sonnet 5 ist nicht verfügbar über Claude on Amazon Bedrock (Legacy) (die InvokeModel- und Converse-APIs).
Google Cloud: verfügbar über Claude on Google Cloud.
Microsoft Foundry (Preview): verfügbar über Claude in Microsoft Foundry.

Claude Sonnet 5 unterstützt Zero Data Retention für Organisationen mit ZDR-Vereinbarungen.

Migrationsleitfaden

Claude Sonnet 5 ist ein Drop-in-Ersatz für Claude Sonnet 4.6. Aktualisiere deine Modell-ID:

model = "claude-sonnet-4-6"  # Before
model = "claude-sonnet-5"  # After

Überprüfe dann Folgendes:

Token-Budgets und -Zählungen: Der neue Tokenizer erzeugt etwa 30 % mehr Token für denselben Text. Zähle Prompts mit der Token-Zählung neu und überprüfe max_tokens-Limits, die nahe an deiner erwarteten Ausgabelänge liegen.
Erweitertes Denken: Wenn du noch budget_tokens setzt, migriere zu adaptivem Denken. Manuelles erweitertes Denken (thinking: {type: "enabled"}) wird nicht unterstützt und gibt einen 400-Fehler zurück.
Sampling-Parameter: Anfragen, die Sampling-Parameter (temperature, top_p, top_k) auf einen nicht standardmäßigen Wert setzen, geben einen 400-Fehler zurück; entferne sie bei der Migration. Tool-Definitionen und Antwortstrukturen sind unverändert, und das Vorausfüllen der Assistant-Nachricht wurde bereits bei Claude Sonnet 4.6 nicht unterstützt.

Details findest du im Abschnitt zu Claude Sonnet 5 im Migrationsleitfaden.

Nächste Schritte

Modellübersicht

Vollständige Spezifikationen und Preise für alle aktuellen Claude-Modelle.

Token-Zählung

Miss deine Prompts mit dem neuen Tokenizer, bevor du migrierst.

Adaptives Denken

Der empfohlene Denkmodus bei Claude Sonnet 5.

Kontextfenster

Wie das 1M-Token-Kontextfenster funktioniert.

Preise

Vollständige Preise, einschließlich der Tarife für Batch-Verarbeitung und Prompt-Caching.

Was this page helpful?

Modelle & PreiseModelle

Was ist neu in Claude Sonnet 5

Überblick über neue Funktionen und Verhaltensänderungen in Claude Sonnet 5.

Neues Modell

Modell	API-Modell-ID	Beschreibung
Claude Sonnet 5	`claude-sonnet-5`	Die beste Kombination aus Geschwindigkeit und Intelligenz

Vollständige Preise und Spezifikationen findest du in der Modellübersicht.

Verhaltensänderungen

Adaptives Denken standardmäßig aktiviert

Sampling-Parameter werden nicht akzeptiert

Manuelles erweitertes Denken entfernt

Python

# Wird von Claude Sonnet 5 nicht unterstützt (gibt 400 zurück)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Verwende stattdessen dies
thinking = {"type": "adaptive"}

Neuer Tokenizer

Die Änderung betrifft alles, was du in Token misst oder budgetierst:

Token-Anzahl: usage-Felder und Ergebnisse der Token-Zählung für denselben Text sind höher als bei Claude Sonnet 4.6. Verwende keine Zählungen wieder, die mit früheren Modellen gemessen wurden; zähle neu mit Claude Sonnet 5.
Kontextfenster-Kapazität in Textmenge: Das Kontextfenster umfasst 1M Token, aber jedes Token deckt im Durchschnitt weniger Text ab, sodass dasselbe Fenster weniger Text aufnimmt als bei Claude Sonnet 4.6.
max_tokens-Budgets: Ein für Claude Sonnet 4.6 abgestimmtes Output-Limit kann bei Claude Sonnet 5 eine gleichwertige Ausgabe abschneiden. Überprüfe Limits, die nahe an deiner erwarteten Ausgabelänge liegen.
Kosten pro Anfrage: Die Preise pro Token sind unverändert (siehe Preise), aber da derselbe Text mehr Token erzeugt, können die Kosten einer gleichwertigen Anfrage von Claude Sonnet 4.6 abweichen.

Von Claude Sonnet 4.6 übernommene API-Einschränkungen

Vorausfüllen der Assistant-Nachricht nicht unterstützt

Verbesserungen der Fähigkeiten

Die größten Verbesserungen gegenüber Claude Sonnet 4.6 liegen bei Coding- und agentischen Aufgaben. Benchmark-Ergebnisse findest du im Transparency Hub von Anthropic.

Cybersicherheits-Schutzmaßnahmen

Preise

Einführungspreise von 2 $/10 $ pro Million Input-/Output-Token gelten bis zum 31. August 2026, danach treten die Standardpreise von 3 $/15 $ pro Million Input-/Output-Token in Kraft.

Vollständige Preise, einschließlich der Tarife für Batch-Verarbeitung und Prompt-Caching, findest du unter Preise.

Verfügbarkeit

Zum Launch ist Claude Sonnet 5 verfügbar auf:

Claude API: verfügbar für alle Kunden.
AWS: verfügbar über Claude in Amazon Bedrock und Claude Platform on AWS. Claude Sonnet 5 ist nicht verfügbar über Claude on Amazon Bedrock (Legacy) (die InvokeModel- und Converse-APIs).
Google Cloud: verfügbar über Claude on Google Cloud.
Microsoft Foundry (Preview): verfügbar über Claude in Microsoft Foundry.

Claude Sonnet 5 unterstützt Zero Data Retention für Organisationen mit ZDR-Vereinbarungen.

Migrationsleitfaden

Claude Sonnet 5 ist ein Drop-in-Ersatz für Claude Sonnet 4.6. Aktualisiere deine Modell-ID:

model = "claude-sonnet-4-6"  # Before
model = "claude-sonnet-5"  # After

Überprüfe dann Folgendes:

Token-Budgets und -Zählungen: Der neue Tokenizer erzeugt etwa 30 % mehr Token für denselben Text. Zähle Prompts mit der Token-Zählung neu und überprüfe max_tokens-Limits, die nahe an deiner erwarteten Ausgabelänge liegen.
Erweitertes Denken: Wenn du noch budget_tokens setzt, migriere zu adaptivem Denken. Manuelles erweitertes Denken (thinking: {type: "enabled"}) wird nicht unterstützt und gibt einen 400-Fehler zurück.
Sampling-Parameter: Anfragen, die Sampling-Parameter (temperature, top_p, top_k) auf einen nicht standardmäßigen Wert setzen, geben einen 400-Fehler zurück; entferne sie bei der Migration. Tool-Definitionen und Antwortstrukturen sind unverändert, und das Vorausfüllen der Assistant-Nachricht wurde bereits bei Claude Sonnet 4.6 nicht unterstützt.

Details findest du im Abschnitt zu Claude Sonnet 5 im Migrationsleitfaden.

Nächste Schritte

Modellübersicht

Vollständige Spezifikationen und Preise für alle aktuellen Claude-Modelle.

Token-Zählung

Miss deine Prompts mit dem neuen Tokenizer, bevor du migrierst.

Adaptives Denken

Der empfohlene Denkmodus bei Claude Sonnet 5.

Kontextfenster

Wie das 1M-Token-Kontextfenster funktioniert.

Preise

Vollständige Preise, einschließlich der Tarife für Batch-Verarbeitung und Prompt-Caching.

Was this page helpful?

Neues Modell

Verhaltensänderungen

Adaptives Denken standardmäßig aktiviert

Sampling-Parameter werden nicht akzeptiert

Manuelles erweitertes Denken entfernt

Neuer Tokenizer

Von Claude Sonnet 4.6 übernommene API-Einschränkungen

Vorausfüllen der Assistant-Nachricht nicht unterstützt

Verbesserungen der Fähigkeiten

Cybersicherheits-Schutzmaßnahmen

Preise

Verfügbarkeit

Migrationsleitfaden

Nächste Schritte

Neues Modell

Verhaltensänderungen

Adaptives Denken standardmäßig aktiviert

Sampling-Parameter werden nicht akzeptiert

Manuelles erweitertes Denken entfernt

Neuer Tokenizer

Von Claude Sonnet 4.6 übernommene API-Einschränkungen

Vorausfüllen der Assistant-Nachricht nicht unterstützt

Verbesserungen der Fähigkeiten

Cybersicherheits-Schutzmaßnahmen

Preise

Verfügbarkeit

Migrationsleitfaden

Nächste Schritte

Neues Modell

Verhaltensänderungen

Adaptives Denken standardmäßig aktiviert

Sampling-Parameter werden nicht akzeptiert

Manuelles erweitertes Denken entfernt

Neuer Tokenizer

Von Claude Sonnet 4.6 übernommene API-Einschränkungen

Vorausfüllen der Assistant-Nachricht nicht unterstützt

Verbesserungen der Fähigkeiten

Cybersicherheits-Schutzmaßnahmen

Preise

Verfügbarkeit

Migrationsleitfaden

Nächste Schritte

Neues Modell

Verhaltensänderungen

Adaptives Denken standardmäßig aktiviert

Sampling-Parameter werden nicht akzeptiert

Manuelles erweitertes Denken entfernt

Neuer Tokenizer

Von Claude Sonnet 4.6 übernommene API-Einschränkungen

Vorausfüllen der Assistant-Nachricht nicht unterstützt

Verbesserungen der Fähigkeiten

Cybersicherheits-Schutzmaßnahmen

Preise

Verfügbarkeit

Migrationsleitfaden

Nächste Schritte