Modelle & Preise

Migrationsleitfaden

Leitfaden für die Migration zu Claude 4.6-Modellen von früheren Claude-Versionen

Migration zu Claude 4.6

Claude Opus 4.6 ist ein nahezu direkter Ersatz für Claude 4.5 mit einigen Breaking Changes, die Sie beachten sollten. Eine vollständige Liste der neuen Funktionen finden Sie unter Neuerungen in Claude 4.6.

Aktualisieren Sie Ihren Modellnamen

# Opus-Migration
model = "claude-opus-4-5"  # Vorher
model = "claude-opus-4-6"  # Nachher

Breaking Changes

Prefill-Entfernung: Das Prefilling von Assistenten-Nachrichten führt zu einem 400-Fehler bei Claude 4.6-Modellen. Verwenden Sie stattdessen strukturierte Ausgaben, Systemaufforderungs-Anweisungen oder output_config.format.
Tool-Parameter-Anführungszeichen: Claude 4.6-Modelle können leicht unterschiedliche JSON-String-Escaping in Tool-Call-Argumenten erzeugen (z. B. unterschiedliche Behandlung von Unicode-Escapes oder Forward-Slash-Escaping). Wenn Sie Tool-Call-input als rohe Zeichenkette analysieren, anstatt einen JSON-Parser zu verwenden, überprüfen Sie Ihre Parsing-Logik. Standard-JSON-Parser (wie json.loads() oder JSON.parse()) handhaben diese Unterschiede automatisch.

Empfohlene Änderungen

Diese sind nicht erforderlich, verbessern aber Ihre Erfahrung:

Migration zu adaptivem Denken: thinking: {type: "enabled", budget_tokens: N} ist bei Claude 4.6-Modellen veraltet und wird in einer zukünftigen Modellversion entfernt. Wechseln Sie zu thinking: {type: "adaptive"} und verwenden Sie den Effort-Parameter, um die Denktiefe zu steuern. Siehe Adaptives Denken.
```
response = client.beta.messages.create(
    model="claude-opus-4-5",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[...],
)
```
Beachten Sie, dass die Migration auch von client.beta.messages.create zu client.messages.create wechselt. Adaptives Denken und Effort sind GA-Funktionen und erfordern nicht den Beta-SDK-Namespace oder Beta-Header.
Entfernen Sie den Effort-Beta-Header: Der Effort-Parameter ist jetzt GA. Entfernen Sie betas=["effort-2025-11-24"] aus Ihren Anfragen.
Entfernen Sie den Beta-Header für feingranulares Tool-Streaming: Feingranulares Tool-Streaming ist jetzt GA. Entfernen Sie betas=["fine-grained-tool-streaming-2025-05-14"] aus Ihren Anfragen.
Entfernen Sie den Beta-Header für verschachteltes Denken (nur Opus 4.6): Adaptives Denken aktiviert automatisch verschachteltes Denken auf Opus 4.6. Entfernen Sie betas=["interleaved-thinking-2025-05-14"] aus Ihren Opus 4.6-Anfragen. Hinweis: Sonnet 4.6 unterstützt diesen Beta-Header weiterhin mit manuellem erweitertem Denken.
Migration zu output_config.format: Wenn Sie strukturierte Ausgaben verwenden, aktualisieren Sie output_format={...} zu output_config={"format": {...}}. Der alte Parameter bleibt funktionsfähig, ist aber veraltet und wird in einer zukünftigen Modellversion entfernt.

Migration von Claude 4.1 oder früher zu Claude 4.6

Wenn Sie von Opus 4.1, Sonnet 4 oder früheren Modellen direkt zu Claude 4.6 migrieren, wenden Sie die oben genannten Claude 4.6 Breaking Changes sowie die zusätzlichen Änderungen in diesem Abschnitt an.

# Von Opus 4.1
model = "claude-opus-4-1-20250805"  # Vorher
model = "claude-opus-4-6"  # Nachher

# Von Sonnet 4
model = "claude-sonnet-4-20250514"  # Vorher
model = "claude-opus-4-6"  # Nachher

# Von Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Vorher
model = "claude-opus-4-6"  # Nachher

Zusätzliche Breaking Changes

Aktualisieren Sie Sampling-Parameter

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Verwenden Sie nur temperature ODER top_p, nicht beide:

# Vorher - Dies führt zu einem Fehler bei Claude 4+-Modellen
response = client.messages.create(
    model="claude-3-7-sonnet-20250219",
    temperature=0.7,
    top_p=0.9,  # Kann nicht beide verwenden
    # ...
)

# Nachher
response = client.messages.create(
    model="claude-opus-4-6",
    temperature=0.7,  # Verwenden Sie temperature ODER top_p, nicht beide
    # ...
)

Aktualisieren Sie Tool-Versionen

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Aktualisieren Sie auf die neuesten Tool-Versionen. Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet.
```
# Vorher
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]

# Nachher
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
```
- Text-Editor: Verwenden Sie text_editor_20250728 und str_replace_based_edit_tool. Siehe Dokumentation des Text-Editor-Tools für Details.
- Code-Ausführung: Aktualisieren Sie auf code_execution_20250825. Siehe Dokumentation des Code-Ausführungs-Tools für Migrationsanweisungen.

Behandeln Sie den refusal-Stoppgrund

Aktualisieren Sie Ihre Anwendung, um Stoppgründe vom Typ refusal zu behandeln:

response = client.messages.create(...)

if response.stop_reason == "refusal":
    # Behandeln Sie die Ablehnung angemessen
    pass

Behandeln Sie den model_context_window_exceeded-Stoppgrund

Claude 4.5+-Modelle geben einen model_context_window_exceeded-Stoppgrund zurück, wenn die Generierung aufgrund des Erreichens des Kontextfenster-Limits stoppt, anstatt des angeforderten max_tokens-Limits. Aktualisieren Sie Ihre Anwendung, um diesen neuen Stoppgrund zu behandeln:
```
response = client.messages.create(...)

if response.stop_reason == "model_context_window_exceeded":
    # Behandeln Sie das Kontextfenster-Limit angemessen
    pass
```
Überprüfen Sie die Behandlung von Tool-Parametern (nachfolgende Zeilenumbrüche)

Claude 4.5+-Modelle bewahren nachfolgende Zeilenumbrüche in Tool-Call-String-Parametern, die zuvor entfernt wurden. Wenn Ihre Tools auf exakte String-Übereinstimmung mit Tool-Call-Parametern angewiesen sind, überprüfen Sie, ob Ihre Logik nachfolgende Zeilenumbrüche korrekt behandelt.
Aktualisieren Sie Ihre Aufforderungen für Verhaltensänderungen

Claude 4+-Modelle haben einen prägnanten, direkten Kommunikationsstil und erfordern explizite Anweisungen. Lesen Sie Best Practices für Aufforderungen für Optimierungsleitfaden.

Zusätzliche empfohlene Änderungen

Entfernen Sie Legacy-Beta-Header: Entfernen Sie token-efficient-tools-2025-02-19 und output-128k-2025-02-19. Alle Claude 4+-Modelle haben integrierte Token-effiziente Tool-Nutzung und diese Header haben keine Auswirkung.

Claude 4.6-Migrations-Checkliste

Migration zu Claude Sonnet 4.6

Claude Sonnet 4.6 kombiniert starke Intelligenz mit schneller Leistung und bietet verbesserte agentengesteuerte Suchfunktionen und kostenlose Code-Ausführung bei Verwendung mit Web-Suche oder Web-Abruf. Es ist ideal für alltägliche Codierung, Analyse und Inhaltsaufgaben.

Eine vollständige Übersicht der Funktionen finden Sie unter Modellübersicht.

Die Preisgestaltung für Sonnet 4.6 beträgt $3 pro Million Eingabe-Token, $15 pro Million Ausgabe-Token. Siehe Claude-Preisgestaltung für Details.

Aktualisieren Sie Ihren Modellnamen:

# Von Sonnet 4.5
model = "claude-sonnet-4-5"  # Vorher
model = "claude-sonnet-4-6"  # Nachher

# Von Sonnet 4
model = "claude-sonnet-4-20250514"  # Vorher
model = "claude-sonnet-4-6"  # Nachher

Breaking Changes

Bei Migration von Sonnet 4.5

Prefilling von Assistenten-Nachrichten wird nicht mehr unterstützt

Dies ist ein Breaking Change bei der Migration von Sonnet 4.5 oder früher.

Das Prefilling von Assistenten-Nachrichten gibt einen 400-Fehler bei Sonnet 4.6 zurück. Verwenden Sie strukturierte Ausgaben, Systemaufforderungs-Anweisungen oder output_config.format stattdessen.

Häufige Prefill-Anwendungsfälle und Migrationen:
- Kontrolle der Ausgabeformatierung (Erzwingung von JSON/YAML-Ausgabe): Verwenden Sie strukturierte Ausgaben oder Tools mit Enum-Feldern für Klassifizierungsaufgaben.
- Beseitigung von Präambeln (Entfernung von "Hier ist..."-Phrasen): Fügen Sie direkte Anweisungen in die Systemaufforderung ein: "Antworten Sie direkt ohne Präambel. Beginnen Sie nicht mit Phrasen wie 'Hier ist...', 'Basierend auf...', usw."
- Vermeidung schlechter Ablehnungen: Claude ist jetzt viel besser bei angemessenen Ablehnungen. Klare Aufforderungen in der Benutzernachricht ohne Prefill sollten ausreichend sein.
- Fortsetzungen (Fortsetzen unterbrochener Antworten): Verschieben Sie die Fortsetzung zur Benutzernachricht: "Ihre vorherige Antwort wurde unterbrochen und endete mit [previous_response]. Fahren Sie fort, wo Sie aufgehört haben."
- Kontext-Hydration / Rollenkonsistenz (Auffrischung des Kontexts in langen Gesprächen): Injizieren Sie, was zuvor Prefilled-Assistenten-Erinnerungen waren, stattdessen in den Benutzerzug.
Tool-Parameter-JSON-Escaping kann unterschiedlich sein

Dies ist ein Breaking Change bei der Migration von Sonnet 4.5 oder früher.

JSON-String-Escaping in Tool-Parametern kann sich von früheren Modellen unterscheiden. Standard-JSON-Parser handhaben dies automatisch, aber benutzerdefiniertes String-basiertes Parsing kann Aktualisierungen benötigen.

Bei Migration von Claude 3.x

Aktualisieren Sie Sampling-Parameter

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Verwenden Sie nur temperature ODER top_p, nicht beide.
Aktualisieren Sie Tool-Versionen

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Aktualisieren Sie auf die neuesten Tool-Versionen (text_editor_20250728, code_execution_20250825). Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet.
Behandeln Sie den refusal-Stoppgrund

Aktualisieren Sie Ihre Anwendung, um Stoppgründe vom Typ refusal zu behandeln.
Aktualisieren Sie Ihre Aufforderungen für Verhaltensänderungen

Claude 4-Modelle haben einen prägnanten, direkten Kommunikationsstil. Lesen Sie Best Practices für Aufforderungen für Optimierungsleitfaden.

Empfohlene Änderungen

Entfernen Sie den fine-grained-tool-streaming-2025-05-14-Beta-Header — Feingranulares Tool-Streaming ist jetzt GA auf Sonnet 4.6 und erfordert keinen Beta-Header mehr.
Migrieren Sie output_format zu output_config.format — Der output_format-Parameter ist veraltet. Verwenden Sie stattdessen output_config.format.

Migration von Sonnet 4.5

Wir empfehlen dringend, von Sonnet 4.5 zu Sonnet 4.6 zu migrieren, das mehr Intelligenz zum gleichen Preis bietet.

Sonnet 4.6 hat standardmäßig ein Effort-Level von high, im Gegensatz zu Sonnet 4.5, das keinen Effort-Parameter hatte. Wir empfehlen, den Effort-Parameter anzupassen, während Sie von Sonnet 4.5 zu Sonnet 4.6 migrieren. Wenn nicht explizit gesetzt, können Sie mit dem Standard-Effort-Level eine höhere Latenz erleben.

Wenn Sie kein erweitertes Denken verwenden

Wenn Sie kein erweitertes Denken auf Sonnet 4.5 verwenden, können Sie auf Sonnet 4.6 ohne es fortfahren. Sie sollten den Effort explizit auf das für Ihren Anwendungsfall angemessene Level setzen. Bei low-Effort mit deaktiviertem Denken können Sie eine ähnliche oder bessere Leistung im Vergleich zu Sonnet 4.5 ohne erweitertes Denken erwarten.

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Wenn Sie erweitertes Denken verwenden

Wenn Sie erweitertes Denken auf Sonnet 4.5 verwenden, wird es auf Sonnet 4.6 weiterhin unterstützt, ohne dass Änderungen an Ihrer Denk-Konfiguration erforderlich sind. Wir empfehlen, ein Denk-Budget von etwa 16k Token beizubehalten. In der Praxis verwenden die meisten Aufgaben nicht so viel, aber es bietet Spielraum für schwierigere Probleme ohne Risiko unkontrollierter Token-Nutzung.

Codierungs- und agentengesteuerte Anwendungsfälle

Für agentengesteuerte Codierung, Frontend-Design, Tool-intensive Workflows und komplexe Enterprise-Workflows empfehlen wir, mit medium-Effort zu beginnen. Wenn Sie feststellen, dass die Latenz zu hoch ist, erwägen Sie, den Effort auf low zu reduzieren. Wenn Sie höhere Intelligenz benötigen, erwägen Sie, den Effort auf high zu erhöhen oder zu Opus 4.6 zu migrieren.

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Chat- und Nicht-Codierungs-Anwendungsfälle

Für Chat, Inhaltsgenerierung, Suche, Klassifizierung und andere Nicht-Codierungs-Aufgaben empfehlen wir, mit low-Effort mit erweitertem Denken zu beginnen. Wenn Sie mehr Tiefe benötigen, erhöhen Sie den Effort auf medium.

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Wann sollte man adaptives Denken versuchen

Die oben genannten Migrationspfade verwenden erweitertes Denken mit budget_tokens für vorhersehbare Token-Nutzung. Wenn Ihre Workload einem der folgenden Muster entspricht, erwägen Sie, stattdessen adaptives Denken zu versuchen:

Autonome Multi-Step-Agenten: Codierungs-Agenten, die Anforderungen in funktionierende Software umwandeln, Datenanalyse-Pipelines und Bug-Findung, bei denen das Modell unabhängig über viele Schritte läuft. Adaptives Denken ermöglicht es dem Modell, sein Denken pro Schritt zu kalibrieren und über längere Trajektorien auf Kurs zu bleiben. Für diese Workloads beginnen Sie mit high-Effort. Wenn Latenz oder Token-Nutzung ein Problem darstellt, reduzieren Sie auf medium.
Computer-Use-Agenten: Sonnet 4.6 erzielte beste Genauigkeit bei Computer-Use-Evaluationen im adaptiven Modus.
Bimodale Workloads: eine Mischung aus einfachen und schwierigen Aufgaben, bei denen adaptiv das Denken bei einfachen Abfragen überspringt und bei komplexen tief nachdenkt.

Wenn Sie adaptives Denken verwenden, evaluieren Sie medium und high-Effort auf Ihren Aufgaben. Das richtige Level hängt vom Tradeoff Ihrer Workload zwischen Qualität, Latenz und Token-Nutzung ab.

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Wenn Sie inkonsistentes Verhalten oder Qualitätsrückgänge mit adaptivem Denken sehen, wechseln Sie zu erweitertem Denken mit budget_tokens. Dies bietet vorhersehbarere Ergebnisse mit einer Obergrenze für Denk-Kosten.

Sonnet 4.6-Migrations-Checkliste

Migration zu Claude Sonnet 4.5

Claude Sonnet 4.5 kombiniert starke Intelligenz mit schneller Leistung und ist ideal für alltägliche Codierung, Analyse und Inhaltsaufgaben.

Eine vollständige Übersicht der Funktionen finden Sie unter Modellübersicht.

Die Preisgestaltung für Sonnet 4.5 beträgt $3 pro Million Eingabe-Token, $15 pro Million Ausgabe-Token. Siehe Claude-Preisgestaltung für Details.

Aktualisieren Sie Ihren Modellnamen:

# Von Sonnet 4
model = "claude-sonnet-4-20250514"  # Vorher
model = "claude-sonnet-4-5-20250929"  # Nachher

# Von Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Vorher
model = "claude-sonnet-4-5-20250929"  # Nachher

Breaking Changes

Diese Breaking Changes gelten bei der Migration von Claude 3.x Sonnet-Modellen.

Aktualisieren Sie Sampling-Parameter

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Verwenden Sie nur temperature ODER top_p, nicht beide.
Aktualisieren Sie Tool-Versionen

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Aktualisieren Sie auf die neuesten Tool-Versionen (text_editor_20250728, code_execution_20250825). Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet.
Behandeln Sie den refusal-Stoppgrund

Aktualisieren Sie Ihre Anwendung, um Stoppgründe vom Typ refusal zu behandeln.
Aktualisieren Sie Ihre Aufforderungen für Verhaltensänderungen

Claude 4-Modelle haben einen prägnanten, direkten Kommunikationsstil. Lesen Sie Best Practices für Aufforderungen für Optimierungsleitfaden.

Sonnet 4.5-Migrations-Checkliste

Aktualisieren Sie die Modell-ID auf claude-sonnet-4-5-20250929
BREAKING: Aktualisieren Sie Tool-Versionen auf die neuesten (text_editor_20250728, code_execution_20250825); Legacy-Versionen werden nicht unterstützt (falls Migration von 3.x)
BREAKING: Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet (falls zutreffend)
BREAKING: Aktualisieren Sie Sampling-Parameter, um nur temperature ODER top_p zu verwenden, nicht beide (falls Migration von 3.x)
Behandeln Sie neuen refusal-Stoppgrund in Ihrer Anwendung
Überprüfen und aktualisieren Sie Aufforderungen gemäß Best Practices für Aufforderungen
Erwägen Sie, erweitertes Denken für komplexe Denkaufgaben zu aktivieren
Testen Sie in der Entwicklungsumgebung vor der Produktionsbereitstellung

Migration zu Claude Haiku 4.5

Claude Haiku 4.5 ist das schnellste und intelligenteste Haiku-Modell mit nahezu Frontier-Leistung und bietet Premium-Modellqualität für interaktive Anwendungen und Hochvolumen-Verarbeitung.

Eine vollständige Übersicht der Funktionen finden Sie unter Modellübersicht.

Die Preisgestaltung für Haiku 4.5 beträgt $1 pro Million Eingabe-Token, $5 pro Million Ausgabe-Token. Siehe Claude-Preisgestaltung für Details.

Aktualisieren Sie Ihren Modellnamen:

# Von Haiku 3.5
model = "claude-3-5-haiku-20241022"  # Vorher
model = "claude-haiku-4-5-20251001"  # Nachher

Überprüfen Sie neue Rate Limits: Haiku 4.5 hat separate Rate Limits von Haiku 3.5. Siehe Rate Limits-Dokumentation für Details.

Für erhebliche Leistungsverbesserungen bei Codierungs- und Denkaufgaben erwägen Sie, erweitertes Denken mit thinking: {type: "enabled", budget_tokens: N} zu aktivieren.

Erweitertes Denken wirkt sich auf die Effizienz des Prompt-Cachings aus.

Erweitertes Denken ist in Claude 4.6 oder neueren Modellen veraltet. Wenn Sie neuere Modelle verwenden, verwenden Sie stattdessen adaptives Denken.

Erkunden Sie neue Funktionen: Siehe Modellübersicht für Details zu Kontextbewusstsein, erhöhter Ausgabekapazität (64K Token), höherer Intelligenz und verbesserter Geschwindigkeit.

Breaking Changes

Diese Breaking Changes gelten bei der Migration von Claude 3.x Haiku-Modellen.

Aktualisieren Sie Sampling-Parameter

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Verwenden Sie nur temperature ODER top_p, nicht beide.
Aktualisieren Sie Tool-Versionen

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Aktualisieren Sie auf die neuesten Tool-Versionen (text_editor_20250728, code_execution_20250825). Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet.
Behandeln Sie den refusal-Stoppgrund

Aktualisieren Sie Ihre Anwendung, um Stoppgründe vom Typ refusal zu behandeln.
Aktualisieren Sie Ihre Aufforderungen für Verhaltensänderungen

Claude 4-Modelle haben einen prägnanten, direkten Kommunikationsstil. Lesen Sie Best Practices für Aufforderungen für Optimierungsleitfaden.

Haiku 4.5-Migrations-Checkliste

Aktualisieren Sie die Modell-ID auf claude-haiku-4-5-20251001
BREAKING: Aktualisieren Sie Tool-Versionen auf die neuesten (text_editor_20250728, code_execution_20250825); Legacy-Versionen werden nicht unterstützt
BREAKING: Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet (falls zutreffend)
BREAKING: Aktualisieren Sie Sampling-Parameter, um nur temperature ODER top_p zu verwenden, nicht beide
Behandeln Sie neuen refusal-Stoppgrund in Ihrer Anwendung
Überprüfen und passen Sie sich an neue Rate Limits an (getrennt von Haiku 3.5)
Überprüfen und aktualisieren Sie Aufforderungen gemäß Best Practices für Aufforderungen
Erwägen Sie, erweitertes Denken für komplexe Denkaufgaben zu aktivieren
Testen Sie in der Entwicklungsumgebung vor der Produktionsbereitstellung

Benötigen Sie Hilfe?

Überprüfen Sie die API-Dokumentation für detaillierte Spezifikationen
Überprüfen Sie Modell-Funktionen für Leistungsvergleiche
Überprüfen Sie API-Versionshinweise für API-Updates
Kontaktieren Sie den Support, wenn Sie während der Migration auf Probleme stoßen

Was this page helpful?

Modelle & Preise

Migrationsleitfaden

Leitfaden für die Migration zu Claude 4.6-Modellen von früheren Claude-Versionen

Migration zu Claude 4.6

Aktualisieren Sie Ihren Modellnamen

# Opus-Migration
model = "claude-opus-4-5"  # Vorher
model = "claude-opus-4-6"  # Nachher

Breaking Changes

Prefill-Entfernung: Das Prefilling von Assistenten-Nachrichten führt zu einem 400-Fehler bei Claude 4.6-Modellen. Verwenden Sie stattdessen strukturierte Ausgaben, Systemaufforderungs-Anweisungen oder output_config.format.
Tool-Parameter-Anführungszeichen: Claude 4.6-Modelle können leicht unterschiedliche JSON-String-Escaping in Tool-Call-Argumenten erzeugen (z. B. unterschiedliche Behandlung von Unicode-Escapes oder Forward-Slash-Escaping). Wenn Sie Tool-Call-input als rohe Zeichenkette analysieren, anstatt einen JSON-Parser zu verwenden, überprüfen Sie Ihre Parsing-Logik. Standard-JSON-Parser (wie json.loads() oder JSON.parse()) handhaben diese Unterschiede automatisch.

Empfohlene Änderungen

Diese sind nicht erforderlich, verbessern aber Ihre Erfahrung:

Migration zu adaptivem Denken: thinking: {type: "enabled", budget_tokens: N} ist bei Claude 4.6-Modellen veraltet und wird in einer zukünftigen Modellversion entfernt. Wechseln Sie zu thinking: {type: "adaptive"} und verwenden Sie den Effort-Parameter, um die Denktiefe zu steuern. Siehe Adaptives Denken.
```
response = client.beta.messages.create(
    model="claude-opus-4-5",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[...],
)
```
Beachten Sie, dass die Migration auch von client.beta.messages.create zu client.messages.create wechselt. Adaptives Denken und Effort sind GA-Funktionen und erfordern nicht den Beta-SDK-Namespace oder Beta-Header.
Entfernen Sie den Effort-Beta-Header: Der Effort-Parameter ist jetzt GA. Entfernen Sie betas=["effort-2025-11-24"] aus Ihren Anfragen.
Entfernen Sie den Beta-Header für feingranulares Tool-Streaming: Feingranulares Tool-Streaming ist jetzt GA. Entfernen Sie betas=["fine-grained-tool-streaming-2025-05-14"] aus Ihren Anfragen.
Entfernen Sie den Beta-Header für verschachteltes Denken (nur Opus 4.6): Adaptives Denken aktiviert automatisch verschachteltes Denken auf Opus 4.6. Entfernen Sie betas=["interleaved-thinking-2025-05-14"] aus Ihren Opus 4.6-Anfragen. Hinweis: Sonnet 4.6 unterstützt diesen Beta-Header weiterhin mit manuellem erweitertem Denken.
Migration zu output_config.format: Wenn Sie strukturierte Ausgaben verwenden, aktualisieren Sie output_format={...} zu output_config={"format": {...}}. Der alte Parameter bleibt funktionsfähig, ist aber veraltet und wird in einer zukünftigen Modellversion entfernt.

Migration von Claude 4.1 oder früher zu Claude 4.6

# Von Opus 4.1
model = "claude-opus-4-1-20250805"  # Vorher
model = "claude-opus-4-6"  # Nachher

# Von Sonnet 4
model = "claude-sonnet-4-20250514"  # Vorher
model = "claude-opus-4-6"  # Nachher

# Von Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Vorher
model = "claude-opus-4-6"  # Nachher

Zusätzliche Breaking Changes

Aktualisieren Sie Sampling-Parameter

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Verwenden Sie nur temperature ODER top_p, nicht beide:

# Vorher - Dies führt zu einem Fehler bei Claude 4+-Modellen
response = client.messages.create(
    model="claude-3-7-sonnet-20250219",
    temperature=0.7,
    top_p=0.9,  # Kann nicht beide verwenden
    # ...
)

# Nachher
response = client.messages.create(
    model="claude-opus-4-6",
    temperature=0.7,  # Verwenden Sie temperature ODER top_p, nicht beide
    # ...
)

Aktualisieren Sie Tool-Versionen

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Aktualisieren Sie auf die neuesten Tool-Versionen. Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet.
```
# Vorher
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]

# Nachher
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
```
- Text-Editor: Verwenden Sie text_editor_20250728 und str_replace_based_edit_tool. Siehe Dokumentation des Text-Editor-Tools für Details.
- Code-Ausführung: Aktualisieren Sie auf code_execution_20250825. Siehe Dokumentation des Code-Ausführungs-Tools für Migrationsanweisungen.

Behandeln Sie den refusal-Stoppgrund

Aktualisieren Sie Ihre Anwendung, um Stoppgründe vom Typ refusal zu behandeln:

response = client.messages.create(...)

if response.stop_reason == "refusal":
    # Behandeln Sie die Ablehnung angemessen
    pass

Behandeln Sie den model_context_window_exceeded-Stoppgrund

Claude 4.5+-Modelle geben einen model_context_window_exceeded-Stoppgrund zurück, wenn die Generierung aufgrund des Erreichens des Kontextfenster-Limits stoppt, anstatt des angeforderten max_tokens-Limits. Aktualisieren Sie Ihre Anwendung, um diesen neuen Stoppgrund zu behandeln:
```
response = client.messages.create(...)

if response.stop_reason == "model_context_window_exceeded":
    # Behandeln Sie das Kontextfenster-Limit angemessen
    pass
```
Überprüfen Sie die Behandlung von Tool-Parametern (nachfolgende Zeilenumbrüche)

Claude 4.5+-Modelle bewahren nachfolgende Zeilenumbrüche in Tool-Call-String-Parametern, die zuvor entfernt wurden. Wenn Ihre Tools auf exakte String-Übereinstimmung mit Tool-Call-Parametern angewiesen sind, überprüfen Sie, ob Ihre Logik nachfolgende Zeilenumbrüche korrekt behandelt.
Aktualisieren Sie Ihre Aufforderungen für Verhaltensänderungen

Claude 4+-Modelle haben einen prägnanten, direkten Kommunikationsstil und erfordern explizite Anweisungen. Lesen Sie Best Practices für Aufforderungen für Optimierungsleitfaden.

Zusätzliche empfohlene Änderungen

Entfernen Sie Legacy-Beta-Header: Entfernen Sie token-efficient-tools-2025-02-19 und output-128k-2025-02-19. Alle Claude 4+-Modelle haben integrierte Token-effiziente Tool-Nutzung und diese Header haben keine Auswirkung.

Claude 4.6-Migrations-Checkliste

Migration zu Claude Sonnet 4.6

Eine vollständige Übersicht der Funktionen finden Sie unter Modellübersicht.

Die Preisgestaltung für Sonnet 4.6 beträgt $3 pro Million Eingabe-Token, $15 pro Million Ausgabe-Token. Siehe Claude-Preisgestaltung für Details.

Aktualisieren Sie Ihren Modellnamen:

# Von Sonnet 4.5
model = "claude-sonnet-4-5"  # Vorher
model = "claude-sonnet-4-6"  # Nachher

# Von Sonnet 4
model = "claude-sonnet-4-20250514"  # Vorher
model = "claude-sonnet-4-6"  # Nachher

Breaking Changes

Bei Migration von Sonnet 4.5

Prefilling von Assistenten-Nachrichten wird nicht mehr unterstützt

Dies ist ein Breaking Change bei der Migration von Sonnet 4.5 oder früher.

Das Prefilling von Assistenten-Nachrichten gibt einen 400-Fehler bei Sonnet 4.6 zurück. Verwenden Sie strukturierte Ausgaben, Systemaufforderungs-Anweisungen oder output_config.format stattdessen.

Häufige Prefill-Anwendungsfälle und Migrationen:
- Kontrolle der Ausgabeformatierung (Erzwingung von JSON/YAML-Ausgabe): Verwenden Sie strukturierte Ausgaben oder Tools mit Enum-Feldern für Klassifizierungsaufgaben.
- Beseitigung von Präambeln (Entfernung von "Hier ist..."-Phrasen): Fügen Sie direkte Anweisungen in die Systemaufforderung ein: "Antworten Sie direkt ohne Präambel. Beginnen Sie nicht mit Phrasen wie 'Hier ist...', 'Basierend auf...', usw."
- Vermeidung schlechter Ablehnungen: Claude ist jetzt viel besser bei angemessenen Ablehnungen. Klare Aufforderungen in der Benutzernachricht ohne Prefill sollten ausreichend sein.
- Fortsetzungen (Fortsetzen unterbrochener Antworten): Verschieben Sie die Fortsetzung zur Benutzernachricht: "Ihre vorherige Antwort wurde unterbrochen und endete mit [previous_response]. Fahren Sie fort, wo Sie aufgehört haben."
- Kontext-Hydration / Rollenkonsistenz (Auffrischung des Kontexts in langen Gesprächen): Injizieren Sie, was zuvor Prefilled-Assistenten-Erinnerungen waren, stattdessen in den Benutzerzug.
Tool-Parameter-JSON-Escaping kann unterschiedlich sein

Dies ist ein Breaking Change bei der Migration von Sonnet 4.5 oder früher.

JSON-String-Escaping in Tool-Parametern kann sich von früheren Modellen unterscheiden. Standard-JSON-Parser handhaben dies automatisch, aber benutzerdefiniertes String-basiertes Parsing kann Aktualisierungen benötigen.

Bei Migration von Claude 3.x

Aktualisieren Sie Sampling-Parameter

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Verwenden Sie nur temperature ODER top_p, nicht beide.
Aktualisieren Sie Tool-Versionen

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Aktualisieren Sie auf die neuesten Tool-Versionen (text_editor_20250728, code_execution_20250825). Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet.
Behandeln Sie den refusal-Stoppgrund

Aktualisieren Sie Ihre Anwendung, um Stoppgründe vom Typ refusal zu behandeln.
Aktualisieren Sie Ihre Aufforderungen für Verhaltensänderungen

Claude 4-Modelle haben einen prägnanten, direkten Kommunikationsstil. Lesen Sie Best Practices für Aufforderungen für Optimierungsleitfaden.

Empfohlene Änderungen

Entfernen Sie den fine-grained-tool-streaming-2025-05-14-Beta-Header — Feingranulares Tool-Streaming ist jetzt GA auf Sonnet 4.6 und erfordert keinen Beta-Header mehr.
Migrieren Sie output_format zu output_config.format — Der output_format-Parameter ist veraltet. Verwenden Sie stattdessen output_config.format.

Migration von Sonnet 4.5

Wir empfehlen dringend, von Sonnet 4.5 zu Sonnet 4.6 zu migrieren, das mehr Intelligenz zum gleichen Preis bietet.

Wenn Sie kein erweitertes Denken verwenden

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Wenn Sie erweitertes Denken verwenden

Codierungs- und agentengesteuerte Anwendungsfälle

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Chat- und Nicht-Codierungs-Anwendungsfälle

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Wann sollte man adaptives Denken versuchen

Autonome Multi-Step-Agenten: Codierungs-Agenten, die Anforderungen in funktionierende Software umwandeln, Datenanalyse-Pipelines und Bug-Findung, bei denen das Modell unabhängig über viele Schritte läuft. Adaptives Denken ermöglicht es dem Modell, sein Denken pro Schritt zu kalibrieren und über längere Trajektorien auf Kurs zu bleiben. Für diese Workloads beginnen Sie mit high-Effort. Wenn Latenz oder Token-Nutzung ein Problem darstellt, reduzieren Sie auf medium.
Computer-Use-Agenten: Sonnet 4.6 erzielte beste Genauigkeit bei Computer-Use-Evaluationen im adaptiven Modus.
Bimodale Workloads: eine Mischung aus einfachen und schwierigen Aufgaben, bei denen adaptiv das Denken bei einfachen Abfragen überspringt und bei komplexen tief nachdenkt.

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Sonnet 4.6-Migrations-Checkliste

Migration zu Claude Sonnet 4.5

Claude Sonnet 4.5 kombiniert starke Intelligenz mit schneller Leistung und ist ideal für alltägliche Codierung, Analyse und Inhaltsaufgaben.

Eine vollständige Übersicht der Funktionen finden Sie unter Modellübersicht.

Die Preisgestaltung für Sonnet 4.5 beträgt $3 pro Million Eingabe-Token, $15 pro Million Ausgabe-Token. Siehe Claude-Preisgestaltung für Details.

Aktualisieren Sie Ihren Modellnamen:

# Von Sonnet 4
model = "claude-sonnet-4-20250514"  # Vorher
model = "claude-sonnet-4-5-20250929"  # Nachher

# Von Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Vorher
model = "claude-sonnet-4-5-20250929"  # Nachher

Breaking Changes

Diese Breaking Changes gelten bei der Migration von Claude 3.x Sonnet-Modellen.

Aktualisieren Sie Sampling-Parameter

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Verwenden Sie nur temperature ODER top_p, nicht beide.
Aktualisieren Sie Tool-Versionen

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Aktualisieren Sie auf die neuesten Tool-Versionen (text_editor_20250728, code_execution_20250825). Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet.
Behandeln Sie den refusal-Stoppgrund

Aktualisieren Sie Ihre Anwendung, um Stoppgründe vom Typ refusal zu behandeln.
Aktualisieren Sie Ihre Aufforderungen für Verhaltensänderungen

Claude 4-Modelle haben einen prägnanten, direkten Kommunikationsstil. Lesen Sie Best Practices für Aufforderungen für Optimierungsleitfaden.

Sonnet 4.5-Migrations-Checkliste

Aktualisieren Sie die Modell-ID auf claude-sonnet-4-5-20250929
BREAKING: Aktualisieren Sie Tool-Versionen auf die neuesten (text_editor_20250728, code_execution_20250825); Legacy-Versionen werden nicht unterstützt (falls Migration von 3.x)
BREAKING: Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet (falls zutreffend)
BREAKING: Aktualisieren Sie Sampling-Parameter, um nur temperature ODER top_p zu verwenden, nicht beide (falls Migration von 3.x)
Behandeln Sie neuen refusal-Stoppgrund in Ihrer Anwendung
Überprüfen und aktualisieren Sie Aufforderungen gemäß Best Practices für Aufforderungen
Erwägen Sie, erweitertes Denken für komplexe Denkaufgaben zu aktivieren
Testen Sie in der Entwicklungsumgebung vor der Produktionsbereitstellung

Migration zu Claude Haiku 4.5

Claude Haiku 4.5 ist das schnellste und intelligenteste Haiku-Modell mit nahezu Frontier-Leistung und bietet Premium-Modellqualität für interaktive Anwendungen und Hochvolumen-Verarbeitung.

Eine vollständige Übersicht der Funktionen finden Sie unter Modellübersicht.

Die Preisgestaltung für Haiku 4.5 beträgt $1 pro Million Eingabe-Token, $5 pro Million Ausgabe-Token. Siehe Claude-Preisgestaltung für Details.

Aktualisieren Sie Ihren Modellnamen:

# Von Haiku 3.5
model = "claude-3-5-haiku-20241022"  # Vorher
model = "claude-haiku-4-5-20251001"  # Nachher

Überprüfen Sie neue Rate Limits: Haiku 4.5 hat separate Rate Limits von Haiku 3.5. Siehe Rate Limits-Dokumentation für Details.

Für erhebliche Leistungsverbesserungen bei Codierungs- und Denkaufgaben erwägen Sie, erweitertes Denken mit thinking: {type: "enabled", budget_tokens: N} zu aktivieren.

Erweitertes Denken wirkt sich auf die Effizienz des Prompt-Cachings aus.

Erweitertes Denken ist in Claude 4.6 oder neueren Modellen veraltet. Wenn Sie neuere Modelle verwenden, verwenden Sie stattdessen adaptives Denken.

Erkunden Sie neue Funktionen: Siehe Modellübersicht für Details zu Kontextbewusstsein, erhöhter Ausgabekapazität (64K Token), höherer Intelligenz und verbesserter Geschwindigkeit.

Breaking Changes

Diese Breaking Changes gelten bei der Migration von Claude 3.x Haiku-Modellen.

Aktualisieren Sie Sampling-Parameter

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Verwenden Sie nur temperature ODER top_p, nicht beide.
Aktualisieren Sie Tool-Versionen

Dies ist ein Breaking Change bei der Migration von Claude 3.x-Modellen.

Aktualisieren Sie auf die neuesten Tool-Versionen (text_editor_20250728, code_execution_20250825). Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet.
Behandeln Sie den refusal-Stoppgrund

Aktualisieren Sie Ihre Anwendung, um Stoppgründe vom Typ refusal zu behandeln.
Aktualisieren Sie Ihre Aufforderungen für Verhaltensänderungen

Claude 4-Modelle haben einen prägnanten, direkten Kommunikationsstil. Lesen Sie Best Practices für Aufforderungen für Optimierungsleitfaden.

Haiku 4.5-Migrations-Checkliste

Aktualisieren Sie die Modell-ID auf claude-haiku-4-5-20251001
BREAKING: Aktualisieren Sie Tool-Versionen auf die neuesten (text_editor_20250728, code_execution_20250825); Legacy-Versionen werden nicht unterstützt
BREAKING: Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet (falls zutreffend)
BREAKING: Aktualisieren Sie Sampling-Parameter, um nur temperature ODER top_p zu verwenden, nicht beide
Behandeln Sie neuen refusal-Stoppgrund in Ihrer Anwendung
Überprüfen und passen Sie sich an neue Rate Limits an (getrennt von Haiku 3.5)
Überprüfen und aktualisieren Sie Aufforderungen gemäß Best Practices für Aufforderungen
Erwägen Sie, erweitertes Denken für komplexe Denkaufgaben zu aktivieren
Testen Sie in der Entwicklungsumgebung vor der Produktionsbereitstellung

Benötigen Sie Hilfe?

Überprüfen Sie die API-Dokumentation für detaillierte Spezifikationen
Überprüfen Sie Modell-Funktionen für Leistungsvergleiche
Überprüfen Sie API-Versionshinweise für API-Updates
Kontaktieren Sie den Support, wenn Sie während der Migration auf Probleme stoßen

Was this page helpful?