Was this page helpful?
Dieser Leitfaden behandelt die Migration von Messages API Code. Wenn Sie Claude Managed Agents verwenden, sind keine Änderungen erforderlich, außer der Aktualisierung des Modellnamens.
Claude Opus 4.7 ist unser bisher leistungsfähigstes allgemein verfügbares Modell. Es ist hochgradig autonom und erbringt außergewöhnliche Leistungen bei langfristigen agentischen Aufgaben, Wissensarbeit, Vision-Aufgaben und Memory-Aufgaben. Claude Opus 4.7 sollte eine starke sofort einsatzbereite Leistung bei bestehenden Claude Opus 4.6 Prompts und Evaluierungen zum gleichen Preis von $5 / $25 pro MTok aufweisen, aber es gibt eine Handvoll Verhaltens- und API-Änderungen, die Sie bei der Migration kennen sollten. Es unterstützt die gleiche Funktionspalette wie Claude Opus 4.6, einschließlich des 1M Token Kontextfensters zu Standard-API-Preisen ohne Long-Context-Aufschlag, 128k maximale Ausgabe-Token, adaptives Denken, Prompt-Caching, Batch-Verarbeitung, Files API, PDF-Unterstützung, Vision und der vollständigen Palette von serverseitigen und clientseitigen Tools (Bash, Code-Ausführung, Computer Use, Text-Editor, Web-Suche, Web-Abruf, MCP-Connector, Memory).
Automatisieren Sie diese Migration mit der Claude API Skill. Führen Sie in Claude Code /claude-api migrate aus, um die gebündelte Claude API Skill aufzurufen:
/claude-api migrate this project to claude-opus-4-7Die Skill wendet den Modell-ID-Austausch, Breaking-Parameter-Änderungen, Prefill-Ersetzung und Effort-Kalibrierung, die unten beschrieben sind, auf Ihre gesamte Codebasis an und erstellt dann eine Checkliste von Elementen zur manuellen Überprüfung. Sie werden aufgefordert, den Migrationsumfang (gesamtes Arbeitsverzeichnis, ein Unterverzeichnis oder eine spezifische Dateiliste) zu bestätigen, bevor Dateien bearbeitet werden.
# Opus Migration
model = "claude-opus-4-6" # Vorher
model = "claude-opus-4-7" # NachherExtended Thinking entfernt: thinking: {type: "enabled", budget_tokens: N} wird auf Claude Opus 4.7 oder späteren Modellen nicht mehr unterstützt und gibt einen 400-Fehler zurück. Wechseln Sie zu adaptivem Denken (thinking: {type: "adaptive"}) und verwenden Sie den Effort-Parameter, um die Denktiefe zu steuern. Adaptives Denken ist standardmäßig deaktiviert auf Claude Opus 4.7: Anfragen ohne thinking Feld laufen ohne Denken, was dem Opus 4.6 Verhalten entspricht. Setzen Sie thinking: {type: "adaptive"} explizit, um es zu aktivieren.
Vorher (Claude Opus 4.6):
client.messages.create(
model="claude-opus-4-6",
max_tokens=64000,
thinking={"type": "enabled", "budget_tokens": 32000},
messages=[{"role": "user", "content": "..."}],
)Der Effort-Parameter ermöglicht es Ihnen, Claudes Intelligenz vs. Token-Ausgaben abzuwägen und Fähigkeit gegen schnellere Geschwindigkeit und niedrigere Kosten zu tauschen. Beginnen Sie mit dem neuen xhigh Effort-Level für Coding- und agentische Anwendungsfälle, und verwenden Sie mindestens high Effort für die meisten intelligenzempfindlichen Anwendungsfälle. Experimentieren Sie mit anderen Effort-Levels, um die Token-Nutzung und Intelligenz weiter abzustimmen:
max: Max Effort kann in einigen Anwendungsfällen Leistungsgewinne liefern, kann aber abnehmende Erträge aus erhöhter Token-Nutzung zeigen. Diese Einstellung kann auch manchmal zu Überdenken neigen. Wir empfehlen, Max Effort für intelligenzfordernde Aufgaben zu testen.xhigh (neu): Extra hoher Effort ist die beste Einstellung für die meisten Coding- und agentischen Anwendungsfälle.high: Diese Einstellung balanciert Token-Nutzung und Intelligenz. Für die meisten intelligenzempfindlichen Anwendungsfälle empfehlen wir mindestens high Effort.medium: Gut für kostensensitive Anwendungsfälle, die Token-Nutzung reduzieren müssen, während sie Intelligenz opfern.low: Reservieren Sie für kurze, begrenzte Aufgaben und latenzempfindliche Workloads, die nicht intelligenzempfindlich sind.Wir erwarten, dass Effort für dieses Modell wichtiger ist als für jedes vorherige Opus, und empfehlen, aktiv damit zu experimentieren, wenn Sie upgraden.
Claude Opus 4.7 hat mehrere Verhaltensunterschiede zu Claude Opus 4.6, die keine API-Breaking-Changes sind, aber möglicherweise Prompt-Updates oder Scaffolding-Entfernung erfordern.
Antwortlänge variiert je nach Anwendungsfall: Claude Opus 4.7 kalibriert die Antwortlänge danach, wie komplex es die Aufgabe beurteilt, anstatt auf eine feste Ausführlichkeit zu standardisieren. Dies bedeutet normalerweise kürzere Antworten bei einfachen Lookups und viel längere bei offenen Analysen. Wenn Ihr Produkt von einem bestimmten Stil oder einer bestimmten Ausführlichkeit der Ausgabe abhängt, müssen Sie möglicherweise Ihre Prompts abstimmen. Zum Beispiel, um Ausführlichkeit zu verringern, könnten Sie hinzufügen: "Geben Sie prägnante, fokussierte Antworten. Überspringen Sie nicht wesentliche Kontexte und halten Sie Beispiele minimal." Wenn Sie spezifische Beispiele von Arten von Ausführlichkeit sehen (d.h. Übererklärung), können Sie zusätzliche Anweisungen in Ihrem Prompt hinzufügen, um sie zu verhindern. Positive Beispiele, die zeigen, wie Claude mit dem angemessenen Maß an Prägnanz kommunizieren kann, sind normalerweise effektiver als negative Beispiele oder Anweisungen, die dem Modell sagen, was es nicht tun soll.
Literalere Befolgung von Anweisungen: Claude Opus 4.7 interpretiert Prompts literaler und expliziter als Claude Opus 4.6, besonders bei niedrigeren Effort-Levels. Es wird eine Anweisung nicht stillschweigend von einem Element auf ein anderes verallgemeinern, und es wird Anfragen, die Sie nicht gestellt haben, nicht ableiten. Der Vorteil dieser Literalität ist Präzision und weniger Durcheinander. Es funktioniert generell besser für API-Anwendungsfälle mit sorgfältig abgestimmten Prompts, strukturierter Extraktion und Pipelines, wo Sie vorhersehbares Verhalten wünschen. Eine Überprüfung von Prompt und Harness kann besonders hilfreich für die Migration zu Claude Opus 4.7 sein.
Direkterer Ton: Wie bei jedem neuen Modell kann sich der Prosa-Stil bei längeren Texten verschieben. Claude Opus 4.7 ist direkter und eigensinniger, mit weniger validierungsgerichteter Formulierung und weniger Emojis als Claudes wärmerer Stil von Opus 4.6. Wenn Ihr Produkt auf eine bestimmte Stimme angewiesen ist, bewerten Sie Style-Prompts gegen die neue Baseline neu.
Diese sind nicht erforderlich, werden aber Ihre Erfahrung verbessern:
Re-evaluieren Sie max_tokens: Da der gleiche Text auf Claude Opus 4.7 eine höhere Token-Anzahl erzeugt, empfehlen wir, Ihre max_tokens Parameter zu aktualisieren, um zusätzlichen Spielraum zu geben, einschließlich Kompaktierungsauslöser. Prompting-Interventionen, task_budget und effort können helfen, Kosten zu kontrollieren und angemessene Token-Nutzung sicherzustellen.
Audit Token-Zähl-Erwartungen: Jeder Code-Pfad, der Token client-seitig schätzt oder ein festes Token-zu-Zeichen-Verhältnis annimmt, sollte gegen Claude Opus 4.7 neu getestet werden. Verwenden Sie den Token-Zähl-Endpunkt, um zu überprüfen.
Adoptieren Sie Task Budgets (Beta): Claude Opus 4.7 führt Task Budgets ein. Diese Budgets ermöglichen es Ihnen, Claude mitzuteilen, wie viele Token es für eine vollständige agentische Schleife hat, einschließlich Denken, Tool-Aufrufe, Tool-Ergebnisse und endgültige Ausgabe. Das Modell sieht einen laufenden Countdown und nutzt ihn, um Arbeit zu priorisieren und die Aufgabe elegant zu beenden, wenn das Budget verbraucht ist. Um zu verwenden, setzen Sie den Beta-Header task-budgets-2026-03-13 und fügen Sie Folgendes zu Ihrer Output-Konfiguration hinzu:
claude-opus-4-6 zu claude-opus-4-7 (oder aktualisieren Sie Aliase).temperature, top_p und top_k aus Request-Payloads.thinking: {type: "enabled", budget_tokens: N} durch thinking: {type: "adaptive"} plus den Effort-Parameter.Wenn Sie von Claude Opus 4.5, Opus 4.1 oder einem früheren Modell direkt zu Claude Opus 4.7 migrieren, wenden Sie alle Opus 4.7 Änderungen oben plus die kumulativen Änderungen in diesem Abschnitt an, die zwischen Opus 4.5 und Opus 4.7 wirksam wurden. Wenn Sie von Opus 4.6 migrieren, benötigen Sie nur den Opus 4.7 Abschnitt oben.
# Opus Migration
model = "claude-opus-4-5" # Vorher
model = "claude-opus-4-7" # NachherPrefill-Entfernung wird in den Opus 4.7 Breaking Changes oben behandelt.
Tool-Parameter-Quoting: Claude Opus 4.6 und später Modelle können leicht unterschiedliches JSON-String-Escaping in Tool-Aufruf-Argumenten erzeugen (z.B. unterschiedliche Behandlung von Unicode-Escapes oder Forward-Slash-Escaping). Wenn Sie Tool-Aufruf input als rohe Zeichenkette analysieren, anstatt einen JSON-Parser zu verwenden, überprüfen Sie Ihre Parsing-Logik. Standard-JSON-Parser (wie json.loads() oder JSON.parse()) handhaben diese Unterschiede automatisch.
Diese Änderungen verbessern Ihre Erfahrung auf Opus 4.7. Elemente, die mit (erforderlich auf Opus 4.7) gekennzeichnet sind, waren optionale Empfehlungen, als Opus 4.6 gestartet wurde, sind aber jetzt obligatorisch; der Rest bleibt empfohlen.
Migration zu adaptivem Denken (erforderlich auf Opus 4.7): thinking: {type: "enabled", budget_tokens: N} gibt einen 400-Fehler auf Claude Opus 4.7 zurück. Wechseln Sie zu thinking: {type: "adaptive"} und verwenden Sie den Effort-Parameter, um die Denktiefe zu steuern. Siehe Adaptives Denken.
Wenn Sie von Opus 4.1, Sonnet 4 (veraltet) oder früheren Modellen direkt zu Claude Opus 4.7 migrieren, wenden Sie die Claude Opus 4.7 Änderungen am Anfang dieses Leitfadens und die kumulativen Änderungen oben plus die zusätzlichen Änderungen in diesem Abschnitt an.
# Von Opus 4.1
model = "claude-opus-4-1-20250805" # Vorher
model = "claude-opus-4-7" # Nachher
# Von Sonnet 4
model = "claude-sonnet-4-20250514" # Vorher
model = "claude-opus-4-7" # Nachher
# Von Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Vorher
model = "claude-opus-4-7" # NachherEntfernen Sie Sampling-Parameter
Dies ist ein Breaking Change bei der Migration von Claude 3.x Modellen.
Ab Claude Opus 4.7 gibt das Setzen von temperature, top_p oder top_k auf einen nicht-Standard-Wert einen 400-Fehler zurück. Der sicherste Migrationspfad ist, diese Parameter vollständig aus Anfragen zu entfernen und Prompting zu verwenden, um das Modellverhalten zu lenken. Wenn Sie temperature = 0 für Determinismus verwendet haben, beachten Sie, dass dies nie identische Ausgaben garantierte.
# Vorher - Dies wird einen Fehler in Claude 4+ Modellen verursachen
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # Nicht-Standard Sampling-Parameter geben 400 auf Opus 4.7 zurück
# ...
)
# Nachher
response = client.messages.create(
model="claude-opus-4-7",
# ...
)token-efficient-tools-2025-02-19 und output-128k-2025-02-19. Alle Claude 4+ Modelle haben eingebaute Token-effiziente Tool-Nutzung und diese Header haben keine Auswirkung.claude-opus-4-7output_config.formatthinking: {type: "enabled", budget_tokens: N} durch thinking: {type: "adaptive"} plus den Effort-Parameter (gibt 400 auf Opus 4.7 zurück)effort-2025-11-24 Beta-Header (Effort ist jetzt GA)Claude Sonnet 4.6 kombiniert starke Intelligenz mit schneller Leistung und bietet verbesserte agentische Suchfähigkeiten und kostenlose Code-Ausführung bei Verwendung mit Web-Suche oder Web-Abruf. Es ist ideal für alltägliches Coding, Analyse und Content-Aufgaben.
Für einen vollständigen Überblick über die Fähigkeiten siehe die Modellübersicht.
Sonnet 4.6 Preisgestaltung ist $3 pro Million Input-Token, $15 pro Million Output-Token. Siehe Claude Preisgestaltung für Details.
Aktualisieren Sie Ihren Modellnamen:
# Von Sonnet 4.5
model = "claude-sonnet-4-5" # Vorher
model = "claude-sonnet-4-6" # Nachher
# Von Sonnet 4
model = "claude-sonnet-4-20250514" # Vorher
model = "claude-sonnet-4-6" # NachherDas Vorausfüllen von Assistenten-Nachrichten wird nicht mehr unterstützt
Dies ist eine Umbruchänderung bei der Migration von Sonnet 4.5 oder früher.
Das Vorausfüllen von Assistenten-Nachrichten gibt einen 400-Fehler auf Sonnet 4.6 zurück. Verwenden Sie stattdessen strukturierte Ausgaben, Systemaufforderungs-Anweisungen oder output_config.format.
Häufige Anwendungsfälle für Vorausfüllung und Migrationen:
Kontrolle der Ausgabeformatierung (Erzwingung von JSON/YAML-Ausgabe): Verwenden Sie strukturierte Ausgaben oder Tools mit Enum-Feldern für Klassifizierungsaufgaben.
Beseitigung von Präambeln (Entfernung von „Hier ist..."-Phrasen): Fügen Sie direkte Anweisungen in der Systemaufforderung hinzu: „Antworten Sie direkt ohne Präambel. Beginnen Sie nicht mit Phrasen wie ‚Hier ist...', ‚Basierend auf...', usw."
Vermeidung schlechter Ablehnungen: Claude ist jetzt viel besser bei angemessenen Ablehnungen. Klare Aufforderungen in der Benutzernachricht ohne Vorausfüllung sollten ausreichend sein.
Aktualisieren Sie Sampling-Parameter
Dies ist eine Umbruchänderung bei der Migration von Claude 3.x-Modellen.
Verwenden Sie nur temperature ODER top_p, nicht beide.
Aktualisieren Sie Tool-Versionen
Dies ist eine Umbruchänderung bei der Migration von Claude 3.x-Modellen.
Aktualisieren Sie auf die neuesten Tool-Versionen (text_editor_20250728, code_execution_20250825). Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet.
Behandeln Sie den refusal-Stoppgrund
Aktualisieren Sie Ihre Anwendung, um Stoppgründe vom Typ refusal zu behandeln.
fine-grained-tool-streaming-2025-05-14-Beta-Header: Feingranulares Tool-Streaming ist jetzt GA auf Sonnet 4.6 und erfordert keinen Beta-Header mehr.output_format zu output_config.format: Der Parameter output_format ist veraltet. Verwenden Sie stattdessen output_config.format.Erwägen Sie die Migration von Sonnet 4.5 zu Sonnet 4.6, das mehr Intelligenz zum gleichen Preis bietet.
Sonnet 4.6 hat standardmäßig eine Anstrengungsstufe von high, im Gegensatz zu Sonnet 4.5, das keinen Anstrengungsparameter hatte. Erwägen Sie, den Anstrengungsparameter bei der Migration von Sonnet 4.5 zu Sonnet 4.6 anzupassen. Falls nicht explizit festgelegt, können Sie mit der standardmäßigen Anstrengungsstufe eine höhere Latenz erleben.
Wenn Sie erweitertes Denken auf Sonnet 4.5 nicht verwenden, können Sie auf Sonnet 4.6 ohne es fortfahren. Sie sollten die Anstrengung explizit auf die für Ihren Anwendungsfall angemessene Stufe setzen. Bei low-Anstrengung mit deaktiviertem Denken können Sie ähnliche oder bessere Leistung im Vergleich zu Sonnet 4.5 ohne erweitertes Denken erwarten.
Wenn Sie erweitertes Denken mit budget_tokens auf Sonnet 4.5 verwenden, ist es auf Sonnet 4.6 immer noch funktional, aber veraltet. Migrieren Sie zu adaptivem Denken mit dem Anstrengungsparameter.
Adaptives Denken ist der empfohlene Ersatz für budget_tokens auf Sonnet 4.6. Es eignet sich besonders gut für die folgenden Workload-Muster:
high-Anstrengung. Wenn Latenz oder Token-Nutzung ein Problem darstellt, reduzieren Sie auf medium.Bei Verwendung von adaptivem Denken bewerten Sie medium- und high-Anstrengung bei Ihren Aufgaben. Die richtige Stufe hängt von den Kompromissen Ihrer Workload zwischen Qualität, Latenz und Token-Nutzung ab.
Wenn Sie inkonsistentes Verhalten oder Qualitätsrückgänge mit adaptivem Denken sehen, versuchen Sie, die Anstrengungseinstellung zu senken oder max_tokens zuerst als harte Grenze zu verwenden. Erweitertes Denken mit budget_tokens ist auf Sonnet 4.6 immer noch funktional, aber veraltet und wird nicht mehr empfohlen.
Wenn Sie budget_tokens während der Migration vorübergehend beibehalten müssen, bietet ein Budget von etwa 16k Token Spielraum für schwierigere Probleme ohne Risiko unkontrollierter Token-Nutzung. Diese Konfiguration ist veraltet und wird in einer zukünftigen Modellversion entfernt.
Für agentengestütztes Coding, Frontend-Design, Tool-intensive Workflows und komplexe Enterprise-Workflows beginnen Sie mit medium-Anstrengung. Wenn Sie feststellen, dass die Latenz zu hoch ist, erwägen Sie, die Anstrengung auf low zu reduzieren. Wenn Sie höhere Intelligenz benötigen, erwägen Sie, die Anstrengung auf high zu erhöhen oder zu Opus 4.7 zu migrieren.
Für Chat, Inhaltsgenerierung, Suche, Klassifizierung und andere Nicht-Coding-Aufgaben beginnen Sie mit low-Anstrengung mit erweitertem Denken. Wenn Sie mehr Tiefe benötigen, erhöhen Sie die Anstrengung auf medium.
claude-sonnet-4-6output_config.formattext_editor_20250728, code_execution_20250825); Legacy-Versionen werden nicht unterstützt (bei Migration von 3.x)undo_edit-Befehl verwendet (falls zutreffend)temperature ODER top_p zu verwenden, nicht beide (bei Migration von 3.x)Claude Sonnet 4.5 kombiniert starke Intelligenz mit schneller Leistung und eignet sich ideal für alltägliches Coding, Analysen und Inhaltsaufgaben.
Eine vollständige Übersicht der Funktionen finden Sie in der Modellübersicht.
Die Preisgestaltung für Sonnet 4.5 beträgt 3 USD pro Million Eingabe-Token, 15 USD pro Million Ausgabe-Token. Weitere Informationen finden Sie unter Claude-Preisgestaltung.
Aktualisieren Sie Ihren Modellnamen:
# Von Sonnet 4
model = "claude-sonnet-4-20250514" # Vorher
model = "claude-sonnet-4-5-20250929" # Nachher
# Von Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Vorher
model = "claude-sonnet-4-5-20250929" # NachherDiese Umbruchänderungen gelten bei der Migration von Claude 3.x Sonnet-Modellen.
Aktualisieren Sie Sampling-Parameter
Dies ist eine Umbruchänderung bei der Migration von Claude 3.x-Modellen.
Verwenden Sie nur temperature ODER top_p, nicht beide.
Aktualisieren Sie Tool-Versionen
Dies ist eine Umbruchänderung bei der Migration von Claude 3.x-Modellen.
Aktualisieren Sie auf die neuesten Tool-Versionen (text_editor_20250728, code_execution_20250825). Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet.
Behandeln Sie den refusal-Stoppgrund
Aktualisieren Sie Ihre Anwendung, um Stoppgründe vom Typ refusal zu behandeln.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825); Legacy-Versionen werden nicht unterstützt (bei Migration von 3.x)undo_edit-Befehl verwendet (falls zutreffend)temperature ODER top_p zu verwenden, nicht beide (bei Migration von 3.x)refusal-Stoppgrund in Ihrer AnwendungClaude Haiku 4.5 ist das schnellste und intelligenteste Haiku-Modell mit nahezu Frontier-Leistung und bietet Premium-Modellqualität für interaktive Anwendungen und Hochvolumen-Verarbeitung.
Eine vollständige Übersicht der Funktionen finden Sie in der Modellübersicht.
Die Preisgestaltung für Haiku 4.5 beträgt 1 USD pro Million Eingabe-Token, 5 USD pro Million Ausgabe-Token. Weitere Informationen finden Sie unter Claude-Preisgestaltung.
Aktualisieren Sie Ihren Modellnamen:
# Von Haiku 3.5
model = "claude-3-5-haiku-20241022" # Vorher
model = "claude-haiku-4-5-20251001" # Nachher
# Von Haiku 3
model = "claude-3-haiku-20240307" # Vorher
model = "claude-haiku-4-5-20251001" # NachherÜberprüfen Sie neue Rate Limits: Haiku 4.5 hat separate Rate Limits von Haiku 3.5 und Haiku 3. Weitere Informationen finden Sie in der Rate Limits-Dokumentation.
Für erhebliche Leistungsverbesserungen bei Coding- und Denkaufgaben erwägen Sie, erweitertes Denken mit thinking: {type: "enabled", budget_tokens: N} zu aktivieren.
Erweitertes Denken beeinflusst die Effizienz des Prompt Caching.
Erweitertes Denken ist in Claude 4.6 oder neueren Modellen veraltet. Wenn Sie neuere Modelle verwenden, verwenden Sie stattdessen adaptives Denken.
Erkunden Sie neue Funktionen: Weitere Informationen zu Kontextbewusstsein, erhöhter Ausgabekapazität (64k Token), höherer Intelligenz und verbesserter Geschwindigkeit finden Sie in der Modellübersicht.
Diese Umbruchänderungen gelten bei der Migration von Claude 3.x Haiku-Modellen.
Aktualisieren Sie Sampling-Parameter
Dies ist eine Umbruchänderung bei der Migration von Claude 3.x-Modellen.
Verwenden Sie nur temperature ODER top_p, nicht beide.
Aktualisieren Sie Tool-Versionen
Dies ist eine Umbruchänderung bei der Migration von Claude 3.x-Modellen.
Aktualisieren Sie auf die neuesten Tool-Versionen (text_editor_20250728, code_execution_20250825). Entfernen Sie jeden Code, der den undo_edit-Befehl verwendet.
Behandeln Sie den refusal-Stoppgrund
Aktualisieren Sie Ihre Anwendung, um Stoppgründe vom Typ refusal zu behandeln.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825); Legacy-Versionen werden nicht unterstütztundo_edit-Befehl verwendet (falls zutreffend)temperature ODER top_p zu verwenden, nicht beiderefusal-Stoppgrund in Ihrer AnwendungNachher (Claude Opus 4.7):
client.messages.create(
model="claude-opus-4-7",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "high"}, # oder "max", "xhigh", "medium", "low"
messages=[{"role": "user", "content": "..."}],
)Adaptives Denken ist durch Prompting steuerbar. Für Anleitung zur Abstimmung, wenn das Modell über- oder unterdenkt, siehe Kalibrierung von Effort und Denktiefe.
Sampling-Parameter entfernt: Das Setzen von temperature, top_p oder top_k auf einen nicht-Standard-Wert auf Claude Opus 4.7 gibt einen 400-Fehler zurück. Der sicherste Migrationspfad ist, diese Parameter vollständig aus Request-Payloads zu entfernen. Prompting ist die empfohlene Methode, um das Modellverhalten auf Claude Opus 4.7 zu lenken. Wenn Sie temperature = 0 für Determinismus verwendet haben, beachten Sie, dass dies nie identische Ausgaben auf früheren Modellen garantierte.
Thinking-Inhalte standardmäßig weggelassen: Thinking-Blöcke erscheinen immer noch im Response-Stream auf Claude Opus 4.7, aber ihr thinking Feld ist leer, es sei denn, Sie entscheiden sich explizit dafür. Dies ist eine stille Änderung von Claude Opus 4.6, wo der Standard darin bestand, zusammengefassten Thinking-Text zurückzugeben. Um zusammengefassten Thinking-Inhalt auf Claude Opus 4.7 wiederherzustellen, setzen Sie thinking.display auf "summarized":
thinking = {
"type": "adaptive",
"display": "summarized",
}Der Standard ist "omitted" auf Claude Opus 4.7. Wenn Ihr Produkt Reasoning an Benutzer streamt, erscheint der neue Standard als lange Pause, bevor die Ausgabe beginnt; setzen Sie display: "summarized", um sichtbare Fortschritte während des Denkens wiederherzustellen. Siehe Extended Thinking für Details.
Aktualisierte Token-Zählung: Claude Opus 4.7 verwendet einen neuen Tokenizer, der zu seiner verbesserten Leistung bei einer breiten Palette von Aufgaben beiträgt. Dieser neue Tokenizer kann beim Verarbeiten von Text ungefähr 1x bis 1,35x so viele Token verwenden wie frühere Modelle (bis zu ~35% mehr, variierend nach Inhalt), und /v1/messages/count_tokens gibt eine andere Anzahl von Token für Claude Opus 4.7 zurück als für Claude Opus 4.6. Die Token-Effizienz von Claude Opus 4.7 kann je nach Workload-Form variieren. Prompting-Interventionen, task_budget und effort können helfen, Kosten zu kontrollieren und angemessene Token-Nutzung sicherzustellen. Beachten Sie, dass diese Kontrollen möglicherweise Modell-Intelligenz beeinträchtigen. Wir empfehlen, Ihre max_tokens Parameter zu aktualisieren, um zusätzlichen Spielraum zu geben, einschließlich Kompaktierungsauslöser. Claude Opus 4.7 bietet ein 1M Kontextfenster zu Standard-API-Preisen ohne Long-Context-Aufschlag.
Prefill-Entfernung (von Opus 4.6 übernommen): Das Prefilling von Assistant-Nachrichten gibt einen 400-Fehler auf Claude Opus 4.7 zurück. Verwenden Sie stattdessen strukturierte Ausgaben, System-Prompt-Anweisungen oder output_config.format.
Eingebaute Fortschritts-Updates in agentischen Traces: Claude Opus 4.7 bietet regelmäßigere, höherwertige Updates für den Benutzer während langer agentischer Traces. Wenn Sie Scaffolding hinzugefügt haben, um Zwischenstatus-Nachrichten zu erzwingen ("Nach jedem 3. Tool-Aufruf, Fortschritt zusammenfassen"), versuchen Sie, es zu entfernen. Wenn Sie feststellen, dass die Länge oder der Inhalt von Claude Opus 4.7s benutzerorientierten Updates nicht gut auf Ihren Anwendungsfall kalibriert sind, beschreiben Sie explizit, wie diese Updates aussehen sollten, im Prompt und geben Sie Beispiele.
Weniger Subagenten standardmäßig erzeugt: Claude Opus 4.7 neigt dazu, standardmäßig weniger Subagenten zu erzeugen. Dieses Verhalten ist jedoch durch Prompting steuerbar; geben Sie Claude Opus 4.7 explizite Anleitung, wann Subagenten wünschenswert sind.
Strengere Effort-Kalibrierung: Bedeutsam unterschiedlich von Claude Opus 4.6, respektiert Claude Opus 4.7 Effort-Levels streng, besonders am unteren Ende. Bei low und medium beschränkt das Modell seine Arbeit auf das, was gefragt wurde, anstatt darüber hinauszugehen. Dies ist gut für Latenz und Kosten, aber bei mäßig komplexen Aufgaben, die mit low Effort laufen, besteht ein gewisses Risiko von Unterdenken. Wenn Sie flaches Reasoning bei komplexen Problemen beobachten, erhöhen Sie Effort auf high oder xhigh, anstatt es durch Prompting zu umgehen. Wenn Sie Effort bei low für Latenz halten müssen, fügen Sie gezielt Anleitung hinzu: "Diese Aufgabe beinhaltet mehrstufiges Reasoning. Denken Sie sorgfältig über das Problem nach, bevor Sie antworten." Siehe Empfohlene Effort-Levels für Claude Opus 4.7.
Weniger Tool-Aufrufe standardmäßig: Claude Opus 4.7 neigt dazu, Tools weniger häufig zu verwenden als Claude Opus 4.6 und Reasoning mehr zu verwenden. Dies führt in den meisten Fällen zu besseren Ergebnissen. Das Erhöhen der Effort-Einstellung ist jedoch ein nützlicher Hebel, um das Niveau der Tool-Nutzung zu erhöhen, besonders in der Wissensarbeit. high oder xhigh Effort-Einstellungen zeigen wesentlich mehr Tool-Nutzung in agentischer Suche und Coding. Für Szenarien, in denen Sie mehr Tool-Nutzung wünschen, können Sie auch Ihren Prompt anpassen, um das Modell explizit anzuweisen, wann und wie es seine Tools richtig nutzen soll.
Echtzeit-Cybersicherheits-Schutzmaßnahmen: Neu hinzugefügt in Claude Opus 4.7, Anfragen, die verbotene oder hochriskante Themen betreffen, können zu Ablehnungen führen. Für legitime Sicherheitsarbeit wie Penetrationstests, Schwachstellenforschung oder Red-Teaming wenden Sie sich an das Cyber Verification Program, um reduzierte Einschränkungen anzufordern. Siehe Schutzmaßnahmen, Warnungen und Einsprüche für Hintergrund.
Hochauflösungs-Bildunterstützung: Claude Opus 4.7 ist das erste Claude-Modell mit Hochauflösungs-Bildunterstützung, mit einer maximalen Bildauflösung von 2576 Pixeln auf der langen Kante (gegenüber 1568 Pixeln bei früheren Modellen). Dies erschließt Gewinne bei Vision-intensiven Workloads und ist besonders wertvoll für Computer Use, Screenshot-Verständnis und Dokumentenanalyse. Hochauflösungs-Unterstützung ist automatisch und erfordert keinen Beta-Header oder Client-seitiges Opt-in. Vollauflösungs-Bilder können ungefähr 3x mehr Bild-Token verwenden als bei früheren Modellen (bis zu 4.784 Token pro Bild, im Vergleich zur vorherigen Obergrenze von ungefähr 1.600 Token pro Bild), also re-budgetieren Sie max_tokens und Kostenerwartungen für Bild-intensive Workloads, oder downsampling vor dem Senden, wenn Sie die zusätzliche Treue nicht benötigen. Zeige- und Bounding-Box-Koordinaten, die vom Modell zurückgegeben werden, sind 1
output_config = {
"effort": "high",
"task_budget": {"type": "tokens", "total": 128000},
}Sie müssen möglicherweise mit verschiedenen Task Budgets für Ihren Anwendungsfall experimentieren. Wenn dem Modell ein Task Budget gegeben wird, das für eine bestimmte Aufgabe zu restriktiv ist, kann es die Aufgabe weniger gründlich abschließen und sein Budget als Einschränkung referenzieren. Für offene agentische Aufgaben, bei denen Qualität wichtiger ist als Geschwindigkeit, setzen Sie kein Task Budget; reservieren Sie Task Budgets für Workloads, bei denen Sie das Modell auf eine Token-Zulage beschränken müssen. Der Mindestwert für ein Task Budget ist 20k Token.
Dies ist keine harte Obergrenze; es ist ein Vorschlag, dessen sich das Modell bewusst ist. Dies unterscheidet sich von max_tokens, das eine harte Pro-Request-Obergrenze für generierte Token ist (max_tokens wird nicht an das Modell übergeben, und das Modell ist sich dessen nicht bewusst), während task_budget eine beratende Obergrenze über die vollständige agentische Schleife ist. Verwenden Sie task_budget, wenn Sie möchten, dass sich das Modell selbst moderiert, und max_tokens als harte Pro-Request-Obergrenze, um die Nutzung zu begrenzen.
Setzen Sie ein großes max_tokens bei max oder xhigh Effort: Wenn Sie Claude Opus 4.7 bei max oder xhigh Effort laufen, setzen Sie ein großes Max-Output-Token-Budget, damit das Modell Platz zum Denken und Handeln über seine Subagenten und Tool-Aufrufe hat. Wir empfehlen, mit 64k Token zu beginnen und von dort aus abzustimmen.
Downsampling von Bildern, wenn hohe Auflösung nicht notwendig ist: Claude Opus 4.7 unterstützt Bilder bis zu 2576px / 3,75MP. Hochauflösungs-Bilder verwenden mehr Token. Wenn die zusätzliche Bildtreue nicht notwendig ist, downsampling Sie Bilder vor dem Senden an Claude, um Token-Nutzungserhöhungen zu vermeiden. Siehe Bilder und Vision.
max_tokensxhigh oder max Effort verwenden, erhöhen Sie max_tokens auf mindestens 64k als Ausgangspunkt.response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 32000},
betas=["interleaved-thinking-2025-05-14"],
messages=[...],
)Beachten Sie, dass die Migration auch von client.beta.messages.create zu client.messages.create wechselt. Adaptives Denken und Effort sind GA-Funktionen und erfordern keinen Beta-SDK-Namespace oder Beta-Header.
Entfernen Sie Effort-Beta-Header: Der Effort-Parameter ist jetzt GA. Entfernen Sie betas=["effort-2025-11-24"] aus Ihren Anfragen.
Entfernen Sie Fine-Grained Tool Streaming Beta Header: Fine-Grained Tool Streaming ist jetzt GA. Entfernen Sie betas=["fine-grained-tool-streaming-2025-05-14"] aus Ihren Anfragen.
Entfernen Sie Interleaved Thinking Beta Header: Adaptives Denken aktiviert automatisch Interleaved Thinking auf Claude Opus 4.7, Opus 4.6 und Sonnet 4.6. Entfernen Sie betas=["interleaved-thinking-2025-05-14"] aus Ihren Anfragen. Der Header ist immer noch funktional auf Sonnet 4.6 mit manuellem Extended Thinking, aber der manuelle Modus ist veraltet.
Migration zu output_config.format: Wenn Sie strukturierte Ausgaben verwenden, aktualisieren Sie output_format={...} zu output_config={"format": {...}}. Der alte Parameter bleibt funktional, ist aber veraltet und wird in einer zukünftigen Modellversion entfernt.
Aktualisieren Sie Tool-Versionen
Dies ist ein Breaking Change bei der Migration von Claude 3.x Modellen.
Aktualisieren Sie auf die neuesten Tool-Versionen. Entfernen Sie alle Codes, die den undo_edit Befehl verwenden.
# Vorher
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# Nachher
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 und str_replace_based_edit_tool. Siehe Text-Editor-Tool-Dokumentation für Details.code_execution_20250825. Siehe Code-Ausführungs-Tool-Dokumentation für Migrationsanweisungen.Behandeln Sie den refusal Stop-Grund
Aktualisieren Sie Ihre Anwendung, um refusal Stop-Gründe zu behandeln:
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Behandeln Sie Ablehnung angemessen
passBehandeln Sie den model_context_window_exceeded Stop-Grund
Claude 4.5+ Modelle geben einen model_context_window_exceeded Stop-Grund zurück, wenn die Generierung aufgrund des Erreichens der Kontextfenster-Grenze stoppt, anstatt der angeforderten max_tokens Grenze. Aktualisieren Sie Ihre Anwendung, um diesen neuen Stop-Grund zu behandeln:
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Behandeln Sie die Kontextfenster-Grenze angemessen
passÜberprüfen Sie Tool-Parameter-Behandlung (nachfolgende Zeilenumbrüche)
Claude 4.5+ Modelle bewahren nachfolgende Zeilenumbrüche in Tool-Aufruf-String-Parametern, die zuvor entfernt wurden. Wenn Ihre Tools auf exakte String-Übereinstimmung gegen Tool-Aufruf-Parameter angewiesen sind, überprüfen Sie, dass Ihre Logik nachfolgende Zeilenumbrüche korrekt behandelt.
Aktualisieren Sie Ihre Prompts für Verhaltensänderungen
Claude 4+ Modelle haben einen prägnanten, direkten Kommunikationsstil und erfordern explizite Anleitung. Überprüfen Sie Prompting Best Practices für Optimierungsanleitung.
fine-grained-tool-streaming-2025-05-14interleaved-thinking-2025-05-14 Beta-Header (adaptives Denken aktiviert Interleaved Thinking automatisch)output_format zu output_config.format (falls zutreffend)temperature, top_p und top_k (nicht-Standard-Werte geben 400 auf Opus 4.7 zurück)text_editor_20250728, code_execution_20250825)refusal Stop-Grundmodel_context_window_exceeded Stop-Grundtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Fortsetzungen (Fortsetzen unterbrochener Antworten): Verschieben Sie die Fortsetzung zur Benutzernachricht: „Ihre vorherige Antwort wurde unterbrochen und endete mit [previous_response]. Fahren Sie dort fort, wo Sie aufgehört haben."
Kontext-Hydration / Rollenkonsistenz (Auffrischung des Kontexts in langen Gesprächen): Injizieren Sie, was zuvor vorausgefüllte Assistenten-Erinnerungen waren, stattdessen in den Benutzerzug.
JSON-Escaping von Tool-Parametern kann unterschiedlich sein
Dies ist eine Umbruchänderung bei der Migration von Sonnet 4.5 oder früher.
Das JSON-String-Escaping in Tool-Parametern kann sich von früheren Modellen unterscheiden. Standard-JSON-Parser handhaben dies automatisch, aber benutzerdefiniertes String-basiertes Parsing kann Aktualisierungen benötigen.
Aktualisieren Sie Ihre Aufforderungen für Verhaltensänderungen
Claude 4-Modelle haben einen prägnanten, direkten Kommunikationsstil. Lesen Sie Best Practices für Aufforderungen für Optimierungsleitfaden.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
output_config={"effort": "low"},
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)refusal-Stoppgrund in Ihrer Anwendungfine-grained-tool-streaming-2025-05-14-Beta-Header (jetzt GA)output_format zu output_config.formatthinking: {type: "enabled", budget_tokens: N} zu thinking: {type: "adaptive"} mit dem Anstrengungsparameter (budget_tokens ist veraltet und wird in einer zukünftigen Version entfernt)Aktualisieren Sie Ihre Aufforderungen für Verhaltensänderungen
Claude 4-Modelle haben einen prägnanten, direkten Kommunikationsstil. Lesen Sie Best Practices für Aufforderungen für Optimierungsleitfaden.
Aktualisieren Sie Ihre Aufforderungen für Verhaltensänderungen
Claude 4-Modelle haben einen prägnanten, direkten Kommunikationsstil. Lesen Sie Best Practices für Aufforderungen für Optimierungsleitfaden.