Was this page helpful?
This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
Der Aufwand-Parameter ermöglicht es Ihnen zu kontrollieren, wie bereitwillig Claude Token beim Antworten auf Anfragen ausgibt. Dies gibt Ihnen die Möglichkeit, zwischen Gründlichkeit der Antwort und Token-Effizienz abzuwägen, alles mit einem einzigen Modell. Der Aufwand-Parameter ist allgemein auf allen unterstützten Modellen verfügbar und erfordert keinen Beta-Header.
Der Aufwand-Parameter wird von Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6 und Claude Opus 4.5 unterstützt.
Für Claude Opus 4.6 und Sonnet 4.6 ersetzt Aufwand budget_tokens als empfohlene Methode zur Kontrolle der Denktiefe. Kombinieren Sie Aufwand mit adaptivem Denken (thinking: {type: "adaptive"}) für das beste Erlebnis. Während budget_tokens auf Opus 4.6 und Sonnet 4.6 noch akzeptiert wird, ist es veraltet und wird in einer zukünftigen Modellversion entfernt. Bei high (Standard) und max Aufwand wird Claude fast immer denken. Bei niedrigeren Aufwandsebenen kann es das Denken bei einfacheren Problemen überspringen.
Standardmäßig verwendet Claude hohen Aufwand und gibt so viele Token wie nötig für hervorragende Ergebnisse aus. Sie können die Aufwandsebene auf max erhöhen, um die absolut höchste Leistung zu erreichen, oder sie senken, um sparsamer mit Token-Nutzung umzugehen und Geschwindigkeit und Kosten zu optimieren, während Sie eine gewisse Leistungsreduktion akzeptieren.
Das Setzen von effort auf "high" erzeugt genau das gleiche Verhalten wie das Weglassen des effort-Parameters vollständig.
Der Aufwand-Parameter beeinflusst alle Token in der Antwort, einschließlich:
Dieser Ansatz hat zwei große Vorteile:
| Ebene | Beschreibung | Typischer Anwendungsfall |
|---|---|---|
max | Absolute maximale Leistung ohne Einschränkungen bei der Token-Ausgabe. Verfügbar auf Claude Mythos Preview, Claude Opus 4.6 und Claude Sonnet 4.6. | Aufgaben, die tiefste mögliche Überlegungen und gründlichste Analyse erfordern |
high | Hohe Leistung. Entspricht dem Nicht-Setzen des Parameters. | Komplexe Überlegungen, schwierige Codierungsprobleme, agentengestützte Aufgaben |
medium | Ausgewogener Ansatz mit moderaten Token-Einsparungen. | Agentengestützte Aufgaben, die ein Gleichgewicht zwischen Geschwindigkeit, Kosten und Leistung erfordern |
low | Am effizientesten. Erhebliche Token-Einsparungen mit einiger Leistungsreduktion. | Einfachere Aufgaben, die beste Geschwindigkeit und niedrigste Kosten benötigen, wie Subagenten |
Aufwand ist ein Verhaltenssignal, kein striktes Token-Budget. Bei niedrigeren Aufwandsebenen wird Claude bei ausreichend schwierigen Problemen immer noch denken, aber es wird weniger denken als bei höheren Aufwandsebenen für das gleiche Problem.
Sonnet 4.6 hat standardmäßig high Aufwand. Setzen Sie Aufwand explizit bei Verwendung von Sonnet 4.6, um unerwartete Latenz zu vermeiden:
Bei Verwendung von Tools beeinflusst der Aufwand-Parameter sowohl die Erklärungen um Tool-Aufrufe als auch die Tool-Aufrufe selbst. Niedrigere Aufwandsebenen neigen dazu zu:
Höhere Aufwandsebenen können:
Der Aufwand-Parameter funktioniert zusammen mit erweitertem Denken. Sein Verhalten hängt vom Modell ab:
thinking-Konfiguration erforderlich). thinking: {type: "disabled"} wird abgelehnt. Aufwand kontrolliert die Denktiefe auf die gleiche Weise wie auf Opus 4.6.thinking: {type: "adaptive"}), wobei Aufwand die empfohlene Kontrolle für die Denktiefe ist. Während budget_tokens auf Opus 4.6 noch akzeptiert wird, ist es veraltet und wird in einer zukünftigen Version entfernt. Bei high und max Aufwand denkt Claude fast immer tief. Bei niedrigeren Ebenen kann es das Denken bei einfacheren Problemen überspringen.thinking: {type: "enabled", budget_tokens: N}) ist noch funktional, aber veraltet.Der Aufwand-Parameter kann mit oder ohne aktiviertes erweitertes Denken verwendet werden. Wenn er ohne Denken verwendet wird, kontrolliert er immer noch die Gesamttoken-Ausgabe für Textantworten und Tool-Aufrufe.
high, aber der richtige Startpunkt hängt von Ihrem Modell und Ihrer Workload ab.curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-6",
"max_tokens": 4096,
"messages": [{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
"output_config": {
"effort": "medium"
}
}'thinking: {type: "enabled", budget_tokens: N}