Der Effort-Parameter ermöglicht es Ihnen zu kontrollieren, wie bereitwillig Claude Token bei der Beantwortung von Anfragen ausgibt. Dies gibt Ihnen die Möglichkeit, zwischen Gründlichkeit der Antwort und Token-Effizienz abzuwägen, alles mit einem einzigen Modell.
Der Effort-Parameter befindet sich derzeit in der Beta-Phase und wird nur von Claude Opus 4.5 unterstützt.
Sie müssen den Beta-Header effort-2025-11-24 einschließen, wenn Sie diese Funktion verwenden.
Standardmäßig verwendet Claude maximale Anstrengung – gibt so viele Token aus, wie für das bestmögliche Ergebnis erforderlich sind. Durch Reduzierung der Effort-Stufe können Sie Claude anweisen, sparsamer mit der Token-Nutzung umzugehen und die Geschwindigkeit und Kosten zu optimieren, während Sie eine gewisse Verringerung der Leistungsfähigkeit akzeptieren.
Das Setzen von effort auf "high" erzeugt genau das gleiche Verhalten wie das Weglassen des effort-Parameters vollständig.
Der Effort-Parameter beeinflusst alle Token in der Antwort, einschließlich:
Dieser Ansatz hat zwei große Vorteile:
| Stufe | Beschreibung | Typischer Anwendungsfall |
|---|---|---|
high | Maximale Leistungsfähigkeit. Claude verwendet so viele Token wie nötig für das bestmögliche Ergebnis. Entspricht dem Nicht-Setzen des Parameters. | Komplexes Denken, schwierige Codierungsprobleme, agentengestützte Aufgaben |
medium | Ausgewogener Ansatz mit moderaten Token-Einsparungen. | Agentengestützte Aufgaben, die ein Gleichgewicht zwischen Geschwindigkeit, Kosten und Leistung erfordern |
low | Am effizientesten. Erhebliche Token-Einsparungen mit einiger Leistungsverringerung. | Einfachere Aufgaben, die die beste Geschwindigkeit und niedrigste Kosten benötigen, wie z. B. Subagenten |
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)Bei der Verwendung von Tools beeinflusst der Effort-Parameter sowohl die Erklärungen um Tool-Aufrufe als auch die Tool-Aufrufe selbst. Niedrigere Effort-Stufen neigen dazu zu:
Höhere Effort-Stufen können:
Der Effort-Parameter funktioniert zusammen mit dem Thinking-Token-Budget, wenn erweitertes Denken aktiviert ist. Diese beiden Steuerelemente dienen unterschiedlichen Zwecken:
Der Effort-Parameter kann mit oder ohne aktiviertes erweitertes Denken verwendet werden. Wenn beide konfiguriert sind:
Für beste Leistung bei komplexen Denkaufgaben verwenden Sie high effort (die Standardeinstellung) mit einem hohen Thinking-Token-Budget. Dies ermöglicht Claude, gründlich zu denken und umfassende Antworten zu geben.