This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
Der Aufwand-Parameter ermöglicht es Ihnen zu kontrollieren, wie bereitwillig Claude Token ausgibt, wenn er auf Anfragen antwortet. Dies gibt Ihnen die Möglichkeit, zwischen Gründlichkeit der Antwort und Token-Effizienz abzuwägen, alles mit einem einzigen Modell. Der Aufwand-Parameter ist allgemein auf allen unterstützten Modellen verfügbar und erfordert keinen Beta-Header.
Der Aufwand-Parameter wird von Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 und Claude Opus 4.5 unterstützt.
Für Claude Opus 4.6 und Sonnet 4.6 ersetzt Aufwand budget_tokens als empfohlene Methode zur Kontrolle der Denktiefe. Kombinieren Sie Aufwand mit adaptivem Denken (thinking: {type: "adaptive"}) für die beste Erfahrung. Während budget_tokens auf Opus 4.6 und Sonnet 4.6 noch akzeptiert wird, ist es veraltet und wird in einer zukünftigen Modellversion entfernt. Bei high (Standard) und max Aufwand wird Claude fast immer denken. Bei niedrigeren Aufwandsebenen kann es das Denken bei einfacheren Problemen überspringen.
Standardmäßig verwendet Claude hohen Aufwand und gibt so viele Token aus, wie für hervorragende Ergebnisse erforderlich sind. Sie können die Aufwandsebene auf max erhöhen, um die absolute höchste Leistung zu erreichen, oder sie senken, um sparsamer mit Token-Nutzung umzugehen und Geschwindigkeit und Kosten zu optimieren, während Sie eine gewisse Leistungsreduktion akzeptieren.
Das Setzen von effort auf "high" erzeugt genau das gleiche Verhalten wie das Weglassen des effort-Parameters vollständig.
Der Aufwand-Parameter beeinflusst alle Token in der Antwort, einschließlich:
Dieser Ansatz hat zwei große Vorteile:
| Ebene | Beschreibung | Typischer Anwendungsfall |
|---|---|---|
max | Absolute maximale Leistung ohne Einschränkungen bei der Token-Ausgabe. Verfügbar auf Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 und Claude Sonnet 4.6. | Aufgaben, die tiefste mögliche Überlegung und gründlichste Analyse erfordern |
xhigh | Erweiterte Leistung für langfristige Arbeiten. Verfügbar auf Claude Opus 4.7. | Langfristige agentengesteuerte und Codierungsaufgaben (über 30 Minuten) mit Token-Budgets in Millionen |
high | Hohe Leistung. Gleichbedeutend mit dem Nicht-Setzen des Parameters. | Komplexe Überlegungen, schwierige Codierungsprobleme, agentengesteuerte Aufgaben |
medium | Ausgewogener Ansatz mit moderaten Token-Einsparungen. | Agentengesteuerte Aufgaben, die ein Gleichgewicht zwischen Geschwindigkeit, Kosten und Leistung erfordern |
low | Am effizientesten. Erhebliche Token-Einsparungen mit etwas Leistungsreduktion. | Einfachere Aufgaben, die die beste Geschwindigkeit und niedrigste Kosten benötigen, wie z.B. Subagenten |
Aufwand ist ein Verhaltenssignal, kein striktes Token-Budget. Bei niedrigeren Aufwandsebenen wird Claude bei ausreichend schwierigen Problemen immer noch denken, aber es wird weniger denken als bei höheren Aufwandsebenen für das gleiche Problem.
Sonnet 4.6 hat standardmäßig high Aufwand. Setzen Sie Aufwand explizit bei Verwendung von Sonnet 4.6, um unerwartete Latenz zu vermeiden:
Beginnen Sie mit xhigh für Codierungs- und agentengesteuerte Anwendungsfälle, und verwenden Sie high als Minimum für die meisten intelligenzempfindlichen Workloads. Senken Sie auf medium für kostenempfindliche Workloads, oder erhöhen Sie auf max nur, wenn Ihre Evaluierungen messbaren Spielraum bei xhigh zeigen.
Der API-Standard ist high. Um xhigh zu verwenden, setzen Sie effort explizit; der Wert, den Sie übergeben, überschreibt den Standard.
| Aufwand | Anleitung für Claude Opus 4.7 |
|---|---|
low | Effizient, aber am besten für kurze, begrenzte Aufgaben. Kombinieren Sie low mit expliziten Checklisten, wenn Ihre Aufgabe mehrere Abschnitte hat. |
medium | Der Drop-in für den durchschnittlichen Workflow, bei dem Sie gute Ergebnisse wünschen und gleichzeitig Kosten senken möchten. |
high | Fortgeschrittene Anwendungsfälle, die immer noch ein Gleichgewicht zwischen Intelligenz und Token-Verbrauch benötigen. Dies ist oft der süße Punkt zwischen Qualität und Token-Effizienz. |
xhigh | Der empfohlene Startpunkt für Codierungs- und agentengesteuerte Arbeiten sowie für explorative Aufgaben wie wiederholte Tool-Aufrufe, detaillierte Websuche und Wissensdatenbank-Suche. Erwarten Sie deutlich höhere Token-Nutzung als high. |
max | Reservieren Sie für echte Grenzprobleme. Bei den meisten Workloads fügt max erhebliche Kosten für relativ kleine Qualitätsgewinne hinzu, und bei einigen strukturierten Ausgabe- oder weniger intelligenzempfindlichen Aufgaben kann es zu Überdenken führen. |
Claude Opus 4.7 respektiert Aufwandsebenen auch strenger als Claude Opus 4.6, besonders bei low und medium. Bei niedrigeren Aufwandsebenen begrenzt das Modell seine Arbeit auf das, was gefragt wurde, anstatt darüber hinauszugehen. Wenn Sie flaches Denken bei komplexen Problemen mit Claude Opus 4.7 beobachten, erhöhen Sie den Aufwand, anstatt es zu umgehen. Wenn Sie den Aufwand aus Latenzgründen niedrig halten müssen, fügen Sie gezielt Anleitung hinzu wie „Diese Aufgabe beinhaltet mehrstufiges Denken. Denken Sie sorgfältig nach, bevor Sie antworten."
Wenn Sie Claude Opus 4.7 mit xhigh oder max Aufwand ausführen, setzen Sie ein großes max_tokens, damit das Modell Platz zum Denken und Handeln über Subagenten und Tool-Aufrufe hinweg hat. Ein Anfang bei 64k Token und Abstimmung von dort ist ein angemessener Standard.
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=4096,
messages=[
{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures",
}
],
output_config={"effort": "medium"},
)
print(response.content[0].text)Bei Verwendung von Tools beeinflusst der Aufwand-Parameter sowohl die Erklärungen um Tool-Aufrufe als auch die Tool-Aufrufe selbst. Niedrigere Aufwandsebenen neigen dazu zu:
Höhere Aufwandsebenen können:
Der Aufwand-Parameter funktioniert zusammen mit erweitertem Denken. Sein Verhalten hängt vom Modell ab:
thinking-Konfiguration erforderlich). thinking: {type: "disabled"} wird abgelehnt. Aufwand kontrolliert die Denktiefe auf die gleiche Weise wie auf Opus 4.7 und Opus 4.6.thinking: {type: "adaptive"}), wobei Aufwand die empfohlene Kontrolle für die Denktiefe ist. Manuelles erweitertes Denken (thinking: {type: "enabled", budget_tokens: N}) wird auf Opus 4.7 nicht mehr unterstützt; verwenden Sie stattdessen adaptives Denken mit Aufwand. Bei high, xhigh und max Aufwand denkt Claude fast immer tief. Bei niedrigeren Ebenen kann es das Denken bei einfacheren Problemen überspringen.thinking: {type: "adaptive"}), wobei Aufwand die empfohlene Kontrolle für die Denktiefe ist. Während budget_tokens auf Opus 4.6 noch akzeptiert wird, ist es veraltet und wird in einer zukünftigen Version entfernt. Bei high und max Aufwand denkt Claude fast immer tief. Bei niedrigeren Ebenen kann es das Denken bei einfacheren Problemen überspringen.thinking: {type: "enabled", budget_tokens: N}) ist noch funktional, aber veraltet.thinking: {type: "enabled", budget_tokens: N}), wobei Aufwand zusammen mit dem Denk-Token-Budget funktioniert. Setzen Sie die Aufwandsebene für Ihre Aufgabe, dann setzen Sie das Denk-Token-Budget basierend auf der Aufgabenkomplexität.Der Aufwand-Parameter kann mit oder ohne aktiviertes erweitertes Denken verwendet werden. Wenn es ohne Denken verwendet wird, kontrolliert es immer noch die Gesamttoken-Ausgabe für Textantworten und Tool-Aufrufe.
high, aber der richtige Startpunkt hängt von Ihrem Modell und Ihrer Workload ab.Was this page helpful?