Aufwand
Der Aufwand-Parameter ermöglicht es Ihnen zu kontrollieren, wie bereit Claude ist, Token beim Antworten auf Anfragen auszugeben. Dies gibt Ihnen die Möglichkeit, zwischen Antwortgründlichkeit und Token-Effizienz abzuwägen, alles mit einem einzigen Modell.
Der Aufwand-Parameter befindet sich derzeit in der Beta-Phase und wird nur von Claude Opus 4.5 unterstützt.
Sie müssen den Beta-Header effort-2025-11-24 einschließen, wenn Sie diese Funktion verwenden.
Wie Aufwand funktioniert
Standardmäßig verwendet Claude maximalen Aufwand – gibt so viele Token aus, wie nötig, um gründliche Antworten zu liefern. Durch Verringerung der Aufwandsebene können Sie Claude anweisen, sparsamer mit der Token-Nutzung umzugehen und Token als teurere Ressource zu behandeln.
Das Setzen von effort auf "high" erzeugt genau das gleiche Verhalten wie das Weglassen des effort-Parameters.
Der Aufwand-Parameter beeinflusst alle Token in der Antwort, einschließlich:
- Textantworten und Erklärungen
- Tool-Aufrufe und Funktionsargumente
- Erweitertes Denken (wenn aktiviert)
Aufwandsebenen
| Ebene | Beschreibung | Typischer Anwendungsfall |
|---|---|---|
high | Maximale Gründlichkeit – Claude verwendet so viele Token wie nötig. Entspricht dem Nicht-Setzen des Parameters. | Komplexe Analysen, detaillierte Erklärungen, Bildungsinhalte |
medium | Ausgewogener Ansatz mit moderaten Token-Einsparungen. | Die meisten Produktionsanwendungsfälle, kostenbewusste Anwendungen |
low | Effizienteste Token-Antworten. | Hochvolumige Automatisierung, einfache Anfragen, wenn Antworten programmgesteuert verarbeitet werden |
Grundlegende Verwendung
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)Verhalten nach Aufwandsebene
Der Aufwand-Parameter steuert hauptsächlich die Ausgabeausführlichkeit und Erklärungstiefe, nicht die Antwortgenauigkeit. Claude führt ähnliche interne Überlegungen unabhängig von der Aufwandsebene durch, passt aber an, wie viel dieser Überlegungen in der Ausgabe erscheint.
Antworten mit niedrigem Aufwand
- Antwort direkt angegeben mit minimaler Erklärung
- Prägnante, effiziente Antworten (1-2 Sätze Kontext)
- Formeln angezeigt, aber nicht hergeleitet
- Geht davon aus, dass der Leser die Antwort überprüfen kann
- Knappe Bestätigungen für Tool-Nutzung („Fertig.", „Behoben.")
Antworten mit mittlerem Aufwand
- Kurzer Kontext vor der Antwort
- Prägnante Begründung mit wichtigen Zwischenschritten
- Kann ein bearbeitetes Beispiel enthalten
- Immer noch auf Effizienz ausgerichtet
Antworten mit hohem Aufwand
- Strukturiert mit Abschnittsüberschriften
- Problemaufbau und Variablendefinitionen
- Schrittweise Lösungsprozess
- Überprüfung und Plausibilitätsprüfungen
- Umfangreiche Markdown-Formatierung
Anwendungsfälle
Wann man niedrigen Aufwand verwendet
- Geschwindigkeitsoptimierung: Niedrigere Token-Anzahl bedeutet schnellere Antwortzeiten, vorteilhaft für latenzempfindliche Anwendungen
- Automatisierte Pipelines: Wenn Antworten von Code verarbeitet werden, anstatt von Menschen gelesen zu werden
- Hochvolumige Anwendungen: Reduzieren Sie Kosten bei routinemäßigen, einfachen Anfragen
- Erfahrene Benutzer: Wenn Benutzer keine detaillierten Erklärungen benötigen
- Schnelle Bestätigungen: Einfache Ja/Nein- oder Statusantworten
Wann man mittleren Aufwand verwendet
- Produktions-APIs: Balance zwischen Klarheit und Kosteneffizienz
- Benutzergerichtete Anwendungen: Genug Kontext ohne übermäßige Ausführlichkeit
- Kostenbewusste Bereitstellungen: Erhebliche Einsparungen mit minimalen Qualitätseinbußen
Wann man hohen Aufwand verwendet (oder keinen Aufwand-Parameter)
- Komplexe Analysen: Wenn Gründlichkeit kritisch ist
- Bildungsinhalte: Wenn Benutzer das Denken verstehen müssen
- Dokumentation: Wenn Antworten als Referenzmaterial dienen
- Debugging: Wenn detaillierte Erklärungen helfen, Probleme zu identifizieren
Aufwand mit Tool-Nutzung
Bei Verwendung von Tools beeinflusst der Aufwand-Parameter sowohl die Erklärungen um Tool-Aufrufe als auch die Tool-Aufrufe selbst. Niedrigere Aufwandsebenen neigen dazu zu:
- Mehrere Operationen in weniger Tool-Aufrufe kombinieren
- Direkt zur Aktion übergehen ohne Präambel
- Knappe Bestätigungsmeldungen nach Abschluss verwenden
Höhere Aufwandsebenen können:
- Den Plan vor Maßnahmen erklären
- Detaillierte Zusammenfassungen von Änderungen bereitstellen
- Umfassendere Code-Kommentare enthalten
Aufwand mit erweitertem Denken
Der Aufwand-Parameter funktioniert zusammen mit dem Thinking-Token-Budget, wenn erweitertes Denken aktiviert ist. Diese beiden Steuerelemente dienen unterschiedlichen Zwecken:
- Aufwand-Parameter: Kontrolliert, wie Claude alle Token ausgibt – einschließlich Thinking-Token, Textantworten und Tool-Aufrufe
- Thinking-Token-Budget: Legt ein maximales Limit für Thinking-Token speziell fest
Der Aufwand-Parameter kann mit oder ohne aktiviertes erweitertes Denken verwendet werden. Wenn beide konfiguriert sind:
- Bestimmen Sie zunächst die für Ihre Aufgabe geeignete Aufwandsebene
- Legen Sie dann das Thinking-Token-Budget basierend auf der Aufgabenkomplexität fest
Für beste Leistung bei komplexen Denkaufgaben verwenden Sie hohen Aufwand (die Standardeinstellung) mit einem hohen Thinking-Token-Budget. Dies ermöglicht Claude, gründlich zu denken und umfassende Antworten zu liefern.
Best Practices
-
Beginnen Sie mit Medium: Für die meisten Anwendungen bietet mittlerer Aufwand ein gutes Gleichgewicht zwischen Qualität und Effizienz.
-
Verwenden Sie niedrig für Automatisierung: Wenn Antworten von Code verarbeitet werden, anstatt von Menschen gelesen zu werden, kann niedriger Aufwand die Kosten erheblich senken, ohne die Genauigkeit zu beeinträchtigen.
-
Testen Sie Ihren Anwendungsfall: Die Auswirkung von Aufwandsebenen variiert je nach Aufgabentyp. Bewerten Sie die Leistung bei Ihren spezifischen Anwendungsfällen, bevor Sie bereitstellen.
-
Überwachen Sie die Qualität: Während die Genauigkeit über Aufwandsebenen hinweg im Allgemeinen erhalten bleibt, variiert die Erklärungsqualität. Stellen Sie sicher, dass die von Ihnen gewählte Ebene die Anforderungen Ihrer Benutzer erfüllt.
-
Erwägen Sie dynamischen Aufwand: Passen Sie den Aufwand basierend auf Aufgabenkomplexität oder Benutzervorliebe an. Einfache Anfragen können niedrigen Aufwand rechtfertigen, während komplexe Analysen von hohem Aufwand profitieren.