Loading...
  • Erstellen
  • Admin
  • Modelle & Preise
  • Client-SDKs
  • API-Referenz
Search...
⌘K
Log in
Aufwand
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Erstellen/Modellfähigkeiten

Aufwand

Kontrollieren Sie, wie viele Token Claude bei der Beantwortung mit dem Aufwand-Parameter verwendet, und wägen Sie zwischen Gründlichkeit der Antwort und Token-Effizienz ab.

Was this page helpful?

  • Wie Aufwand funktioniert
  • Aufwandsebenen
  • Empfohlene Aufwandsebenen für Sonnet 4.6
  • Empfohlene Aufwandsebenen für Claude Opus 4.7
  • Grundlegende Verwendung
  • Wann Sie den Aufwand-Parameter anpassen sollten
  • Aufwand mit Tool-Nutzung
  • Aufwand mit erweitertem Denken
  • Best Practices

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Der Aufwand-Parameter ermöglicht es Ihnen zu kontrollieren, wie bereitwillig Claude Token ausgibt, wenn er auf Anfragen antwortet. Dies gibt Ihnen die Möglichkeit, zwischen Gründlichkeit der Antwort und Token-Effizienz abzuwägen, alles mit einem einzigen Modell. Der Aufwand-Parameter ist allgemein auf allen unterstützten Modellen verfügbar und erfordert keinen Beta-Header.

Der Aufwand-Parameter wird von Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 und Claude Opus 4.5 unterstützt.

Für Claude Opus 4.6 und Sonnet 4.6 ersetzt Aufwand budget_tokens als empfohlene Methode zur Kontrolle der Denktiefe. Kombinieren Sie Aufwand mit adaptivem Denken (thinking: {type: "adaptive"}) für die beste Erfahrung. Während budget_tokens auf Opus 4.6 und Sonnet 4.6 noch akzeptiert wird, ist es veraltet und wird in einer zukünftigen Modellversion entfernt. Bei high (Standard) und max Aufwand wird Claude fast immer denken. Bei niedrigeren Aufwandsebenen kann es das Denken bei einfacheren Problemen überspringen.

Wie Aufwand funktioniert

Standardmäßig verwendet Claude hohen Aufwand und gibt so viele Token aus, wie für hervorragende Ergebnisse erforderlich sind. Sie können die Aufwandsebene auf max erhöhen, um die absolute höchste Leistung zu erreichen, oder sie senken, um sparsamer mit Token-Nutzung umzugehen und Geschwindigkeit und Kosten zu optimieren, während Sie eine gewisse Leistungsreduktion akzeptieren.

Das Setzen von effort auf "high" erzeugt genau das gleiche Verhalten wie das Weglassen des effort-Parameters vollständig.

Der Aufwand-Parameter beeinflusst alle Token in der Antwort, einschließlich:

  • Textantworten und Erklärungen
  • Tool-Aufrufe und Funktionsargumente
  • Erweitertes Denken (wenn aktiviert)

Dieser Ansatz hat zwei große Vorteile:

  1. Es erfordert nicht, dass Denken aktiviert ist, um es zu verwenden.
  2. Es kann alle Token-Ausgaben beeinflussen, einschließlich Tool-Aufrufe. Zum Beispiel würde niedrigerer Aufwand bedeuten, dass Claude weniger Tool-Aufrufe macht. Dies gibt einen viel größeren Grad an Kontrolle über die Effizienz.

Aufwandsebenen

EbeneBeschreibungTypischer Anwendungsfall
maxAbsolute maximale Leistung ohne Einschränkungen bei der Token-Ausgabe. Verfügbar auf Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 und Claude Sonnet 4.6.Aufgaben, die tiefste mögliche Überlegung und gründlichste Analyse erfordern
xhighErweiterte Leistung für langfristige Arbeiten. Verfügbar auf Claude Opus 4.7.Langfristige agentengesteuerte und Codierungsaufgaben (über 30 Minuten) mit Token-Budgets in Millionen
highHohe Leistung. Gleichbedeutend mit dem Nicht-Setzen des Parameters.Komplexe Überlegungen, schwierige Codierungsprobleme, agentengesteuerte Aufgaben
mediumAusgewogener Ansatz mit moderaten Token-Einsparungen.Agentengesteuerte Aufgaben, die ein Gleichgewicht zwischen Geschwindigkeit, Kosten und Leistung erfordern
lowAm effizientesten. Erhebliche Token-Einsparungen mit etwas Leistungsreduktion.

Aufwand ist ein Verhaltenssignal, kein striktes Token-Budget. Bei niedrigeren Aufwandsebenen wird Claude bei ausreichend schwierigen Problemen immer noch denken, aber es wird weniger denken als bei höheren Aufwandsebenen für das gleiche Problem.

Empfohlene Aufwandsebenen für Sonnet 4.6

Sonnet 4.6 hat standardmäßig high Aufwand. Setzen Sie Aufwand explizit bei Verwendung von Sonnet 4.6, um unerwartete Latenz zu vermeiden:

  • Medium Aufwand (empfohlener Standard): Beste Balance zwischen Geschwindigkeit, Kosten und Leistung für die meisten Anwendungen. Geeignet für agentengesteuerte Codierung, Tool-intensive Workflows und Code-Generierung.
  • Low Aufwand: Für hochvolumige oder latenzempfindliche Workloads. Geeignet für Chat und nicht-Codierungs-Anwendungsfälle, bei denen schnellere Bearbeitung Priorität hat.
  • High Aufwand: Für Aufgaben, die maximale Intelligenz von Sonnet 4.6 erfordern.
  • Max Aufwand: Für Aufgaben, die absolute höchste Leistung ohne Einschränkungen bei der Token-Ausgabe erfordern.

Empfohlene Aufwandsebenen für Claude Opus 4.7

Beginnen Sie mit xhigh für Codierungs- und agentengesteuerte Anwendungsfälle, und verwenden Sie high als Minimum für die meisten intelligenzempfindlichen Workloads. Senken Sie auf medium für kostenempfindliche Workloads, oder erhöhen Sie auf max nur, wenn Ihre Evaluierungen messbaren Spielraum bei xhigh zeigen.

Der API-Standard ist high. Um xhigh zu verwenden, setzen Sie effort explizit; der Wert, den Sie übergeben, überschreibt den Standard.

AufwandAnleitung für Claude Opus 4.7
lowEffizient, aber am besten für kurze, begrenzte Aufgaben. Kombinieren Sie low mit expliziten Checklisten, wenn Ihre Aufgabe mehrere Abschnitte hat.
mediumDer Drop-in für den durchschnittlichen Workflow, bei dem Sie gute Ergebnisse wünschen und gleichzeitig Kosten senken möchten.
highFortgeschrittene Anwendungsfälle, die immer noch ein Gleichgewicht zwischen Intelligenz und Token-Verbrauch benötigen. Dies ist oft der süße Punkt zwischen Qualität und Token-Effizienz.
xhighDer empfohlene Startpunkt für Codierungs- und agentengesteuerte Arbeiten sowie für explorative Aufgaben wie wiederholte Tool-Aufrufe, detaillierte Websuche und Wissensdatenbank-Suche. Erwarten Sie deutlich höhere Token-Nutzung als high.
maxReservieren Sie für echte Grenzprobleme. Bei den meisten Workloads fügt max erhebliche Kosten für relativ kleine Qualitätsgewinne hinzu, und bei einigen strukturierten Ausgabe- oder weniger intelligenzempfindlichen Aufgaben kann es zu Überdenken führen.

Claude Opus 4.7 respektiert Aufwandsebenen auch strenger als Claude Opus 4.6, besonders bei low und medium. Bei niedrigeren Aufwandsebenen begrenzt das Modell seine Arbeit auf das, was gefragt wurde, anstatt darüber hinauszugehen. Wenn Sie flaches Denken bei komplexen Problemen mit Claude Opus 4.7 beobachten, erhöhen Sie den Aufwand, anstatt es zu umgehen. Wenn Sie den Aufwand aus Latenzgründen niedrig halten müssen, fügen Sie gezielt Anleitung hinzu wie „Diese Aufgabe beinhaltet mehrstufiges Denken. Denken Sie sorgfältig nach, bevor Sie antworten."

Wenn Sie Claude Opus 4.7 mit xhigh oder max Aufwand ausführen, setzen Sie ein großes max_tokens, damit das Modell Platz zum Denken und Handeln über Subagenten und Tool-Aufrufe hinweg hat. Ein Anfang bei 64k Token und Abstimmung von dort ist ein angemessener Standard.

Grundlegende Verwendung

Wann Sie den Aufwand-Parameter anpassen sollten

  • Verwenden Sie max Aufwand, wenn Sie die absolute höchste Leistung ohne Einschränkungen benötigen: die gründlichste Überlegung und tiefste Analyse. Verfügbar auf Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 und Claude Sonnet 4.6.
  • Verwenden Sie xhigh Aufwand für fortgeschrittene Codierung und komplexe agentengesteuerte Arbeiten, die erweiterte Erkundung erfordern, wie wiederholte Tool-Aufrufe und detaillierte Suche. Verfügbar auf Claude Opus 4.7.
  • Verwenden Sie high Aufwand (Standard), wenn Sie Claudes beste Arbeit benötigen: komplexe Überlegungen, nuancierte Analysen, schwierige Codierungsprobleme oder jede Aufgabe, bei der Qualität die oberste Priorität ist.
  • Verwenden Sie medium Aufwand als ausgewogene Option, wenn Sie solide Leistung ohne die volle Token-Ausgabe von hohem Aufwand wünschen.
  • Verwenden Sie low Aufwand, wenn Sie Geschwindigkeit optimieren (weil Claude mit weniger Token antwortet) oder Kosten. Zum Beispiel einfache Klassifizierungsaufgaben, schnelle Nachschlagvorgänge oder hochvolumige Anwendungsfälle, bei denen marginale Qualitätsverbesserungen zusätzliche Latenz oder Ausgaben nicht rechtfertigen.

Aufwand mit Tool-Nutzung

Bei Verwendung von Tools beeinflusst der Aufwand-Parameter sowohl die Erklärungen um Tool-Aufrufe als auch die Tool-Aufrufe selbst. Niedrigere Aufwandsebenen neigen dazu zu:

  • Mehrere Operationen in weniger Tool-Aufrufe kombinieren
  • Weniger Tool-Aufrufe machen
  • Direkt zur Aktion ohne Vorrede gehen
  • Knappe Bestätigungsmeldungen nach Abschluss verwenden

Höhere Aufwandsebenen können:

  • Mehr Tool-Aufrufe machen
  • Den Plan vor Maßnahmen erklären
  • Detaillierte Zusammenfassungen von Änderungen bereitstellen
  • Umfassendere Code-Kommentare enthalten

Aufwand mit erweitertem Denken

Der Aufwand-Parameter funktioniert zusammen mit erweitertem Denken. Sein Verhalten hängt vom Modell ab:

  • Claude Mythos Preview verwendet adaptives Denken standardmäßig (keine thinking-Konfiguration erforderlich). thinking: {type: "disabled"} wird abgelehnt. Aufwand kontrolliert die Denktiefe auf die gleiche Weise wie auf Opus 4.7 und Opus 4.6.
  • Claude Opus 4.7 verwendet adaptives Denken (thinking: {type: "adaptive"}), wobei Aufwand die empfohlene Kontrolle für die Denktiefe ist. Manuelles erweitertes Denken (thinking: {type: "enabled", budget_tokens: N}) wird auf Opus 4.7 nicht mehr unterstützt; verwenden Sie stattdessen adaptives Denken mit Aufwand. Bei high, xhigh und max Aufwand denkt Claude fast immer tief. Bei niedrigeren Ebenen kann es das Denken bei einfacheren Problemen überspringen.
  • Claude Opus 4.6 verwendet adaptives Denken (thinking: {type: "adaptive"}), wobei Aufwand die empfohlene Kontrolle für die Denktiefe ist. Während budget_tokens auf Opus 4.6 noch akzeptiert wird, ist es veraltet und wird in einer zukünftigen Version entfernt. Bei high und Aufwand denkt Claude fast immer tief. Bei niedrigeren Ebenen kann es das Denken bei einfacheren Problemen überspringen.

Der Aufwand-Parameter kann mit oder ohne aktiviertes erweitertes Denken verwendet werden. Wenn es ohne Denken verwendet wird, kontrolliert es immer noch die Gesamttoken-Ausgabe für Textantworten und Tool-Aufrufe.

Best Practices

  1. Setzen Sie Aufwand explizit: Die API hat standardmäßig high, aber der richtige Startpunkt hängt von Ihrem Modell und Ihrer Workload ab.
  2. Verwenden Sie low für geschwindigkeitsempfindliche oder einfache Aufgaben: Wenn Latenz wichtig ist oder Aufgaben unkompliziert sind, kann niedriger Aufwand Antwortzeiten und Kosten erheblich reduzieren.
  3. Testen Sie Ihren Anwendungsfall: Die Auswirkung von Aufwandsebenen variiert je nach Aufgabentyp. Evaluieren Sie die Leistung bei Ihren spezifischen Anwendungsfällen, bevor Sie bereitstellen.
  4. Erwägen Sie dynamischen Aufwand: Passen Sie den Aufwand basierend auf der Aufgabenkomplexität an. Einfache Abfragen können niedrigen Aufwand rechtfertigen, während agentengesteuerte Codierung und komplexe Überlegungen von hohem Aufwand profitieren.
Einfachere Aufgaben, die die beste Geschwindigkeit und niedrigste Kosten benötigen, wie z.B. Subagenten
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)
max
  • Claude Sonnet 4.6 verwendet adaptives Denken (wobei Aufwand die Denktiefe kontrolliert). Manuelles Denken mit verschachteltem Modus (thinking: {type: "enabled", budget_tokens: N}) ist noch funktional, aber veraltet.
  • Claude Opus 4.5 und andere Claude 4 Modelle verwenden manuelles Denken (thinking: {type: "enabled", budget_tokens: N}), wobei Aufwand zusammen mit dem Denk-Token-Budget funktioniert. Setzen Sie die Aufwandsebene für Ihre Aufgabe, dann setzen Sie das Denk-Token-Budget basierend auf der Aufgabenkomplexität.