Loading...
    • Erstellen
    • Admin
    • Modelle & Preise
    • Client SDKs
    • API-Referenz
    Search...
    ⌘K
    Erste Schritte
    Einführung in ClaudeSchnellstart
    Entwickeln mit Claude
    FunktionsübersichtVerwendung der Messages APIStoppgründe behandeln
    Modellfähigkeiten
    Erweitertes DenkenAdaptives DenkenAufwandSchnellmodus (Beta: Forschungsvorschau)Strukturierte AusgabenZitateStreaming-NachrichtenStapelverarbeitungSuchergebnisseStreaming-AblehnungenMehrsprachige UnterstützungEmbeddings
    Tools
    ÜbersichtWie Tool-Nutzung funktioniertWeb-SuchtoolWeb-AbruftoolCode-AusführungstoolSpeichertoolBash-ToolComputer-Use-ToolTexteditor-Tool
    Tool-Infrastruktur
    Tool-SucheProgrammatisches Tool-AufrufenFeingranulares Tool-Streaming
    Kontextverwaltung
    KontextfensterKomprimierungKontextbearbeitungPrompt-CachingToken-Zählung
    Mit Dateien arbeiten
    Files APIPDF-UnterstützungBilder und Vision
    Skills
    ÜbersichtSchnellstartBest PracticesSkills für UnternehmenSkills in der API
    MCP
    Remote-MCP-ServerMCP-Connector
    Prompt-Engineering
    ÜbersichtBest Practices für PromptsConsole-Prompting-Tools
    Testen und Evaluieren
    Erfolg definieren und Evaluierungen erstellenDas Evaluierungstool in der Console verwendenLatenz reduzieren
    Leitplanken stärken
    Halluzinationen reduzierenAusgabekonsistenz erhöhenJailbreaks abmildernPrompt-Lecks reduzieren
    Ressourcen
    Glossar
    Versionshinweise
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Modellfähigkeiten

    Aufwand

    Kontrollieren Sie, wie viele Token Claude beim Antworten mit dem Aufwand-Parameter verwendet, und wägen Sie zwischen Gründlichkeit der Antwort und Token-Effizienz ab.

    Was this page helpful?

    • Wie Aufwand funktioniert
    • Aufwandsebenen
    • Empfohlene Aufwandsebenen für Sonnet 4.6
    • Grundlegende Verwendung
    • Wann der Aufwand-Parameter angepasst werden sollte
    • Aufwand mit Tool-Nutzung
    • Aufwand mit erweitertem Denken
    • Best Practices

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    Der Aufwand-Parameter ermöglicht es Ihnen zu kontrollieren, wie bereitwillig Claude Token beim Antworten auf Anfragen ausgibt. Dies gibt Ihnen die Möglichkeit, zwischen Gründlichkeit der Antwort und Token-Effizienz abzuwägen, alles mit einem einzigen Modell. Der Aufwand-Parameter ist allgemein auf allen unterstützten Modellen verfügbar und erfordert keinen Beta-Header.

    Der Aufwand-Parameter wird von Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6 und Claude Opus 4.5 unterstützt.

    Für Claude Opus 4.6 und Sonnet 4.6 ersetzt Aufwand budget_tokens als empfohlene Methode zur Kontrolle der Denktiefe. Kombinieren Sie Aufwand mit adaptivem Denken (thinking: {type: "adaptive"}) für das beste Erlebnis. Während budget_tokens auf Opus 4.6 und Sonnet 4.6 noch akzeptiert wird, ist es veraltet und wird in einer zukünftigen Modellversion entfernt. Bei high (Standard) und max Aufwand wird Claude fast immer denken. Bei niedrigeren Aufwandsebenen kann es das Denken bei einfacheren Problemen überspringen.

    Wie Aufwand funktioniert

    Standardmäßig verwendet Claude hohen Aufwand und gibt so viele Token wie nötig für hervorragende Ergebnisse aus. Sie können die Aufwandsebene auf max erhöhen, um die absolut höchste Leistung zu erreichen, oder sie senken, um sparsamer mit Token-Nutzung umzugehen und Geschwindigkeit und Kosten zu optimieren, während Sie eine gewisse Leistungsreduktion akzeptieren.

    Das Setzen von effort auf "high" erzeugt genau das gleiche Verhalten wie das Weglassen des effort-Parameters vollständig.

    Der Aufwand-Parameter beeinflusst alle Token in der Antwort, einschließlich:

    • Textantworten und Erklärungen
    • Tool-Aufrufe und Funktionsargumente
    • Erweitertes Denken (wenn aktiviert)

    Dieser Ansatz hat zwei große Vorteile:

    1. Es erfordert nicht, dass Denken aktiviert ist, um es zu verwenden.
    2. Es kann alle Token-Ausgaben beeinflussen, einschließlich Tool-Aufrufe. Zum Beispiel würde niedrigerer Aufwand bedeuten, dass Claude weniger Tool-Aufrufe macht. Dies gibt einen viel größeren Grad an Kontrolle über Effizienz.

    Aufwandsebenen

    EbeneBeschreibungTypischer Anwendungsfall
    maxAbsolute maximale Leistung ohne Einschränkungen bei der Token-Ausgabe. Verfügbar auf Claude Mythos Preview, Claude Opus 4.6 und Claude Sonnet 4.6.Aufgaben, die tiefste mögliche Überlegungen und gründlichste Analyse erfordern
    highHohe Leistung. Entspricht dem Nicht-Setzen des Parameters.Komplexe Überlegungen, schwierige Codierungsprobleme, agentengestützte Aufgaben
    mediumAusgewogener Ansatz mit moderaten Token-Einsparungen.Agentengestützte Aufgaben, die ein Gleichgewicht zwischen Geschwindigkeit, Kosten und Leistung erfordern
    lowAm effizientesten. Erhebliche Token-Einsparungen mit einiger Leistungsreduktion.Einfachere Aufgaben, die beste Geschwindigkeit und niedrigste Kosten benötigen, wie Subagenten

    Aufwand ist ein Verhaltenssignal, kein striktes Token-Budget. Bei niedrigeren Aufwandsebenen wird Claude bei ausreichend schwierigen Problemen immer noch denken, aber es wird weniger denken als bei höheren Aufwandsebenen für das gleiche Problem.

    Empfohlene Aufwandsebenen für Sonnet 4.6

    Sonnet 4.6 hat standardmäßig high Aufwand. Setzen Sie Aufwand explizit bei Verwendung von Sonnet 4.6, um unerwartete Latenz zu vermeiden:

    • Mittlerer Aufwand (empfohlener Standard): Beste Balance zwischen Geschwindigkeit, Kosten und Leistung für die meisten Anwendungen. Geeignet für agentengestützte Codierung, Tool-intensive Workflows und Code-Generierung.
    • Niedriger Aufwand: Für hochvolumige oder latenzempfindliche Workloads. Geeignet für Chat und nicht-codierende Anwendungsfälle, bei denen schnellere Bearbeitung Priorität hat.
    • Hoher Aufwand: Für Aufgaben, die maximale Intelligenz von Sonnet 4.6 erfordern.
    • Maximaler Aufwand: Für Aufgaben, die die absolut höchste Leistung ohne Einschränkungen bei der Token-Ausgabe erfordern.

    Grundlegende Verwendung

    Wann der Aufwand-Parameter angepasst werden sollte

    • Verwenden Sie maximalen Aufwand, wenn Sie die absolut höchste Leistung ohne Einschränkungen benötigen: die gründlichsten Überlegungen und tiefste Analyse. Verfügbar auf Claude Mythos Preview, Claude Opus 4.6 und Claude Sonnet 4.6.
    • Verwenden Sie hohen Aufwand (Standard), wenn Sie Claudes beste Arbeit benötigen: komplexe Überlegungen, nuancierte Analyse, schwierige Codierungsprobleme oder jede Aufgabe, bei der Qualität oberste Priorität hat.
    • Verwenden Sie mittleren Aufwand als ausgewogene Option, wenn Sie solide Leistung ohne die vollständige Token-Ausgabe des hohen Aufwands wünschen.
    • Verwenden Sie niedrigen Aufwand, wenn Sie Geschwindigkeit optimieren (weil Claude mit weniger Token antwortet) oder Kosten. Zum Beispiel einfache Klassifizierungsaufgaben, schnelle Nachschlagungen oder hochvolumige Anwendungsfälle, bei denen marginale Qualitätsverbesserungen zusätzliche Latenz oder Ausgaben nicht rechtfertigen.

    Aufwand mit Tool-Nutzung

    Bei Verwendung von Tools beeinflusst der Aufwand-Parameter sowohl die Erklärungen um Tool-Aufrufe als auch die Tool-Aufrufe selbst. Niedrigere Aufwandsebenen neigen dazu zu:

    • Mehrere Operationen in weniger Tool-Aufrufe kombinieren
    • Weniger Tool-Aufrufe machen
    • Direkt zur Aktion ohne Vorrede übergehen
    • Knappe Bestätigungsmeldungen nach Abschluss verwenden

    Höhere Aufwandsebenen können:

    • Mehr Tool-Aufrufe machen
    • Den Plan vor Maßnahmen erklären
    • Detaillierte Zusammenfassungen von Änderungen bereitstellen
    • Umfassendere Code-Kommentare enthalten

    Aufwand mit erweitertem Denken

    Der Aufwand-Parameter funktioniert zusammen mit erweitertem Denken. Sein Verhalten hängt vom Modell ab:

    • Claude Mythos Preview verwendet adaptives Denken standardmäßig (keine thinking-Konfiguration erforderlich). thinking: {type: "disabled"} wird abgelehnt. Aufwand kontrolliert die Denktiefe auf die gleiche Weise wie auf Opus 4.6.
    • Claude Opus 4.6 verwendet adaptives Denken (thinking: {type: "adaptive"}), wobei Aufwand die empfohlene Kontrolle für die Denktiefe ist. Während budget_tokens auf Opus 4.6 noch akzeptiert wird, ist es veraltet und wird in einer zukünftigen Version entfernt. Bei high und max Aufwand denkt Claude fast immer tief. Bei niedrigeren Ebenen kann es das Denken bei einfacheren Problemen überspringen.
    • Claude Sonnet 4.6 verwendet adaptives Denken (wobei Aufwand die Denktiefe kontrolliert). Manuelles Denken mit verschachteltem Modus (thinking: {type: "enabled", budget_tokens: N}) ist noch funktional, aber veraltet.
    • Claude Opus 4.5 und andere Claude 4 Modelle verwenden manuelles Denken (), wobei Aufwand zusammen mit dem Denk-Token-Budget funktioniert. Setzen Sie die Aufwandsebene für Ihre Aufgabe, dann setzen Sie das Denk-Token-Budget basierend auf der Aufgabenkomplexität.

    Der Aufwand-Parameter kann mit oder ohne aktiviertes erweitertes Denken verwendet werden. Wenn er ohne Denken verwendet wird, kontrolliert er immer noch die Gesamttoken-Ausgabe für Textantworten und Tool-Aufrufe.

    Best Practices

    1. Setzen Sie Aufwand explizit: Die API hat standardmäßig high, aber der richtige Startpunkt hängt von Ihrem Modell und Ihrer Workload ab.
    2. Verwenden Sie niedrig für geschwindigkeitsempfindliche oder einfache Aufgaben: Wenn Latenz wichtig ist oder Aufgaben unkompliziert sind, kann niedriger Aufwand Antwortzeiten und Kosten erheblich reduzieren.
    3. Testen Sie Ihren Anwendungsfall: Die Auswirkung von Aufwandsebenen variiert je nach Aufgabentyp. Bewerten Sie die Leistung bei Ihren spezifischen Anwendungsfällen, bevor Sie bereitstellen.
    4. Erwägen Sie dynamischen Aufwand: Passen Sie Aufwand basierend auf Aufgabenkomplexität an. Einfache Abfragen können niedrigen Aufwand rechtfertigen, während agentengestützte Codierung und komplexe Überlegungen von hohem Aufwand profitieren.
    curl https://api.anthropic.com/v1/messages \
        --header "x-api-key: $ANTHROPIC_API_KEY" \
        --header "anthropic-version: 2023-06-01" \
        --header "content-type: application/json" \
        --data '{
            "model": "claude-opus-4-6",
            "max_tokens": 4096,
            "messages": [{
                "role": "user",
                "content": "Analyze the trade-offs between microservices and monolithic architectures"
            }],
            "output_config": {
                "effort": "medium"
            }
        }'
    thinking: {type: "enabled", budget_tokens: N}