Loading...
    • Erstellen
    • Admin
    • Modelle & Preise
    • Client SDKs
    • API-Referenz
    Search...
    ⌘K
    Erste Schritte
    Einführung in ClaudeSchnellstart
    Mit Claude erstellen
    FunktionsübersichtVerwendung der Messages APIClaude API-FähigkeitStop-Gründe verarbeiten
    Modellmöglichkeiten
    Extended ThinkingAdaptive ThinkingAufwandTask Budgets (Beta)Fast Mode (Beta: Research Preview)Strukturierte AusgabenZitateStreaming MessagesBatch-VerarbeitungSuchergebnisseStreaming-AblehnungenMehrsprachige UnterstützungEmbeddings
    Tools
    ÜbersichtWie Tool-Nutzung funktioniertWeb Search ToolWeb Fetch ToolCode Execution ToolAdvisor ToolMemory ToolBash ToolComputer Use ToolText Editor Tool
    Tool-Infrastruktur
    Tool-ReferenzTool-SucheProgrammgesteuerte Tool-AufrufeFeingranulares Tool-Streaming
    Kontextverwaltung
    KontextfensterKomprimierungKontextbearbeitungPrompt CachingToken-Zählung
    Mit Dateien arbeiten
    Files APIPDF-UnterstützungBilder und Vision
    Skills
    ÜbersichtSchnellstartBest PracticesSkills für UnternehmenSkills in der API
    MCP
    Remote MCP ServerMCP Connector
    Prompt Engineering
    ÜbersichtBest Practices für PromptingConsole Prompting Tools
    Testen und evaluieren
    Erfolg definieren und Evaluierungen erstellenVerwendung des Evaluation Tools in ConsoleLatenz reduzieren
    Guardrails verstärken
    Halluzinationen reduzierenAusgabekonsistenz erhöhenJailbreaks abschwächenPrompt-Leak reduzieren
    Ressourcen
    Glossar
    Versionshinweise
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Modellmöglichkeiten

    Aufwand

    Kontrollieren Sie, wie viele Token Claude bei der Beantwortung mit dem Aufwand-Parameter verwendet, und wägen Sie zwischen Gründlichkeit der Antwort und Token-Effizienz ab.

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    Der Aufwand-Parameter ermöglicht es Ihnen zu kontrollieren, wie bereitwillig Claude Token ausgibt, wenn er auf Anfragen antwortet. Dies gibt Ihnen die Möglichkeit, zwischen Gründlichkeit der Antwort und Token-Effizienz abzuwägen, alles mit einem einzigen Modell. Der Aufwand-Parameter ist allgemein auf allen unterstützten Modellen verfügbar und erfordert keinen Beta-Header.

    Der Aufwand-Parameter wird von Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 und Claude Opus 4.5 unterstützt.

    Für Claude Opus 4.6 und Sonnet 4.6 ersetzt Aufwand budget_tokens als empfohlene Methode zur Kontrolle der Denktiefe. Kombinieren Sie Aufwand mit adaptivem Denken (thinking: {type: "adaptive"}) für die beste Erfahrung. Während budget_tokens auf Opus 4.6 und Sonnet 4.6 noch akzeptiert wird, ist es veraltet und wird in einer zukünftigen Modellversion entfernt. Bei high (Standard) und max Aufwand wird Claude fast immer denken. Bei niedrigeren Aufwandsebenen kann es das Denken bei einfacheren Problemen überspringen.

    Wie Aufwand funktioniert

    Standardmäßig verwendet Claude hohen Aufwand und gibt so viele Token aus, wie für hervorragende Ergebnisse erforderlich sind. Sie können die Aufwandsebene auf max erhöhen, um die absolute höchste Leistung zu erreichen, oder sie senken, um sparsamer mit Token-Nutzung umzugehen und Geschwindigkeit und Kosten zu optimieren, während Sie eine gewisse Leistungsreduktion akzeptieren.

    Das Setzen von effort auf "high" erzeugt genau das gleiche Verhalten wie das Weglassen des effort-Parameters vollständig.

    Der Aufwand-Parameter beeinflusst alle Token in der Antwort, einschließlich:

    • Textantworten und Erklärungen
    • Tool-Aufrufe und Funktionsargumente
    • Erweitertes Denken (wenn aktiviert)

    Dieser Ansatz hat zwei große Vorteile:

    1. Es erfordert nicht, dass Denken aktiviert ist, um es zu verwenden.
    2. Es kann alle Token-Ausgaben beeinflussen, einschließlich Tool-Aufrufe. Zum Beispiel würde niedrigerer Aufwand bedeuten, dass Claude weniger Tool-Aufrufe macht. Dies gibt einen viel größeren Grad an Kontrolle über die Effizienz.

    Aufwandsebenen

    EbeneBeschreibungTypischer Anwendungsfall
    maxAbsolute maximale Leistung ohne Einschränkungen bei der Token-Ausgabe. Verfügbar auf Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 und Claude Sonnet 4.6.Aufgaben, die tiefste mögliche Überlegung und gründlichste Analyse erfordern
    xhighErweiterte Leistung für langfristige Arbeiten. Verfügbar auf Claude Opus 4.7.Langfristige agentengesteuerte und Codierungsaufgaben (über 30 Minuten) mit Token-Budgets in Millionen
    highHohe Leistung. Gleichbedeutend mit dem Nicht-Setzen des Parameters.Komplexe Überlegungen, schwierige Codierungsprobleme, agentengesteuerte Aufgaben
    mediumAusgewogener Ansatz mit moderaten Token-Einsparungen.Agentengesteuerte Aufgaben, die ein Gleichgewicht zwischen Geschwindigkeit, Kosten und Leistung erfordern
    lowAm effizientesten. Erhebliche Token-Einsparungen mit etwas Leistungsreduktion.Einfachere Aufgaben, die die beste Geschwindigkeit und niedrigste Kosten benötigen, wie z.B. Subagenten

    Aufwand ist ein Verhaltenssignal, kein striktes Token-Budget. Bei niedrigeren Aufwandsebenen wird Claude bei ausreichend schwierigen Problemen immer noch denken, aber es wird weniger denken als bei höheren Aufwandsebenen für das gleiche Problem.

    Empfohlene Aufwandsebenen für Sonnet 4.6

    Sonnet 4.6 hat standardmäßig high Aufwand. Setzen Sie Aufwand explizit bei Verwendung von Sonnet 4.6, um unerwartete Latenz zu vermeiden:

    • Medium Aufwand (empfohlener Standard): Beste Balance zwischen Geschwindigkeit, Kosten und Leistung für die meisten Anwendungen. Geeignet für agentengesteuerte Codierung, Tool-intensive Workflows und Code-Generierung.
    • Low Aufwand: Für hochvolumige oder latenzempfindliche Workloads. Geeignet für Chat und nicht-Codierungs-Anwendungsfälle, bei denen schnellere Bearbeitung Priorität hat.
    • High Aufwand: Für Aufgaben, die maximale Intelligenz von Sonnet 4.6 erfordern.
    • Max Aufwand: Für Aufgaben, die absolute höchste Leistung ohne Einschränkungen bei der Token-Ausgabe erfordern.

    Empfohlene Aufwandsebenen für Claude Opus 4.7

    Beginnen Sie mit xhigh für Codierungs- und agentengesteuerte Anwendungsfälle, und verwenden Sie high als Minimum für die meisten intelligenzempfindlichen Workloads. Senken Sie auf medium für kostenempfindliche Workloads, oder erhöhen Sie auf max nur, wenn Ihre Evaluierungen messbaren Spielraum bei xhigh zeigen.

    Der API-Standard ist high. Um xhigh zu verwenden, setzen Sie effort explizit; der Wert, den Sie übergeben, überschreibt den Standard.

    AufwandAnleitung für Claude Opus 4.7
    lowEffizient, aber am besten für kurze, begrenzte Aufgaben. Kombinieren Sie low mit expliziten Checklisten, wenn Ihre Aufgabe mehrere Abschnitte hat.
    mediumDer Drop-in für den durchschnittlichen Workflow, bei dem Sie gute Ergebnisse wünschen und gleichzeitig Kosten senken möchten.
    highFortgeschrittene Anwendungsfälle, die immer noch ein Gleichgewicht zwischen Intelligenz und Token-Verbrauch benötigen. Dies ist oft der süße Punkt zwischen Qualität und Token-Effizienz.
    xhighDer empfohlene Startpunkt für Codierungs- und agentengesteuerte Arbeiten sowie für explorative Aufgaben wie wiederholte Tool-Aufrufe, detaillierte Websuche und Wissensdatenbank-Suche. Erwarten Sie deutlich höhere Token-Nutzung als high.
    maxReservieren Sie für echte Grenzprobleme. Bei den meisten Workloads fügt max erhebliche Kosten für relativ kleine Qualitätsgewinne hinzu, und bei einigen strukturierten Ausgabe- oder weniger intelligenzempfindlichen Aufgaben kann es zu Überdenken führen.

    Claude Opus 4.7 respektiert Aufwandsebenen auch strenger als Claude Opus 4.6, besonders bei low und medium. Bei niedrigeren Aufwandsebenen begrenzt das Modell seine Arbeit auf das, was gefragt wurde, anstatt darüber hinauszugehen. Wenn Sie flaches Denken bei komplexen Problemen mit Claude Opus 4.7 beobachten, erhöhen Sie den Aufwand, anstatt es zu umgehen. Wenn Sie den Aufwand aus Latenzgründen niedrig halten müssen, fügen Sie gezielt Anleitung hinzu wie „Diese Aufgabe beinhaltet mehrstufiges Denken. Denken Sie sorgfältig nach, bevor Sie antworten."

    Wenn Sie Claude Opus 4.7 mit xhigh oder max Aufwand ausführen, setzen Sie ein großes max_tokens, damit das Modell Platz zum Denken und Handeln über Subagenten und Tool-Aufrufe hinweg hat. Ein Anfang bei 64k Token und Abstimmung von dort ist ein angemessener Standard.

    Grundlegende Verwendung

    client = anthropic.Anthropic()
    
    response = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=4096,
        messages=[
            {
                "role": "user",
                "content": "Analyze the trade-offs between microservices and monolithic architectures",
            }
        ],
        output_config={"effort": "medium"},
    )
    
    print(response.content[0].text)

    Wann Sie den Aufwand-Parameter anpassen sollten

    • Verwenden Sie max Aufwand, wenn Sie die absolute höchste Leistung ohne Einschränkungen benötigen: die gründlichste Überlegung und tiefste Analyse. Verfügbar auf Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 und Claude Sonnet 4.6.
    • Verwenden Sie xhigh Aufwand für fortgeschrittene Codierung und komplexe agentengesteuerte Arbeiten, die erweiterte Erkundung erfordern, wie wiederholte Tool-Aufrufe und detaillierte Suche. Verfügbar auf Claude Opus 4.7.
    • Verwenden Sie high Aufwand (Standard), wenn Sie Claudes beste Arbeit benötigen: komplexe Überlegungen, nuancierte Analysen, schwierige Codierungsprobleme oder jede Aufgabe, bei der Qualität die oberste Priorität ist.
    • Verwenden Sie medium Aufwand als ausgewogene Option, wenn Sie solide Leistung ohne die volle Token-Ausgabe von hohem Aufwand wünschen.
    • Verwenden Sie low Aufwand, wenn Sie Geschwindigkeit optimieren (weil Claude mit weniger Token antwortet) oder Kosten. Zum Beispiel einfache Klassifizierungsaufgaben, schnelle Nachschlagvorgänge oder hochvolumige Anwendungsfälle, bei denen marginale Qualitätsverbesserungen zusätzliche Latenz oder Ausgaben nicht rechtfertigen.

    Aufwand mit Tool-Nutzung

    Bei Verwendung von Tools beeinflusst der Aufwand-Parameter sowohl die Erklärungen um Tool-Aufrufe als auch die Tool-Aufrufe selbst. Niedrigere Aufwandsebenen neigen dazu zu:

    • Mehrere Operationen in weniger Tool-Aufrufe kombinieren
    • Weniger Tool-Aufrufe machen
    • Direkt zur Aktion ohne Vorrede gehen
    • Knappe Bestätigungsmeldungen nach Abschluss verwenden

    Höhere Aufwandsebenen können:

    • Mehr Tool-Aufrufe machen
    • Den Plan vor Maßnahmen erklären
    • Detaillierte Zusammenfassungen von Änderungen bereitstellen
    • Umfassendere Code-Kommentare enthalten

    Aufwand mit erweitertem Denken

    Der Aufwand-Parameter funktioniert zusammen mit erweitertem Denken. Sein Verhalten hängt vom Modell ab:

    • Claude Mythos Preview verwendet adaptives Denken standardmäßig (keine thinking-Konfiguration erforderlich). thinking: {type: "disabled"} wird abgelehnt. Aufwand kontrolliert die Denktiefe auf die gleiche Weise wie auf Opus 4.7 und Opus 4.6.
    • Claude Opus 4.7 verwendet adaptives Denken (thinking: {type: "adaptive"}), wobei Aufwand die empfohlene Kontrolle für die Denktiefe ist. Manuelles erweitertes Denken (thinking: {type: "enabled", budget_tokens: N}) wird auf Opus 4.7 nicht mehr unterstützt; verwenden Sie stattdessen adaptives Denken mit Aufwand. Bei high, xhigh und max Aufwand denkt Claude fast immer tief. Bei niedrigeren Ebenen kann es das Denken bei einfacheren Problemen überspringen.
    • Claude Opus 4.6 verwendet adaptives Denken (thinking: {type: "adaptive"}), wobei Aufwand die empfohlene Kontrolle für die Denktiefe ist. Während budget_tokens auf Opus 4.6 noch akzeptiert wird, ist es veraltet und wird in einer zukünftigen Version entfernt. Bei high und max Aufwand denkt Claude fast immer tief. Bei niedrigeren Ebenen kann es das Denken bei einfacheren Problemen überspringen.
    • Claude Sonnet 4.6 verwendet adaptives Denken (wobei Aufwand die Denktiefe kontrolliert). Manuelles Denken mit verschachteltem Modus (thinking: {type: "enabled", budget_tokens: N}) ist noch funktional, aber veraltet.
    • Claude Opus 4.5 und andere Claude 4 Modelle verwenden manuelles Denken (thinking: {type: "enabled", budget_tokens: N}), wobei Aufwand zusammen mit dem Denk-Token-Budget funktioniert. Setzen Sie die Aufwandsebene für Ihre Aufgabe, dann setzen Sie das Denk-Token-Budget basierend auf der Aufgabenkomplexität.

    Der Aufwand-Parameter kann mit oder ohne aktiviertes erweitertes Denken verwendet werden. Wenn es ohne Denken verwendet wird, kontrolliert es immer noch die Gesamttoken-Ausgabe für Textantworten und Tool-Aufrufe.

    Best Practices

    1. Setzen Sie Aufwand explizit: Die API hat standardmäßig high, aber der richtige Startpunkt hängt von Ihrem Modell und Ihrer Workload ab.
    2. Verwenden Sie low für geschwindigkeitsempfindliche oder einfache Aufgaben: Wenn Latenz wichtig ist oder Aufgaben unkompliziert sind, kann niedriger Aufwand Antwortzeiten und Kosten erheblich reduzieren.
    3. Testen Sie Ihren Anwendungsfall: Die Auswirkung von Aufwandsebenen variiert je nach Aufgabentyp. Evaluieren Sie die Leistung bei Ihren spezifischen Anwendungsfällen, bevor Sie bereitstellen.
    4. Erwägen Sie dynamischen Aufwand: Passen Sie den Aufwand basierend auf der Aufgabenkomplexität an. Einfache Abfragen können niedrigen Aufwand rechtfertigen, während agentengesteuerte Codierung und komplexe Überlegungen von hohem Aufwand profitieren.

    Was this page helpful?

    • Wie Aufwand funktioniert
    • Aufwandsebenen
    • Empfohlene Aufwandsebenen für Sonnet 4.6
    • Empfohlene Aufwandsebenen für Claude Opus 4.7
    • Grundlegende Verwendung
    • Wann Sie den Aufwand-Parameter anpassen sollten
    • Aufwand mit Tool-Nutzung
    • Aufwand mit erweitertem Denken
    • Best Practices