Loading...
    • Entwicklerleitfaden
    • API-Referenz
    • MCP
    • Ressourcen
    • Versionshinweise
    Search...
    ⌘K
    Erste Schritte
    Einführung in ClaudeSchnelleinstieg
    Modelle & Preise
    ModellübersichtEin Modell auswählenNeuerungen in Claude 4.5Migration zu Claude 4.5ModellabschreibungenPreise
    Mit Claude entwickeln
    FunktionsübersichtVerwendung der Messages APIKontextfensterBest Practices für Prompting
    Funktionen
    Prompt-CachingKontext-BearbeitungErweitertes DenkenAufwandStreaming MessagesBatch-VerarbeitungZitationenMehrsprachige UnterstützungToken-ZählungEmbeddingsVisionPDF-UnterstützungFiles APISuchergebnisseStrukturierte Ausgaben
    Tools
    ÜbersichtTool-Verwendung implementierenToken-effiziente Tool-VerwendungFeingranulares Tool-StreamingBash-ToolCode-Ausführungs-ToolProgrammatischer Tool-AufrufComputer-Use-ToolText-Editor-ToolWeb-Abruf-ToolWeb-Such-ToolMemory-ToolTool-Such-Tool
    Agent Skills
    ÜbersichtSchnelleinstiegBest PracticesSkills mit der API verwenden
    Agent SDK
    ÜbersichtTypeScript SDKPython SDKMigrationsleitfaden
    MCP in der API
    MCP-ConnectorRemote MCP-Server
    Claude auf Drittanbieter-Plattformen
    Amazon BedrockMicrosoft FoundryVertex AI
    Prompt Engineering
    ÜbersichtPrompt-GeneratorPrompt-Vorlagen verwendenPrompt-VerbessererKlar und direkt seinBeispiele verwenden (Multishot-Prompting)Claude denken lassen (CoT)XML-Tags verwendenClaude eine Rolle geben (System-Prompts)Claudes Antwort vorausfüllenKomplexe Prompts verkettenTipps für langen KontextTipps für erweitertes Denken
    Testen & Evaluieren
    Erfolgskriterien definierenTestfälle entwickelnEvaluierungstool verwendenLatenz reduzieren
    Schutzmaßnahmen verstärken
    Halluzinationen reduzierenAusgabekonsistenz erhöhenJailbreaks abschwächenStreaming-AblehnungenPrompt-Lecks reduzierenClaude im Charakter halten
    Verwaltung und Überwachung
    Admin API-ÜbersichtUsage and Cost APIClaude Code Analytics API
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Funktionen

    Effort

    Kontrollieren Sie, wie viele Token Claude bei der Antwort mit dem Effort-Parameter verwendet, und wägen Sie zwischen Gründlichkeit der Antwort und Token-Effizienz ab.

    Der Effort-Parameter ermöglicht es Ihnen zu kontrollieren, wie bereitwillig Claude Token bei der Beantwortung von Anfragen ausgibt. Dies gibt Ihnen die Möglichkeit, zwischen Gründlichkeit der Antwort und Token-Effizienz abzuwägen, alles mit einem einzigen Modell.

    Der Effort-Parameter befindet sich derzeit in der Beta-Phase und wird nur von Claude Opus 4.5 unterstützt.

    Sie müssen den Beta-Header effort-2025-11-24 einschließen, wenn Sie diese Funktion verwenden.

    Wie Effort funktioniert

    Standardmäßig verwendet Claude maximale Anstrengung – gibt so viele Token wie nötig für das bestmögliche Ergebnis aus. Durch Reduzierung der Effort-Stufe können Sie Claude anweisen, sparsamer mit der Token-Nutzung umzugehen und die Geschwindigkeit und Kosten zu optimieren, während Sie eine gewisse Reduktion der Leistungsfähigkeit akzeptieren.

    Das Setzen von effort auf "high" erzeugt genau das gleiche Verhalten wie das Weglassen des effort-Parameters vollständig.

    Der Effort-Parameter beeinflusst alle Token in der Antwort, einschließlich:

    • Textantworten und Erklärungen
    • Tool-Aufrufe und Funktionsargumente
    • Erweitertes Denken (wenn aktiviert)

    Dieser Ansatz hat zwei große Vorteile:

    1. Es erfordert nicht, dass Denken aktiviert ist, um es zu verwenden.
    2. Es kann alle Token-Ausgaben beeinflussen, einschließlich Tool-Aufrufe. Zum Beispiel würde niedrigere Anstrengung bedeuten, dass Claude weniger Tool-Aufrufe macht. Dies gibt einen viel größeren Grad an Kontrolle über die Effizienz.

    Effort-Stufen

    StufeBeschreibungTypischer Anwendungsfall
    highMaximale Leistungsfähigkeit – Claude verwendet so viele Token wie nötig für das bestmögliche Ergebnis. Entspricht dem Nicht-Setzen des Parameters.Komplexes Denken, schwierige Codierungsprobleme, agentengesteuerte Aufgaben
    mediumAusgewogener Ansatz mit moderaten Token-Einsparungen.Agentengesteuerte Aufgaben, die ein Gleichgewicht zwischen Geschwindigkeit, Kosten und Leistung erfordern
    lowAm effizientesten – erhebliche Token-Einsparungen mit einiger Leistungsreduktion.Einfachere Aufgaben, die die beste Geschwindigkeit und niedrigste Kosten benötigen, wie z. B. Subagenten

    Grundlegende Verwendung

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.beta.messages.create(
        model="claude-opus-4-5-20251101",
        betas=["effort-2025-11-24"],
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    Wann sollte ich den Effort-Parameter anpassen?

    • Verwenden Sie high effort (die Standardeinstellung), wenn Sie Claudes beste Arbeit benötigen – komplexes Denken, differenzierte Analyse, schwierige Codierungsprobleme oder jede Aufgabe, bei der Qualität die oberste Priorität ist.
    • Verwenden Sie medium effort als ausgewogene Option, wenn Sie solide Leistung ohne die vollständige Token-Ausgabe von high effort möchten.
    • Verwenden Sie low effort, wenn Sie Geschwindigkeit optimieren (weil Claude mit weniger Token antwortet) oder Kosten – zum Beispiel einfache Klassifizierungsaufgaben, schnelle Nachschlagvorgänge oder Hochvolumen-Anwendungsfälle, bei denen marginale Qualitätsverbesserungen zusätzliche Latenz oder Ausgaben nicht rechtfertigen.

    Effort mit Tool-Nutzung

    Bei der Verwendung von Tools beeinflusst der Effort-Parameter sowohl die Erklärungen um Tool-Aufrufe als auch die Tool-Aufrufe selbst. Niedrigere Effort-Stufen neigen dazu zu:

    • Mehrere Operationen in weniger Tool-Aufrufe kombinieren
    • Weniger Tool-Aufrufe machen
    • Direkt zur Aktion übergehen ohne Präambel
    • Knappe Bestätigungsmeldungen nach Abschluss verwenden

    Höhere Effort-Stufen können:

    • Mehr Tool-Aufrufe machen
    • Den Plan vor der Aktion erklären
    • Detaillierte Zusammenfassungen von Änderungen bereitstellen
    • Umfassendere Code-Kommentare enthalten

    Effort mit erweitertem Denken

    Der Effort-Parameter funktioniert zusammen mit dem Thinking-Token-Budget, wenn erweitertes Denken aktiviert ist. Diese beiden Steuerelemente dienen unterschiedlichen Zwecken:

    • Effort-Parameter: Kontrolliert, wie Claude alle Token ausgibt – einschließlich Thinking-Token, Textantworten und Tool-Aufrufe
    • Thinking-Token-Budget: Legt eine maximale Grenze für Thinking-Token speziell fest

    Der Effort-Parameter kann mit oder ohne aktiviertes erweitertes Denken verwendet werden. Wenn beide konfiguriert sind:

    1. Bestimmen Sie zunächst die für Ihre Aufgabe geeignete Effort-Stufe
    2. Legen Sie dann das Thinking-Token-Budget basierend auf der Aufgabenkomplexität fest

    Für beste Leistung bei komplexen Denkaufgaben verwenden Sie high effort (die Standardeinstellung) mit einem hohen Thinking-Token-Budget. Dies ermöglicht Claude, gründlich zu denken und umfassende Antworten zu geben.

    Best Practices

    1. Beginnen Sie mit high: Verwenden Sie niedrigere Effort-Stufen, um Leistung gegen Token-Effizienz abzuwägen.
    2. Verwenden Sie low für geschwindigkeitssensitive oder einfache Aufgaben: Wenn Latenz wichtig ist oder Aufgaben unkompliziert sind, kann low effort Antwortzeiten und Kosten erheblich reduzieren.
    3. Testen Sie Ihren Anwendungsfall: Die Auswirkung von Effort-Stufen variiert je nach Aufgabentyp. Bewerten Sie die Leistung bei Ihren spezifischen Anwendungsfällen, bevor Sie sie bereitstellen.
    4. Erwägen Sie dynamische Anstrengung: Passen Sie die Anstrengung basierend auf der Aufgabenkomplexität an. Einfache Abfragen können niedrige Anstrengung rechtfertigen, während agentengesteuerte Codierung und komplexes Denken von hoher Anstrengung profitieren.
    • Wie Effort funktioniert
    • Effort-Stufen
    • Grundlegende Verwendung
    • Wann sollte ich den Effort-Parameter anpassen?
    • Effort mit Tool-Nutzung
    • Effort mit erweitertem Denken
    • Best Practices