Loading...
    • Entwicklerleitfaden
    • API-Referenz
    • MCP
    • Ressourcen
    • Versionshinweise
    Search...
    ⌘K
    Erste Schritte
    Einführung in ClaudeSchnelleinstieg
    Modelle & Preise
    ModellübersichtModell auswählenNeuerungen in Claude 4.5Migration zu Claude 4.5ModellabschreibungenPreise
    Mit Claude erstellen
    FunktionsübersichtMessages API verwendenKontextfensterBest Practices für Prompts
    Fähigkeiten
    Prompt-CachingKontext-BearbeitungErweitertes DenkenAufwandStreaming MessagesBatch-VerarbeitungZitateMehrsprachige UnterstützungToken-ZählungEmbeddingsVisionPDF-UnterstützungFiles APISuchergebnisseStrukturierte Ausgaben
    Tools
    ÜbersichtTool-Nutzung implementierenFeingranulares Tool-StreamingBash-ToolCode-Ausführungs-ToolProgrammatischer Tool-AufrufComputer-Use-ToolText-Editor-ToolWeb-Fetch-ToolWeb-Such-ToolMemory-ToolTool-Such-Tool
    Agent Skills
    ÜbersichtSchnelleinstiegBest PracticesSkills mit der API verwenden
    Agent SDK
    ÜbersichtSchnelleinstiegTypeScript SDKTypeScript V2 (Vorschau)Python SDKMigrationsleitfaden
    MCP in der API
    MCP-ConnectorRemote MCP-Server
    Claude auf Plattformen von Drittanbietern
    Amazon BedrockMicrosoft FoundryVertex AI
    Prompt Engineering
    ÜbersichtPrompt-GeneratorPrompt-Vorlagen verwendenPrompt-VerbessererKlar und direkt seinBeispiele verwenden (Multishot-Prompting)Claude denken lassen (CoT)XML-Tags verwendenClaude eine Rolle geben (System-Prompts)Claudes Antwort vorausfüllenKomplexe Prompts verkettenTipps für langen KontextTipps für erweitertes Denken
    Testen & Evaluieren
    Erfolgskriterien definierenTestfälle entwickelnEvaluierungs-Tool verwendenLatenz reduzieren
    Schutzvorrichtungen verstärken
    Halluzinationen reduzierenAusgabekonsistenz erhöhenJailbreaks abschwächenStreaming-AblehnungenPrompt-Lecks reduzierenClaude im Charakter halten
    Verwaltung und Überwachung
    Admin API ÜbersichtNutzungs- und Kosten-APIClaude Code Analytics API
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Fähigkeiten

    Effort

    Kontrollieren Sie, wie viele Token Claude bei der Antwort mit dem Effort-Parameter verwendet, und wägen Sie zwischen Gründlichkeit der Antwort und Token-Effizienz ab.

    Der Effort-Parameter ermöglicht es Ihnen zu kontrollieren, wie bereitwillig Claude Token bei der Beantwortung von Anfragen ausgibt. Dies gibt Ihnen die Möglichkeit, zwischen Gründlichkeit der Antwort und Token-Effizienz abzuwägen, alles mit einem einzigen Modell.

    Der Effort-Parameter befindet sich derzeit in der Beta-Phase und wird nur von Claude Opus 4.5 unterstützt.

    Sie müssen den Beta-Header effort-2025-11-24 einschließen, wenn Sie diese Funktion verwenden.

    Wie Effort funktioniert

    Standardmäßig verwendet Claude maximale Anstrengung – gibt so viele Token aus, wie für das bestmögliche Ergebnis erforderlich sind. Durch Reduzierung der Effort-Stufe können Sie Claude anweisen, sparsamer mit der Token-Nutzung umzugehen und die Geschwindigkeit und Kosten zu optimieren, während Sie eine gewisse Verringerung der Leistungsfähigkeit akzeptieren.

    Das Setzen von effort auf "high" erzeugt genau das gleiche Verhalten wie das Weglassen des effort-Parameters vollständig.

    Der Effort-Parameter beeinflusst alle Token in der Antwort, einschließlich:

    • Textantworten und Erklärungen
    • Tool-Aufrufe und Funktionsargumente
    • Erweitertes Denken (wenn aktiviert)

    Dieser Ansatz hat zwei große Vorteile:

    1. Es ist nicht erforderlich, dass Denken aktiviert ist, um es zu verwenden.
    2. Es kann alle Token-Ausgaben beeinflussen, einschließlich Tool-Aufrufe. Zum Beispiel würde niedrigere Anstrengung bedeuten, dass Claude weniger Tool-Aufrufe macht. Dies gibt einen viel größeren Grad an Kontrolle über die Effizienz.

    Effort-Stufen

    StufeBeschreibungTypischer Anwendungsfall
    highMaximale Leistungsfähigkeit. Claude verwendet so viele Token wie nötig für das bestmögliche Ergebnis. Entspricht dem Nicht-Setzen des Parameters.Komplexes Denken, schwierige Codierungsprobleme, agentengestützte Aufgaben
    mediumAusgewogener Ansatz mit moderaten Token-Einsparungen.Agentengestützte Aufgaben, die ein Gleichgewicht zwischen Geschwindigkeit, Kosten und Leistung erfordern
    lowAm effizientesten. Erhebliche Token-Einsparungen mit einiger Leistungsverringerung.Einfachere Aufgaben, die die beste Geschwindigkeit und niedrigste Kosten benötigen, wie z. B. Subagenten

    Grundlegende Verwendung

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.beta.messages.create(
        model="claude-opus-4-5-20251101",
        betas=["effort-2025-11-24"],
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    Wann sollte ich den Effort-Parameter anpassen?

    • Verwenden Sie high effort (die Standardeinstellung), wenn Sie Claudes beste Arbeit benötigen – komplexes Denken, differenzierte Analyse, schwierige Codierungsprobleme oder jede Aufgabe, bei der Qualität die oberste Priorität ist.
    • Verwenden Sie medium effort als ausgewogene Option, wenn Sie eine solide Leistung ohne die volle Token-Ausgabe von high effort wünschen.
    • Verwenden Sie low effort, wenn Sie Geschwindigkeit optimieren (weil Claude mit weniger Token antwortet) oder Kosten – zum Beispiel einfache Klassifizierungsaufgaben, schnelle Nachschlagungen oder Anwendungsfälle mit hohem Volumen, bei denen marginale Qualitätsverbesserungen keine zusätzliche Latenz oder Ausgaben rechtfertigen.

    Effort mit Tool-Nutzung

    Bei der Verwendung von Tools beeinflusst der Effort-Parameter sowohl die Erklärungen um Tool-Aufrufe als auch die Tool-Aufrufe selbst. Niedrigere Effort-Stufen neigen dazu zu:

    • Mehrere Operationen in weniger Tool-Aufrufe kombinieren
    • Weniger Tool-Aufrufe machen
    • Direkt zur Aktion übergehen ohne Präambel
    • Knappe Bestätigungsmeldungen nach Abschluss verwenden

    Höhere Effort-Stufen können:

    • Mehr Tool-Aufrufe machen
    • Den Plan vor der Aktion erklären
    • Detaillierte Zusammenfassungen von Änderungen bereitstellen
    • Umfassendere Code-Kommentare enthalten

    Effort mit erweitertem Denken

    Der Effort-Parameter funktioniert zusammen mit dem Thinking-Token-Budget, wenn erweitertes Denken aktiviert ist. Diese beiden Steuerelemente dienen unterschiedlichen Zwecken:

    • Effort-Parameter: Kontrolliert, wie Claude alle Token ausgibt – einschließlich Thinking-Tokens, Textantworten und Tool-Aufrufe
    • Thinking-Token-Budget: Legt eine maximale Grenze für Thinking-Tokens speziell fest

    Der Effort-Parameter kann mit oder ohne aktiviertes erweitertes Denken verwendet werden. Wenn beide konfiguriert sind:

    1. Bestimmen Sie zunächst die für Ihre Aufgabe geeignete Effort-Stufe
    2. Legen Sie dann das Thinking-Token-Budget basierend auf der Aufgabenkomplexität fest

    Für beste Leistung bei komplexen Denkaufgaben verwenden Sie high effort (die Standardeinstellung) mit einem hohen Thinking-Token-Budget. Dies ermöglicht Claude, gründlich zu denken und umfassende Antworten zu geben.

    Best Practices

    1. Beginnen Sie mit high: Verwenden Sie niedrigere Effort-Stufen, um Leistung gegen Token-Effizienz abzuwägen.
    2. Verwenden Sie low für geschwindigkeitssensitive oder einfache Aufgaben: Wenn Latenz wichtig ist oder Aufgaben unkompliziert sind, kann low effort die Antwortzeiten und Kosten erheblich reduzieren.
    3. Testen Sie Ihren Anwendungsfall: Die Auswirkung von Effort-Stufen variiert je nach Aufgabentyp. Bewerten Sie die Leistung bei Ihren spezifischen Anwendungsfällen, bevor Sie sie bereitstellen.
    4. Erwägen Sie dynamische Anstrengung: Passen Sie die Anstrengung basierend auf der Aufgabenkomplexität an. Einfache Abfragen können niedrige Anstrengung rechtfertigen, während agentengestützte Codierung und komplexes Denken von hoher Anstrengung profitieren.
    • Wie Effort funktioniert
    • Effort-Stufen
    • Grundlegende Verwendung
    • Wann sollte ich den Effort-Parameter anpassen?
    • Effort mit Tool-Nutzung
    • Effort mit erweitertem Denken
    • Best Practices