Loading...
    • 開發者指南
    • API 參考
    • MCP
    • 資源
    • 發行說明
    Search...
    ⌘K
    入門
    Claude 簡介快速開始
    模型與定價
    模型概覽選擇模型Claude 4.6 新功能遷移指南模型棄用定價
    使用 Claude 構建
    功能概覽使用 Messages API處理停止原因提示最佳實踐
    模型能力
    延伸思考自適應思考思考力度快速模式(研究預覽)結構化輸出引用串流訊息批次處理PDF 支援搜尋結果多語言支援嵌入視覺
    工具
    概覽如何實作工具使用網頁搜尋工具網頁擷取工具程式碼執行工具記憶工具Bash 工具電腦使用工具文字編輯器工具
    工具基礎設施
    工具搜尋程式化工具呼叫細粒度工具串流
    上下文管理
    上下文視窗壓縮上下文編輯提示快取Token 計數
    檔案與資源
    Files API
    Agent 技能
    概覽快速開始最佳實踐企業技能透過 API 使用技能
    Agent SDK
    概覽快速開始TypeScript SDKTypeScript V2(預覽)Python SDK遷移指南
    API 中的 MCP
    MCP 連接器遠端 MCP 伺服器
    第三方平台上的 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    提示工程
    概覽提示產生器使用提示範本提示改進器清晰直接使用範例(多範例提示)讓 Claude 思考(CoT)使用 XML 標籤賦予 Claude 角色(系統提示)串連複雜提示長上下文技巧延伸思考技巧
    測試與評估
    定義成功標準開發測試案例使用評估工具降低延遲
    強化防護機制
    減少幻覺提高輸出一致性防範越獄攻擊串流拒絕減少提示洩漏讓 Claude 保持角色
    管理與監控
    Admin API 概覽資料駐留工作區用量與成本 APIClaude Code Analytics API零資料保留
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    模型能力

    Effort

    使用 effort 參數控制 Claude 回應時使用的 token 數量,在回應完整性和 token 效率之間進行權衡。

    Was this page helpful?

    • effort 的運作方式
    • Effort 級別
    • 何時應該調整 effort 參數?
    • Effort 與工具使用
    • Effort 與延伸思考

    effort 參數允許您控制 Claude 在回應請求時花費 token 的積極程度。這讓您能夠在回應完整性和 token 效率之間進行權衡,且全部使用單一模型。effort 參數已在所有支援的模型上正式可用,無需 beta 標頭。

    effort 參數由 Claude Opus 4.6 和 Claude Opus 4.5 支援。

    對於 Claude Opus 4.6,effort 取代 budget_tokens 成為控制思考深度的建議方式。將 effort 與自適應思考(thinking: {type: "adaptive"})結合使用可獲得最佳體驗。雖然 budget_tokens 在 Opus 4.6 上仍然被接受,但它已被棄用,將在未來的模型版本中移除。在 high(預設)和 max effort 下,Claude 幾乎總是會進行思考。在較低的 effort 級別下,它可能會跳過較簡單問題的思考。

    effort 的運作方式

    預設情況下,Claude 使用高 effort——花費所需的 token 數量以獲得出色的結果。您可以將 effort 級別提高到 max 以獲得絕對最高的能力,或降低它以更保守地使用 token,在接受一些能力降低的情況下優化速度和成本。

    將 effort 設定為 "high" 會產生與完全省略 effort 參數完全相同的行為。

    effort 參數影響回應中的所有 token,包括:

    • 文字回應和解釋
    • 工具呼叫和函數參數
    • 延伸思考(啟用時)

    這種方法有兩個主要優勢:

    1. 不需要啟用思考即可使用。
    2. 它可以影響所有 token 花費,包括工具呼叫。例如,較低的 effort 意味著 Claude 會進行較少的工具呼叫。這提供了對效率更大程度的控制。

    Effort 級別

    級別描述典型使用場景
    max絕對最大能力,不限制 token 花費。僅限 Opus 4.6——在其他模型上使用 max 的請求將返回錯誤。需要最深層推理和最徹底分析的任務
    high高能力。等同於不設定該參數。複雜推理、困難的程式設計問題、代理任務
    medium平衡方法,適度節省 token。需要在速度、成本和效能之間取得平衡的代理任務
    low最高效率。顯著節省 token,但能力有所降低。需要最佳速度和最低成本的較簡單任務,例如子代理

    Effort 是一個行為信號,而非嚴格的 token 預算。在較低的 effort 級別下,Claude 仍然會對足夠困難的問題進行思考——只是對於相同問題,它的思考量會比在較高 effort 級別下少。

    基本用法

    何時應該調整 effort 參數?

    • 當您需要不受限制的絕對最高能力時,使用 max effort——最徹底的推理和最深入的分析。僅在 Opus 4.6 上可用;在其他模型上使用 max 的請求將返回錯誤。
    • 當您需要 Claude 的最佳表現時,使用 high effort(預設值)——複雜推理、細緻分析、困難的程式設計問題,或任何品質是首要優先的任務。
    • 當您想要穩健的效能而不需要 high effort 的完整 token 花費時,使用 medium effort 作為平衡選項。
    • 當您優化速度(因為 Claude 用更少的 token 回答)或成本時,使用 low effort——例如,簡單的分類任務、快速查詢,或邊際品質提升不足以證明額外延遲或花費合理性的高流量使用場景。

    Effort 與工具使用

    使用工具時,effort 參數會影響工具呼叫周圍的解釋和工具呼叫本身。較低的 effort 級別傾向於:

    • 將多個操作合併為較少的工具呼叫
    • 進行較少的工具呼叫
    • 直接進行操作而不做前言
    • 完成後使用簡短的確認訊息

    較高的 effort 級別可能會:

    • 進行更多的工具呼叫
    • 在採取行動前解釋計劃
    • 提供詳細的變更摘要
    • 包含更全面的程式碼註解

    Effort 與延伸思考

    effort 參數與延伸思考協同運作。其行為取決於模型:

    • Claude Opus 4.6 使用自適應思考(thinking: {type: "adaptive"}),其中 effort 是控制思考深度的建議方式。雖然 budget_tokens 在 Opus 4.6 上仍然被接受,但它已被棄用,將在未來版本中移除。在 high 和 max effort 下,Claude 幾乎總是進行深度思考。在較低級別下,它可能會跳過較簡單問題的思考。
    • Claude Opus 4.5 使用手動思考(thinking: {type: "enabled", budget_tokens: N}),其中 effort 與思考 token 預算協同運作。根據您的任務設定 effort 級別,然後根據任務複雜度設定思考 token 預算。

    effort 參數可以在啟用或未啟用延伸思考的情況下使用。在未使用思考時,它仍然控制文字回應和工具呼叫的整體 token 花費。

    最佳實踐

    1. 從 high 開始:使用較低的 effort 級別來在效能和 token 效率之間進行權衡。
    2. 對速度敏感或簡單的任務使用 low:當延遲很重要或任務很簡單時,low effort 可以顯著減少回應時間和成本。
    3. 測試您的使用場景:effort 級別的影響因任務類型而異。在部署前評估您特定使用場景的效能。
    4. 考慮動態 effort:根據任務複雜度調整 effort。簡單的查詢可能適合 low effort,而代理程式設計和複雜推理則受益於 high effort。
    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)