Loading...
  • 建構
  • 管理
  • 模型與定價
  • 客戶端 SDK
  • API 參考
Search...
⌘K
Log in
效能
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
建構/模型功能

努力程度

使用努力程度參數控制 Claude 在回應時使用多少個 token,在回應的完整性和 token 效率之間進行權衡。

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

努力程度參數允許您控制 Claude 在回應請求時花費 token 的積極程度。這使您能夠在回應的完整性和 token 效率之間進行權衡,所有這些都可以使用單一模型完成。努力程度參數通常在所有支援的模型上可用,無需 beta 標頭。

努力程度參數受 Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6、Claude Sonnet 4.6 和 Claude Opus 4.5 支援。

對於 Claude Opus 4.6 和 Sonnet 4.6,努力程度取代了 budget_tokens 作為控制思考深度的推薦方式。將努力程度與自適應思考(thinking: {type: "adaptive"})結合使用以獲得最佳體驗。雖然 budget_tokens 在 Opus 4.6 和 Sonnet 4.6 上仍然被接受,但它已被棄用,將在未來的模型版本中移除。在 high(預設)和 max 努力程度下,Claude 幾乎總是會思考。在較低的努力程度下,它可能會跳過對較簡單問題的思考。

努力程度如何運作

預設情況下,Claude 使用高努力程度,花費盡可能多的 token 以獲得優異的結果。您可以將努力程度提高到 max 以獲得絕對最高的能力,或降低它以更保守地使用 token,優化速度和成本,同時接受某些能力的降低。

將 effort 設定為 "high" 會產生與完全省略 effort 參數相同的行為。

努力程度參數影響回應中的所有 token,包括:

  • 文字回應和解釋
  • 工具呼叫和函數參數
  • 延伸思考(啟用時)

這種方法有兩個主要優點:

  1. 它不需要啟用思考就能使用。
  2. 它可以影響所有 token 支出,包括工具呼叫。例如,較低的努力程度意味著 Claude 會進行較少的工具呼叫。這提供了對效率的更大控制程度。

努力程度

級別描述典型使用案例
max絕對最大能力,對 token 支出沒有限制。在 Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6 和 Claude Sonnet 4.6 上可用。需要最深入推理和最徹底分析的任務
xhigh用於長期工作的延伸能力。在 Claude Opus 4.7 上可用。長期執行的代理和編碼任務(超過 30 分鐘),token 預算達數百萬
high高能力。等同於不設定參數。複雜推理、困難的編碼問題、代理任務
medium平衡的方法,具有適度的 token 節省。需要速度、成本和性能平衡的代理任務
low最高效。顯著的 token 節省,但能力有所降低。需要最佳速度和最低成本的較簡單任務,例如子代理

努力程度是一個行為信號,而不是嚴格的 token 預算。在較低的努力程度下,Claude 仍然會在足夠困難的問題上進行思考,但對於同一問題,它的思考量會少於在較高努力程度下的思考量。

Sonnet 4.6 的推薦努力程度

Sonnet 4.6 預設為 high 努力程度。使用 Sonnet 4.6 時明確設定努力程度以避免意外的延遲:

  • 中等努力程度(推薦預設值):對於大多數應用程式,速度、成本和性能的最佳平衡。適合代理編碼、工具密集型工作流程和程式碼生成。
  • 低努力程度: 用於高容量或延遲敏感的工作負載。適合聊天和非編碼使用案例,其中優先考慮更快的周轉時間。
  • 高努力程度: 用於需要 Sonnet 4.6 最大智能的任務。
  • 最大努力程度: 用於需要絕對最高能力且對 token 支出沒有限制的任務。

Claude Opus 4.7 的推薦努力程度

從編碼和代理使用案例的 xhigh 開始,並將 high 用作大多數智能敏感工作負載的最低值。對於成本敏感的工作負載,降低到 medium,或僅當您的評估在 xhigh 時顯示可測量的餘量時才升高到 max。

API 預設值為 high。要使用 xhigh,請明確設定 effort;您傳遞的值會覆蓋預設值。

努力程度Claude Opus 4.7 的指導
low高效,但最適合簡短、範圍明確的任務。如果您的任務有多個部分,請將 low 與明確的檢查清單配對。
medium適用於平均工作流程的替代方案,您希望獲得良好的結果同時降低成本。
high仍然需要智能和 token 消耗平衡的進階使用案例。這通常是平衡品質和 token 效率的最佳點。
xhigh編碼和代理工作的推薦起點,以及探索性任務(例如重複工具呼叫、詳細網路搜尋和知識庫搜尋)。預期 token 使用量會明顯高於 high。
max保留用於真正的前沿問題。在大多數工作負載上,max 會增加顯著的成本以換取相對較小的品質提升,在某些結構化輸出或較低智能敏感性的任務上,它可能導致過度思考。

Claude Opus 4.7 也比 Claude Opus 4.6 更嚴格地遵守努力程度,特別是在 low 和 medium 時。在較低的努力程度下,模型會將其工作範圍限制在所要求的內容,而不是超越預期。如果您在使用 Claude Opus 4.7 處理複雜問題時觀察到淺層推理,請提高努力程度,而不是繞過提示。如果您必須為了延遲而保持低努力程度,請添加有針對性的指導,例如「此任務涉及多步驟推理。在回應前仔細思考。」

在 xhigh 或 max 努力程度下執行 Claude Opus 4.7 時,設定一個大的 max_tokens,以便模型有空間在子代理和工具呼叫中進行思考和行動。從 64k token 開始並從那裡進行調整是一個合理的預設值。

基本用法

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)

何時調整努力程度參數

  • 當您需要絕對最高的能力且沒有限制時,使用最大努力程度:最徹底的推理和最深入的分析。在 Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6 和 Claude Sonnet 4.6 上可用。
  • 使用超高努力程度進行進階編碼和複雜的代理工作,需要延伸探索,例如重複工具呼叫和詳細搜尋。在 Claude Opus 4.7 上可用。
  • 當您需要 Claude 的最佳工作時,使用高努力程度(預設值):複雜推理、細緻分析、困難的編碼問題,或任何品質是首要優先事項的任務。
  • 當您想要穩定的性能而不需要高努力程度的完整 token 支出時,使用中等努力程度作為平衡選項。
  • 當您優化速度(因為 Claude 用較少的 token 回應)或成本時,使用低努力程度。例如,簡單的分類任務、快速查詢或高容量使用案例,其中邊際品質改進不足以證明額外的延遲或支出。

努力程度與工具使用

使用工具時,努力程度參數會影響工具呼叫周圍的解釋和工具呼叫本身。較低的努力程度傾向於:

  • 將多個操作合併為較少的工具呼叫
  • 進行較少的工具呼叫
  • 直接進行操作而不進行前言
  • 完成後使用簡潔的確認訊息

較高的努力程度可能會:

  • 進行更多工具呼叫
  • 在採取行動前解釋計畫
  • 提供詳細的變更摘要
  • 包含更全面的程式碼註解

努力程度與延伸思考

努力程度參數與延伸思考一起運作。其行為取決於模型:

  • Claude Mythos Preview 預設使用自適應思考(無需 thinking 配置)。thinking: {type: "disabled"} 被拒絕。努力程度控制思考深度的方式與 Opus 4.7 和 Opus 4.6 上相同。
  • Claude Opus 4.7 使用自適應思考(thinking: {type: "adaptive"}),其中努力程度是控制思考深度的推薦方式。Opus 4.7 上不再支援手動延伸思考(thinking: {type: "enabled", budget_tokens: N});改用自適應思考與努力程度。在 high、xhigh 和 max 努力程度下,Claude 幾乎總是進行深入思考。在較低的級別,它可能會跳過對較簡單問題的思考。
  • Claude Opus 4.6 使用自適應思考(thinking: {type: "adaptive"}),其中努力程度是控制思考深度的推薦方式。雖然 budget_tokens 在 Opus 4.6 上仍然被接受,但它已被棄用,將在未來版本中移除。在 high 和 max 努力程度下,Claude 幾乎總是進行深入思考。在較低的級別,它可能會跳過對較簡單問題的思考。
  • Claude Sonnet 4.6 使用自適應思考(其中努力程度控制思考深度)。手動思考與交錯模式(thinking: {type: "enabled", budget_tokens: N})仍然可用但已棄用。
  • Claude Opus 4.5 和其他 Claude 4 模型使用手動思考(thinking: {type: "enabled", budget_tokens: N}),其中努力程度與思考 token 預算一起運作。為您的任務設定努力程度,然後根據任務複雜性設定思考 token 預算。

努力程度參數可以在啟用或不啟用延伸思考的情況下使用。在不啟用思考的情況下使用時,它仍然控制文字回應和工具呼叫的整體 token 支出。

最佳實踐

  1. 明確設定努力程度: API 預設為 high,但正確的起點取決於您的模型和工作負載。
  2. 對速度敏感或簡單的任務使用低努力程度: 當延遲很重要或任務很簡單時,低努力程度可以顯著減少回應時間和成本。
  3. 測試您的使用案例: 努力程度的影響因任務類型而異。在部署前評估您特定使用案例的性能。
  4. 考慮動態努力程度: 根據任務複雜性調整努力程度。簡單查詢可能需要低努力程度,而代理編碼和複雜推理受益於高努力程度。

Was this page helpful?

  • Sonnet 4.6 的推薦努力程度
  • Claude Opus 4.7 的推薦努力程度