Loading...
    • 建構
    • 管理
    • 模型與定價
    • 客戶端 SDK
    • API 參考
    Search...
    ⌘K
    第一步
    Claude 簡介快速入門
    使用 Claude 建構
    功能概覽使用 Messages API處理停止原因
    模型功能
    延伸思考自適應思考效能快速模式(測試版:研究預覽)結構化輸出引用來源串流訊息批次處理搜尋結果串流拒絕多語言支援嵌入向量
    工具
    概覽工具使用方式網路搜尋工具網路擷取工具程式碼執行工具記憶體工具Bash 工具電腦使用工具文字編輯器工具
    工具基礎架構
    工具搜尋程式化工具呼叫細粒度工具串流
    上下文管理
    上下文視窗壓縮上下文編輯提示快取Token 計數
    處理檔案
    Files APIPDF 支援圖像與視覺
    技能
    概覽快速入門最佳實踐企業版技能API 中的技能
    MCP
    遠端 MCP 伺服器MCP 連接器
    提示工程
    概覽提示最佳實踐Console 提示工具
    測試與評估
    定義成功標準並建立評估在 Console 中使用評估工具降低延遲
    強化防護欄
    減少幻覺提高輸出一致性防範越獄減少提示洩漏
    資源
    詞彙表
    版本說明
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    模型功能

    努力程度

    使用努力程度參數控制 Claude 在回應時使用多少個 token,在回應完整性和 token 效率之間進行權衡。

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    努力程度參數允許您控制 Claude 在回應請求時花費 token 的積極程度。這使您能夠在單一模型上在回應完整性和 token 效率之間進行權衡。努力程度參數在所有支援的模型上普遍可用,無需 beta 標頭。

    努力程度參數由 Claude Mythos Preview、Claude Opus 4.6、Claude Sonnet 4.6 和 Claude Opus 4.5 支援。

    對於 Claude Opus 4.6 和 Sonnet 4.6,努力程度取代 budget_tokens 成為控制思考深度的推薦方式。將努力程度與自適應思考(thinking: {type: "adaptive"})結合使用以獲得最佳體驗。雖然 budget_tokens 在 Opus 4.6 和 Sonnet 4.6 上仍被接受,但已被棄用,將在未來的模型版本中移除。在 high(預設)和 max 努力程度下,Claude 幾乎總是會思考。在較低的努力程度下,它可能會跳過簡單問題的思考。

    努力程度如何運作

    預設情況下,Claude 使用高努力程度,花費盡可能多的 token 以獲得優異的結果。您可以將努力程度提升到 max 以獲得絕對最高的能力,或降低它以更保守地使用 token,優化速度和成本,同時接受某些能力的降低。

    將 effort 設定為 "high" 會產生與完全省略 effort 參數完全相同的行為。

    努力程度參數影響回應中的所有 token,包括:

    • 文字回應和解釋
    • 工具呼叫和函數參數
    • 擴展思考(啟用時)

    這種方法有兩個主要優點:

    1. 它不需要啟用思考就能使用。
    2. 它可以影響所有 token 支出,包括工具呼叫。例如,較低的努力程度意味著 Claude 進行的工具呼叫較少。這提供了對效率的更大控制程度。

    努力程度

    級別描述典型使用案例
    max絕對最大能力,對 token 支出沒有限制。在 Claude Mythos Preview、Claude Opus 4.6 和 Claude Sonnet 4.6 上可用。需要最深層推理和最徹底分析的任務
    high高能力。等同於不設定參數。複雜推理、困難的編碼問題、代理任務
    medium平衡的方法,具有適度的 token 節省。需要速度、成本和性能平衡的代理任務
    low最有效率。顯著的 token 節省,但能力有所降低。需要最佳速度和最低成本的簡單任務,例如子代理

    努力程度是一個行為信號,而不是嚴格的 token 預算。在較低的努力程度下,Claude 在遇到足夠困難的問題時仍會思考,但對於相同的問題,它的思考程度會少於在較高努力程度下的思考。

    Sonnet 4.6 的推薦努力程度

    Sonnet 4.6 預設為 high 努力程度。使用 Sonnet 4.6 時明確設定努力程度以避免意外的延遲:

    • 中等努力程度(推薦預設值):對大多數應用程式而言,速度、成本和性能的最佳平衡。適合代理編碼、工具密集型工作流程和程式碼生成。
    • 低努力程度: 適用於高容量或延遲敏感的工作負載。適合聊天和非編碼使用案例,其中優先考慮更快的周轉時間。
    • 高努力程度: 適用於需要 Sonnet 4.6 最大智能的任務。
    • 最大努力程度: 適用於需要絕對最高能力且對 token 支出沒有限制的任務。

    基本用法

    curl https://api.anthropic.com/v1/messages \
        --header "x-api-key: $ANTHROPIC_API_KEY" \
        --header "anthropic-version: 2023-06-01" \
        --header "content-type: application/json" \
        --data '{
            "model": "claude-opus-4-6",
            "max_tokens": 4096,
            "messages": [{
                "role": "user",
                "content": "Analyze the trade-offs between microservices and monolithic architectures"
            }],
            "output_config": {
                "effort": "medium"
            }
        }'

    何時調整努力程度參數

    • 當您需要絕對最高的能力且沒有限制時,使用最大努力程度:最徹底的推理和最深層的分析。在 Claude Mythos Preview、Claude Opus 4.6 和 Claude Sonnet 4.6 上可用。
    • 當您需要 Claude 的最佳表現時,使用高努力程度(預設值):複雜推理、細緻分析、困難的編碼問題,或任何品質是首要優先事項的任務。
    • 當您想要穩定的性能而不需要高努力程度的完整 token 支出時,使用中等努力程度作為平衡選項。
    • 當您優化速度(因為 Claude 用較少的 token 回答)或成本時,使用低努力程度。例如,簡單的分類任務、快速查詢或高容量使用案例,其中邊際品質改進不足以證明額外的延遲或支出。

    努力程度與工具使用

    使用工具時,努力程度參數影響工具呼叫周圍的解釋和工具呼叫本身。較低的努力程度傾向於:

    • 將多個操作合併為較少的工具呼叫
    • 進行較少的工具呼叫
    • 直接進行操作而不需要前言
    • 完成後使用簡潔的確認訊息

    較高的努力程度可能會:

    • 進行更多的工具呼叫
    • 在採取行動前解釋計畫
    • 提供變更的詳細摘要
    • 包含更全面的程式碼註解

    努力程度與擴展思考

    努力程度參數與擴展思考一起運作。其行為取決於模型:

    • Claude Mythos Preview 預設使用自適應思考(無需 thinking 配置)。thinking: {type: "disabled"} 被拒絕。努力程度以與 Opus 4.6 相同的方式控制思考深度。
    • Claude Opus 4.6 使用自適應思考(thinking: {type: "adaptive"}),其中努力程度是控制思考深度的推薦方式。雖然 budget_tokens 在 Opus 4.6 上仍被接受,但已被棄用,將在未來版本中移除。在 high 和 max 努力程度下,Claude 幾乎總是進行深度思考。在較低的級別下,它可能會跳過簡單問題的思考。
    • Claude Sonnet 4.6 使用自適應思考(其中努力程度控制思考深度)。手動思考與交錯模式(thinking: {type: "enabled", budget_tokens: N})仍然可用但已棄用。
    • Claude Opus 4.5 和其他 Claude 4 模型使用手動思考(thinking: {type: "enabled", budget_tokens: N}),其中努力程度與思考 token 預算一起運作。為您的任務設定努力程度,然後根據任務複雜性設定思考 token 預算。

    努力程度參數可以在啟用或不啟用擴展思考的情況下使用。在不啟用思考的情況下使用時,它仍然控制文字回應和工具呼叫的整體 token 支出。

    最佳實踐

    1. 明確設定努力程度: API 預設為 high,但正確的起點取決於您的模型和工作負載。
    2. 對速度敏感或簡單任務使用低努力程度: 當延遲很重要或任務很簡單時,低努力程度可以顯著減少回應時間和成本。
    3. 測試您的使用案例: 努力程度的影響因任務類型而異。在部署前評估您特定使用案例的性能。
    4. 考慮動態努力程度: 根據任務複雜性調整努力程度。簡單查詢可能需要低努力程度,而代理編碼和複雜推理受益於高努力程度。

    Was this page helpful?

    • Sonnet 4.6 的推薦努力程度