This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
努力程度參數允許您控制 Claude 在回應請求時花費 token 的積極程度。這使您能夠在單一模型上在回應完整性和 token 效率之間進行權衡。努力程度參數在所有支援的模型上普遍可用,無需 beta 標頭。
努力程度參數由 Claude Mythos Preview、Claude Opus 4.6、Claude Sonnet 4.6 和 Claude Opus 4.5 支援。
對於 Claude Opus 4.6 和 Sonnet 4.6,努力程度取代 budget_tokens 成為控制思考深度的推薦方式。將努力程度與自適應思考(thinking: {type: "adaptive"})結合使用以獲得最佳體驗。雖然 budget_tokens 在 Opus 4.6 和 Sonnet 4.6 上仍被接受,但已被棄用,將在未來的模型版本中移除。在 high(預設)和 max 努力程度下,Claude 幾乎總是會思考。在較低的努力程度下,它可能會跳過簡單問題的思考。
預設情況下,Claude 使用高努力程度,花費盡可能多的 token 以獲得優異的結果。您可以將努力程度提升到 max 以獲得絕對最高的能力,或降低它以更保守地使用 token,優化速度和成本,同時接受某些能力的降低。
將 effort 設定為 "high" 會產生與完全省略 effort 參數完全相同的行為。
努力程度參數影響回應中的所有 token,包括:
這種方法有兩個主要優點:
| 級別 | 描述 | 典型使用案例 |
|---|---|---|
max | 絕對最大能力,對 token 支出沒有限制。在 Claude Mythos Preview、Claude Opus 4.6 和 Claude Sonnet 4.6 上可用。 | 需要最深層推理和最徹底分析的任務 |
high | 高能力。等同於不設定參數。 | 複雜推理、困難的編碼問題、代理任務 |
medium | 平衡的方法,具有適度的 token 節省。 | 需要速度、成本和性能平衡的代理任務 |
low | 最有效率。顯著的 token 節省,但能力有所降低。 | 需要最佳速度和最低成本的簡單任務,例如子代理 |
努力程度是一個行為信號,而不是嚴格的 token 預算。在較低的努力程度下,Claude 在遇到足夠困難的問題時仍會思考,但對於相同的問題,它的思考程度會少於在較高努力程度下的思考。
Sonnet 4.6 預設為 high 努力程度。使用 Sonnet 4.6 時明確設定努力程度以避免意外的延遲:
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-6",
"max_tokens": 4096,
"messages": [{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
"output_config": {
"effort": "medium"
}
}'使用工具時,努力程度參數影響工具呼叫周圍的解釋和工具呼叫本身。較低的努力程度傾向於:
較高的努力程度可能會:
努力程度參數與擴展思考一起運作。其行為取決於模型:
thinking 配置)。thinking: {type: "disabled"} 被拒絕。努力程度以與 Opus 4.6 相同的方式控制思考深度。thinking: {type: "adaptive"}),其中努力程度是控制思考深度的推薦方式。雖然 budget_tokens 在 Opus 4.6 上仍被接受,但已被棄用,將在未來版本中移除。在 high 和 max 努力程度下,Claude 幾乎總是進行深度思考。在較低的級別下,它可能會跳過簡單問題的思考。thinking: {type: "enabled", budget_tokens: N})仍然可用但已棄用。thinking: {type: "enabled", budget_tokens: N}),其中努力程度與思考 token 預算一起運作。為您的任務設定努力程度,然後根據任務複雜性設定思考 token 預算。努力程度參數可以在啟用或不啟用擴展思考的情況下使用。在不啟用思考的情況下使用時,它仍然控制文字回應和工具呼叫的整體 token 支出。
high,但正確的起點取決於您的模型和工作負載。Was this page helpful?