This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
努力程度參數允許您控制 Claude 在回應請求時花費 token 的積極程度。這使您能夠在回應的完整性和 token 效率之間進行權衡,所有這些都可以使用單一模型完成。努力程度參數通常在所有支援的模型上可用,無需 beta 標頭。
努力程度參數受 Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6、Claude Sonnet 4.6 和 Claude Opus 4.5 支援。
對於 Claude Opus 4.6 和 Sonnet 4.6,努力程度取代了 budget_tokens 作為控制思考深度的推薦方式。將努力程度與自適應思考(thinking: {type: "adaptive"})結合使用以獲得最佳體驗。雖然 budget_tokens 在 Opus 4.6 和 Sonnet 4.6 上仍然被接受,但它已被棄用,將在未來的模型版本中移除。在 high(預設)和 max 努力程度下,Claude 幾乎總是會思考。在較低的努力程度下,它可能會跳過對較簡單問題的思考。
預設情況下,Claude 使用高努力程度,花費盡可能多的 token 以獲得優異的結果。您可以將努力程度提高到 max 以獲得絕對最高的能力,或降低它以更保守地使用 token,優化速度和成本,同時接受某些能力的降低。
將 effort 設定為 "high" 會產生與完全省略 effort 參數相同的行為。
努力程度參數影響回應中的所有 token,包括:
這種方法有兩個主要優點:
| 級別 | 描述 | 典型使用案例 |
|---|---|---|
max | 絕對最大能力,對 token 支出沒有限制。在 Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6 和 Claude Sonnet 4.6 上可用。 | 需要最深入推理和最徹底分析的任務 |
xhigh | 用於長期工作的延伸能力。在 Claude Opus 4.7 上可用。 | 長期執行的代理和編碼任務(超過 30 分鐘),token 預算達數百萬 |
high | 高能力。等同於不設定參數。 | 複雜推理、困難的編碼問題、代理任務 |
medium | 平衡的方法,具有適度的 token 節省。 | 需要速度、成本和性能平衡的代理任務 |
low | 最高效。顯著的 token 節省,但能力有所降低。 | 需要最佳速度和最低成本的較簡單任務,例如子代理 |
努力程度是一個行為信號,而不是嚴格的 token 預算。在較低的努力程度下,Claude 仍然會在足夠困難的問題上進行思考,但對於同一問題,它的思考量會少於在較高努力程度下的思考量。
Sonnet 4.6 預設為 high 努力程度。使用 Sonnet 4.6 時明確設定努力程度以避免意外的延遲:
從編碼和代理使用案例的 xhigh 開始,並將 high 用作大多數智能敏感工作負載的最低值。對於成本敏感的工作負載,降低到 medium,或僅當您的評估在 xhigh 時顯示可測量的餘量時才升高到 max。
API 預設值為 high。要使用 xhigh,請明確設定 effort;您傳遞的值會覆蓋預設值。
| 努力程度 | Claude Opus 4.7 的指導 |
|---|---|
low | 高效,但最適合簡短、範圍明確的任務。如果您的任務有多個部分,請將 low 與明確的檢查清單配對。 |
medium | 適用於平均工作流程的替代方案,您希望獲得良好的結果同時降低成本。 |
high | 仍然需要智能和 token 消耗平衡的進階使用案例。這通常是平衡品質和 token 效率的最佳點。 |
xhigh | 編碼和代理工作的推薦起點,以及探索性任務(例如重複工具呼叫、詳細網路搜尋和知識庫搜尋)。預期 token 使用量會明顯高於 high。 |
max | 保留用於真正的前沿問題。在大多數工作負載上,max 會增加顯著的成本以換取相對較小的品質提升,在某些結構化輸出或較低智能敏感性的任務上,它可能導致過度思考。 |
Claude Opus 4.7 也比 Claude Opus 4.6 更嚴格地遵守努力程度,特別是在 low 和 medium 時。在較低的努力程度下,模型會將其工作範圍限制在所要求的內容,而不是超越預期。如果您在使用 Claude Opus 4.7 處理複雜問題時觀察到淺層推理,請提高努力程度,而不是繞過提示。如果您必須為了延遲而保持低努力程度,請添加有針對性的指導,例如「此任務涉及多步驟推理。在回應前仔細思考。」
在 xhigh 或 max 努力程度下執行 Claude Opus 4.7 時,設定一個大的 max_tokens,以便模型有空間在子代理和工具呼叫中進行思考和行動。從 64k token 開始並從那裡進行調整是一個合理的預設值。
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=4096,
messages=[
{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures",
}
],
output_config={"effort": "medium"},
)
print(response.content[0].text)使用工具時,努力程度參數會影響工具呼叫周圍的解釋和工具呼叫本身。較低的努力程度傾向於:
較高的努力程度可能會:
努力程度參數與延伸思考一起運作。其行為取決於模型:
thinking 配置)。thinking: {type: "disabled"} 被拒絕。努力程度控制思考深度的方式與 Opus 4.7 和 Opus 4.6 上相同。thinking: {type: "adaptive"}),其中努力程度是控制思考深度的推薦方式。Opus 4.7 上不再支援手動延伸思考(thinking: {type: "enabled", budget_tokens: N});改用自適應思考與努力程度。在 high、xhigh 和 max 努力程度下,Claude 幾乎總是進行深入思考。在較低的級別,它可能會跳過對較簡單問題的思考。thinking: {type: "adaptive"}),其中努力程度是控制思考深度的推薦方式。雖然 budget_tokens 在 Opus 4.6 上仍然被接受,但它已被棄用,將在未來版本中移除。在 high 和 max 努力程度下,Claude 幾乎總是進行深入思考。在較低的級別,它可能會跳過對較簡單問題的思考。thinking: {type: "enabled", budget_tokens: N})仍然可用但已棄用。thinking: {type: "enabled", budget_tokens: N}),其中努力程度與思考 token 預算一起運作。為您的任務設定努力程度,然後根據任務複雜性設定思考 token 預算。努力程度參數可以在啟用或不啟用延伸思考的情況下使用。在不啟用思考的情況下使用時,它仍然控制文字回應和工具呼叫的整體 token 支出。
high,但正確的起點取決於您的模型和工作負載。Was this page helpful?