Was this page helpful?
effort 參數允許您控制 Claude 在回應請求時花費 token 的積極程度。這讓您能夠在回應完整性和 token 效率之間進行權衡,且全部使用單一模型。effort 參數已在所有支援的模型上正式可用,無需 beta 標頭。
effort 參數由 Claude Opus 4.6 和 Claude Opus 4.5 支援。
對於 Claude Opus 4.6,effort 取代 budget_tokens 成為控制思考深度的建議方式。將 effort 與自適應思考(thinking: {type: "adaptive"})結合使用可獲得最佳體驗。雖然 budget_tokens 在 Opus 4.6 上仍然被接受,但它已被棄用,將在未來的模型版本中移除。在 high(預設)和 max effort 下,Claude 幾乎總是會進行思考。在較低的 effort 級別下,它可能會跳過較簡單問題的思考。
預設情況下,Claude 使用高 effort——花費所需的 token 數量以獲得出色的結果。您可以將 effort 級別提高到 max 以獲得絕對最高的能力,或降低它以更保守地使用 token,在接受一些能力降低的情況下優化速度和成本。
將 effort 設定為 "high" 會產生與完全省略 effort 參數完全相同的行為。
effort 參數影響回應中的所有 token,包括:
這種方法有兩個主要優勢:
| 級別 | 描述 | 典型使用場景 |
|---|---|---|
max | 絕對最大能力,不限制 token 花費。僅限 Opus 4.6——在其他模型上使用 max 的請求將返回錯誤。 | 需要最深層推理和最徹底分析的任務 |
high | 高能力。等同於不設定該參數。 | 複雜推理、困難的程式設計問題、代理任務 |
medium | 平衡方法,適度節省 token。 | 需要在速度、成本和效能之間取得平衡的代理任務 |
low | 最高效率。顯著節省 token,但能力有所降低。 | 需要最佳速度和最低成本的較簡單任務,例如子代理 |
Effort 是一個行為信號,而非嚴格的 token 預算。在較低的 effort 級別下,Claude 仍然會對足夠困難的問題進行思考——只是對於相同問題,它的思考量會比在較高 effort 級別下少。
max 的請求將返回錯誤。使用工具時,effort 參數會影響工具呼叫周圍的解釋和工具呼叫本身。較低的 effort 級別傾向於:
較高的 effort 級別可能會:
effort 參數與延伸思考協同運作。其行為取決於模型:
thinking: {type: "adaptive"}),其中 effort 是控制思考深度的建議方式。雖然 budget_tokens 在 Opus 4.6 上仍然被接受,但它已被棄用,將在未來版本中移除。在 high 和 max effort 下,Claude 幾乎總是進行深度思考。在較低級別下,它可能會跳過較簡單問題的思考。thinking: {type: "enabled", budget_tokens: N}),其中 effort 與思考 token 預算協同運作。根據您的任務設定 effort 級別,然後根據任務複雜度設定思考 token 預算。effort 參數可以在啟用或未啟用延伸思考的情況下使用。在未使用思考時,它仍然控制文字回應和工具呼叫的整體 token 花費。
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)