This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
努力程度参数允许您控制 Claude 在响应请求时花费令牌的积极程度。这使您能够在响应完整性和令牌效率之间进行权衡,所有这些都可以通过单个模型实现。努力程度参数在所有支持的模型上普遍可用,无需 beta 标头。
努力程度参数由 Claude Mythos Preview、Claude Opus 4.6、Claude Sonnet 4.6 和 Claude Opus 4.5 支持。
对于 Claude Opus 4.6 和 Sonnet 4.6,努力程度取代 budget_tokens 成为控制思考深度的推荐方式。将努力程度与自适应思考(thinking: {type: "adaptive"})结合使用以获得最佳体验。虽然 budget_tokens 在 Opus 4.6 和 Sonnet 4.6 上仍然被接受,但它已被弃用,将在未来的模型版本中删除。在 high(默认)和 max 努力程度下,Claude 几乎总是会思考。在较低的努力程度下,它可能会跳过对较简单问题的思考。
默认情况下,Claude 使用高努力程度,花费尽可能多的令牌以获得优异的结果。您可以将努力程度提高到 max 以获得绝对最高的能力,或降低它以更保守地使用令牌,优化速度和成本,同时接受一些能力的降低。
将 effort 设置为 "high" 会产生与完全省略 effort 参数完全相同的行为。
努力程度参数影响响应中的所有令牌,包括:
这种方法有两个主要优势:
| 级别 | 描述 | 典型用例 |
|---|---|---|
max | 绝对最大能力,对令牌支出没有限制。在 Claude Mythos Preview、Claude Opus 4.6 和 Claude Sonnet 4.6 上可用。 | 需要最深入推理和最彻底分析的任务 |
high | 高能力。等同于不设置参数。 | 复杂推理、困难的编码问题、代理任务 |
medium | 平衡的方法,具有适度的令牌节省。 | 需要速度、成本和性能平衡的代理任务 |
low | 最高效。显著的令牌节省,但能力有所降低。 | 需要最佳速度和最低成本的较简单任务,例如子代理 |
努力程度是一个行为信号,而不是严格的令牌预算。在较低的努力程度下,Claude 仍然会在足够困难的问题上思考,但对于同一问题,它的思考会少于在较高努力程度下的思考。
Sonnet 4.6 默认为 high 努力程度。使用 Sonnet 4.6 时明确设置努力程度以避免意外延迟:
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-6",
"max_tokens": 4096,
"messages": [{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
"output_config": {
"effort": "medium"
}
}'使用工具时,努力程度参数影响工具调用周围的解释和工具调用本身。较低的努力程度倾向于:
较高的努力程度可能会:
努力程度参数与扩展思考一起工作。其行为取决于模型:
thinking 配置)。thinking: {type: "disabled"} 被拒绝。努力程度以与 Opus 4.6 相同的方式控制思考深度。thinking: {type: "adaptive"}),其中努力程度是控制思考深度的推荐方式。虽然 budget_tokens 在 Opus 4.6 上仍然被接受,但它已被弃用,将在未来版本中删除。在 high 和 max 努力程度下,Claude 几乎总是深入思考。在较低的级别下,它可能会跳过对较简单问题的思考。thinking: {type: "enabled", budget_tokens: N})仍然可用但已弃用。thinking: {type: "enabled", budget_tokens: N}),其中努力程度与思考令牌预算一起工作。为您的任务设置努力程度,然后根据任务复杂性设置思考令牌预算。努力程度参数可以在启用或不启用扩展思考的情况下使用。在不启用思考的情况下使用时,它仍然控制文本响应和工具调用的总体令牌支出。
high,但正确的起点取决于您的模型和工作负载。Was this page helpful?