Was this page helpful?
This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
努力程度参数允许您控制 Claude 在响应请求时花费令牌的积极程度。这使您能够在响应详尽程度和令牌效率之间进行权衡,所有这些都可以通过单个模型实现。努力程度参数在所有支持的模型上普遍可用,无需 beta 标头。
努力程度参数由 Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6、Claude Sonnet 4.6 和 Claude Opus 4.5 支持。
对于 Claude Opus 4.6 和 Sonnet 4.6,努力程度取代了 budget_tokens 作为控制思考深度的推荐方式。将努力程度与自适应思考(thinking: {type: "adaptive"})结合使用以获得最佳体验。虽然 budget_tokens 在 Opus 4.6 和 Sonnet 4.6 上仍然被接受,但它已被弃用,将在未来的模型版本中删除。在 high(默认)和 max 努力程度下,Claude 几乎总是会思考。在较低的努力程度下,它可能会跳过对更简单问题的思考。
默认情况下,Claude 使用高努力程度,花费尽可能多的令牌以获得优异的结果。您可以将努力程度提高到 max 以获得绝对最高的能力,或降低它以更保守地使用令牌,优化速度和成本,同时接受某些能力的降低。
将 effort 设置为 "high" 会产生与完全省略 effort 参数相同的行为。
努力程度参数影响响应中的所有令牌,包括:
这种方法有两个主要优势:
| 级别 | 描述 | 典型用例 |
|---|---|---|
max | 绝对最大能力,对令牌支出没有限制。在 Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6 和 Claude Sonnet 4.6 上可用。 | 需要最深入推理和最彻底分析的任务 |
xhigh | 用于长期工作的扩展能力。在 Claude Opus 4.7 上可用。 | 长期运行的代理和编码任务(超过 30 分钟),令牌预算达数百万 |
high | 高能力。等同于不设置参数。 | 复杂推理、困难的编码问题、代理任务 |
medium | 平衡的方法,具有适度的令牌节省。 | 需要速度、成本和性能平衡的代理任务 |
low | 最高效。显著的令牌节省,但能力有所降低。 | 需要最佳速度和最低成本的更简单任务,例如子代理 |
努力程度是一个行为信号,而不是严格的令牌预算。在较低的努力程度下,Claude 仍然会在足够困难的问题上思考,但对于同一问题,它的思考会比在较高努力程度下少。
Sonnet 4.6 默认为 high 努力程度。使用 Sonnet 4.6 时明确设置努力程度以避免意外延迟:
从编码和代理用例的 xhigh 开始,并将 high 用作大多数智能敏感工作负载的最低值。对于成本敏感的工作负载,降低到 medium,或仅当您的评估显示在 xhigh 处有可测量的余地时才升高到 max。
API 默认值为 high。要使用 xhigh,请明确设置 effort;您传递的值会覆盖默认值。
| 努力程度 | Claude Opus 4.7 的指导 |
|---|---|
low | 高效,但最适合短期、有范围的任务。如果您的任务有多个部分,请将 low 与明确的检查清单配对。 |
medium | 适用于您想要获得良好结果同时降低成本的平均工作流的替代方案。 |
high | 仍然需要智能和令牌消耗平衡的高级用例。这通常是平衡质量和令牌效率的最佳点。 |
xhigh | 编码和代理工作的推荐起点,以及探索性任务(如重复工具调用、详细网络搜索和知识库搜索)的推荐起点。预期令牌使用量会比 high 显著更高。 |
max | 保留用于真正的前沿问题。在大多数工作负载上,max 增加了显著的成本,但质量收益相对较小,在某些结构化输出或智能敏感度较低的任务上,它可能导致过度思考。 |
Claude Opus 4.7 也比 Claude Opus 4.6 更严格地遵守努力程度,特别是在 low 和 medium 处。在较低的努力程度下,模型将其工作范围限制在所要求的内容,而不是超越预期。如果您在 Claude Opus 4.7 上观察到复杂问题的浅层推理,请提高努力程度,而不是通过提示来解决。如果您必须为了降低延迟而保持较低的努力程度,请添加有针对性的指导,例如"此任务涉及多步推理。在响应前仔细思考。"
在 xhigh 或 max 努力程度下运行 Claude Opus 4.7 时,设置一个大的 max_tokens,以便模型有空间在子代理和工具调用中思考和行动。从 64k 令牌开始并从那里进行调整是一个合理的默认值。
使用工具时,努力程度参数影响工具调用周围的解释和工具调用本身。较低的努力程度倾向于:
较高的努力程度可能:
努力程度参数与扩展思考一起工作。其行为取决于模型:
thinking 配置)。thinking: {type: "disabled"} 被拒绝。努力程度以与 Opus 4.7 和 Opus 4.6 相同的方式控制思考深度。thinking: {type: "adaptive"}),其中努力程度是控制思考深度的推荐方式。Opus 4.7 不再支持手动扩展思考(thinking: {type: "enabled", budget_tokens: N});改为使用自适应思考与努力程度。在 high、xhigh 和 max 努力程度下,Claude 几乎总是深入思考。在较低的级别,它可能会跳过对更简单问题的思考。thinking: {type: "adaptive"}),其中努力程度是控制思考深度的推荐方式。虽然 budget_tokens 在 Opus 4.6 上仍然被接受,但它已被弃用,将在未来版本中删除。在 high 和 max 努力程度下,Claude 几乎总是深入思考。在较低的级别,它可能会跳过对更简单问题的思考。努力程度参数可以在启用或不启用扩展思考的情况下使用。在不启用思考的情况下使用时,它仍然控制文本响应和工具调用的总体令牌支出。
high,但正确的起点取决于您的模型和工作负载。client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=4096,
messages=[
{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures",
}
],
output_config={"effort": "medium"},
)
print(response.content[0].text)thinking: {type: "enabled", budget_tokens: N}thinking: {type: "enabled", budget_tokens: N}),其中努力程度与思考令牌预算一起工作。为您的任务设置努力程度,然后根据任务复杂性设置思考令牌预算。