Loading...
  • 构建
  • 管理
  • 模型与定价
  • 客户端 SDK
  • API 参考
Search...
⌘K
Log in
努力程度
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
构建/模型能力

努力程度

使用努力程度参数控制 Claude 在响应时使用多少令牌,在响应详尽程度和令牌效率之间进行权衡。

Was this page helpful?

  • Sonnet 4.6 的推荐努力程度
  • Claude Opus 4.7 的推荐努力程度

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

努力程度参数允许您控制 Claude 在响应请求时花费令牌的积极程度。这使您能够在响应详尽程度和令牌效率之间进行权衡,所有这些都可以通过单个模型实现。努力程度参数在所有支持的模型上普遍可用,无需 beta 标头。

努力程度参数由 Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6、Claude Sonnet 4.6 和 Claude Opus 4.5 支持。

对于 Claude Opus 4.6 和 Sonnet 4.6,努力程度取代了 budget_tokens 作为控制思考深度的推荐方式。将努力程度与自适应思考(thinking: {type: "adaptive"})结合使用以获得最佳体验。虽然 budget_tokens 在 Opus 4.6 和 Sonnet 4.6 上仍然被接受,但它已被弃用,将在未来的模型版本中删除。在 high(默认)和 max 努力程度下,Claude 几乎总是会思考。在较低的努力程度下,它可能会跳过对更简单问题的思考。

努力程度如何工作

默认情况下,Claude 使用高努力程度,花费尽可能多的令牌以获得优异的结果。您可以将努力程度提高到 max 以获得绝对最高的能力,或降低它以更保守地使用令牌,优化速度和成本,同时接受某些能力的降低。

将 effort 设置为 "high" 会产生与完全省略 effort 参数相同的行为。

努力程度参数影响响应中的所有令牌,包括:

  • 文本响应和解释
  • 工具调用和函数参数
  • 扩展思考(启用时)

这种方法有两个主要优势:

  1. 它不需要启用思考就能使用它。
  2. 它可以影响所有令牌支出,包括工具调用。例如,较低的努力程度意味着 Claude 会进行较少的工具调用。这提供了对效率的更大控制程度。

努力程度

级别描述典型用例
max绝对最大能力,对令牌支出没有限制。在 Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6 和 Claude Sonnet 4.6 上可用。需要最深入推理和最彻底分析的任务
xhigh用于长期工作的扩展能力。在 Claude Opus 4.7 上可用。长期运行的代理和编码任务(超过 30 分钟),令牌预算达数百万
high高能力。等同于不设置参数。复杂推理、困难的编码问题、代理任务
medium平衡的方法,具有适度的令牌节省。需要速度、成本和性能平衡的代理任务
low最高效。显著的令牌节省,但能力有所降低。需要最佳速度和最低成本的更简单任务,例如子代理

努力程度是一个行为信号,而不是严格的令牌预算。在较低的努力程度下,Claude 仍然会在足够困难的问题上思考,但对于同一问题,它的思考会比在较高努力程度下少。

Sonnet 4.6 的推荐努力程度

Sonnet 4.6 默认为 high 努力程度。使用 Sonnet 4.6 时明确设置努力程度以避免意外延迟:

  • 中等努力程度(推荐默认值):对大多数应用程序来说,速度、成本和性能的最佳平衡。适合代理编码、工具密集型工作流和代码生成。
  • 低努力程度: 用于高容量或延迟敏感的工作负载。适合聊天和非编码用例,其中优先考虑更快的周转时间。
  • 高努力程度: 用于需要 Sonnet 4.6 最大智能的任务。
  • 最大努力程度: 用于需要绝对最高能力且对令牌支出没有限制的任务。

Claude Opus 4.7 的推荐努力程度

从编码和代理用例的 xhigh 开始,并将 high 用作大多数智能敏感工作负载的最低值。对于成本敏感的工作负载,降低到 medium,或仅当您的评估显示在 xhigh 处有可测量的余地时才升高到 max。

API 默认值为 high。要使用 xhigh,请明确设置 effort;您传递的值会覆盖默认值。

努力程度Claude Opus 4.7 的指导
low高效,但最适合短期、有范围的任务。如果您的任务有多个部分,请将 low 与明确的检查清单配对。
medium适用于您想要获得良好结果同时降低成本的平均工作流的替代方案。
high仍然需要智能和令牌消耗平衡的高级用例。这通常是平衡质量和令牌效率的最佳点。
xhigh编码和代理工作的推荐起点,以及探索性任务(如重复工具调用、详细网络搜索和知识库搜索)的推荐起点。预期令牌使用量会比 high 显著更高。
max保留用于真正的前沿问题。在大多数工作负载上,max 增加了显著的成本,但质量收益相对较小,在某些结构化输出或智能敏感度较低的任务上,它可能导致过度思考。

Claude Opus 4.7 也比 Claude Opus 4.6 更严格地遵守努力程度,特别是在 low 和 medium 处。在较低的努力程度下,模型将其工作范围限制在所要求的内容,而不是超越预期。如果您在 Claude Opus 4.7 上观察到复杂问题的浅层推理,请提高努力程度,而不是通过提示来解决。如果您必须为了降低延迟而保持较低的努力程度,请添加有针对性的指导,例如"此任务涉及多步推理。在响应前仔细思考。"

在 xhigh 或 max 努力程度下运行 Claude Opus 4.7 时,设置一个大的 max_tokens,以便模型有空间在子代理和工具调用中思考和行动。从 64k 令牌开始并从那里进行调整是一个合理的默认值。

基本用法

何时调整努力程度参数

  • 当您需要绝对最高的能力且没有限制时,使用最大努力程度:最彻底的推理和最深入的分析。在 Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6 和 Claude Sonnet 4.6 上可用。
  • 对于需要扩展探索的高级编码和复杂代理工作(例如重复工具调用和详细搜索),使用超高努力程度。在 Claude Opus 4.7 上可用。
  • 当您需要 Claude 的最佳工作时,使用高努力程度(默认值):复杂推理、细致分析、困难的编码问题或任何质量是首要优先事项的任务。
  • 当您想要可靠的性能而不需要高努力程度的全部令牌支出时,使用中等努力程度作为平衡选项。
  • 当您优化速度(因为 Claude 用更少的令牌回答)或成本时,使用低努力程度。例如,简单的分类任务、快速查询或高容量用例,其中边际质量改进不足以证明额外的延迟或支出。

努力程度与工具使用

使用工具时,努力程度参数影响工具调用周围的解释和工具调用本身。较低的努力程度倾向于:

  • 将多个操作合并为更少的工具调用
  • 进行更少的工具调用
  • 直接进行操作而不需要前言
  • 完成后使用简洁的确认消息

较高的努力程度可能:

  • 进行更多的工具调用
  • 在采取行动前解释计划
  • 提供详细的更改摘要
  • 包含更全面的代码注释

努力程度与扩展思考

努力程度参数与扩展思考一起工作。其行为取决于模型:

  • Claude Mythos Preview 默认使用自适应思考(无需 thinking 配置)。thinking: {type: "disabled"} 被拒绝。努力程度以与 Opus 4.7 和 Opus 4.6 相同的方式控制思考深度。
  • Claude Opus 4.7 使用自适应思考(thinking: {type: "adaptive"}),其中努力程度是控制思考深度的推荐方式。Opus 4.7 不再支持手动扩展思考(thinking: {type: "enabled", budget_tokens: N});改为使用自适应思考与努力程度。在 high、xhigh 和 max 努力程度下,Claude 几乎总是深入思考。在较低的级别,它可能会跳过对更简单问题的思考。
  • Claude Opus 4.6 使用自适应思考(thinking: {type: "adaptive"}),其中努力程度是控制思考深度的推荐方式。虽然 budget_tokens 在 Opus 4.6 上仍然被接受,但它已被弃用,将在未来版本中删除。在 high 和 max 努力程度下,Claude 几乎总是深入思考。在较低的级别,它可能会跳过对更简单问题的思考。
  • 使用(其中努力程度控制思考深度)。带有的手动思考()仍然可用但已弃用。

努力程度参数可以在启用或不启用扩展思考的情况下使用。在不启用思考的情况下使用时,它仍然控制文本响应和工具调用的总体令牌支出。

最佳实践

  1. 明确设置努力程度: API 默认为 high,但正确的起点取决于您的模型和工作负载。
  2. 对速度敏感或简单任务使用低努力程度: 当延迟很重要或任务很简单时,低努力程度可以显著减少响应时间和成本。
  3. 测试您的用例: 努力程度的影响因任务类型而异。在部署前在您的特定用例上评估性能。
  4. 考虑动态努力程度: 根据任务复杂性调整努力程度。简单查询可能需要低努力程度,而代理编码和复杂推理受益于高努力程度。
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)
Claude Sonnet 4.6
自适应思考
交错模式
thinking: {type: "enabled", budget_tokens: N}
  • Claude Opus 4.5 和其他 Claude 4 模型使用手动思考(thinking: {type: "enabled", budget_tokens: N}),其中努力程度与思考令牌预算一起工作。为您的任务设置努力程度,然后根据任务复杂性设置思考令牌预算。