模型能力

Effort

使用 effort 参数控制 Claude 响应时使用的 token 数量，在响应全面性和 token 效率之间进行权衡。

effort 参数允许您控制 Claude 在响应请求时花费 token 的积极程度。这使您能够在响应全面性和 token 效率之间进行权衡，且只需使用单一模型。effort 参数已在所有支持的模型上正式可用，无需 beta 头。

effort 参数由 Claude Opus 4.6 和 Claude Opus 4.5 支持。

对于 Claude Opus 4.6，effort 取代 budget_tokens 成为控制思考深度的推荐方式。将 effort 与自适应思考（thinking: {type: "adaptive"}）结合使用可获得最佳体验。虽然 Opus 4.6 仍然接受 budget_tokens，但它已被弃用，将在未来的模型版本中移除。在 high（默认）和 max effort 级别下，Claude 几乎总是会进行思考。在较低的 effort 级别下，它可能会跳过对简单问题的思考。

effort 的工作原理

默认情况下，Claude 使用高 effort——花费尽可能多的 token 以获得出色的结果。您可以将 effort 级别提高到 max 以获得绝对最高的能力，或者降低它以更保守地使用 token，优化速度和成本，同时接受一些能力上的降低。

将 effort 设置为 "high" 与完全省略 effort 参数产生完全相同的行为。

effort 参数影响响应中的所有 token，包括：

文本响应和解释
工具调用和函数参数
扩展思考（启用时）

这种方法有两个主要优势：

无需启用思考即可使用。
它可以影响所有 token 消耗，包括工具调用。例如，较低的 effort 意味着 Claude 会进行更少的工具调用。这提供了对效率更大程度的控制。

Effort 级别

级别	描述	典型使用场景
`max`	绝对最高能力，对 token 消耗没有限制。仅限 Opus 4.6——在其他模型上使用 `max` 的请求将返回错误。	需要最深层推理和最全面分析的任务
`high`	高能力。等同于不设置该参数。	复杂推理、困难的编码问题、智能体任务
`medium`	平衡方法，适度节省 token。	需要在速度、成本和性能之间取得平衡的智能体任务
`low`	最高效。显著节省 token，但能力有所降低。	需要最佳速度和最低成本的简单任务，例如子智能体

Effort 是一个行为信号，而非严格的 token 预算。在较低的 effort 级别下，Claude 仍然会对足够困难的问题进行思考——只是对于同一问题，它的思考量会比在较高 effort 级别下更少。

基本用法

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=4096,
    messages=[{
        "role": "user",
        "content": "Analyze the trade-offs between microservices and monolithic architectures"
    }],
    output_config={
        "effort": "medium"
    }
)

print(response.content[0].text)

何时应该调整 effort 参数？

当您需要绝对最高能力且不受限制时，使用 max effort——最全面的推理和最深入的分析。仅在 Opus 4.6 上可用；在其他模型上使用 max 的请求将返回错误。
当您需要 Claude 的最佳表现时，使用 high effort（默认值）——复杂推理、细致分析、困难的编码问题，或任何以质量为首要优先级的任务。
当您希望在不消耗 high effort 全部 token 的情况下获得稳定性能时，使用 medium effort 作为平衡选项。
当您优化速度（因为 Claude 用更少的 token 回答）或成本时，使用 low effort——例如，简单的分类任务、快速查询，或边际质量提升不足以证明额外延迟或花费合理性的高流量使用场景。

Effort 与工具使用

使用工具时，effort 参数同时影响工具调用周围的解释和工具调用本身。较低的 effort 级别倾向于：

将多个操作合并为更少的工具调用
进行更少的工具调用
直接执行操作而不做前言
完成后使用简洁的确认消息

较高的 effort 级别可能会：

进行更多的工具调用
在执行操作前解释计划
提供详细的变更摘要
包含更全面的代码注释

Effort 与扩展思考

effort 参数与扩展思考协同工作。其行为取决于模型：

Claude Opus 4.6 使用自适应思考（thinking: {type: "adaptive"}），其中 effort 是控制思考深度的推荐方式。虽然 Opus 4.6 仍然接受 budget_tokens，但它已被弃用，将在未来版本中移除。在 high 和 max effort 级别下，Claude 几乎总是会进行深度思考。在较低级别下，它可能会跳过对简单问题的思考。
Claude Opus 4.5 使用手动思考（thinking: {type: "enabled", budget_tokens: N}），其中 effort 与思考 token 预算协同工作。根据您的任务设置 effort 级别，然后根据任务复杂度设置思考 token 预算。

effort 参数可以在启用或不启用扩展思考的情况下使用。在不使用思考时，它仍然控制文本响应和工具调用的整体 token 消耗。

最佳实践

从 high 开始：使用较低的 effort 级别来在性能和 token 效率之间进行权衡。
对速度敏感或简单的任务使用 low：当延迟很重要或任务很简单时，low effort 可以显著减少响应时间和成本。
测试您的使用场景：effort 级别的影响因任务类型而异。在部署之前，在您的特定使用场景上评估性能。
考虑动态 effort：根据任务复杂度调整 effort。简单查询可能适合使用 low effort，而智能体编码和复杂推理则受益于 high effort。

Was this page helpful?

模型能力

Effort

使用 effort 参数控制 Claude 响应时使用的 token 数量，在响应全面性和 token 效率之间进行权衡。

effort 参数由 Claude Opus 4.6 和 Claude Opus 4.5 支持。

effort 的工作原理

将 effort 设置为 "high" 与完全省略 effort 参数产生完全相同的行为。

effort 参数影响响应中的所有 token，包括：

文本响应和解释
工具调用和函数参数
扩展思考（启用时）

这种方法有两个主要优势：

无需启用思考即可使用。
它可以影响所有 token 消耗，包括工具调用。例如，较低的 effort 意味着 Claude 会进行更少的工具调用。这提供了对效率更大程度的控制。

Effort 级别

级别	描述	典型使用场景
`max`	绝对最高能力，对 token 消耗没有限制。仅限 Opus 4.6——在其他模型上使用 `max` 的请求将返回错误。	需要最深层推理和最全面分析的任务
`high`	高能力。等同于不设置该参数。	复杂推理、困难的编码问题、智能体任务
`medium`	平衡方法，适度节省 token。	需要在速度、成本和性能之间取得平衡的智能体任务
`low`	最高效。显著节省 token，但能力有所降低。	需要最佳速度和最低成本的简单任务，例如子智能体

基本用法

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=4096,
    messages=[{
        "role": "user",
        "content": "Analyze the trade-offs between microservices and monolithic architectures"
    }],
    output_config={
        "effort": "medium"
    }
)

print(response.content[0].text)

何时应该调整 effort 参数？

当您需要绝对最高能力且不受限制时，使用 max effort——最全面的推理和最深入的分析。仅在 Opus 4.6 上可用；在其他模型上使用 max 的请求将返回错误。
当您需要 Claude 的最佳表现时，使用 high effort（默认值）——复杂推理、细致分析、困难的编码问题，或任何以质量为首要优先级的任务。
当您希望在不消耗 high effort 全部 token 的情况下获得稳定性能时，使用 medium effort 作为平衡选项。
当您优化速度（因为 Claude 用更少的 token 回答）或成本时，使用 low effort——例如，简单的分类任务、快速查询，或边际质量提升不足以证明额外延迟或花费合理性的高流量使用场景。

Effort 与工具使用

使用工具时，effort 参数同时影响工具调用周围的解释和工具调用本身。较低的 effort 级别倾向于：

将多个操作合并为更少的工具调用
进行更少的工具调用
直接执行操作而不做前言
完成后使用简洁的确认消息

较高的 effort 级别可能会：

进行更多的工具调用
在执行操作前解释计划
提供详细的变更摘要
包含更全面的代码注释

Effort 与扩展思考

effort 参数与扩展思考协同工作。其行为取决于模型：

Claude Opus 4.6 使用自适应思考（thinking: {type: "adaptive"}），其中 effort 是控制思考深度的推荐方式。虽然 Opus 4.6 仍然接受 budget_tokens，但它已被弃用，将在未来版本中移除。在 high 和 max effort 级别下，Claude 几乎总是会进行深度思考。在较低级别下，它可能会跳过对简单问题的思考。
Claude Opus 4.5 使用手动思考（thinking: {type: "enabled", budget_tokens: N}），其中 effort 与思考 token 预算协同工作。根据您的任务设置 effort 级别，然后根据任务复杂度设置思考 token 预算。

effort 参数可以在启用或不启用扩展思考的情况下使用。在不使用思考时，它仍然控制文本响应和工具调用的整体 token 消耗。

最佳实践

从 high 开始：使用较低的 effort 级别来在性能和 token 效率之间进行权衡。
对速度敏感或简单的任务使用 low：当延迟很重要或任务很简单时，low effort 可以显著减少响应时间和成本。
测试您的使用场景：effort 级别的影响因任务类型而异。在部署之前，在您的特定使用场景上评估性能。
考虑动态 effort：根据任务复杂度调整 effort。简单查询可能适合使用 low effort，而智能体编码和复杂推理则受益于 high effort。

Was this page helpful?