Loading...
    • 构建
    • 管理
    • 模型与定价
    • 客户端 SDK
    • API 参考
    Search...
    ⌘K
    入门步骤
    Claude 简介快速入门
    使用 Claude 构建
    功能概览使用 Messages API处理停止原因
    模型能力
    扩展思考自适应思考努力程度快速模式(测试版:研究预览)结构化输出引用流式消息批量处理搜索结果流式拒绝多语言支持嵌入
    工具
    概览工具使用原理网页搜索工具网页抓取工具代码执行工具记忆工具Bash 工具计算机使用工具文本编辑器工具
    工具基础设施
    工具搜索程序化工具调用细粒度工具流式传输
    上下文管理
    上下文窗口压缩上下文编辑提示词缓存Token 计数
    文件处理
    Files APIPDF 支持图像与视觉
    技能
    概览快速入门最佳实践企业级技能API 中的技能
    MCP
    远程 MCP 服务器MCP 连接器
    提示词工程
    概览提示词最佳实践Console 提示词工具
    测试与评估
    定义成功标准并构建评估在 Console 中使用评估工具降低延迟
    加强安全护栏
    减少幻觉提高输出一致性防范越狱减少提示词泄露
    资源
    术语表
    发布说明
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    模型能力

    努力程度

    使用努力程度参数控制 Claude 在响应时使用多少令牌,在响应完整性和令牌效率之间进行权衡。

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    努力程度参数允许您控制 Claude 在响应请求时花费令牌的积极程度。这使您能够在响应完整性和令牌效率之间进行权衡,所有这些都可以通过单个模型实现。努力程度参数在所有支持的模型上普遍可用,无需 beta 标头。

    努力程度参数由 Claude Mythos Preview、Claude Opus 4.6、Claude Sonnet 4.6 和 Claude Opus 4.5 支持。

    对于 Claude Opus 4.6 和 Sonnet 4.6,努力程度取代 budget_tokens 成为控制思考深度的推荐方式。将努力程度与自适应思考(thinking: {type: "adaptive"})结合使用以获得最佳体验。虽然 budget_tokens 在 Opus 4.6 和 Sonnet 4.6 上仍然被接受,但它已被弃用,将在未来的模型版本中删除。在 high(默认)和 max 努力程度下,Claude 几乎总是会思考。在较低的努力程度下,它可能会跳过对较简单问题的思考。

    努力程度如何工作

    默认情况下,Claude 使用高努力程度,花费尽可能多的令牌以获得优异的结果。您可以将努力程度提高到 max 以获得绝对最高的能力,或降低它以更保守地使用令牌,优化速度和成本,同时接受一些能力的降低。

    将 effort 设置为 "high" 会产生与完全省略 effort 参数完全相同的行为。

    努力程度参数影响响应中的所有令牌,包括:

    • 文本响应和解释
    • 工具调用和函数参数
    • 扩展思考(启用时)

    这种方法有两个主要优势:

    1. 它不需要启用思考就能使用。
    2. 它可以影响所有令牌支出,包括工具调用。例如,较低的努力程度意味着 Claude 进行的工具调用更少。这提供了对效率的更大控制度。

    努力程度

    级别描述典型用例
    max绝对最大能力,对令牌支出没有限制。在 Claude Mythos Preview、Claude Opus 4.6 和 Claude Sonnet 4.6 上可用。需要最深入推理和最彻底分析的任务
    high高能力。等同于不设置参数。复杂推理、困难的编码问题、代理任务
    medium平衡的方法,具有适度的令牌节省。需要速度、成本和性能平衡的代理任务
    low最高效。显著的令牌节省,但能力有所降低。需要最佳速度和最低成本的较简单任务,例如子代理

    努力程度是一个行为信号,而不是严格的令牌预算。在较低的努力程度下,Claude 仍然会在足够困难的问题上思考,但对于同一问题,它的思考会少于在较高努力程度下的思考。

    Sonnet 4.6 的推荐努力程度

    Sonnet 4.6 默认为 high 努力程度。使用 Sonnet 4.6 时明确设置努力程度以避免意外延迟:

    • 中等努力程度(推荐默认值):对于大多数应用程序,速度、成本和性能的最佳平衡。适合代理编码、工具密集型工作流和代码生成。
    • 低努力程度: 用于高容量或延迟敏感的工作负载。适合聊天和非编码用例,其中优先考虑更快的周转时间。
    • 高努力程度: 用于需要 Sonnet 4.6 最大智能的任务。
    • 最大努力程度: 用于需要绝对最高能力且对令牌支出没有限制的任务。

    基本用法

    curl https://api.anthropic.com/v1/messages \
        --header "x-api-key: $ANTHROPIC_API_KEY" \
        --header "anthropic-version: 2023-06-01" \
        --header "content-type: application/json" \
        --data '{
            "model": "claude-opus-4-6",
            "max_tokens": 4096,
            "messages": [{
                "role": "user",
                "content": "Analyze the trade-offs between microservices and monolithic architectures"
            }],
            "output_config": {
                "effort": "medium"
            }
        }'

    何时调整努力程度参数

    • 当您需要绝对最高的能力且没有限制时,使用最大努力程度:最彻底的推理和最深入的分析。在 Claude Mythos Preview、Claude Opus 4.6 和 Claude Sonnet 4.6 上可用。
    • 当您需要 Claude 的最佳工作时,使用高努力程度(默认值):复杂推理、细致分析、困难的编码问题,或任何质量是首要优先事项的任务。
    • 当您想要可靠的性能而不需要高努力程度的全部令牌支出时,使用中等努力程度作为平衡选项。
    • 当您优化速度(因为 Claude 用更少的令牌回答)或成本时,使用低努力程度。例如,简单的分类任务、快速查询或高容量用例,其中边际质量改进不足以证明额外的延迟或支出。

    工具使用中的努力程度

    使用工具时,努力程度参数影响工具调用周围的解释和工具调用本身。较低的努力程度倾向于:

    • 将多个操作合并为更少的工具调用
    • 进行更少的工具调用
    • 直接进行操作而不需要前言
    • 完成后使用简洁的确认消息

    较高的努力程度可能会:

    • 进行更多的工具调用
    • 在采取行动前解释计划
    • 提供详细的更改摘要
    • 包含更全面的代码注释

    扩展思考中的努力程度

    努力程度参数与扩展思考一起工作。其行为取决于模型:

    • Claude Mythos Preview 默认使用自适应思考(无需 thinking 配置)。thinking: {type: "disabled"} 被拒绝。努力程度以与 Opus 4.6 相同的方式控制思考深度。
    • Claude Opus 4.6 使用自适应思考(thinking: {type: "adaptive"}),其中努力程度是控制思考深度的推荐方式。虽然 budget_tokens 在 Opus 4.6 上仍然被接受,但它已被弃用,将在未来版本中删除。在 high 和 max 努力程度下,Claude 几乎总是深入思考。在较低的级别下,它可能会跳过对较简单问题的思考。
    • Claude Sonnet 4.6 使用自适应思考(其中努力程度控制思考深度)。手动思考与交错模式(thinking: {type: "enabled", budget_tokens: N})仍然可用但已弃用。
    • Claude Opus 4.5 和其他 Claude 4 模型使用手动思考(thinking: {type: "enabled", budget_tokens: N}),其中努力程度与思考令牌预算一起工作。为您的任务设置努力程度,然后根据任务复杂性设置思考令牌预算。

    努力程度参数可以在启用或不启用扩展思考的情况下使用。在不启用思考的情况下使用时,它仍然控制文本响应和工具调用的总体令牌支出。

    最佳实践

    1. 明确设置努力程度: API 默认为 high,但正确的起点取决于您的模型和工作负载。
    2. 对速度敏感或简单任务使用低努力程度: 当延迟很重要或任务很简单时,低努力程度可以显著减少响应时间和成本。
    3. 测试您的用例: 努力程度的影响因任务类型而异。在部署前评估您特定用例的性能。
    4. 考虑动态努力程度: 根据任务复杂性调整努力程度。简单查询可能需要低努力程度,而代理编码和复杂推理受益于高努力程度。

    Was this page helpful?

    • Sonnet 4.6 的推荐努力程度