Loading...
    • 开发者指南
    • API 参考
    • MCP
    • 资源
    • 更新日志
    Search...
    ⌘K
    入门
    Claude 简介快速开始
    模型与定价
    模型概览选择模型Claude 4.6 新特性迁移指南模型弃用定价
    使用 Claude 构建
    功能概览使用 Messages API处理停止原因提示词最佳实践
    模型能力
    扩展思考自适应思考思考力度快速模式(研究预览)结构化输出引用流式消息批量处理PDF 支持搜索结果多语言支持嵌入视觉
    工具
    概览如何实现工具使用网页搜索工具网页获取工具代码执行工具记忆工具Bash 工具计算机使用工具文本编辑器工具
    工具基础设施
    工具搜索编程式工具调用细粒度工具流式传输
    上下文管理
    上下文窗口压缩上下文编辑提示缓存Token 计数
    文件与资源
    Files API
    Agent 技能
    概览快速开始最佳实践企业版技能通过 API 使用技能
    Agent SDK
    概览快速开始TypeScript SDKTypeScript V2(预览)Python SDK迁移指南
    API 中的 MCP
    MCP 连接器远程 MCP 服务器
    第三方平台上的 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    提示工程
    概览提示词生成器使用提示词模板提示词优化器清晰直接使用示例(多样本提示)让 Claude 思考(思维链)使用 XML 标签赋予 Claude 角色(系统提示词)链式复杂提示长上下文技巧扩展思考技巧
    测试与评估
    定义成功标准开发测试用例使用评估工具降低延迟
    加强安全护栏
    减少幻觉提高输出一致性防范越狱攻击流式拒绝减少提示词泄露保持 Claude 角色一致
    管理与监控
    Admin API 概览数据驻留工作空间用量与成本 APIClaude Code Analytics API零数据留存
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    模型能力

    Effort

    使用 effort 参数控制 Claude 响应时使用的 token 数量,在响应全面性和 token 效率之间进行权衡。

    effort 参数允许您控制 Claude 在响应请求时花费 token 的积极程度。这使您能够在响应全面性和 token 效率之间进行权衡,且只需使用单一模型。effort 参数已在所有支持的模型上正式可用,无需 beta 头。

    effort 参数由 Claude Opus 4.6 和 Claude Opus 4.5 支持。

    对于 Claude Opus 4.6,effort 取代 budget_tokens 成为控制思考深度的推荐方式。将 effort 与自适应思考(thinking: {type: "adaptive"})结合使用可获得最佳体验。虽然 Opus 4.6 仍然接受 budget_tokens,但它已被弃用,将在未来的模型版本中移除。在 high(默认)和 max effort 级别下,Claude 几乎总是会进行思考。在较低的 effort 级别下,它可能会跳过对简单问题的思考。

    effort 的工作原理

    默认情况下,Claude 使用高 effort——花费尽可能多的 token 以获得出色的结果。您可以将 effort 级别提高到 max 以获得绝对最高的能力,或者降低它以更保守地使用 token,优化速度和成本,同时接受一些能力上的降低。

    将 effort 设置为 "high" 与完全省略 effort 参数产生完全相同的行为。

    effort 参数影响响应中的所有 token,包括:

    • 文本响应和解释
    • 工具调用和函数参数
    • 扩展思考(启用时)

    这种方法有两个主要优势:

    1. 无需启用思考即可使用。
    2. 它可以影响所有 token 消耗,包括工具调用。例如,较低的 effort 意味着 Claude 会进行更少的工具调用。这提供了对效率更大程度的控制。

    Effort 级别

    级别描述典型使用场景
    max绝对最高能力,对 token 消耗没有限制。仅限 Opus 4.6——在其他模型上使用 max 的请求将返回错误。需要最深层推理和最全面分析的任务
    high高能力。等同于不设置该参数。复杂推理、困难的编码问题、智能体任务
    medium平衡方法,适度节省 token。需要在速度、成本和性能之间取得平衡的智能体任务
    low最高效。显著节省 token,但能力有所降低。需要最佳速度和最低成本的简单任务,例如子智能体

    Effort 是一个行为信号,而非严格的 token 预算。在较低的 effort 级别下,Claude 仍然会对足够困难的问题进行思考——只是对于同一问题,它的思考量会比在较高 effort 级别下更少。

    基本用法

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    何时应该调整 effort 参数?

    • 当您需要绝对最高能力且不受限制时,使用 max effort——最全面的推理和最深入的分析。仅在 Opus 4.6 上可用;在其他模型上使用 max 的请求将返回错误。
    • 当您需要 Claude 的最佳表现时,使用 high effort(默认值)——复杂推理、细致分析、困难的编码问题,或任何以质量为首要优先级的任务。
    • 当您希望在不消耗 high effort 全部 token 的情况下获得稳定性能时,使用 medium effort 作为平衡选项。
    • 当您优化速度(因为 Claude 用更少的 token 回答)或成本时,使用 low effort——例如,简单的分类任务、快速查询,或边际质量提升不足以证明额外延迟或花费合理性的高流量使用场景。

    Effort 与工具使用

    使用工具时,effort 参数同时影响工具调用周围的解释和工具调用本身。较低的 effort 级别倾向于:

    • 将多个操作合并为更少的工具调用
    • 进行更少的工具调用
    • 直接执行操作而不做前言
    • 完成后使用简洁的确认消息

    较高的 effort 级别可能会:

    • 进行更多的工具调用
    • 在执行操作前解释计划
    • 提供详细的变更摘要
    • 包含更全面的代码注释

    Effort 与扩展思考

    effort 参数与扩展思考协同工作。其行为取决于模型:

    • Claude Opus 4.6 使用自适应思考(thinking: {type: "adaptive"}),其中 effort 是控制思考深度的推荐方式。虽然 Opus 4.6 仍然接受 budget_tokens,但它已被弃用,将在未来版本中移除。在 high 和 max effort 级别下,Claude 几乎总是会进行深度思考。在较低级别下,它可能会跳过对简单问题的思考。
    • Claude Opus 4.5 使用手动思考(thinking: {type: "enabled", budget_tokens: N}),其中 effort 与思考 token 预算协同工作。根据您的任务设置 effort 级别,然后根据任务复杂度设置思考 token 预算。

    effort 参数可以在启用或不启用扩展思考的情况下使用。在不使用思考时,它仍然控制文本响应和工具调用的整体 token 消耗。

    最佳实践

    1. 从 high 开始:使用较低的 effort 级别来在性能和 token 效率之间进行权衡。
    2. 对速度敏感或简单的任务使用 low:当延迟很重要或任务很简单时,low effort 可以显著减少响应时间和成本。
    3. 测试您的使用场景:effort 级别的影响因任务类型而异。在部署之前,在您的特定使用场景上评估性能。
    4. 考虑动态 effort:根据任务复杂度调整 effort。简单查询可能适合使用 low effort,而智能体编码和复杂推理则受益于 high effort。

    Was this page helpful?

    • effort 的工作原理
    • Effort 级别
    • 何时应该调整 effort 参数?
    • Effort 与工具使用
    • Effort 与扩展思考