Loading...
    • 开发者指南
    • API 参考
    • MCP
    • 资源
    • 更新日志
    Search...
    ⌘K
    入门
    Claude 简介快速开始
    模型与定价
    模型概览选择模型Claude 4.6 新特性迁移指南模型弃用定价
    使用 Claude 构建
    功能概览使用 Messages API处理停止原因提示词最佳实践
    上下文管理
    上下文窗口压缩上下文编辑
    能力
    提示缓存扩展思考自适应思考推理力度流式消息批量处理引用多语言支持Token 计数嵌入视觉PDF 支持Files API搜索结果结构化输出
    工具
    概览如何实现工具使用细粒度工具流式传输Bash 工具代码执行工具程序化工具调用计算机使用工具文本编辑器工具网页抓取工具网页搜索工具记忆工具工具搜索工具
    Agent Skills
    概览快速开始最佳实践企业级 Skills通过 API 使用 Skills
    Agent SDK
    概览快速开始TypeScript SDKTypeScript V2(预览版)Python SDK迁移指南
    API 中的 MCP
    MCP 连接器远程 MCP 服务器
    第三方平台上的 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    提示工程
    概览提示词生成器使用提示词模板提示词优化器清晰直接使用示例(多样本提示)让 Claude 思考(思维链)使用 XML 标签赋予 Claude 角色(系统提示词)链式复杂提示长上下文技巧扩展思考技巧
    测试与评估
    定义成功标准开发测试用例使用评估工具降低延迟
    加强安全护栏
    减少幻觉提高输出一致性防范越狱攻击流式拒绝减少提示词泄露保持 Claude 角色设定
    管理与监控
    Admin API 概览数据驻留工作空间用量与成本 APIClaude Code Analytics API零数据留存
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    模型与定价

    Claude 4.6 新功能

    Claude Opus 4.6 新功能和新特性概述。

    Claude 4.6 代表了 Claude 模型的新一代,带来了重大的新功能和 API 改进。本页面总结了发布时所有可用的新功能。

    新模型

    模型API 模型 ID描述
    Claude Opus 4.6claude-opus-4-6我们最智能的模型,用于构建智能体和编程

    Claude Opus 4.6 支持 200K 上下文窗口(1M token 上下文窗口以 beta 形式提供)、128K 最大输出 token、扩展思考以及所有现有的 Claude API 功能。

    有关完整的定价和规格,请参阅模型概述。

    新功能

    自适应思考模式

    自适应思考(thinking: {type: "adaptive"})是 Opus 4.6 推荐的思考模式。Claude 会动态决定何时思考以及思考多少。在默认努力级别(high)下,Claude 几乎总是会进行思考。在较低的努力级别下,它可能会跳过对简单问题的思考。

    thinking: {type: "enabled"} 和 budget_tokens 在 Opus 4.6 上已弃用。它们仍然可以使用,但将在未来的模型版本中移除。请改用自适应思考和努力参数来控制思考深度。自适应思考还会自动启用交错思考。

    response = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=16000,
        thinking={"type": "adaptive"},
        messages=[{"role": "user", "content": "Solve this complex problem..."}]
    )

    努力参数正式发布

    努力参数现已正式发布(无需 beta 头)。新的 max 努力级别在 Opus 4.6 上提供最高的能力水平。将努力参数与自适应思考结合使用,以实现最佳的成本-质量权衡。

    压缩 API(beta)

    压缩提供自动的服务器端上下文摘要,实现实际上无限的对话。当上下文接近窗口限制时,API 会自动摘要对话的早期部分。

    细粒度工具流式传输(正式发布)

    细粒度工具流式传输现已在所有模型和平台上正式发布。无需 beta 头。

    128K 输出 token

    Opus 4.6 支持最多 128K 输出 token,是之前 64K 限制的两倍。这使得更长的思考预算和更全面的响应成为可能。SDK 要求对具有较大 max_tokens 值的请求使用流式传输,以避免 HTTP 超时。如果您不需要增量处理事件,请使用 .stream() 配合 .get_final_message() 来获取完整响应——详情请参阅流式消息。

    数据驻留控制

    数据驻留控制允许您使用 inference_geo 参数指定模型推理运行的位置。您可以为每个请求选择 "global"(默认)或 "us" 路由。仅限美国的推理在 Claude Opus 4.6 及更新模型上定价为 1.1 倍。

    弃用

    type: "enabled" 和 budget_tokens

    thinking: {type: "enabled", budget_tokens: N} 在 Opus 4.6 上已弃用。它仍然可以使用,但将在未来的模型版本中移除。请迁移到 thinking: {type: "adaptive"} 并配合努力参数使用。

    interleaved-thinking-2025-05-14 beta 头

    interleaved-thinking-2025-05-14 beta 头在 Opus 4.6 上已弃用。如果包含该头,它会被安全忽略,但不再需要。自适应思考会自动启用交错思考。在使用 Opus 4.6 时,请从您的请求中移除 betas=["interleaved-thinking-2025-05-14"]。

    output_format

    用于结构化输出的 output_format 参数已移至 output_config.format。旧参数仍然可以使用,但已弃用,将在未来的模型版本中移除。

    # 之前
    response = client.messages.create(
        output_format={"type": "json_schema", "schema": {...}},
        ...
    )
    
    # 之后
    response = client.messages.create(
        output_config={"format": {"type": "json_schema", "schema": {...}}},
        ...
    )

    破坏性变更

    预填充移除

    在 Opus 4.6 上不支持预填充助手消息(最后一轮助手预填充)。包含预填充助手消息的请求将返回 400 错误。

    替代方案:

    • 结构化输出用于控制响应格式
    • 系统提示指令用于引导响应风格
    • output_config.format 用于 JSON 输出

    工具参数引号处理

    Opus 4.6 在工具调用参数中可能产生略有不同的 JSON 字符串转义(例如,对 Unicode 转义或正斜杠转义的不同处理)。标准 JSON 解析器会自动处理这些差异。如果您将工具调用的 input 作为原始字符串解析而不是使用 json.loads() 或 JSON.parse(),请验证您的解析逻辑是否仍然有效。

    迁移指南

    有关分步迁移说明,请参阅迁移到 Claude 4.6。

    后续步骤

    自适应思考

    了解如何使用自适应思考模式。

    模型概述

    比较所有 Claude 模型。

    压缩

    探索服务器端上下文压缩。

    迁移指南

    分步迁移说明。

    Was this page helpful?

    • 压缩 API(beta)
    • 128K 输出 token
    • type: "enabled" 和 budget_tokens
    • interleaved-thinking-2025-05-14 beta 头
    • output_format