Claude Sonnet 5 是 Anthropic Sonnet 模型系列的新一代产品。它是 Claude Sonnet 4.6 的直接升级替代版本,包含三项行为变更:adaptive thinking(自适应思考)默认开启;手动扩展思考现在会返回 400 错误(该功能在 Claude Sonnet 4.6 中已被弃用);将采样参数(temperature、top_p、top_k)设置为非默认值会返回 400 错误。本页面总结了发布时的所有新内容,包括新的分词器。
| 模型 | API 模型 ID | 描述 |
|---|---|---|
| Claude Sonnet 5 | claude-sonnet-5 | 速度与智能的最佳结合 |
Claude Sonnet 5 默认支持 100 万令牌上下文窗口(100 万令牌既是默认值也是最大值;没有更小的上下文变体)、128k 最大输出令牌、自适应思考,以及与 Claude Sonnet 4.6 相同的工具集和平台功能,但 Priority Tier(优先级层级)除外,该功能在 Claude Sonnet 5 上不可用。
有关完整的定价和规格信息,请参阅模型概述。
在 Claude Sonnet 4.6 上,不带 thinking 字段的请求会在不启用思考的情况下运行。在 Claude Sonnet 5 上,相同的请求会以自适应思考模式运行。要关闭思考功能,请传递 thinking: {type: "disabled"}。由于 max_tokens 是总输出(思考内容加响应文本)的硬性限制,对于在 Claude Sonnet 4.6 上未启用思考运行的工作负载,请重新审视该参数。
将 temperature、top_p 或 top_k 设置为非默认值会返回 400 错误。迁移时请移除这些参数;使用默认值(或省略该参数)是可以接受的。请使用系统提示指令来引导模型行为。这对于 Sonnet 级别的模型是新变化;相同的限制此前已在 Claude Opus 4.7 上引入。
手动扩展思考(thinking: {type: "enabled", budget_tokens: N})在 Claude Sonnet 4.6 中已被弃用;在 Claude Sonnet 5 上该功能已被移除并会返回 400 错误,与 Claude Opus 4.8 和 Claude Opus 4.7 上的行为相同。请改用带有 effort 参数的自适应思考。
# Claude Sonnet 5 不支持此参数(返回 400)
thinking = {"type": "enabled", "budget_tokens": 32000}
# 请改用此参数
thinking = {"type": "adaptive"}Claude Sonnet 5 使用新的 "tokenizer"(分词器)。相同的输入文本产生的令牌数量比 Claude Sonnet 4.6 多约 30%。这不是 API 变更:请求、响应和流式传输事件保持相同的结构,无需更改代码。
此变更会影响您以令牌为单位衡量或预算的所有内容:
usage 字段和令牌计数结果会高于 Claude Sonnet 4.6。不要重复使用针对早期模型测量的计数;请针对 Claude Sonnet 5 重新计数。max_tokens 预算: 针对 Claude Sonnet 4.6 调优的输出限制可能会在 Claude Sonnet 5 上截断等效的输出。请重新审视那些设置得接近预期输出长度的限制。预填充助手消息会返回 400 错误,与 Claude Sonnet 4.6 相同。请改用结构化输出、系统提示指令或 output_config.format。
Claude Sonnet 5 是 Claude Sonnet 4.6 在相同价格下的能力升级版本。对于需要比 Claude Sonnet 4.6 更强能力但又不想升级到 Opus 级别模型的工作负载,它也是一个可选方案。
相比 Claude Sonnet 4.6,最大的提升体现在编码和智能体任务方面。有关基准测试结果,请参阅 Anthropic 透明度中心。
Claude Sonnet 5 是首个具备实时网络安全防护措施的 Sonnet 级别模型。涉及被禁止或高风险网络安全主题的请求可能会被拒绝。拒绝会以成功的 HTTP 200 响应返回,其中 stop_reason: "refusal",而不是错误。有关背景信息,请参阅防护措施、警告和申诉。
Claude Sonnet 5 的定价为每百万输入令牌 3 美元、每百万输出令牌 15 美元,与 Claude Sonnet 4.6 相同。由于新的分词器对相同文本产生的令牌数量多约 30%,即使每令牌定价不变,等效请求的成本也可能与 Claude Sonnet 4.6 不同。
每百万输入/输出令牌 2 美元/10 美元的推介定价有效期至 2026 年 8 月 31 日,此后将恢复每百万输入/输出令牌 3 美元/15 美元的标准定价。
有关完整定价信息(包括批处理和提示缓存费率),请参阅定价。
发布时,Claude Sonnet 5 可在以下平台使用:
InvokeModel 和 Converse API)上不可用。对于签订了 ZDR 协议的组织,Claude Sonnet 5 支持零数据保留。
Claude Sonnet 5 是 Claude Sonnet 4.6 的直接替代版本。更新您的模型 ID:
model = "claude-sonnet-4-6" # Before
model = "claude-sonnet-5" # After然后检查以下内容:
max_tokens 限制。budget_tokens,请迁移到自适应思考。手动扩展思考(thinking: {type: "enabled"})不受支持,会返回 400 错误。temperature、top_p、top_k)设置为非默认值的请求会返回 400 错误;迁移时请移除这些参数。工具定义和响应结构保持不变,助手消息预填充在 Claude Sonnet 4.6 上已不受支持。有关详细信息,请参阅迁移指南中的 Claude Sonnet 5 部分。
所有当前 Claude 模型的完整规格和定价。
在迁移之前,使用新的分词器测量您的提示。
Claude Sonnet 5 上推荐的思考开启模式。
100 万令牌上下文窗口的工作原理。
完整定价信息,包括批处理和提示缓存费率。
Was this page helpful?