Claude 4.6 代表了 Claude 模型的新一代,带来了重大的新功能和 API 改进。本页面总结了发布时所有可用的新功能。
| 模型 | API 模型 ID | 描述 |
|---|---|---|
| Claude Opus 4.6 | claude-opus-4-6 | 我们最智能的模型,用于构建智能体和编程 |
Claude Opus 4.6 支持 200K 上下文窗口(1M token 上下文窗口以 beta 形式提供)、128K 最大输出 token、扩展思考以及所有现有的 Claude API 功能。
有关完整的定价和规格,请参阅模型概述。
自适应思考(thinking: {type: "adaptive"})是 Opus 4.6 推荐的思考模式。Claude 会动态决定何时思考以及思考多少。在默认努力级别(high)下,Claude 几乎总是会进行思考。在较低的努力级别下,它可能会跳过对简单问题的思考。
thinking: {type: "enabled"} 和 budget_tokens 在 Opus 4.6 上已弃用。它们仍然可以使用,但将在未来的模型版本中移除。请改用自适应思考和努力参数来控制思考深度。自适应思考还会自动启用交错思考。
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[{"role": "user", "content": "Solve this complex problem..."}]
)努力参数现已正式发布(无需 beta 头)。新的 max 努力级别在 Opus 4.6 上提供最高的能力水平。将努力参数与自适应思考结合使用,以实现最佳的成本-质量权衡。
压缩提供自动的服务器端上下文摘要,实现实际上无限的对话。当上下文接近窗口限制时,API 会自动摘要对话的早期部分。
细粒度工具流式传输现已在所有模型和平台上正式发布。无需 beta 头。
Opus 4.6 支持最多 128K 输出 token,是之前 64K 限制的两倍。这使得更长的思考预算和更全面的响应成为可能。SDK 要求对具有较大 max_tokens 值的请求使用流式传输,以避免 HTTP 超时。如果您不需要增量处理事件,请使用 .stream() 配合 .get_final_message() 来获取完整响应——详情请参阅流式消息。
数据驻留控制允许您使用 inference_geo 参数指定模型推理运行的位置。您可以为每个请求选择 "global"(默认)或 "us" 路由。仅限美国的推理在 Claude Opus 4.6 及更新模型上定价为 1.1 倍。
type: "enabled" 和 budget_tokensthinking: {type: "enabled", budget_tokens: N} 在 Opus 4.6 上已弃用。它仍然可以使用,但将在未来的模型版本中移除。请迁移到 thinking: {type: "adaptive"} 并配合努力参数使用。
interleaved-thinking-2025-05-14 beta 头interleaved-thinking-2025-05-14 beta 头在 Opus 4.6 上已弃用。如果包含该头,它会被安全忽略,但不再需要。自适应思考会自动启用交错思考。在使用 Opus 4.6 时,请从您的请求中移除 betas=["interleaved-thinking-2025-05-14"]。
output_format用于结构化输出的 output_format 参数已移至 output_config.format。旧参数仍然可以使用,但已弃用,将在未来的模型版本中移除。
# 之前
response = client.messages.create(
output_format={"type": "json_schema", "schema": {...}},
...
)
# 之后
response = client.messages.create(
output_config={"format": {"type": "json_schema", "schema": {...}}},
...
)在 Opus 4.6 上不支持预填充助手消息(最后一轮助手预填充)。包含预填充助手消息的请求将返回 400 错误。
替代方案:
output_config.format 用于 JSON 输出Opus 4.6 在工具调用参数中可能产生略有不同的 JSON 字符串转义(例如,对 Unicode 转义或正斜杠转义的不同处理)。标准 JSON 解析器会自动处理这些差异。如果您将工具调用的 input 作为原始字符串解析而不是使用 json.loads() 或 JSON.parse(),请验证您的解析逻辑是否仍然有效。
有关分步迁移说明,请参阅迁移到 Claude 4.6。
Was this page helpful?