模型与定价

Claude 4.6 新功能

Claude Opus 4.6 新功能和新特性概述。

Claude 4.6 代表了 Claude 模型的新一代，带来了重大的新功能和 API 改进。本页面总结了发布时所有可用的新功能。

新模型

模型	API 模型 ID	描述
Claude Opus 4.6	`claude-opus-4-6`	我们最智能的模型，用于构建智能体和编程

Claude Opus 4.6 支持 200K 上下文窗口（1M token 上下文窗口以 beta 形式提供）、128K 最大输出 token、扩展思考以及所有现有的 Claude API 功能。

有关完整的定价和规格，请参阅模型概述。

新功能

自适应思考模式

自适应思考（thinking: {type: "adaptive"}）是 Opus 4.6 推荐的思考模式。Claude 会动态决定何时思考以及思考多少。在默认努力级别（high）下，Claude 几乎总是会进行思考。在较低的努力级别下，它可能会跳过对简单问题的思考。

thinking: {type: "enabled"} 和 budget_tokens 在 Opus 4.6 上已弃用。它们仍然可以使用，但将在未来的模型版本中移除。请改用自适应思考和努力参数来控制思考深度。自适应思考还会自动启用交错思考。

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[{"role": "user", "content": "Solve this complex problem..."}]
)

努力参数正式发布

努力参数现已正式发布（无需 beta 头）。新的 max 努力级别在 Opus 4.6 上提供最高的能力水平。将努力参数与自适应思考结合使用，以实现最佳的成本-质量权衡。

压缩 API（beta）

压缩提供自动的服务器端上下文摘要，实现实际上无限的对话。当上下文接近窗口限制时，API 会自动摘要对话的早期部分。

细粒度工具流式传输（正式发布）

细粒度工具流式传输现已在所有模型和平台上正式发布。无需 beta 头。

128K 输出 token

Opus 4.6 支持最多 128K 输出 token，是之前 64K 限制的两倍。这使得更长的思考预算和更全面的响应成为可能。SDK 要求对具有较大 max_tokens 值的请求使用流式传输，以避免 HTTP 超时。如果您不需要增量处理事件，请使用 .stream() 配合 .get_final_message() 来获取完整响应——详情请参阅流式消息。

数据驻留控制

数据驻留控制允许您使用 inference_geo 参数指定模型推理运行的位置。您可以为每个请求选择 "global"（默认）或 "us" 路由。仅限美国的推理在 Claude Opus 4.6 及更新模型上定价为 1.1 倍。

弃用

`type: "enabled"` 和 `budget_tokens`

thinking: {type: "enabled", budget_tokens: N} 在 Opus 4.6 上已弃用。它仍然可以使用，但将在未来的模型版本中移除。请迁移到 thinking: {type: "adaptive"} 并配合努力参数使用。

`interleaved-thinking-2025-05-14` beta 头

interleaved-thinking-2025-05-14 beta 头在 Opus 4.6 上已弃用。如果包含该头，它会被安全忽略，但不再需要。自适应思考会自动启用交错思考。在使用 Opus 4.6 时，请从您的请求中移除 betas=["interleaved-thinking-2025-05-14"]。

`output_format`

用于结构化输出的 output_format 参数已移至 output_config.format。旧参数仍然可以使用，但已弃用，将在未来的模型版本中移除。

# 之前
response = client.messages.create(
    output_format={"type": "json_schema", "schema": {...}},
    ...
)

# 之后
response = client.messages.create(
    output_config={"format": {"type": "json_schema", "schema": {...}}},
    ...
)

破坏性变更

预填充移除

在 Opus 4.6 上不支持预填充助手消息（最后一轮助手预填充）。包含预填充助手消息的请求将返回 400 错误。

替代方案：

结构化输出用于控制响应格式
系统提示指令用于引导响应风格
output_config.format 用于 JSON 输出

工具参数引号处理

Opus 4.6 在工具调用参数中可能产生略有不同的 JSON 字符串转义（例如，对 Unicode 转义或正斜杠转义的不同处理）。标准 JSON 解析器会自动处理这些差异。如果您将工具调用的 input 作为原始字符串解析而不是使用 json.loads() 或 JSON.parse()，请验证您的解析逻辑是否仍然有效。

迁移指南

有关分步迁移说明，请参阅迁移到 Claude 4.6。

后续步骤

了解如何使用自适应思考模式。

比较所有 Claude 模型。

探索服务器端上下文压缩。

分步迁移说明。

Was this page helpful?

模型与定价

Claude 4.6 新功能

Claude Opus 4.6 新功能和新特性概述。

Claude 4.6 代表了 Claude 模型的新一代，带来了重大的新功能和 API 改进。本页面总结了发布时所有可用的新功能。

新模型

模型	API 模型 ID	描述
Claude Opus 4.6	`claude-opus-4-6`	我们最智能的模型，用于构建智能体和编程

Claude Opus 4.6 支持 200K 上下文窗口（1M token 上下文窗口以 beta 形式提供）、128K 最大输出 token、扩展思考以及所有现有的 Claude API 功能。

有关完整的定价和规格，请参阅模型概述。

新功能

自适应思考模式

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[{"role": "user", "content": "Solve this complex problem..."}]
)

努力参数正式发布

压缩 API（beta）

压缩提供自动的服务器端上下文摘要，实现实际上无限的对话。当上下文接近窗口限制时，API 会自动摘要对话的早期部分。

细粒度工具流式传输（正式发布）

细粒度工具流式传输现已在所有模型和平台上正式发布。无需 beta 头。

128K 输出 token

数据驻留控制

弃用

`type: "enabled"` 和 `budget_tokens`

`interleaved-thinking-2025-05-14` beta 头

`output_format`

用于结构化输出的 output_format 参数已移至 output_config.format。旧参数仍然可以使用，但已弃用，将在未来的模型版本中移除。

# 之前
response = client.messages.create(
    output_format={"type": "json_schema", "schema": {...}},
    ...
)

# 之后
response = client.messages.create(
    output_config={"format": {"type": "json_schema", "schema": {...}}},
    ...
)

破坏性变更

预填充移除

在 Opus 4.6 上不支持预填充助手消息（最后一轮助手预填充）。包含预填充助手消息的请求将返回 400 错误。

替代方案：

结构化输出用于控制响应格式
系统提示指令用于引导响应风格
output_config.format 用于 JSON 输出

工具参数引号处理

迁移指南

有关分步迁移说明，请参阅迁移到 Claude 4.6。

后续步骤

了解如何使用自适应思考模式。

比较所有 Claude 模型。

探索服务器端上下文压缩。

分步迁移说明。

Was this page helpful?

新模型

新功能

自适应思考模式

努力参数正式发布

压缩 API（beta）

细粒度工具流式传输（正式发布）

128K 输出 token

数据驻留控制

弃用

type: "enabled" 和 budget_tokens

interleaved-thinking-2025-05-14 beta 头

output_format

破坏性变更

预填充移除

工具参数引号处理

迁移指南

后续步骤

新模型

新功能

自适应思考模式

努力参数正式发布

压缩 API（beta）

细粒度工具流式传输（正式发布）

128K 输出 token

数据驻留控制

弃用

type: "enabled" 和 budget_tokens

interleaved-thinking-2025-05-14 beta 头

output_format

破坏性变更

预填充移除

工具参数引号处理

迁移指南

后续步骤

`type: "enabled"` 和 `budget_tokens`

`interleaved-thinking-2025-05-14` beta 头

`output_format`

`type: "enabled"` 和 `budget_tokens`

`interleaved-thinking-2025-05-14` beta 头

`output_format`