模型与定价模型

Claude Opus 5 新特性

Claude Opus 5 的新功能和行为变更概述。

Claude Opus 5 相比 Claude Opus 4.8 是一次跨越式的提升，在深度推理、代理式和长程任务以及测试时计算扩展方面取得了最大的进步。本页总结了 Claude Opus 5 的所有新内容，包括默认开启思考、对话中途工具变更，以及关于何时可以禁用思考的破坏性变更。

新模型

模型	API 模型 ID	描述
Claude Opus 5	`claude-opus-5`	适用于复杂的代理式编码和企业工作

Claude Opus 5 拥有 100 万令牌的上下文窗口（100 万令牌既是默认值也是最大值；没有更小的上下文变体）、128k 最大输出令牌，以及默认开启的思考。

有关完整的定价和规格，请参阅模型概述。

新功能

对话中途工具变更（测试版）

您可以在对话的各轮之间添加或移除工具，同时保留提示缓存，而无需在整个会话期间重复发送固定的工具列表。对话中途工具变更目前处于测试阶段：请在您的请求中包含 mid-conversation-tool-changes-2026-07-01 测试版标头。有关用法，请参阅对话中途工具变更。

默认回退模式

fallbacks 参数支持新的 "default" 模式，该模式按拒绝类别应用 Anthropic 推荐的回退模型，而不是由您自己维护的模型列表。整个 fallbacks 参数处于测试阶段。请使用 server-side-fallback-2026-07-01 测试版标头，它同时支持 "default" 模式和显式模型列表（较早的 server-side-fallback-2026-06-01 标头仅接受显式列表）。请参阅拒绝与回退。

更低的提示缓存最小值

Claude Opus 5 上可缓存提示的最小长度为 512 个令牌，低于 Claude Opus 4.8 上的 1,024 个令牌。在 Claude Opus 4.8 上因太短而无法缓存的提示现在无需更改代码即可创建缓存条目。有关各模型的最小值，请参阅提示缓存。

快速模式

快速模式（研究预览版）仅在 Claude API 上对 Claude Opus 5 可用；目前在 Amazon Bedrock、Google Cloud 或 Microsoft Foundry 上不可用。Claude Opus 5 的快速模式定价为每百万输入令牌 10 美元、每百万输出令牌 50 美元。有关访问权限、支持的模型和定价，请参阅快速模式。

行为变更

默认开启思考

在 Claude Opus 4.8 上，除非您设置 thinking: {"type": "adaptive"}，否则请求在不思考的情况下运行。在 Claude Opus 5 上，相同的请求会在开启思考的情况下运行：模型会在每一轮中决定何时思考以及思考多少，而 effort 参数是控制思考深度的手段。传输值保持不变；thinking: {"type": "adaptive"} 仍然有效，并且等同于默认值。

由于 max_tokens 是对总输出（思考加响应文本）的硬性限制，对于在 Claude Opus 4.8 上不使用思考运行的工作负载，请重新审视该值。

API 保留了禁用思考的选项，但需遵守下面的 effort 限制。

Effort 更加重要

Claude Opus 5 比任何早期的 Opus 模型都更可靠地将额外的 effort 转化为更好的结果，因此您选择的 effort 级别具有更大的影响。完整的级别阶梯均可用：low、medium、high、xhigh 和 max，其中 max 是最高级别，用于尽可能深入的推理。从默认值 high 开始，并根据您的评估向任一方向调整：在质量保持不变的情况下降低级别以节省令牌和延迟，或者为最苛刻的工作提高级别。当以 xhigh 或 max effort 运行时，请设置较大的 max_tokens，以便模型有空间在子代理和工具调用之间进行思考和行动。

此请求将 effort 一路调高到 max：

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

在 Claude Opus 5 上思考是默认开启的，因此不需要 thinking 字段。

禁用思考需要 effort 为 `high` 或更低

在 Claude Opus 5 上，只有当 effort 级别为 high 或更低时，才接受 thinking: {"type": "disabled"}。在 effort 为 xhigh 或 max 时设置 thinking: {"type": "disabled"} 会返回 400 错误。这是从 Claude Opus 5 开始正式可用的行为，在每个请求上强制执行，并且相对于 Claude Opus 4.8 是一个破坏性变更——在 Claude Opus 4.8 上，禁用思考与 effort 级别无关。如果您目前在高 effort 级别下禁用思考，请要么保持禁用思考并将 effort 设置为 high 或更低，要么保留 effort 级别并移除 thinking 字段。

在禁用思考的情况下，Claude Opus 5 偶尔会将工具调用写入其文本输出而不是发出 tool_use 块，或者在其可见响应中包含内部 XML 标签。在可能的情况下，请保持思考开启，并通过较低的 effort 级别来控制令牌成本；对于必须保持禁用思考的集成，请参阅在禁用思考的情况下运行以了解提示方面的缓解措施。

模型行为差异

除了上述 API 变更之外，Claude Opus 5 的行为与 Claude Opus 4.8 存在一些差异，即使不更改任何代码您也可能会注意到。面向用户的默认响应和书面交付物会更长。在代理式会话中，模型会更频繁地向用户叙述其进度。在多代理框架中，它更乐于委派给子代理。它还会在未被要求的情况下验证自己的工作，因此请移除从早期模型沿用下来的验证指令（"包含最终验证步骤"、"使用子代理进行验证"）；这些指令会导致 Claude Opus 5 过度验证。有关调整这些行为的提示模式，请参阅为 Claude Opus 5 编写提示。

能力提升

与 Claude Opus 4.8 相比，Claude Opus 5 是一次跨越式的提升而非渐进式改进，并且以 Claude Fable 5 一半的成本提供前沿智能。最大的进步体现在：

深度推理，在长问题链中持续进行多步分析。
代理式编码和长程任务，在扩展的工具使用循环中保持专注于任务，并完成多文件功能、较大规模的重构以及端到端的功能开发，而不会留下存根或占位符。
测试时计算扩展，将额外的 effort（最高到 max 级别）转化为更好的结果。
较低 effort 级别下的效率，low 和 medium effort 以更高设置的一小部分令牌和延迟产出强劲的质量。
代码审查和缺陷发现，每次审查都能以高比率发现真实缺陷且误报很少，并且在较低 effort 级别下仍保持准确。
视觉，理解图表、文档和示意图，并复现 UI 和前端视觉效果，在获得可迭代分析、裁剪和验证其工作的工具时表现最强。
长上下文工作，100 万令牌的上下文窗口既是默认值也是最大值，并且在整个窗口范围内保持一致的指令遵循、工具调用和推理能力。
办公和文档任务，生成和编辑包含非平凡公式的复杂多工作表电子表格，并制作结构良好的幻灯片。
多代理协调，运行子代理团队，采用有效的编写者-验证者模式，代理之间相互覆盖工作的情况很少。

有关充分发挥这些能力的提示模式，请参阅为 Claude Opus 5 编写提示。

定价

Claude Opus 5 的定价为每百万输入令牌 5 美元、每百万输出令牌 25 美元，与 Claude Opus 4.8 相同。

有关完整定价（包括批处理、提示缓存和快速模式费率），请参阅定价。

可用性

Claude Opus 5 可在以下平台使用：

Claude API： 对所有客户可用，模型 ID 为 claude-opus-5。
AWS： 通过 Claude in Amazon Bedrock 提供，模型 ID 为 anthropic.claude-opus-5。Claude Opus 5 也可以通过 bedrock-runtime 上的 InvokeModel API 访问，由相同的基础设施提供服务；Claude on Amazon Bedrock（旧版）集成未将其包含在其 ARN 版本化模型 ID 表中。
Google Cloud： 通过 Claude on Google Cloud 提供，模型 ID 为 claude-opus-5。
Microsoft Foundry： 通过 Claude in Microsoft Foundry 提供。

Claude Opus 4.8 在所有这些平台上仍然可用。

迁移指南

要从 Claude Opus 4.8 迁移，请更新您的模型 ID：

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

然后审查这两项行为变更：思考默认开启，并且在 effort 为 xhigh 或 max 时禁用思考会返回 400 错误。有关分步说明，请参阅迁移指南。

后续步骤

模型概述

所有当前 Claude 模型的完整规格和定价。

为 Claude Opus 5 编写提示

Claude Opus 5 特有的行为差异和提示模式。

Effort

控制 Claude 在响应时使用的令牌数量，从 low 到 max。

思考

思考在默认开启时如何工作，以及何时可以禁用。

任务预算

为 Claude 提供一个建议性的令牌预算，以便其据此安排工作节奏。

迁移指南

从以前的 Claude 版本迁移到最新 Claude 模型的指南。

快速模式

以高级定价从 Claude Opus 模型获得更高的每秒输出令牌数。

Was this page helpful?

模型与定价模型

Claude Opus 5 新特性

Claude Opus 5 的新功能和行为变更概述。

新模型

模型	API 模型 ID	描述
Claude Opus 5	`claude-opus-5`	适用于复杂的代理式编码和企业工作

Claude Opus 5 拥有 100 万令牌的上下文窗口（100 万令牌既是默认值也是最大值；没有更小的上下文变体）、128k 最大输出令牌，以及默认开启的思考。

有关完整的定价和规格，请参阅模型概述。

新功能

对话中途工具变更（测试版）

默认回退模式

更低的提示缓存最小值

快速模式

行为变更

默认开启思考

由于 max_tokens 是对总输出（思考加响应文本）的硬性限制，对于在 Claude Opus 4.8 上不使用思考运行的工作负载，请重新审视该值。

API 保留了禁用思考的选项，但需遵守下面的 effort 限制。

Effort 更加重要

此请求将 effort 一路调高到 max：

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

在 Claude Opus 5 上思考是默认开启的，因此不需要 thinking 字段。

禁用思考需要 effort 为 `high` 或更低

模型行为差异

能力提升

与 Claude Opus 4.8 相比，Claude Opus 5 是一次跨越式的提升而非渐进式改进，并且以 Claude Fable 5 一半的成本提供前沿智能。最大的进步体现在：

深度推理，在长问题链中持续进行多步分析。
代理式编码和长程任务，在扩展的工具使用循环中保持专注于任务，并完成多文件功能、较大规模的重构以及端到端的功能开发，而不会留下存根或占位符。
测试时计算扩展，将额外的 effort（最高到 max 级别）转化为更好的结果。
较低 effort 级别下的效率，low 和 medium effort 以更高设置的一小部分令牌和延迟产出强劲的质量。
代码审查和缺陷发现，每次审查都能以高比率发现真实缺陷且误报很少，并且在较低 effort 级别下仍保持准确。
视觉，理解图表、文档和示意图，并复现 UI 和前端视觉效果，在获得可迭代分析、裁剪和验证其工作的工具时表现最强。
长上下文工作，100 万令牌的上下文窗口既是默认值也是最大值，并且在整个窗口范围内保持一致的指令遵循、工具调用和推理能力。
办公和文档任务，生成和编辑包含非平凡公式的复杂多工作表电子表格，并制作结构良好的幻灯片。
多代理协调，运行子代理团队，采用有效的编写者-验证者模式，代理之间相互覆盖工作的情况很少。

有关充分发挥这些能力的提示模式，请参阅为 Claude Opus 5 编写提示。

定价

Claude Opus 5 的定价为每百万输入令牌 5 美元、每百万输出令牌 25 美元，与 Claude Opus 4.8 相同。

有关完整定价（包括批处理、提示缓存和快速模式费率），请参阅定价。

可用性

Claude Opus 5 可在以下平台使用：

Claude API： 对所有客户可用，模型 ID 为 claude-opus-5。
AWS： 通过 Claude in Amazon Bedrock 提供，模型 ID 为 anthropic.claude-opus-5。Claude Opus 5 也可以通过 bedrock-runtime 上的 InvokeModel API 访问，由相同的基础设施提供服务；Claude on Amazon Bedrock（旧版）集成未将其包含在其 ARN 版本化模型 ID 表中。
Google Cloud： 通过 Claude on Google Cloud 提供，模型 ID 为 claude-opus-5。
Microsoft Foundry： 通过 Claude in Microsoft Foundry 提供。

Claude Opus 4.8 在所有这些平台上仍然可用。

迁移指南

要从 Claude Opus 4.8 迁移，请更新您的模型 ID：

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

然后审查这两项行为变更：思考默认开启，并且在 effort 为 xhigh 或 max 时禁用思考会返回 400 错误。有关分步说明，请参阅迁移指南。

后续步骤

模型概述

所有当前 Claude 模型的完整规格和定价。

为 Claude Opus 5 编写提示

Claude Opus 5 特有的行为差异和提示模式。

Effort

控制 Claude 在响应时使用的令牌数量，从 low 到 max。

思考

思考在默认开启时如何工作，以及何时可以禁用。

任务预算

为 Claude 提供一个建议性的令牌预算，以便其据此安排工作节奏。

迁移指南

从以前的 Claude 版本迁移到最新 Claude 模型的指南。

快速模式

以高级定价从 Claude Opus 模型获得更高的每秒输出令牌数。

Was this page helpful?

新模型

新功能

对话中途工具变更（测试版）

默认回退模式

更低的提示缓存最小值

快速模式

行为变更

默认开启思考

Effort 更加重要

禁用思考需要 effort 为 high 或更低

模型行为差异

能力提升

定价

可用性

迁移指南

后续步骤

新模型

新功能

对话中途工具变更（测试版）

默认回退模式

更低的提示缓存最小值

快速模式

行为变更

默认开启思考

Effort 更加重要

禁用思考需要 effort 为 high 或更低

模型行为差异

能力提升

定价

可用性

迁移指南

后续步骤

新模型

新功能

对话中途工具变更（测试版）

默认回退模式

更低的提示缓存最小值

快速模式

行为变更

默认开启思考

Effort 更加重要

禁用思考需要 effort 为 `high` 或更低

模型行为差异

能力提升

定价

可用性

迁移指南

后续步骤

新模型

新功能

对话中途工具变更（测试版）

默认回退模式

更低的提示缓存最小值

快速模式

行为变更

默认开启思考

Effort 更加重要

禁用思考需要 effort 为 `high` 或更低

模型行为差异

能力提升

定价

可用性

迁移指南

后续步骤