Claude Opus 4.8 是 Anthropic 最强大的 Opus 级模型,它在 Claude Opus 4.7 的基础上构建。本页总结了发布时的所有新内容,包括 "fast mode"(快速模式,在 Claude API 上作为研究预览版提供)以及更低的 1,024 令牌最小可缓存提示长度。
| 模型 | API 模型 ID | 描述 |
|---|---|---|
| Claude Opus 4.8 | claude-opus-4-8 | Anthropic 最强大的 Opus 级模型,适用于复杂推理、长周期智能体编码和高自主性工作 |
Claude Opus 4.8 在 Claude API、Amazon Bedrock 和 Vertex AI 上默认支持 100 万令牌上下文窗口(在 Microsoft Foundry 上为 20 万),支持 12.8 万最大输出令牌、自适应思考,以及与 Claude Opus 4.7 相同的工具集和平台功能。
有关完整的定价和规格信息,请参阅模型概述。
Claude Opus 4.8 接受在 messages 数组中紧跟用户轮次之后的 role: "system" 消息(需遵守放置规则)。这使您可以在长时间运行的对话后期追加更新的指令,而无需重述完整的系统提示,从而保留早期轮次的提示缓存命中,并降低智能体循环中的输入成本。无需 beta 标头。有关使用详情,请参阅对话中途系统消息。
拒绝响应上的 stop_details 对象(自 Claude Opus 4.7 起可用)现已公开记录在文档中。当 Claude 拒绝完成某个请求时,除了现有的 refusal 停止原因外,该对象还会描述拒绝的类别,使您的应用程序更容易区分不同类别的被拒绝请求,并将用户引导至正确的后续步骤。无需 beta 标头。有关类别列表和处理指南,请参阅处理停止原因。
Claude Opus 4.8 上的 effort 参数在所有平台(包括 Claude API 和 Claude Code)上的默认值均为 high。如果您目前已显式设置 effort,则您的设置保持不变。有关各级别的指南,请参阅 Effort。
快速模式现已作为研究预览版在 Claude API 上为 Claude Opus 4.8 提供。设置 speed: "fast" 可从同一模型获得最高 2.5 倍的每秒输出令牌速度,但采用高级定价。有关访问方式、支持的模型和定价,请参阅快速模式。
Claude Opus 4.8 上的最小可缓存提示长度为 1,024 个令牌,低于 Claude Opus 4.7。在 Claude Opus 4.7 上因过短而无法缓存的提示现在无需更改代码即可创建缓存条目。有关各模型的最小值,请参阅提示缓存。
这些约束与 Claude Opus 4.7 相同,因此已在 Claude Opus 4.7 上运行的代码无需更改。它们仅适用于 Messages API;Claude Managed Agents 不受影响。
在 Claude Opus 4.8 上将 temperature、top_p 或 top_k 设置为非默认值会返回 400 错误,与 Claude Opus 4.7 相同。请省略这些参数,并使用提示来引导模型的行为。
与 Claude Opus 4.7 一样,Claude Opus 4.8 不支持扩展思考预算。设置 thinking: {"type": "enabled", "budget_tokens": N} 会返回 400 错误。请使用自适应思考和 effort 参数来控制思考深度。
# 之前(Opus 4.6 或更早版本)
thinking = {"type": "enabled", "budget_tokens": 32000}
# 之后(Opus 4.7 及更高版本)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}与 Claude Opus 4.7 相比,Claude Opus 4.8 针对以下方面的行为改进:
启用自适应思考后,Claude Opus 4.8 仅在判断当前轮次需要时才触发推理。对于简单的查询和简短的智能体步骤,它会直接响应;对于复杂的多步骤问题,它会先推理再回答。与相同 effort 级别下的 Claude Opus 4.7 相比,这减少了双峰工作负载上浪费的思考令牌。与 Claude Opus 4.7 一样,除非您在请求中显式设置 thinking: {type: "adaptive"},否则思考功能处于关闭状态。
这些不是 API 破坏性变更,但可能需要更新提示。有关完整指南,请参阅迁移到 Claude Opus 4.8。
有关分步迁移说明和完整的迁移检查清单,请参阅迁移到 Claude Opus 4.8。如果您使用 Claude Code 或 Agent SDK,Claude API 技能可以自动将这些迁移步骤应用到您的代码库。
从 Claude Opus 4.7 升级的分步说明。
各级别的 effort 指南,包括新的默认值。
Claude Opus 4.8 上唯一支持的开启思考模式。
对话中途系统消息如何保留缓存命中。
拒绝停止详情及其处理方法。
以高级定价获得更高的输出速度。
Was this page helpful?