• 消息
  • 托管智能体
  • 管理
Search...
⌘K
模型
模型概览模型 ID 与版本控制选择模型Claude Fable 5 和 Claude Mythos 5 介绍Claude Opus 4.8 新功能在模型版本之间升级模型弃用模型卡片系统提示定价
Log in
Claude Opus 4.8 新功能
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
模型与定价/模型

Claude Opus 4.8 的新特性

Claude Opus 4.8 中新功能和行为变更的概述。

Claude Opus 4.8 是 Anthropic 最强大的 Opus 级模型,它在 Claude Opus 4.7 的基础上构建。本页总结了发布时的所有新内容,包括 "fast mode"(快速模式,在 Claude API 上作为研究预览版提供)以及更低的 1,024 令牌最小可缓存提示长度。

新模型

模型API 模型 ID描述
Claude Opus 4.8claude-opus-4-8Anthropic 最强大的 Opus 级模型,适用于复杂推理、长周期智能体编码和高自主性工作

Claude Opus 4.8 在 Claude API、Amazon Bedrock 和 Vertex AI 上默认支持 100 万令牌上下文窗口(在 Microsoft Foundry 上为 20 万),支持 12.8 万最大输出令牌、自适应思考,以及与 Claude Opus 4.7 相同的工具集和平台功能。

有关完整的定价和规格信息,请参阅模型概述。

新功能

对话中途系统消息

Claude Opus 4.8 接受在 messages 数组中紧跟用户轮次之后的 role: "system" 消息(需遵守放置规则)。这使您可以在长时间运行的对话后期追加更新的指令,而无需重述完整的系统提示,从而保留早期轮次的提示缓存命中,并降低智能体循环中的输入成本。无需 beta 标头。有关使用详情,请参阅对话中途系统消息。

拒绝停止详情

拒绝响应上的 stop_details 对象(自 Claude Opus 4.7 起可用)现已公开记录在文档中。当 Claude 拒绝完成某个请求时,除了现有的 refusal 停止原因外,该对象还会描述拒绝的类别,使您的应用程序更容易区分不同类别的被拒绝请求,并将用户引导至正确的后续步骤。无需 beta 标头。有关类别列表和处理指南,请参阅处理停止原因。

Effort 默认值

Claude Opus 4.8 上的 effort 参数在所有平台(包括 Claude API 和 Claude Code)上的默认值均为 high。如果您目前已显式设置 effort,则您的设置保持不变。有关各级别的指南,请参阅 Effort。

快速模式

快速模式现已作为研究预览版在 Claude API 上为 Claude Opus 4.8 提供。设置 speed: "fast" 可从同一模型获得最高 2.5 倍的每秒输出令牌速度,但采用高级定价。有关访问方式、支持的模型和定价,请参阅快速模式。

更低的提示缓存最小值

Claude Opus 4.8 上的最小可缓存提示长度为 1,024 个令牌,低于 Claude Opus 4.7。在 Claude Opus 4.7 上因过短而无法缓存的提示现在无需更改代码即可创建缓存条目。有关各模型的最小值,请参阅提示缓存。

从 Claude Opus 4.7 继承的 API 约束

这些约束与 Claude Opus 4.7 相同,因此已在 Claude Opus 4.7 上运行的代码无需更改。它们仅适用于 Messages API;Claude Managed Agents 不受影响。

不支持采样参数

在 Claude Opus 4.8 上将 temperature、top_p 或 top_k 设置为非默认值会返回 400 错误,与 Claude Opus 4.7 相同。请省略这些参数,并使用提示来引导模型的行为。

自适应思考是唯一的思考模式

与 Claude Opus 4.7 一样,Claude Opus 4.8 不支持扩展思考预算。设置 thinking: {"type": "enabled", "budget_tokens": N} 会返回 400 错误。请使用自适应思考和 effort 参数来控制思考深度。

Python
# 之前(Opus 4.6 或更早版本)
thinking = {"type": "enabled", "budget_tokens": 32000}

# 之后(Opus 4.7 及更高版本)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

能力改进

改进领域

与 Claude Opus 4.7 相比,Claude Opus 4.8 针对以下方面的行为改进:

  • 长周期智能体编码,包括更好的长上下文处理、更少的压缩操作,以及更好的压缩恢复能力。
  • 推理 effort 校准,在各个 effort 级别上跨多个领域表现出更可靠的行为。
  • 工具触发,减少了跳过任务所需工具调用的情况。

自适应思考

启用自适应思考后,Claude Opus 4.8 仅在判断当前轮次需要时才触发推理。对于简单的查询和简短的智能体步骤,它会直接响应;对于复杂的多步骤问题,它会先推理再回答。与相同 effort 级别下的 Claude Opus 4.7 相比,这减少了双峰工作负载上浪费的思考令牌。与 Claude Opus 4.7 一样,除非您在请求中显式设置 thinking: {type: "adaptive"},否则思考功能处于关闭状态。

行为变更

这些不是 API 破坏性变更,但可能需要更新提示。有关完整指南,请参阅迁移到 Claude Opus 4.8。

  • 启用自适应思考时,在相同 effort 级别下浪费的思考令牌更少,因为模型会逐轮决定是否进行思考。
  • 更好的工具触发。 模型不太可能跳过任务所需的工具调用,这是部分用户在 Claude Opus 4.7 上报告的问题。
  • 更好的压缩处理和长上下文质量。 长智能体轨迹在压缩后能保持任务方向,偏离情况更少。

迁移指南

有关分步迁移说明和完整的迁移检查清单,请参阅迁移到 Claude Opus 4.8。如果您使用 Claude Code 或 Agent SDK,Claude API 技能可以自动将这些迁移步骤应用到您的代码库。

后续步骤

迁移指南

从 Claude Opus 4.7 升级的分步说明。

Effort

各级别的 effort 指南,包括新的默认值。

自适应思考

Claude Opus 4.8 上唯一支持的开启思考模式。

提示缓存

对话中途系统消息如何保留缓存命中。

处理停止原因

拒绝停止详情及其处理方法。

快速模式

以高级定价获得更高的输出速度。

Was this page helpful?

  • 新模型
  • 新功能
  • 对话中途系统消息
  • 拒绝停止详情
  • Effort 默认值
  • 快速模式
  • 更低的提示缓存最小值
  • 从 Claude Opus 4.7 继承的 API 约束
  • 不支持采样参数
  • 自适应思考是唯一的思考模式
  • 能力改进
  • 改进领域
  • 自适应思考
  • 行为变更
  • 迁移指南
  • 后续步骤