• 訊息
  • 託管代理
  • 管理

Search...
⌘K
模型
模型概覽模型 ID 與版本控制選擇模型Claude Fable 5 與 Claude Mythos 5 介紹Claude Opus 4.8 的新功能在模型版本之間升級模型棄用模型卡系統提示定價

Log in
Claude Opus 4.8 的新功能
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
模型與定價/模型

Claude Opus 4.8 的新功能

Claude Opus 4.8 中新功能與行為變更的概覽。

Claude Opus 4.8 是 Anthropic 最強大的 Opus 層級模型,以 Claude Opus 4.7 為基礎打造。本頁面總結了發布時的所有新內容,包括「fast mode」(快速模式,Claude API 上的研究預覽版)以及更低的 1,024 個 token 最小可快取提示長度。

新模型

模型API 模型 ID說明
Claude Opus 4.8claude-opus-4-8Anthropic 最強大的 Opus 層級模型,適用於複雜推理、長時程代理式程式編寫以及高自主性工作

Claude Opus 4.8 在 Claude API、Amazon Bedrock 和 Vertex AI 上預設支援 1M token 上下文視窗(Microsoft Foundry 上為 200k)、128k 最大輸出 token、adaptive thinking(自適應思考),以及與 Claude Opus 4.7 相同的工具集和平台功能。

如需完整的定價與規格,請參閱模型概覽。

新功能

對話中系統訊息

Claude Opus 4.8 接受在 messages 陣列中緊接在使用者回合之後的 role: "system" 訊息(須遵守放置規則)。這讓您可以在長時間執行的對話中稍後附加更新的指令,而無需重述完整的系統提示,從而保留先前回合的提示快取命中,並降低代理式迴圈的輸入成本。不需要 beta 標頭。請參閱對話中系統訊息以了解使用詳情。

拒絕停止詳情

拒絕回應上的 stop_details 物件(自 Claude Opus 4.7 起可用)現已公開記錄於文件中。當 Claude 拒絕完成請求時,除了現有的 refusal 停止原因之外,此物件還會描述拒絕的類別,讓您的應用程式更容易區分不同類型的被拒絕請求,並將使用者引導至正確的下一步。不需要 beta 標頭。請參閱處理停止原因以了解類別清單和處理指引。

Effort 預設值

Claude Opus 4.8 上的 effort 參數在所有介面(包括 Claude API 和 Claude Code)上的預設值均為 high。如果您目前已明確設定 effort,您的設定將保持不變。請參閱 Effort 以了解各層級的指引。

快速模式

Fast mode(快速模式)現已作為研究預覽版在 Claude API 上提供給 Claude Opus 4.8 使用。設定 speed: "fast" 即可從同一模型獲得最高 2.5 倍的每秒輸出 token 速度,並採用進階定價。請參閱快速模式以了解存取方式、支援的模型和定價。

更低的提示快取最小值

Claude Opus 4.8 上的最小可快取提示長度為 1,024 個 token,低於 Claude Opus 4.7。在 Claude Opus 4.7 上因太短而無法快取的提示,現在無需變更程式碼即可建立快取項目。請參閱提示快取以了解各模型的最小值。

繼承自 Claude Opus 4.7 的 API 限制



這些限制與 Claude Opus 4.7 相同,因此已在 Claude Opus 4.7 上執行的程式碼無需變更。這些限制僅適用於 Messages API;Claude Managed Agents 不受影響。

不支援取樣參數

在 Claude Opus 4.8 上將 temperature、top_p 或 top_k 設定為非預設值會回傳 400 錯誤,與 Claude Opus 4.7 相同。請省略這些參數,並使用提示來引導模型的行為。

自適應思考是唯一的思考模式

與 Claude Opus 4.7 相同,Claude Opus 4.8 不支援擴展思考預算。設定 thinking: {"type": "enabled", "budget_tokens": N} 會回傳 400 錯誤。請使用自適應思考和 effort 參數來控制思考深度。

Python
# 之前(Opus 4.6 或更早版本)
thinking = {"type": "enabled", "budget_tokens": 32000}

# 之後(Opus 4.7 及更新版本)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

能力改進

改進領域

與 Claude Opus 4.7 相比,Claude Opus 4.8 針對以下方面的行為改進:

  • 長時程代理式程式編寫,包括更好的長上下文處理、更少的壓縮次數,以及更好的壓縮恢復能力。
  • 推理 effort 校準,在各個 effort 層級上跨多個領域具有更可靠的行為。
  • 工具觸發,減少跳過任務所需工具呼叫的情況。

自適應思考

啟用自適應思考後,Claude Opus 4.8 僅在判斷該回合需要時才觸發推理。對於簡單的查詢和簡短的代理式步驟,它會直接回應;對於複雜的多步驟問題,它會先推理再回答。與相同 effort 層級的 Claude Opus 4.7 相比,這減少了雙峰工作負載上浪費的思考 token。與 Claude Opus 4.7 相同,除非您在請求中明確設定 thinking: {type: "adaptive"},否則思考功能為關閉狀態。

行為變更

這些不是 API 的破壞性變更,但可能需要更新提示。請參閱遷移至 Claude Opus 4.8 以獲得完整指引。

  • 啟用自適應思考時,在相同 effort 層級下浪費的思考 token 更少,因為模型會逐回合決定是否進行思考。
  • 更好的工具觸發。 模型較不容易跳過任務所需的工具呼叫,這是部分使用者在 Claude Opus 4.7 上回報的問題。
  • 更好的壓縮處理和長上下文品質。 長代理式追蹤在壓縮後能保持在任務軌道上,較少出現偏離。

遷移指南

如需逐步遷移說明和完整的遷移檢查清單,請參閱遷移至 Claude Opus 4.8。如果您使用 Claude Code 或 Agent SDK,Claude API skill 可以自動將這些遷移步驟套用到您的程式碼庫。

後續步驟


遷移指南

從 Claude Opus 4.7 升級的逐步說明。

Effort

各層級的 effort 指引,包括新的預設值。

自適應思考

Claude Opus 4.8 上唯一支援的思考開啟模式。

提示快取

對話中系統訊息如何保留快取命中。

處理停止原因

拒絕停止詳情及其處理方式。


快速模式

以進階定價獲得更高的輸出速度。

Was this page helpful?

  • 新模型
  • 新功能
  • 對話中系統訊息
  • 拒絕停止詳情
  • Effort 預設值
  • 快速模式
  • 更低的提示快取最小值
  • 繼承自 Claude Opus 4.7 的 API 限制
  • 不支援取樣參數
  • 自適應思考是唯一的思考模式
  • 能力改進
  • 改進領域
  • 自適應思考
  • 行為變更
  • 遷移指南
  • 後續步驟