Claude Opus 4.8 是 Anthropic 最強大的 Opus 層級模型,以 Claude Opus 4.7 為基礎打造。本頁面總結了發布時的所有新內容,包括「fast mode」(快速模式,Claude API 上的研究預覽版)以及更低的 1,024 個 token 最小可快取提示長度。
| 模型 | API 模型 ID | 說明 |
|---|---|---|
| Claude Opus 4.8 | claude-opus-4-8 | Anthropic 最強大的 Opus 層級模型,適用於複雜推理、長時程代理式程式編寫以及高自主性工作 |
Claude Opus 4.8 在 Claude API、Amazon Bedrock 和 Vertex AI 上預設支援 1M token 上下文視窗(Microsoft Foundry 上為 200k)、128k 最大輸出 token、adaptive thinking(自適應思考),以及與 Claude Opus 4.7 相同的工具集和平台功能。
如需完整的定價與規格,請參閱模型概覽。
Claude Opus 4.8 接受在 messages 陣列中緊接在使用者回合之後的 role: "system" 訊息(須遵守放置規則)。這讓您可以在長時間執行的對話中稍後附加更新的指令,而無需重述完整的系統提示,從而保留先前回合的提示快取命中,並降低代理式迴圈的輸入成本。不需要 beta 標頭。請參閱對話中系統訊息以了解使用詳情。
拒絕回應上的 stop_details 物件(自 Claude Opus 4.7 起可用)現已公開記錄於文件中。當 Claude 拒絕完成請求時,除了現有的 refusal 停止原因之外,此物件還會描述拒絕的類別,讓您的應用程式更容易區分不同類型的被拒絕請求,並將使用者引導至正確的下一步。不需要 beta 標頭。請參閱處理停止原因以了解類別清單和處理指引。
Claude Opus 4.8 上的 effort 參數在所有介面(包括 Claude API 和 Claude Code)上的預設值均為 high。如果您目前已明確設定 effort,您的設定將保持不變。請參閱 Effort 以了解各層級的指引。
Fast mode(快速模式)現已作為研究預覽版在 Claude API 上提供給 Claude Opus 4.8 使用。設定 speed: "fast" 即可從同一模型獲得最高 2.5 倍的每秒輸出 token 速度,並採用進階定價。請參閱快速模式以了解存取方式、支援的模型和定價。
Claude Opus 4.8 上的最小可快取提示長度為 1,024 個 token,低於 Claude Opus 4.7。在 Claude Opus 4.7 上因太短而無法快取的提示,現在無需變更程式碼即可建立快取項目。請參閱提示快取以了解各模型的最小值。
這些限制與 Claude Opus 4.7 相同,因此已在 Claude Opus 4.7 上執行的程式碼無需變更。這些限制僅適用於 Messages API;Claude Managed Agents 不受影響。
在 Claude Opus 4.8 上將 temperature、top_p 或 top_k 設定為非預設值會回傳 400 錯誤,與 Claude Opus 4.7 相同。請省略這些參數,並使用提示來引導模型的行為。
與 Claude Opus 4.7 相同,Claude Opus 4.8 不支援擴展思考預算。設定 thinking: {"type": "enabled", "budget_tokens": N} 會回傳 400 錯誤。請使用自適應思考和 effort 參數來控制思考深度。
# 之前(Opus 4.6 或更早版本)
thinking = {"type": "enabled", "budget_tokens": 32000}
# 之後(Opus 4.7 及更新版本)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}與 Claude Opus 4.7 相比,Claude Opus 4.8 針對以下方面的行為改進:
啟用自適應思考後,Claude Opus 4.8 僅在判斷該回合需要時才觸發推理。對於簡單的查詢和簡短的代理式步驟,它會直接回應;對於複雜的多步驟問題,它會先推理再回答。與相同 effort 層級的 Claude Opus 4.7 相比,這減少了雙峰工作負載上浪費的思考 token。與 Claude Opus 4.7 相同,除非您在請求中明確設定 thinking: {type: "adaptive"},否則思考功能為關閉狀態。
這些不是 API 的破壞性變更,但可能需要更新提示。請參閱遷移至 Claude Opus 4.8 以獲得完整指引。
如需逐步遷移說明和完整的遷移檢查清單,請參閱遷移至 Claude Opus 4.8。如果您使用 Claude Code 或 Agent SDK,Claude API skill 可以自動將這些遷移步驟套用到您的程式碼庫。
從 Claude Opus 4.7 升級的逐步說明。
各層級的 effort 指引,包括新的預設值。
Claude Opus 4.8 上唯一支援的思考開啟模式。
對話中系統訊息如何保留快取命中。
拒絕停止詳情及其處理方式。
以進階定價獲得更高的輸出速度。
Was this page helpful?