模型與定價模型

Claude Opus 5 的新功能

Claude Opus 5 的新功能與行為變更概覽。

Claude Opus 5 相較於 Claude Opus 4.8 是一次跨越式的改進，在深度推理、代理式與長時程任務，以及測試時運算擴展方面有最大的提升。本頁總結了 Claude Opus 5 的所有新內容，包括預設開啟思考、對話中途工具變更，以及關於何時可以停用思考的重大變更。

新模型

模型	API 模型 ID	描述
Claude Opus 5	`claude-opus-5`	適用於複雜的代理式編碼與企業工作

Claude Opus 5 具有 1M token 上下文視窗（1M token 既是預設值也是最大值；沒有較小的上下文變體）、128k 最大輸出 token，以及預設開啟的思考功能。

如需完整的定價與規格，請參閱模型概覽。

新功能

對話中途工具變更（beta）

您可以在對話的回合之間新增或移除工具，同時保留提示快取，而不必在整個工作階段中重複傳送固定的工具清單。對話中途工具變更目前處於 beta 階段：請在您的請求中包含 mid-conversation-tool-changes-2026-07-01 beta 標頭。使用方式請參閱對話中途工具變更。

預設備援模式

fallbacks 參數支援新的 "default" 模式，該模式會依拒絕類別套用 Anthropic 建議的備援模型，而不是由您自行維護的模型清單。整個 fallbacks 參數都處於 beta 階段。請使用 server-side-fallback-2026-07-01 beta 標頭，它同時支援 "default" 模式與明確的模型清單（較早的 server-side-fallback-2026-06-01 標頭僅接受明確的清單）。請參閱拒絕與備援。

更低的提示快取最小值

Claude Opus 5 上可快取的最小提示長度為 512 個 token，低於 Claude Opus 4.8 的 1,024 個 token。在 Claude Opus 4.8 上因太短而無法快取的提示，現在無需變更程式碼即可建立快取項目。各模型的最小值請參閱提示快取。

快速模式

快速模式（研究預覽）僅在 Claude API 上提供給 Claude Opus 5；目前在 Amazon Bedrock、Google Cloud 或 Microsoft Foundry 上尚未提供。Claude Opus 5 的快速模式定價為每百萬輸入 token 10 美元、每百萬輸出 token 50 美元。有關存取方式、支援的模型與定價，請參閱快速模式。

行為變更

預設開啟思考

在 Claude Opus 4.8 上，除非您設定 thinking: {"type": "adaptive"}，否則請求會在不思考的情況下執行。在 Claude Opus 5 上，相同的請求會在開啟思考的情況下執行：模型會在每個回合自行決定何時思考以及思考多少，而 effort 參數則是控制思考深度的方式。傳輸值保持不變；thinking: {"type": "adaptive"} 仍然有效，且等同於預設值。

由於 max_tokens 是總輸出（思考加上回應文字）的硬性限制，對於在 Claude Opus 4.8 上不使用思考執行的工作負載，請重新檢視此設定。

API 仍保留停用思考的選項，但須遵守下方的 effort 限制。

Effort 更加重要

Claude Opus 5 比任何先前的 Opus 模型更可靠地將額外的 effort 轉化為更好的結果，因此您選擇的 effort 等級更為重要。完整的等級階梯皆可使用：low、medium、high、xhigh 和 max，其中 max 是最高層級，可進行最深入的推理。請從預設值 high 開始，並根據您的評估向任一方向調整：在品質維持的情況下降低等級以節省 token 與延遲，或在最嚴苛的工作中提高等級。以 xhigh 或 max effort 執行時，請設定較大的 max_tokens，讓模型有空間在子代理與工具呼叫之間進行思考與行動。

此請求將 effort 一路調高到 max：

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

Claude Opus 5 上的思考功能預設開啟，因此不需要 thinking 欄位。

停用思考需要 effort 為 `high` 或更低

在 Claude Opus 5 上，只有當 effort 等級為 high 或更低時，才接受 thinking: {"type": "disabled"}。在 effort 為 xhigh 或 max 時設定 thinking: {"type": "disabled"} 會回傳 400 錯誤。這是 Claude Opus 5 及之後版本的正式可用行為，會在每個請求上強制執行，並且是相對於 Claude Opus 4.8 的重大變更——在 Claude Opus 4.8 上，停用思考與 effort 等級是相互獨立的。如果您目前在高 effort 等級下停用思考，請選擇保持停用思考並將 effort 設為 high 或更低，或者保留 effort 等級並移除 thinking 欄位。

在停用思考的情況下，Claude Opus 5 偶爾會將工具呼叫寫入其文字輸出中，而不是發出 tool_use 區塊，或在其可見回應中包含內部 XML 標籤。在可能的情況下，請保持啟用思考，並透過較低的 effort 等級來控制 token 成本；對於必須停用思考的整合，請參閱在停用思考的情況下執行以了解提示方面的緩解措施。

模型行為差異

除了上述 API 變更之外，Claude Opus 5 的行為與 Claude Opus 4.8 有所不同，即使不變更任何程式碼您也可能會注意到。預設的面向使用者回應與書面交付成果會更長。在代理式工作階段中，模型會更頻繁地向使用者敘述其進度。在多代理框架中，它會更積極地委派給子代理。它也會在未被要求的情況下驗證自己的工作，因此請移除從早期模型沿用下來的驗證指示（「包含最終驗證步驟」、「使用子代理進行驗證」）；這些指示會導致 Claude Opus 5 過度驗證。有關調整這些行為的提示模式，請參閱為 Claude Opus 5 撰寫提示。

能力改進

與 Claude Opus 4.8 相比，Claude Opus 5 是跨越式的改進而非漸進式的改進，並以 Claude Fable 5 一半的成本提供尖端智慧。最大的提升在於：

深度推理，在長問題鏈中維持多步驟分析。
代理式編碼與長時程任務，在延長的工具使用迴圈中保持專注於任務，並完成多檔案功能、較大規模的重構，以及端到端的功能開發，而不會留下殘缺程式碼或佔位符。
測試時運算擴展，將額外的 effort（最高到 max 等級）轉化為更好的結果。
較低 effort 等級下的效率，low 和 medium effort 能以較高設定的一小部分 token 與延遲產生優異的品質。
程式碼審查與錯誤偵測，每次審查都能以高比率找出真正的錯誤且誤報很少，並在較低的 effort 等級下保持準確。
視覺能力，理解圖表、文件與示意圖，並重現 UI 與前端視覺效果，在提供工具讓其反覆分析、裁切與驗證其工作時表現最佳。
長上下文工作，1M token 上下文視窗既是預設值也是最大值，並在整個視窗中保持一致的指令遵循、工具呼叫與推理能力。
辦公與文件任務，生成與編輯具有複雜公式的多工作表試算表，並產生結構良好的簡報。
多代理協調，運行子代理團隊，具備有效的撰寫者-驗證者模式，且代理之間互相覆寫工作的情況很少。

有關充分發揮這些能力的提示模式，請參閱為 Claude Opus 5 撰寫提示。

定價

Claude Opus 5 的定價為每百萬輸入 token 5 美元、每百萬輸出 token 25 美元，與 Claude Opus 4.8 相同。

完整定價（包括批次處理、提示快取與快速模式費率）請參閱定價。

可用性

Claude Opus 5 可在以下平台使用：

**Claude API：**所有客戶皆可使用，模型 ID 為 claude-opus-5。
**AWS：**可透過 Claude in Amazon Bedrock 使用，模型 ID 為 anthropic.claude-opus-5。Claude Opus 5 也可透過 bedrock-runtime 上的 InvokeModel API 存取，由相同的基礎設施提供服務；Claude on Amazon Bedrock（舊版）整合的 ARN 版本化模型 ID 表格中不包含此模型。
**Google Cloud：**可透過 Claude on Google Cloud 使用，模型 ID 為 claude-opus-5。
**Microsoft Foundry：**可透過 Claude in Microsoft Foundry 使用。

Claude Opus 4.8 在上述所有平台上仍然可用。

遷移指南

若要從 Claude Opus 4.8 遷移，請更新您的模型 ID：

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

接著請檢視兩項行為變更：思考預設為開啟，且在 effort 為 xhigh 或 max 時停用思考會回傳 400 錯誤。逐步說明請參閱遷移指南。

後續步驟

模型概覽

所有目前 Claude 模型的完整規格與定價。

為 Claude Opus 5 撰寫提示

Claude Opus 5 特有的行為差異與提示模式。

Effort

控制 Claude 回應時使用的 token 數量，從 low 到 max。

思考

思考在預設開啟時如何運作，以及何時可以停用。

任務預算

為 Claude 提供建議性的 token 預算，以調配其工作節奏。

遷移指南

從先前的 Claude 版本遷移到最新 Claude 模型的指南。

快速模式

以進階定價從 Claude Opus 模型獲得更高的每秒輸出 token 數。

Was this page helpful?

模型與定價模型

Claude Opus 5 的新功能

Claude Opus 5 的新功能與行為變更概覽。

新模型

模型	API 模型 ID	描述
Claude Opus 5	`claude-opus-5`	適用於複雜的代理式編碼與企業工作

Claude Opus 5 具有 1M token 上下文視窗（1M token 既是預設值也是最大值；沒有較小的上下文變體）、128k 最大輸出 token，以及預設開啟的思考功能。

如需完整的定價與規格，請參閱模型概覽。

新功能

對話中途工具變更（beta）

預設備援模式

更低的提示快取最小值

快速模式

行為變更

預設開啟思考

由於 max_tokens 是總輸出（思考加上回應文字）的硬性限制，對於在 Claude Opus 4.8 上不使用思考執行的工作負載，請重新檢視此設定。

API 仍保留停用思考的選項，但須遵守下方的 effort 限制。

Effort 更加重要

此請求將 effort 一路調高到 max：

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

Claude Opus 5 上的思考功能預設開啟，因此不需要 thinking 欄位。

停用思考需要 effort 為 `high` 或更低

模型行為差異

能力改進

與 Claude Opus 4.8 相比，Claude Opus 5 是跨越式的改進而非漸進式的改進，並以 Claude Fable 5 一半的成本提供尖端智慧。最大的提升在於：

深度推理，在長問題鏈中維持多步驟分析。
代理式編碼與長時程任務，在延長的工具使用迴圈中保持專注於任務，並完成多檔案功能、較大規模的重構，以及端到端的功能開發，而不會留下殘缺程式碼或佔位符。
測試時運算擴展，將額外的 effort（最高到 max 等級）轉化為更好的結果。
較低 effort 等級下的效率，low 和 medium effort 能以較高設定的一小部分 token 與延遲產生優異的品質。
程式碼審查與錯誤偵測，每次審查都能以高比率找出真正的錯誤且誤報很少，並在較低的 effort 等級下保持準確。
視覺能力，理解圖表、文件與示意圖，並重現 UI 與前端視覺效果，在提供工具讓其反覆分析、裁切與驗證其工作時表現最佳。
長上下文工作，1M token 上下文視窗既是預設值也是最大值，並在整個視窗中保持一致的指令遵循、工具呼叫與推理能力。
辦公與文件任務，生成與編輯具有複雜公式的多工作表試算表，並產生結構良好的簡報。
多代理協調，運行子代理團隊，具備有效的撰寫者-驗證者模式，且代理之間互相覆寫工作的情況很少。

有關充分發揮這些能力的提示模式，請參閱為 Claude Opus 5 撰寫提示。

定價

Claude Opus 5 的定價為每百萬輸入 token 5 美元、每百萬輸出 token 25 美元，與 Claude Opus 4.8 相同。

完整定價（包括批次處理、提示快取與快速模式費率）請參閱定價。

可用性

Claude Opus 5 可在以下平台使用：

**Claude API：**所有客戶皆可使用，模型 ID 為 claude-opus-5。
**AWS：**可透過 Claude in Amazon Bedrock 使用，模型 ID 為 anthropic.claude-opus-5。Claude Opus 5 也可透過 bedrock-runtime 上的 InvokeModel API 存取，由相同的基礎設施提供服務；Claude on Amazon Bedrock（舊版）整合的 ARN 版本化模型 ID 表格中不包含此模型。
**Google Cloud：**可透過 Claude on Google Cloud 使用，模型 ID 為 claude-opus-5。
**Microsoft Foundry：**可透過 Claude in Microsoft Foundry 使用。

Claude Opus 4.8 在上述所有平台上仍然可用。

遷移指南

若要從 Claude Opus 4.8 遷移，請更新您的模型 ID：

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

接著請檢視兩項行為變更：思考預設為開啟，且在 effort 為 xhigh 或 max 時停用思考會回傳 400 錯誤。逐步說明請參閱遷移指南。

後續步驟

模型概覽

所有目前 Claude 模型的完整規格與定價。

為 Claude Opus 5 撰寫提示

Claude Opus 5 特有的行為差異與提示模式。

Effort

控制 Claude 回應時使用的 token 數量，從 low 到 max。

思考

思考在預設開啟時如何運作，以及何時可以停用。

任務預算

為 Claude 提供建議性的 token 預算，以調配其工作節奏。

遷移指南

從先前的 Claude 版本遷移到最新 Claude 模型的指南。

快速模式

以進階定價從 Claude Opus 模型獲得更高的每秒輸出 token 數。

Was this page helpful?

新模型

新功能

對話中途工具變更（beta）

預設備援模式

更低的提示快取最小值

快速模式

行為變更

預設開啟思考

Effort 更加重要

停用思考需要 effort 為 high 或更低

模型行為差異

能力改進

定價

可用性

遷移指南

後續步驟

新模型

新功能

對話中途工具變更（beta）

預設備援模式

更低的提示快取最小值

快速模式

行為變更

預設開啟思考

Effort 更加重要

停用思考需要 effort 為 high 或更低

模型行為差異

能力改進

定價

可用性

遷移指南

後續步驟

新模型

新功能

對話中途工具變更（beta）

預設備援模式

更低的提示快取最小值

快速模式

行為變更

預設開啟思考

Effort 更加重要

停用思考需要 effort 為 `high` 或更低

模型行為差異

能力改進

定價

可用性

遷移指南

後續步驟

新模型

新功能

對話中途工具變更（beta）

預設備援模式

更低的提示快取最小值

快速模式

行為變更

預設開啟思考

Effort 更加重要

停用思考需要 effort 為 `high` 或更低

模型行為差異

能力改進

定價

可用性

遷移指南

後續步驟