模型與定價

遷移指南

從先前 Claude 版本遷移至 Claude 4.6 模型的指南

遷移至 Claude 4.6

Claude Opus 4.6 幾乎可以直接替換 Claude 4.5，但有一些需要注意的破壞性變更。如需完整的新功能列表，請參閱 Claude 4.6 的新功能。

更新您的模型名稱

# Opus 遷移
model = "claude-opus-4-5"  # 之前
model = "claude-opus-4-6"  # 之後

破壞性變更

移除預填充： 在 Claude 4.6 模型上預填充助手訊息會返回 400 錯誤。請改用結構化輸出、系統提示指令或 output_config.format。
工具參數引號處理： Claude 4.6 模型在工具呼叫參數中可能產生略有不同的 JSON 字串跳脫（例如，對 Unicode 跳脫或正斜線跳脫的不同處理方式）。如果您將工具呼叫的 input 作為原始字串解析而非使用 JSON 解析器，請驗證您的解析邏輯。標準 JSON 解析器（如 json.loads() 或 JSON.parse()）會自動處理這些差異。

建議變更

這些不是必需的，但會改善您的使用體驗：

遷移至自適應思考： thinking: {type: "enabled", budget_tokens: N} 在 Claude 4.6 模型上已棄用，將在未來的模型版本中移除。請切換至 thinking: {type: "adaptive"} 並使用 effort 參數來控制思考深度。請參閱自適應思考。
```
response = client.beta.messages.create(
    model="claude-opus-4-5",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[...],
)
```
請注意，此遷移也從 client.beta.messages.create 移至 client.messages.create。自適應思考和 effort 是正式發布（GA）功能，不需要 beta SDK 命名空間或任何 beta 標頭。
移除 effort beta 標頭： effort 參數現已正式發布。請從您的請求中移除 betas=["effort-2025-11-24"]。
移除細粒度工具串流 beta 標頭： 細粒度工具串流現已正式發布。請從您的請求中移除 betas=["fine-grained-tool-streaming-2025-05-14"]。
移除交錯思考 beta 標頭（僅限 Opus 4.6）： 自適應思考會在 Opus 4.6 上自動啟用交錯思考。請從您的 Opus 4.6 請求中移除 betas=["interleaved-thinking-2025-05-14"]。注意：Sonnet 4.6 在手動延伸思考模式下仍支援此 beta 標頭。
遷移至 output_config.format： 如果使用結構化輸出，請將 output_format={...} 更新為 output_config={"format": {...}}。舊參數仍可運作，但已棄用，將在未來的模型版本中移除。

從 Claude 4.1 或更早版本遷移至 Claude 4.6

如果您從 Opus 4.1、Sonnet 4 或更早的模型直接遷移至 Claude 4.6，請套用上述 Claude 4.6 破壞性變更以及本節中的額外變更。

# 從 Opus 4.1
model = "claude-opus-4-1-20250805"  # 之前
model = "claude-opus-4-6"  # 之後

# 從 Sonnet 4
model = "claude-sonnet-4-20250514"  # 之前
model = "claude-opus-4-6"  # 之後

# 從 Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # 之前
model = "claude-opus-4-6"  # 之後

額外破壞性變更

更新取樣參數

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

僅使用 temperature 或 top_p，不要同時使用：

# 之前 - 在 Claude 4+ 模型中這會報錯
response = client.messages.create(
    model="claude-3-7-sonnet-20250219",
    temperature=0.7,
    top_p=0.9,  # 不能同時使用兩者
    # ...
)

# 之後
response = client.messages.create(
    model="claude-opus-4-6",
    temperature=0.7,  # 使用 temperature 或 top_p，不要同時使用
    # ...
)

更新工具版本

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

更新至最新的工具版本。移除任何使用 undo_edit 命令的程式碼。
```
# 之前
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]

# 之後
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
```
- 文字編輯器： 使用 text_editor_20250728 和 str_replace_based_edit_tool。詳情請參閱文字編輯器工具文件。
- 程式碼執行： 升級至 code_execution_20250825。遷移說明請參閱程式碼執行工具文件。

處理 refusal 停止原因

更新您的應用程式以處理 refusal 停止原因：

response = client.messages.create(...)

if response.stop_reason == "refusal":
    # 適當處理拒絕
    pass

處理 model_context_window_exceeded 停止原因

Claude 4.5+ 模型在生成因達到上下文視窗限制而停止時，會返回 model_context_window_exceeded 停止原因，而非請求的 max_tokens 限制。更新您的應用程式以處理此新的停止原因：
```
response = client.messages.create(...)

if response.stop_reason == "model_context_window_exceeded":
    # 適當處理上下文視窗限制
    pass
```
驗證工具參數處理（尾隨換行符）

Claude 4.5+ 模型會保留工具呼叫字串參數中先前被去除的尾隨換行符。如果您的工具依賴於對工具呼叫參數的精確字串匹配，請驗證您的邏輯是否正確處理尾隨換行符。
針對行為變更更新您的提示

Claude 4+ 模型具有更簡潔、直接的溝通風格，需要明確的指示。請查閱提示最佳實踐以獲取最佳化指導。

額外建議變更

移除舊版 beta 標頭： 移除 token-efficient-tools-2025-02-19 和 output-128k-2025-02-19。所有 Claude 4+ 模型都內建了 token 高效工具使用，這些標頭不再有任何效果。

Claude 4.6 遷移檢查清單

遷移至 Claude Sonnet 4.6

Claude Sonnet 4.6 結合了強大的智慧與快速的效能，具備改進的代理搜尋功能，以及在搭配網頁搜尋或網頁擷取使用時免費的程式碼執行。它非常適合日常編碼、分析和內容任務。

如需完整的功能概覽，請參閱模型概覽。

Sonnet 4.6 定價為每百萬輸入 token 3 美元，每百萬輸出 token 15 美元。詳情請參閱 Claude 定價。

更新您的模型名稱：

# 從 Sonnet 4.5
model = "claude-sonnet-4-5"  # 之前
model = "claude-sonnet-4-6"  # 之後

# 從 Sonnet 4
model = "claude-sonnet-4-20250514"  # 之前
model = "claude-sonnet-4-6"  # 之後

破壞性變更

從 Sonnet 4.5 遷移時

不再支援預填充助手訊息

從 Sonnet 4.5 或更早版本遷移時，這是一個破壞性變更。

在 Sonnet 4.6 上預填充助手訊息會返回 400 錯誤。請改用結構化輸出、系統提示指令或 output_config.format。

常見預填充使用案例及遷移方式：
- 控制輸出格式（強制 JSON/YAML 輸出）：使用結構化輸出或帶有列舉欄位的工具進行分類任務。
- 消除前言（移除「Here is...」等短語）：在系統提示中添加直接指令：「直接回應，不要加前言。不要以『Here is...』、『Based on...』等短語開頭。」
- 避免不當拒絕：Claude 現在在適當拒絕方面已大幅改善。在使用者訊息中進行清晰的提示而不使用預填充應該就足夠了。
- 續寫（恢復中斷的回應）：將續寫移至使用者訊息：「您之前的回應被中斷，結尾為 [previous_response]。請從中斷處繼續。」
- 上下文注入/角色一致性（在長對話中刷新上下文）：將先前預填充的助手提醒改為注入到使用者回合中。
工具參數 JSON 跳脫可能不同

從 Sonnet 4.5 或更早版本遷移時，這是一個破壞性變更。

工具參數中的 JSON 字串跳脫可能與先前模型不同。標準 JSON 解析器會自動處理此問題，但自訂的基於字串的解析可能需要更新。

從 Claude 3.x 遷移時

更新取樣參數

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

僅使用 temperature 或 top_p，不要同時使用。
更新工具版本

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

更新至最新的工具版本（text_editor_20250728、code_execution_20250825）。移除任何使用 undo_edit 命令的程式碼。
處理 refusal 停止原因

更新您的應用程式以處理 refusal 停止原因。
針對行為變更更新您的提示

Claude 4 模型具有更簡潔、直接的溝通風格。請查閱提示最佳實踐以獲取最佳化指導。

建議變更

移除 fine-grained-tool-streaming-2025-05-14 beta 標頭 — 細粒度工具串流在 Sonnet 4.6 上現已正式發布，不再需要 beta 標頭。
將 output_format 遷移至 output_config.format — output_format 參數已棄用。請改用 output_config.format。

從 Sonnet 4.5 遷移

我們強烈建議從 Sonnet 4.5 遷移至 Sonnet 4.6，它以相同的價格提供更高的智慧。

Sonnet 4.6 預設的 effort 等級為 high，而 Sonnet 4.5 沒有 effort 參數。我們建議在從 Sonnet 4.5 遷移至 Sonnet 4.6 時調整 effort 參數。如果未明確設定，您可能會因預設的 effort 等級而體驗到更高的延遲。

如果您未使用延伸思考

如果您在 Sonnet 4.5 上未使用延伸思考，可以在 Sonnet 4.6 上繼續不使用。您應該明確將 effort 設定為適合您使用案例的等級。在 low effort 且停用思考的情況下，相較於未使用延伸思考的 Sonnet 4.5，您可以預期相似或更好的效能。

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

如果您正在使用延伸思考

如果您在 Sonnet 4.5 上使用延伸思考，Sonnet 4.6 繼續支援，無需更改您的思考配置。我們建議將思考預算保持在約 16k token。實際上，大多數任務不會使用那麼多，但它為較困難的問題提供了餘裕，而不會有 token 使用失控的風險。

編碼和代理使用案例

對於代理編碼、前端設計、工具密集型工作流程和複雜的企業工作流程，我們建議從 medium effort 開始。如果您發現延遲太高，考慮將 effort 降低至 low。如果您需要更高的智慧，考慮將 effort 提高至 high 或遷移至 Opus 4.6。

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

聊天和非編碼使用案例

對於聊天、內容生成、搜尋、分類和其他非編碼任務，我們建議從 low effort 搭配延伸思考開始。如果您需要更深入的處理，將 effort 提高至 medium。

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

何時嘗試自適應思考

上述遷移路徑使用帶有 budget_tokens 的延伸思考以獲得可預測的 token 使用量。如果您的工作負載符合以下模式之一，考慮嘗試自適應思考：

自主多步驟代理： 將需求轉化為可運作軟體的編碼代理、資料分析管線和錯誤查找，模型在多個步驟中獨立運行。自適應思考讓模型在每個步驟校準其推理，在更長的軌跡中保持正軌。對於這些工作負載，從 high effort 開始。如果延遲或 token 使用量是問題，降低至 medium。
電腦使用代理： Sonnet 4.6 在使用自適應模式的電腦使用評估中達到了同類最佳的準確度。
雙模態工作負載： 簡單和困難任務的混合，自適應模式在簡單查詢時跳過思考，在複雜查詢時進行深度推理。

使用自適應思考時，在您的任務上評估 medium 和 high effort。正確的等級取決於您的工作負載在品質、延遲和 token 使用量之間的權衡。

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

如果您在使用自適應思考時遇到不一致的行為或品質下降，請切換至帶有 budget_tokens 的延伸思考。這提供了更可預測的結果，並對思考成本設有上限。

Sonnet 4.6 遷移檢查清單

遷移至 Claude Sonnet 4.5

Claude Sonnet 4.5 結合了強大的智慧與快速的效能，非常適合日常編碼、分析和內容任務。

如需完整的功能概覽，請參閱模型概覽。

Sonnet 4.5 定價為每百萬輸入 token 3 美元，每百萬輸出 token 15 美元。詳情請參閱 Claude 定價。

更新您的模型名稱：

# 從 Sonnet 4
model = "claude-sonnet-4-20250514"  # 之前
model = "claude-sonnet-4-5-20250929"  # 之後

# 從 Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # 之前
model = "claude-sonnet-4-5-20250929"  # 之後

破壞性變更

這些破壞性變更適用於從 Claude 3.x Sonnet 模型遷移時。

更新取樣參數

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

僅使用 temperature 或 top_p，不要同時使用。
更新工具版本

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

更新至最新的工具版本（text_editor_20250728、code_execution_20250825）。移除任何使用 undo_edit 命令的程式碼。
處理 refusal 停止原因

更新您的應用程式以處理 refusal 停止原因。
針對行為變更更新您的提示

Claude 4 模型具有更簡潔、直接的溝通風格。請查閱提示最佳實踐以獲取最佳化指導。

Sonnet 4.5 遷移檢查清單

將模型 ID 更新為 claude-sonnet-4-5-20250929
破壞性： 將工具版本更新至最新（text_editor_20250728、code_execution_20250825）；不支援舊版本（如果從 3.x 遷移）
破壞性： 移除任何使用 undo_edit 命令的程式碼（如適用）
破壞性： 更新取樣參數，僅使用 temperature 或 top_p，不要同時使用（如果從 3.x 遷移）
在您的應用程式中處理新的 refusal 停止原因
依照提示最佳實踐審查並更新提示
考慮為複雜推理任務啟用延伸思考
在正式部署前於開發環境中測試

遷移至 Claude Haiku 4.5

Claude Haiku 4.5 是最快且最智慧的 Haiku 模型，具有接近前沿的效能，為互動式應用程式和大量處理提供高品質模型品質。

如需完整的功能概覽，請參閱模型概覽。

Haiku 4.5 定價為每百萬輸入 token 1 美元，每百萬輸出 token 5 美元。詳情請參閱 Claude 定價。

更新您的模型名稱：

# 從 Haiku 3.5
model = "claude-3-5-haiku-20241022"  # 之前
model = "claude-haiku-4-5-20251001"  # 之後

查看新的速率限制： Haiku 4.5 與 Haiku 3.5 有不同的速率限制。詳情請參閱速率限制文件。

為了在編碼和推理任務上獲得顯著的效能提升，考慮使用 thinking: {type: "enabled", budget_tokens: N} 啟用延伸思考。

延伸思考會影響提示快取效率。

延伸思考在 Claude 4.6 或更新的模型中已棄用。如果使用較新的模型，請改用自適應思考。

探索新功能： 請參閱模型概覽以了解上下文感知、增加的輸出容量（64K token）、更高的智慧和改進的速度等詳情。

破壞性變更

這些破壞性變更適用於從 Claude 3.x Haiku 模型遷移時。

更新取樣參數

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

僅使用 temperature 或 top_p，不要同時使用。
更新工具版本

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

更新至最新的工具版本（text_editor_20250728、code_execution_20250825）。移除任何使用 undo_edit 命令的程式碼。
處理 refusal 停止原因

更新您的應用程式以處理 refusal 停止原因。
針對行為變更更新您的提示

Claude 4 模型具有更簡潔、直接的溝通風格。請查閱提示最佳實踐以獲取最佳化指導。

Haiku 4.5 遷移檢查清單

將模型 ID 更新為 claude-haiku-4-5-20251001
破壞性： 將工具版本更新至最新（text_editor_20250728、code_execution_20250825）；不支援舊版本
破壞性： 移除任何使用 undo_edit 命令的程式碼（如適用）
破壞性： 更新取樣參數，僅使用 temperature 或 top_p，不要同時使用
在您的應用程式中處理新的 refusal 停止原因
審查並調整新的速率限制（與 Haiku 3.5 分開）
依照提示最佳實踐審查並更新提示
考慮為複雜推理任務啟用延伸思考
在正式部署前於開發環境中測試

需要幫助？

查閱 API 文件以獲取詳細規格
查閱模型功能以進行效能比較
查閱 API 發布說明以獲取 API 更新
如果在遷移過程中遇到任何問題，請聯繫支援團隊

Was this page helpful?

模型與定價

遷移指南

從先前 Claude 版本遷移至 Claude 4.6 模型的指南

遷移至 Claude 4.6

Claude Opus 4.6 幾乎可以直接替換 Claude 4.5，但有一些需要注意的破壞性變更。如需完整的新功能列表，請參閱 Claude 4.6 的新功能。

更新您的模型名稱

# Opus 遷移
model = "claude-opus-4-5"  # 之前
model = "claude-opus-4-6"  # 之後

破壞性變更

移除預填充： 在 Claude 4.6 模型上預填充助手訊息會返回 400 錯誤。請改用結構化輸出、系統提示指令或 output_config.format。
工具參數引號處理： Claude 4.6 模型在工具呼叫參數中可能產生略有不同的 JSON 字串跳脫（例如，對 Unicode 跳脫或正斜線跳脫的不同處理方式）。如果您將工具呼叫的 input 作為原始字串解析而非使用 JSON 解析器，請驗證您的解析邏輯。標準 JSON 解析器（如 json.loads() 或 JSON.parse()）會自動處理這些差異。

建議變更

這些不是必需的，但會改善您的使用體驗：

遷移至自適應思考： thinking: {type: "enabled", budget_tokens: N} 在 Claude 4.6 模型上已棄用，將在未來的模型版本中移除。請切換至 thinking: {type: "adaptive"} 並使用 effort 參數來控制思考深度。請參閱自適應思考。
```
response = client.beta.messages.create(
    model="claude-opus-4-5",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[...],
)
```
請注意，此遷移也從 client.beta.messages.create 移至 client.messages.create。自適應思考和 effort 是正式發布（GA）功能，不需要 beta SDK 命名空間或任何 beta 標頭。
移除 effort beta 標頭： effort 參數現已正式發布。請從您的請求中移除 betas=["effort-2025-11-24"]。
移除細粒度工具串流 beta 標頭： 細粒度工具串流現已正式發布。請從您的請求中移除 betas=["fine-grained-tool-streaming-2025-05-14"]。
移除交錯思考 beta 標頭（僅限 Opus 4.6）： 自適應思考會在 Opus 4.6 上自動啟用交錯思考。請從您的 Opus 4.6 請求中移除 betas=["interleaved-thinking-2025-05-14"]。注意：Sonnet 4.6 在手動延伸思考模式下仍支援此 beta 標頭。
遷移至 output_config.format： 如果使用結構化輸出，請將 output_format={...} 更新為 output_config={"format": {...}}。舊參數仍可運作，但已棄用，將在未來的模型版本中移除。

從 Claude 4.1 或更早版本遷移至 Claude 4.6

如果您從 Opus 4.1、Sonnet 4 或更早的模型直接遷移至 Claude 4.6，請套用上述 Claude 4.6 破壞性變更以及本節中的額外變更。

# 從 Opus 4.1
model = "claude-opus-4-1-20250805"  # 之前
model = "claude-opus-4-6"  # 之後

# 從 Sonnet 4
model = "claude-sonnet-4-20250514"  # 之前
model = "claude-opus-4-6"  # 之後

# 從 Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # 之前
model = "claude-opus-4-6"  # 之後

額外破壞性變更

更新取樣參數

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

僅使用 temperature 或 top_p，不要同時使用：

# 之前 - 在 Claude 4+ 模型中這會報錯
response = client.messages.create(
    model="claude-3-7-sonnet-20250219",
    temperature=0.7,
    top_p=0.9,  # 不能同時使用兩者
    # ...
)

# 之後
response = client.messages.create(
    model="claude-opus-4-6",
    temperature=0.7,  # 使用 temperature 或 top_p，不要同時使用
    # ...
)

更新工具版本

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

更新至最新的工具版本。移除任何使用 undo_edit 命令的程式碼。
```
# 之前
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]

# 之後
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
```
- 文字編輯器： 使用 text_editor_20250728 和 str_replace_based_edit_tool。詳情請參閱文字編輯器工具文件。
- 程式碼執行： 升級至 code_execution_20250825。遷移說明請參閱程式碼執行工具文件。

處理 refusal 停止原因

更新您的應用程式以處理 refusal 停止原因：

response = client.messages.create(...)

if response.stop_reason == "refusal":
    # 適當處理拒絕
    pass

處理 model_context_window_exceeded 停止原因

Claude 4.5+ 模型在生成因達到上下文視窗限制而停止時，會返回 model_context_window_exceeded 停止原因，而非請求的 max_tokens 限制。更新您的應用程式以處理此新的停止原因：
```
response = client.messages.create(...)

if response.stop_reason == "model_context_window_exceeded":
    # 適當處理上下文視窗限制
    pass
```
驗證工具參數處理（尾隨換行符）

Claude 4.5+ 模型會保留工具呼叫字串參數中先前被去除的尾隨換行符。如果您的工具依賴於對工具呼叫參數的精確字串匹配，請驗證您的邏輯是否正確處理尾隨換行符。
針對行為變更更新您的提示

Claude 4+ 模型具有更簡潔、直接的溝通風格，需要明確的指示。請查閱提示最佳實踐以獲取最佳化指導。

額外建議變更

移除舊版 beta 標頭： 移除 token-efficient-tools-2025-02-19 和 output-128k-2025-02-19。所有 Claude 4+ 模型都內建了 token 高效工具使用，這些標頭不再有任何效果。

Claude 4.6 遷移檢查清單

遷移至 Claude Sonnet 4.6

如需完整的功能概覽，請參閱模型概覽。

Sonnet 4.6 定價為每百萬輸入 token 3 美元，每百萬輸出 token 15 美元。詳情請參閱 Claude 定價。

更新您的模型名稱：

# 從 Sonnet 4.5
model = "claude-sonnet-4-5"  # 之前
model = "claude-sonnet-4-6"  # 之後

# 從 Sonnet 4
model = "claude-sonnet-4-20250514"  # 之前
model = "claude-sonnet-4-6"  # 之後

破壞性變更

從 Sonnet 4.5 遷移時

不再支援預填充助手訊息

從 Sonnet 4.5 或更早版本遷移時，這是一個破壞性變更。

在 Sonnet 4.6 上預填充助手訊息會返回 400 錯誤。請改用結構化輸出、系統提示指令或 output_config.format。

常見預填充使用案例及遷移方式：
- 控制輸出格式（強制 JSON/YAML 輸出）：使用結構化輸出或帶有列舉欄位的工具進行分類任務。
- 消除前言（移除「Here is...」等短語）：在系統提示中添加直接指令：「直接回應，不要加前言。不要以『Here is...』、『Based on...』等短語開頭。」
- 避免不當拒絕：Claude 現在在適當拒絕方面已大幅改善。在使用者訊息中進行清晰的提示而不使用預填充應該就足夠了。
- 續寫（恢復中斷的回應）：將續寫移至使用者訊息：「您之前的回應被中斷，結尾為 [previous_response]。請從中斷處繼續。」
- 上下文注入/角色一致性（在長對話中刷新上下文）：將先前預填充的助手提醒改為注入到使用者回合中。
工具參數 JSON 跳脫可能不同

從 Sonnet 4.5 或更早版本遷移時，這是一個破壞性變更。

工具參數中的 JSON 字串跳脫可能與先前模型不同。標準 JSON 解析器會自動處理此問題，但自訂的基於字串的解析可能需要更新。

從 Claude 3.x 遷移時

更新取樣參數

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

僅使用 temperature 或 top_p，不要同時使用。
更新工具版本

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

更新至最新的工具版本（text_editor_20250728、code_execution_20250825）。移除任何使用 undo_edit 命令的程式碼。
處理 refusal 停止原因

更新您的應用程式以處理 refusal 停止原因。
針對行為變更更新您的提示

Claude 4 模型具有更簡潔、直接的溝通風格。請查閱提示最佳實踐以獲取最佳化指導。

建議變更

移除 fine-grained-tool-streaming-2025-05-14 beta 標頭 — 細粒度工具串流在 Sonnet 4.6 上現已正式發布，不再需要 beta 標頭。
將 output_format 遷移至 output_config.format — output_format 參數已棄用。請改用 output_config.format。

從 Sonnet 4.5 遷移

我們強烈建議從 Sonnet 4.5 遷移至 Sonnet 4.6，它以相同的價格提供更高的智慧。

如果您未使用延伸思考

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

如果您正在使用延伸思考

編碼和代理使用案例

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

聊天和非編碼使用案例

對於聊天、內容生成、搜尋、分類和其他非編碼任務，我們建議從 low effort 搭配延伸思考開始。如果您需要更深入的處理，將 effort 提高至 medium。

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

何時嘗試自適應思考

上述遷移路徑使用帶有 budget_tokens 的延伸思考以獲得可預測的 token 使用量。如果您的工作負載符合以下模式之一，考慮嘗試自適應思考：

自主多步驟代理： 將需求轉化為可運作軟體的編碼代理、資料分析管線和錯誤查找，模型在多個步驟中獨立運行。自適應思考讓模型在每個步驟校準其推理，在更長的軌跡中保持正軌。對於這些工作負載，從 high effort 開始。如果延遲或 token 使用量是問題，降低至 medium。
電腦使用代理： Sonnet 4.6 在使用自適應模式的電腦使用評估中達到了同類最佳的準確度。
雙模態工作負載： 簡單和困難任務的混合，自適應模式在簡單查詢時跳過思考，在複雜查詢時進行深度推理。

使用自適應思考時，在您的任務上評估 medium 和 high effort。正確的等級取決於您的工作負載在品質、延遲和 token 使用量之間的權衡。

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

如果您在使用自適應思考時遇到不一致的行為或品質下降，請切換至帶有 budget_tokens 的延伸思考。這提供了更可預測的結果，並對思考成本設有上限。

Sonnet 4.6 遷移檢查清單

遷移至 Claude Sonnet 4.5

Claude Sonnet 4.5 結合了強大的智慧與快速的效能，非常適合日常編碼、分析和內容任務。

如需完整的功能概覽，請參閱模型概覽。

Sonnet 4.5 定價為每百萬輸入 token 3 美元，每百萬輸出 token 15 美元。詳情請參閱 Claude 定價。

更新您的模型名稱：

# 從 Sonnet 4
model = "claude-sonnet-4-20250514"  # 之前
model = "claude-sonnet-4-5-20250929"  # 之後

# 從 Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # 之前
model = "claude-sonnet-4-5-20250929"  # 之後

破壞性變更

這些破壞性變更適用於從 Claude 3.x Sonnet 模型遷移時。

更新取樣參數

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

僅使用 temperature 或 top_p，不要同時使用。
更新工具版本

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

更新至最新的工具版本（text_editor_20250728、code_execution_20250825）。移除任何使用 undo_edit 命令的程式碼。
處理 refusal 停止原因

更新您的應用程式以處理 refusal 停止原因。
針對行為變更更新您的提示

Claude 4 模型具有更簡潔、直接的溝通風格。請查閱提示最佳實踐以獲取最佳化指導。

Sonnet 4.5 遷移檢查清單

將模型 ID 更新為 claude-sonnet-4-5-20250929
破壞性： 將工具版本更新至最新（text_editor_20250728、code_execution_20250825）；不支援舊版本（如果從 3.x 遷移）
破壞性： 移除任何使用 undo_edit 命令的程式碼（如適用）
破壞性： 更新取樣參數，僅使用 temperature 或 top_p，不要同時使用（如果從 3.x 遷移）
在您的應用程式中處理新的 refusal 停止原因
依照提示最佳實踐審查並更新提示
考慮為複雜推理任務啟用延伸思考
在正式部署前於開發環境中測試

遷移至 Claude Haiku 4.5

Claude Haiku 4.5 是最快且最智慧的 Haiku 模型，具有接近前沿的效能，為互動式應用程式和大量處理提供高品質模型品質。

如需完整的功能概覽，請參閱模型概覽。

Haiku 4.5 定價為每百萬輸入 token 1 美元，每百萬輸出 token 5 美元。詳情請參閱 Claude 定價。

更新您的模型名稱：

# 從 Haiku 3.5
model = "claude-3-5-haiku-20241022"  # 之前
model = "claude-haiku-4-5-20251001"  # 之後

查看新的速率限制： Haiku 4.5 與 Haiku 3.5 有不同的速率限制。詳情請參閱速率限制文件。

為了在編碼和推理任務上獲得顯著的效能提升，考慮使用 thinking: {type: "enabled", budget_tokens: N} 啟用延伸思考。

延伸思考會影響提示快取效率。

延伸思考在 Claude 4.6 或更新的模型中已棄用。如果使用較新的模型，請改用自適應思考。

探索新功能： 請參閱模型概覽以了解上下文感知、增加的輸出容量（64K token）、更高的智慧和改進的速度等詳情。

破壞性變更

這些破壞性變更適用於從 Claude 3.x Haiku 模型遷移時。

更新取樣參數

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

僅使用 temperature 或 top_p，不要同時使用。
更新工具版本

從 Claude 3.x 模型遷移時，這是一個破壞性變更。

更新至最新的工具版本（text_editor_20250728、code_execution_20250825）。移除任何使用 undo_edit 命令的程式碼。
處理 refusal 停止原因

更新您的應用程式以處理 refusal 停止原因。
針對行為變更更新您的提示

Claude 4 模型具有更簡潔、直接的溝通風格。請查閱提示最佳實踐以獲取最佳化指導。

Haiku 4.5 遷移檢查清單

將模型 ID 更新為 claude-haiku-4-5-20251001
破壞性： 將工具版本更新至最新（text_editor_20250728、code_execution_20250825）；不支援舊版本
破壞性： 移除任何使用 undo_edit 命令的程式碼（如適用）
破壞性： 更新取樣參數，僅使用 temperature 或 top_p，不要同時使用
在您的應用程式中處理新的 refusal 停止原因
審查並調整新的速率限制（與 Haiku 3.5 分開）
依照提示最佳實踐審查並更新提示
考慮為複雜推理任務啟用延伸思考
在正式部署前於開發環境中測試

需要幫助？

查閱 API 文件以獲取詳細規格
查閱模型功能以進行效能比較
查閱 API 發布說明以獲取 API 更新
如果在遷移過程中遇到任何問題，請聯繫支援團隊

Was this page helpful?