模型與定價

Claude 4.6 的新功能

Claude Opus 4.6 新功能與能力概覽。

Claude 4.6 代表了 Claude 模型的下一代，帶來了重大的新功能和 API 改進。本頁面總結了發布時所有可用的新功能。

新模型

模型	API 模型 ID	描述
Claude Opus 4.6	`claude-opus-4-6`	我們最智慧的模型，用於建構代理和編碼

Claude Opus 4.6 支援 200K 上下文視窗（1M token 上下文視窗以 beta 形式提供）、128K 最大輸出 token、延伸思考，以及所有現有的 Claude API 功能。

如需完整的定價和規格，請參閱模型概覽。

新功能

自適應思考模式

自適應思考（thinking: {type: "adaptive"}）是 Opus 4.6 推薦的思考模式。Claude 會動態決定何時思考以及思考多少。在預設的努力程度（high）下，Claude 幾乎總是會進行思考。在較低的努力程度下，它可能會跳過較簡單問題的思考。

thinking: {type: "enabled"} 和 budget_tokens 在 Opus 4.6 上已棄用。它們仍然可以運作，但將在未來的模型版本中移除。請改用自適應思考和努力程度參數來控制思考深度。自適應思考也會自動啟用交錯思考。

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[{"role": "user", "content": "Solve this complex problem..."}]
)

努力程度參數正式發布

努力程度參數現已正式發布（不需要 beta 標頭）。新的 max 努力程度在 Opus 4.6 上提供最高的能力。將努力程度與自適應思考結合使用，以獲得最佳的成本與品質權衡。

壓縮 API（beta）

壓縮提供自動的伺服器端上下文摘要，實現實質上無限的對話。當上下文接近視窗限制時，API 會自動摘要對話的早期部分。

細粒度工具串流（正式發布）

細粒度工具串流現已在所有模型和平台上正式發布。不需要 beta 標頭。

128K 輸出 token

Opus 4.6 支援最多 128K 輸出 token，是先前 64K 限制的兩倍。這使得更長的思考預算和更全面的回應成為可能。SDK 要求對具有較大 max_tokens 值的請求使用串流，以避免 HTTP 逾時。如果您不需要增量處理事件，請使用 .stream() 搭配 .get_final_message() 來取得完整回應——詳情請參閱串流訊息。

資料駐留控制

資料駐留控制允許您使用 inference_geo 參數指定模型推論執行的位置。您可以為每個請求選擇 "global"（預設）或 "us" 路由。僅限美國的推論在 Claude Opus 4.6 和更新的模型上定價為 1.1 倍。

棄用項目

`type: "enabled"` 和 `budget_tokens`

thinking: {type: "enabled", budget_tokens: N} 在 Opus 4.6 上已棄用。它仍然可以運作，但將在未來的模型版本中移除。請遷移至 thinking: {type: "adaptive"} 並搭配努力程度參數。

`interleaved-thinking-2025-05-14` beta 標頭

interleaved-thinking-2025-05-14 beta 標頭在 Opus 4.6 上已棄用。如果包含該標頭，它會被安全地忽略，但不再需要。自適應思考會自動啟用交錯思考。在使用 Opus 4.6 時，請從您的請求中移除 betas=["interleaved-thinking-2025-05-14"]。

`output_format`

用於結構化輸出的 output_format 參數已移至 output_config.format。舊參數仍然可以運作，但已棄用，將在未來的模型版本中移除。

# 之前
response = client.messages.create(
    output_format={"type": "json_schema", "schema": {...}},
    ...
)

# 之後
response = client.messages.create(
    output_config={"format": {"type": "json_schema", "schema": {...}}},
    ...
)

重大變更

移除預填

預填助手訊息（最後一輪助手預填）在 Opus 4.6 上不受支援。包含預填助手訊息的請求會返回 400 錯誤。

替代方案：

結構化輸出用於控制回應格式
系統提示指令用於引導回應風格
output_config.format 用於 JSON 輸出

工具參數引號處理

Opus 4.6 可能在工具呼叫參數中產生略有不同的 JSON 字串跳脫（例如，對 Unicode 跳脫或正斜線跳脫的不同處理）。標準 JSON 解析器會自動處理這些差異。如果您將工具呼叫的 input 作為原始字串解析，而不是使用 json.loads() 或 JSON.parse()，請驗證您的解析邏輯是否仍然有效。

遷移指南

如需逐步遷移說明，請參閱遷移至 Claude 4.6。

後續步驟

了解如何使用自適應思考模式。

比較所有 Claude 模型。

探索伺服器端上下文壓縮。

逐步遷移說明。

Was this page helpful?

模型與定價

Claude 4.6 的新功能

Claude Opus 4.6 新功能與能力概覽。

Claude 4.6 代表了 Claude 模型的下一代，帶來了重大的新功能和 API 改進。本頁面總結了發布時所有可用的新功能。

新模型

模型	API 模型 ID	描述
Claude Opus 4.6	`claude-opus-4-6`	我們最智慧的模型，用於建構代理和編碼

Claude Opus 4.6 支援 200K 上下文視窗（1M token 上下文視窗以 beta 形式提供）、128K 最大輸出 token、延伸思考，以及所有現有的 Claude API 功能。

如需完整的定價和規格，請參閱模型概覽。

新功能

自適應思考模式

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[{"role": "user", "content": "Solve this complex problem..."}]
)

努力程度參數正式發布

壓縮 API（beta）

壓縮提供自動的伺服器端上下文摘要，實現實質上無限的對話。當上下文接近視窗限制時，API 會自動摘要對話的早期部分。

細粒度工具串流（正式發布）

細粒度工具串流現已在所有模型和平台上正式發布。不需要 beta 標頭。

128K 輸出 token

資料駐留控制

棄用項目

`type: "enabled"` 和 `budget_tokens`

`interleaved-thinking-2025-05-14` beta 標頭

`output_format`

用於結構化輸出的 output_format 參數已移至 output_config.format。舊參數仍然可以運作，但已棄用，將在未來的模型版本中移除。

# 之前
response = client.messages.create(
    output_format={"type": "json_schema", "schema": {...}},
    ...
)

# 之後
response = client.messages.create(
    output_config={"format": {"type": "json_schema", "schema": {...}}},
    ...
)

重大變更

移除預填

預填助手訊息（最後一輪助手預填）在 Opus 4.6 上不受支援。包含預填助手訊息的請求會返回 400 錯誤。

替代方案：

結構化輸出用於控制回應格式
系統提示指令用於引導回應風格
output_config.format 用於 JSON 輸出

工具參數引號處理

遷移指南

如需逐步遷移說明，請參閱遷移至 Claude 4.6。

後續步驟

了解如何使用自適應思考模式。

比較所有 Claude 模型。

探索伺服器端上下文壓縮。

逐步遷移說明。

Was this page helpful?

新模型

新功能

自適應思考模式

努力程度參數正式發布

壓縮 API（beta）

細粒度工具串流（正式發布）

128K 輸出 token

資料駐留控制

棄用項目

type: "enabled" 和 budget_tokens

interleaved-thinking-2025-05-14 beta 標頭

output_format

重大變更

移除預填

工具參數引號處理

遷移指南

後續步驟

新模型

新功能

自適應思考模式

努力程度參數正式發布

壓縮 API（beta）

細粒度工具串流（正式發布）

128K 輸出 token

資料駐留控制

棄用項目

type: "enabled" 和 budget_tokens

interleaved-thinking-2025-05-14 beta 標頭

output_format

重大變更

移除預填

工具參數引號處理

遷移指南

後續步驟

`type: "enabled"` 和 `budget_tokens`

`interleaved-thinking-2025-05-14` beta 標頭

`output_format`

`type: "enabled"` 和 `budget_tokens`

`interleaved-thinking-2025-05-14` beta 標頭

`output_format`