Claude 4.6 代表了 Claude 模型的下一代,帶來了重大的新功能和 API 改進。本頁面總結了發布時所有可用的新功能。
| 模型 | API 模型 ID | 描述 |
|---|---|---|
| Claude Opus 4.6 | claude-opus-4-6 | 我們最智慧的模型,用於建構代理和編碼 |
Claude Opus 4.6 支援 200K 上下文視窗(1M token 上下文視窗以 beta 形式提供)、128K 最大輸出 token、延伸思考,以及所有現有的 Claude API 功能。
如需完整的定價和規格,請參閱模型概覽。
自適應思考(thinking: {type: "adaptive"})是 Opus 4.6 推薦的思考模式。Claude 會動態決定何時思考以及思考多少。在預設的努力程度(high)下,Claude 幾乎總是會進行思考。在較低的努力程度下,它可能會跳過較簡單問題的思考。
thinking: {type: "enabled"} 和 budget_tokens 在 Opus 4.6 上已棄用。它們仍然可以運作,但將在未來的模型版本中移除。請改用自適應思考和努力程度參數來控制思考深度。自適應思考也會自動啟用交錯思考。
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[{"role": "user", "content": "Solve this complex problem..."}]
)努力程度參數現已正式發布(不需要 beta 標頭)。新的 max 努力程度在 Opus 4.6 上提供最高的能力。將努力程度與自適應思考結合使用,以獲得最佳的成本與品質權衡。
壓縮提供自動的伺服器端上下文摘要,實現實質上無限的對話。當上下文接近視窗限制時,API 會自動摘要對話的早期部分。
細粒度工具串流現已在所有模型和平台上正式發布。不需要 beta 標頭。
Opus 4.6 支援最多 128K 輸出 token,是先前 64K 限制的兩倍。這使得更長的思考預算和更全面的回應成為可能。SDK 要求對具有較大 max_tokens 值的請求使用串流,以避免 HTTP 逾時。如果您不需要增量處理事件,請使用 .stream() 搭配 .get_final_message() 來取得完整回應——詳情請參閱串流訊息。
資料駐留控制允許您使用 inference_geo 參數指定模型推論執行的位置。您可以為每個請求選擇 "global"(預設)或 "us" 路由。僅限美國的推論在 Claude Opus 4.6 和更新的模型上定價為 1.1 倍。
type: "enabled" 和 budget_tokensthinking: {type: "enabled", budget_tokens: N} 在 Opus 4.6 上已棄用。它仍然可以運作,但將在未來的模型版本中移除。請遷移至 thinking: {type: "adaptive"} 並搭配努力程度參數。
interleaved-thinking-2025-05-14 beta 標頭interleaved-thinking-2025-05-14 beta 標頭在 Opus 4.6 上已棄用。如果包含該標頭,它會被安全地忽略,但不再需要。自適應思考會自動啟用交錯思考。在使用 Opus 4.6 時,請從您的請求中移除 betas=["interleaved-thinking-2025-05-14"]。
output_format用於結構化輸出的 output_format 參數已移至 output_config.format。舊參數仍然可以運作,但已棄用,將在未來的模型版本中移除。
# 之前
response = client.messages.create(
output_format={"type": "json_schema", "schema": {...}},
...
)
# 之後
response = client.messages.create(
output_config={"format": {"type": "json_schema", "schema": {...}}},
...
)預填助手訊息(最後一輪助手預填)在 Opus 4.6 上不受支援。包含預填助手訊息的請求會返回 400 錯誤。
替代方案:
output_config.format 用於 JSON 輸出Opus 4.6 可能在工具呼叫參數中產生略有不同的 JSON 字串跳脫(例如,對 Unicode 跳脫或正斜線跳脫的不同處理)。標準 JSON 解析器會自動處理這些差異。如果您將工具呼叫的 input 作為原始字串解析,而不是使用 json.loads() 或 JSON.parse(),請驗證您的解析邏輯是否仍然有效。
如需逐步遷移說明,請參閱遷移至 Claude 4.6。
Was this page helpful?