迁移指南 - Claude API Docs

迁移到 Claude 4.6

Claude Opus 4.6 几乎可以直接替代 Claude 4.5，但有一些需要注意的破坏性变更。有关新功能的完整列表，请参阅 Claude 4.6 的新功能。

更新您的模型名称

# Opus 迁移
model = "claude-opus-4-5"  # 之前
model = "claude-opus-4-6"  # 之后

破坏性变更

移除预填充： 在 Claude 4.6 模型上预填充助手消息会返回 400 错误。请改用结构化输出、系统提示指令或 output_config.format。
工具参数引号处理： Claude 4.6 模型在工具调用参数中可能产生略有不同的 JSON 字符串转义（例如，对 Unicode 转义或正斜杠转义的不同处理）。如果您将工具调用的 input 作为原始字符串解析而不是使用 JSON 解析器，请验证您的解析逻辑。标准 JSON 解析器（如 json.loads() 或 JSON.parse()）会自动处理这些差异。

建议的变更

这些不是必需的，但会改善您的使用体验：

迁移到自适应思考： thinking: {type: "enabled", budget_tokens: N} 在 Claude 4.6 模型上已弃用，将在未来的模型版本中移除。请切换到 thinking: {type: "adaptive"} 并使用 effort 参数来控制思考深度。请参阅自适应思考。

从 Claude 4.1 或更早版本迁移到 Claude 4.6

如果您从 Opus 4.1、Sonnet 4 或更早的模型直接迁移到 Claude 4.6，请应用上述 Claude 4.6 破坏性变更以及本节中的额外变更。

# 从 Opus 4.1
model = "claude-opus-4-1-20250805"  # 之前
model = "claude-opus-4-6"  # 之后

# 从 Sonnet 4
model = "claude-sonnet-4-20250514"  # 之前
model = "claude-opus-4-6"  # 之后

# 从 Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # 之前
model = "claude-opus-4-6"  # 之后

额外的破坏性变更

更新采样参数

从 Claude 3.x 模型迁移时，这是一个破坏性变更。

只使用 temperature 或 top_p，不能同时使用：

# 之前 - 在 Claude 4+ 模型中会报错
response = client.messages.create(
    model="claude-3-7-sonnet-20250219",
    temperature=0.7,
    top_p=0.9,  # 不能同时使用
    # ...
)

# 之后
response = client.messages.create(
    model="claude-opus-4-6",
    temperature=0.7,  # 使用 temperature 或 top_p，不能同时使用
    # ...
)

额外的建议变更

移除旧版 beta 头： 移除 token-efficient-tools-2025-02-19 和 output-128k-2025-02-19。所有 Claude 4+ 模型都内置了 token 高效工具使用，这些头不再有任何效果。

Claude 4.6 迁移清单

将模型 ID 更新为 claude-opus-4-6
破坏性变更： 移除助手消息预填充（返回 400 错误）；改用结构化输出或 output_config.format
建议： 从 thinking: {type: "enabled", budget_tokens: N} 迁移到 thinking: {type: "adaptive"} 并使用 effort 参数（budget_tokens 已弃用，将在未来版本中移除）
验证工具调用 JSON 解析使用标准 JSON 解析器
移除 effort-2025-11-24 beta 头（effort 现已正式发布）
移除 fine-grained-tool-streaming-2025-05-14 beta 头
移除 interleaved-thinking-2025-05-14 beta 头（仅限 Opus 4.6；Sonnet 4.6 仍然支持）

迁移到 Claude Sonnet 4.6

Claude Sonnet 4.6 结合了强大的智能和快速的性能，具有改进的智能体搜索功能，以及与网页搜索或网页获取一起使用时的免费代码执行。它非常适合日常编码、分析和内容任务。

有关功能的完整概述，请参阅模型概述。

Sonnet 4.6 的定价为每百万输入 token 3 美元，每百万输出 token 15 美元。详情请参阅 Claude 定价。

更新您的模型名称：

# 从 Sonnet 4.5
model = "claude-sonnet-4-5"  # 之前
model = "claude-sonnet-4-6"  # 之后

# 从 Sonnet 4
model = "claude-sonnet-4-20250514"  # 之前
model = "claude-sonnet-4-6"  # 之后

破坏性变更

从 Sonnet 4.5 迁移时

不再支持预填充助手消息

从 Sonnet 4.5 或更早版本迁移时，这是一个破坏性变更。

在 Sonnet 4.6 上预填充助手消息会返回 400 错误。请改用结构化输出、系统提示指令或 output_config.format。

常见预填充用例及迁移方案：
- 控制输出格式（强制 JSON/YAML 输出）：使用结构化输出或带有枚举字段的工具进行分类任务。
- 消除前言（移除"Here is..."短语）：在系统提示中添加直接指令："直接回复，不要加前言。不要以'Here is...'、'Based on...'等短语开头。"
- 避免错误拒绝：Claude 现在在适当拒绝方面做得更好了。在用户消息中进行清晰的提示而不使用预填充应该就足够了。
- 续写（恢复中断的响应）：将续写移到用户消息中："您之前的响应被中断，以 [previous_response] 结尾。请从中断处继续。"

从 Claude 3.x 迁移时

更新采样参数

从 Claude 3.x 模型迁移时，这是一个破坏性变更。

只使用 temperature 或 top_p，不能同时使用。
更新工具版本

从 Claude 3.x 模型迁移时，这是一个破坏性变更。

更新到最新的工具版本（text_editor_20250728、code_execution_20250825）。移除任何使用 undo_edit 命令的代码。
处理 refusal 停止原因

更新您的应用程序以处理 refusal 停止原因。
针对行为变更更新您的提示

建议的变更

移除 fine-grained-tool-streaming-2025-05-14 beta 头 — 细粒度工具流式传输在 Sonnet 4.6 上已正式发布，不再需要 beta 头。
将 output_format 迁移到 output_config.format — output_format 参数已弃用。请改用 output_config.format。

从 Sonnet 4.5 迁移

我们强烈建议从 Sonnet 4.5 迁移到 Sonnet 4.6，后者以相同的价格提供更高的智能。

Sonnet 4.6 默认的 effort 级别为 high，而 Sonnet 4.5 没有 effort 参数。我们建议在从 Sonnet 4.5 迁移到 Sonnet 4.6 时调整 effort 参数。如果未明确设置，您可能会因默认的 effort 级别而体验到更高的延迟。

如果您未使用扩展思考

如果您在 Sonnet 4.5 上未使用扩展思考，可以在 Sonnet 4.6 上继续不使用。您应该明确将 effort 设置为适合您用例的级别。在 low effort 且禁用思考的情况下，您可以期望获得与没有扩展思考的 Sonnet 4.5 相似或更好的性能。

如果您正在使用扩展思考

如果您在 Sonnet 4.5 上使用扩展思考，Sonnet 4.6 继续支持，无需更改您的思考配置。我们建议将思考预算保持在约 16k token。实际上，大多数任务不会使用那么多，但它为更难的问题提供了余量，而不会有 token 使用失控的风险。

编码和智能体用例

对于智能体编码、前端设计、工具密集型工作流和复杂的企业工作流，我们建议从 medium effort 开始。如果您发现延迟太高，考虑将 effort 降低到 low。如果您需要更高的智能，考虑将 effort 提高到 high 或迁移到 Opus 4.6。

聊天和非编码用例

对于聊天、内容生成、搜索、分类和其他非编码任务，我们建议从 low effort 配合扩展思考开始。如果您需要更深入的分析，将 effort 提高到 medium。

何时尝试自适应思考

上述迁移路径使用带有 budget_tokens 的扩展思考以获得可预测的 token 使用量。如果您的工作负载符合以下模式之一，请考虑尝试自适应思考：

自主多步骤智能体： 将需求转化为可运行软件的编码智能体、数据分析管道和 bug 查找，其中模型跨多个步骤独立运行。自适应思考让模型在每个步骤校准其推理，在更长的轨迹上保持正确方向。对于这些工作负载，从 high effort 开始。如果延迟或 token 使用是一个问题，降低到 medium。
计算机使用智能体： Sonnet 4.6 在使用自适应模式的计算机使用评估中取得了同类最佳的准确率。
双模态工作负载： 简单和困难任务的混合，自适应模式在简单查询上跳过思考，在复杂查询上进行深度推理。

使用自适应思考时，在您的任务上评估 medium 和 high effort。合适的级别取决于您的工作负载在质量、延迟和 token 使用之间的权衡。

如果您在使用自适应思考时遇到不一致的行为或质量下降，请切换到带有 budget_tokens 的扩展思考。这提供了更可预测的结果，并对思考成本设有上限。

Sonnet 4.6 迁移清单

将模型 ID 更新为 claude-sonnet-4-6
破坏性变更： 移除助手消息预填充；改用结构化输出或 output_config.format
破坏性变更： 验证工具参数 JSON 解析能处理转义差异
破坏性变更： 将工具版本更新到最新（text_editor_20250728、code_execution_20250825）；不支持旧版本（如果从 3.x 迁移）
破坏性变更： 移除任何使用 undo_edit 命令的代码（如适用）
破坏性变更： 更新采样参数，只使用 temperature 或 top_p，不能同时使用（如果从 3.x 迁移）
在您的应用程序中处理新的 refusal 停止原因

迁移到 Claude Sonnet 4.5

Claude Sonnet 4.5 结合了强大的智能和快速的性能，非常适合日常编码、分析和内容任务。

有关功能的完整概述，请参阅模型概述。

Sonnet 4.5 的定价为每百万输入 token 3 美元，每百万输出 token 15 美元。详情请参阅 Claude 定价。

更新您的模型名称：

# 从 Sonnet 4
model = "claude-sonnet-4-20250514"  # 之前
model = "claude-sonnet-4-5-20250929"  # 之后

# 从 Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # 之前
model = "claude-sonnet-4-5-20250929"  # 之后

破坏性变更

这些破坏性变更适用于从 Claude 3.x Sonnet 模型迁移时。

更新采样参数

从 Claude 3.x 模型迁移时，这是一个破坏性变更。

只使用 temperature 或 top_p，不能同时使用。
更新工具版本

从 Claude 3.x 模型迁移时，这是一个破坏性变更。

更新到最新的工具版本（text_editor_20250728、code_execution_20250825）。移除任何使用 undo_edit 命令的代码。
处理 refusal 停止原因

更新您的应用程序以处理 refusal 停止原因。
针对行为变更更新您的提示

Sonnet 4.5 迁移清单

将模型 ID 更新为 claude-sonnet-4-5-20250929
破坏性变更： 将工具版本更新到最新（text_editor_20250728、code_execution_20250825）；不支持旧版本（如果从 3.x 迁移）
破坏性变更： 移除任何使用 undo_edit 命令的代码（如适用）
破坏性变更： 更新采样参数，只使用 temperature 或 top_p，不能同时使用（如果从 3.x 迁移）
在您的应用程序中处理新的 refusal 停止原因
按照提示最佳实践审查和更新提示
考虑为复杂推理任务启用扩展思考

迁移到 Claude Haiku 4.5

Claude Haiku 4.5 是最快、最智能的 Haiku 模型，具有接近前沿的性能，为交互式应用和大批量处理提供高端模型质量。

有关功能的完整概述，请参阅模型概述。

Haiku 4.5 的定价为每百万输入 token 1 美元，每百万输出 token 5 美元。详情请参阅 Claude 定价。

更新您的模型名称：

# 从 Haiku 3.5
model = "claude-3-5-haiku-20241022"  # 之前
model = "claude-haiku-4-5-20251001"  # 之后

查看新的速率限制： Haiku 4.5 与 Haiku 3.5 有不同的速率限制。详情请参阅速率限制文档。

为了在编码和推理任务上获得显著的性能提升，请考虑使用 thinking: {type: "enabled", budget_tokens: N} 启用扩展思考。

扩展思考会影响提示缓存效率。

扩展思考在 Claude 4.6 或更新的模型中已弃用。如果使用更新的模型，请改用自适应思考。

探索新功能： 请参阅模型概述了解上下文感知、增加的输出容量（64K token）、更高的智能和更快的速度等详情。

破坏性变更

这些破坏性变更适用于从 Claude 3.x Haiku 模型迁移时。

更新采样参数

从 Claude 3.x 模型迁移时，这是一个破坏性变更。

只使用 temperature 或 top_p，不能同时使用。
更新工具版本

从 Claude 3.x 模型迁移时，这是一个破坏性变更。

更新到最新的工具版本（text_editor_20250728、code_execution_20250825）。移除任何使用 undo_edit 命令的代码。
处理 refusal 停止原因

更新您的应用程序以处理 refusal 停止原因。
针对行为变更更新您的提示

Haiku 4.5 迁移清单

将模型 ID 更新为 claude-haiku-4-5-20251001
破坏性变更： 将工具版本更新到最新（text_editor_20250728、code_execution_20250825）；不支持旧版本
破坏性变更： 移除任何使用 undo_edit 命令的代码（如适用）
破坏性变更： 更新采样参数，只使用 temperature 或 top_p，不能同时使用
在您的应用程序中处理新的 refusal 停止原因
审查和调整新的速率限制（与 Haiku 3.5 分开）
按照提示最佳实践审查和更新提示

需要帮助？

查看 API 文档获取详细规格
查看模型功能获取性能比较
查看 API 发布说明获取 API 更新
如果在迁移过程中遇到任何问题，请联系支持团队

response = client.beta.messages.create(
    model="claude-opus-4-5",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[...],
)

更新工具版本

从 Claude 3.x 模型迁移时，这是一个破坏性变更。

更新到最新的工具版本。移除任何使用 undo_edit 命令的代码。

# 之前
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]

# 之后
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]

文本编辑器： 使用 text_editor_20250728 和 str_replace_based_edit_tool。详情请参阅文本编辑器工具文档。
代码执行： 升级到 code_execution_20250825。迁移说明请参阅代码执行工具文档。

处理 model_context_window_exceeded 停止原因

Claude 4.5+ 模型在生成因达到上下文窗口限制而停止时，会返回 model_context_window_exceeded 停止原因，而不是请求的 max_tokens 限制。更新您的应用程序以处理这个新的停止原因：

response = client.messages.create(...)

if response.stop_reason == "model_context_window_exceeded":
    # 适当处理上下文窗口限制
    pass

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)