Claude 4.5 引入了三个为不同用例设计的模型:
Claude Opus 4.5 代表了我们最智能的模型,结合了最大能力和实际性能。它在推理、编码和复杂问题解决任务中提供了阶跃式改进,同时保持了 Opus 系列所期望的高质量输出。
Claude Opus 4.5 是唯一支持努力参数的模型,允许您控制 Claude 在响应时使用多少令牌。这使您能够在响应的彻底性和令牌效率之间进行权衡,只需使用一个模型。
努力参数影响响应中的所有令牌,包括文本响应、工具调用和扩展思考。您可以选择:
Claude Opus 4.5 引入了增强的计算机使用功能,具有新的缩放操作,可以以全分辨率详细检查特定屏幕区域。这使 Claude 能够检查细粒度的 UI 元素、小文本和详细的视觉信息,这些信息在标准屏幕截图中可能不清楚。
缩放功能特别适用于:
Claude Opus 4.5 以更易接受的价格点提供旗舰级智能,相比之前的 Opus 模型,使先进的 AI 能力可用于更广泛的应用和用例。
Claude Opus 4.5 自动保留整个对话中的所有先前思考块,在扩展的多轮交互和工具使用会话中保持推理连续性。这确保 Claude 在处理复杂的长期运行任务时能够有效地利用其完整的推理历史。
Claude Sonnet 4.5 是我们迄今为止最好的编码模型,在整个开发生命周期中有显著改进:
Claude Sonnet 4.5 在代理功能中引入了重大进展:
Claude Sonnet 4.5 具有精炼的通信方法,简洁、直接且自然。它提供基于事实的进度更新,可能在工具调用后跳过冗长的摘要以保持工作流动力(尽管这可以通过提示调整)。
有关使用此通信风格的详细指导,请参阅 Claude 4 最佳实践。
Claude Sonnet 4.5 在创意内容任务中表现出色:
Claude Haiku 4.5 代表了 Haiku 模型系列的变革性飞跃,为我们最快的模型类别带来了前沿功能:
Claude Haiku 4.5 以显著更低的成本和更快的速度提供与 Sonnet 4 相匹配的接近前沿的性能:
Claude Haiku 4.5 是第一个支持扩展思考的 Haiku 模型,为 Haiku 系列带来了高级推理功能:
扩展思考必须通过向 API 请求添加 thinking 参数来显式启用。有关实现详情,请参阅扩展思考文档。
Claude Haiku 4.5 具有上下文感知功能,使模型能够在整个对话中跟踪其剩余上下文窗口:
这是第一个具有原生上下文感知功能的 Haiku 模型。有关提示指导,请参阅 Claude 4 最佳实践。
Claude Haiku 4.5 提供了现代 Claude 模型所期望的强大编码功能:
Haiku 4.5 为需要智能和效率的用例而设计:
程序化工具调用允许 Claude 在代码执行容器中以编程方式编写调用您的工具的代码,而不是为每个工具调用都需要通过模型的往返。这显著降低了多工具工作流的延迟,并通过允许 Claude 在数据到达模型的上下文窗口之前过滤或处理数据来减少令牌消耗。
tools=[
{
"type": "code_execution_20250825",
"name": "code_execution"
},
{
"name": "query_database",
"description": "Execute a SQL query against the sales database. Returns a list of rows as JSON objects.",
"input_schema": {...},
"allowed_callers": ["code_execution_20250825"] # Enable programmatic calling
}
]关键优势:
advanced-tool-use-2025-11-20工具搜索工具使 Claude 能够通过动态发现和按需加载工具来处理数百或数千个工具。Claude 搜索您的工具目录并仅加载它需要的工具,而不是将所有工具定义预先加载到上下文窗口中。
有两种搜索变体可用:
tool_search_tool_regex_20251119):Claude 构造正则表达式模式来搜索工具名称、描述和参数tool_search_tool_bm25_20251119):Claude 使用自然语言查询来搜索工具tools=[
{
"type": "tool_search_tool_regex_20251119",
"name": "tool_search_tool_regex"
},
{
"name": "get_weather",
"description": "Get the weather at a specific location",
"input_schema": {...},
"defer_loading": True # Load on-demand via search
}
]这种方法解决了两个关键挑战:
advanced-tool-use-2025-11-20努力参数允许您控制 Claude 在响应时使用多少令牌,在响应的彻底性和令牌效率之间进行权衡:
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
output_config={
"effort": "medium" # "low", "medium", or "high"
}
)努力参数影响响应中的所有令牌,包括文本响应、工具调用和扩展思考。较低的努力级别会产生更简洁的响应,最少的解释,而较高的努力提供详细的推理和全面的答案。
effort-2025-11-24工具使用示例允许您提供有效工具输入的具体示例,以帮助 Claude 更有效地理解如何使用您的工具。这对于具有嵌套对象、可选参数或格式敏感输入的复杂工具特别有用。
tools=[
{
"name": "get_weather",
"description": "Get the current weather in a given location",
"input_schema": {...},
"input_examples": [
{
"location": "San Francisco, CA",
"unit": "fahrenheit"
},
{
"location": "Tokyo, Japan",
"unit": "celsius"
},
{
"location": "New York, NY" # Demonstrates optional 'unit' parameter
}
]
}
]示例包含在提示中,与您的工具架构一起,向 Claude 展示格式良好的工具调用的具体模式。每个示例必须根据工具的 input_schema 有效。
advanced-tool-use-2025-11-20。新的内存工具使 Claude 能够在上下文窗口外存储和检索信息:
tools=[
{
"type": "memory_20250818",
"name": "memory"
}
]这允许:
context-management-2025-06-27使用上下文编辑通过自动工具调用清除进行智能上下文管理:
response = client.beta.messages.create(
betas=["context-management-2025-06-27"],
model="claude-sonnet-4-5", # or claude-haiku-4-5
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
context_management={
"edits": [
{
"type": "clear_tool_uses_20250919",
"trigger": {"type": "input_tokens", "value": 500},
"keep": {"type": "tool_uses", "value": 2},
"clear_at_least": {"type": "input_tokens", "value": 100}
}
]
},
tools=[...]
)此功能在接近令牌限制时自动删除较旧的工具调用和结果,帮助在长期运行的代理会话中管理上下文。
context-management-2025-06-27Claude 4.5 模型引入了新的 model_context_window_exceeded 停止原因,明确指示生成何时因达到上下文窗口限制而停止,而不是请求的 max_tokens 限制。这使得在应用程序逻辑中更容易处理上下文窗口限制。
{
"stop_reason": "model_context_window_exceeded",
"usage": {
"input_tokens": 150000,
"output_tokens": 49950
}
}Claude 4.5 模型包含一个错误修复,保留了工具调用字符串参数中的有意格式。以前,字符串参数中的尾随换行符有时会被错误地剥离。此修复确保需要精确格式的工具(如文本编辑器)接收完全按预期的参数。
这是一个幕后改进,不需要 API 更改。但是,具有字符串参数的工具现在可能会接收以前被剥离的尾随换行符的值。
示例:
// 之前:最后的换行符意外被剥离
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit"
}
}
// 之后:尾随换行符按预期保留
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit\n"
}
}Claude 4.5 模型包含自动优化以改进模型性能。这些优化可能会向请求添加少量令牌,但您不会为这些系统添加的令牌付费。
以下功能在 Claude 4 中引入,在所有 Claude 4 模型中可用,包括 Claude Sonnet 4.5 和 Claude Haiku 4.5。
Claude 4 模型为模型因安全原因拒绝生成的内容引入了新的 refusal 停止原因:
{
"id": "msg_014XEDjypDjFzgKVWdFUXxZP",
"type": "message",
"role": "assistant",
"model": "claude-sonnet-4-5",
"content": [{"type": "text", "text": "I would be happy to assist you. You can "}],
"stop_reason": "refusal",
"stop_sequence": null,
"usage": {
"input_tokens": 564,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"output_tokens": 22
}
}使用 Claude 4 模型时,您应该更新应用程序以处理 refusal 停止原因。
启用扩展思考后,Claude 4 模型的消息 API 返回 Claude 完整思考过程的摘要。总结思考提供了扩展思考的全部智能优势,同时防止了滥用。
虽然 API 在 Claude 3.7 和 4 模型中是一致的,但扩展思考的流式响应可能以"分块"交付模式返回,流式事件之间可能有延迟。
总结由与您在请求中针对的模型不同的模型处理。思考模型看不到总结的输出。
有关更多信息,请参阅扩展思考文档。
Claude 4 模型支持将工具使用与扩展思考交错,允许更自然的对话,其中工具使用和响应可以与常规消息混合。
交错思考处于测试版。要启用交错思考,请将测试版标头 interleaved-thinking-2025-05-14 添加到您的 API 请求。
有关更多信息,请参阅扩展思考文档。
Claude 4 模型有可能影响您如何构建提示的显著行为变化:
Claude 4 模型针对精确指令遵循进行了训练,需要更明确的方向:
有关使用这些模型的全面指导,请参阅 Claude 4 提示工程最佳实践。
文本编辑器工具已针对 Claude 4 模型进行了更新,具有以下更改:
text_editor_20250728str_replace_based_edit_toolundo_edit 命令对于 Claude Sonnet 3.7,str_replace_editor 文本编辑器工具保持不变。
如果您从 Claude Sonnet 3.7 迁移并使用文本编辑器工具:
# Claude Sonnet 3.7
tools=[
{
"type": "text_editor_20250124",
"name": "str_replace_editor"
}
]
# Claude 4 models
tools=[
{
"type": "text_editor_20250728",
"name": "str_replace_based_edit_tool"
}
]有关更多信息,请参阅文本编辑器工具文档。
如果您使用代码执行工具,请确保您使用最新版本 code_execution_20250825,它添加了 Bash 命令和文件操作功能。
旧版本 code_execution_20250522(仅 Python)仍然可用,但不建议用于新实现。
有关迁移说明,请参阅代码执行工具文档。
Claude 4.5 模型保持竞争性定价:
| 模型 | 输入 | 输出 |
|---|---|---|
| Claude Opus 4.5 | 每百万令牌 $5 | 每百万令牌 $25 |
| Claude Sonnet 4.5 | 每百万令牌 $3 | 每百万令牌 $15 |
| Claude Haiku 4.5 | 每百万令牌 $1 | 每百万令牌 $5 |
有关更多详情,请参阅定价文档。
从 Claude 4.5 模型(Opus 4.5、Sonnet 4.5 和 Haiku 4.5)开始,AWS Bedrock 和 Google Vertex AI 提供两种端点类型:
此区域定价适用于所有 Claude 4.5 模型:Opus 4.5、Sonnet 4.5 和 Haiku 4.5。
Claude API(1P)默认是全局的,不受此更改影响。 Claude API 是全局唯一的(相当于其他提供商的全局端点提供和定价)。
有关实现详情和迁移指导:
Claude 4.5 模型在以下平台上可用:
| 模型 | Claude API | Amazon Bedrock | Google Cloud Vertex AI |
|---|---|---|---|
| Claude Opus 4.5 | claude-opus-4-5-20251101 | anthropic.claude-opus-4-5-20251101-v1:0 | claude-opus-4-5@20251101 |
| Claude Sonnet 4.5 | claude-sonnet-4-5-20250929 | anthropic.claude-sonnet-4-5-20250929-v1:0 | claude-sonnet-4-5@20250929 |
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 | anthropic.claude-haiku-4-5-20251001-v1:0 | claude-haiku-4-5@20251001 |
也可通过 Claude.ai 和 Claude Code 平台获得。
破坏性更改和迁移要求因您升级的模型而异。有关详细的迁移说明,包括分步指南、破坏性更改和迁移清单,请参阅迁移到 Claude 4.5。
迁移指南涵盖以下场景:
从以前的模型升级