有关 Claude 应用的发布说明,请参阅 Claude 帮助中心的 Claude 应用发布说明。
有关 Claude Code 的更新,请参阅 claude-code 代码仓库中的完整 CHANGELOG.md。
- Python、TypeScript、Go、Java、Ruby、PHP 和 C# SDK 现已支持
code_execution_20260120,这是代码执行工具的新版本,增加了 REPL 状态持久化功能,也是程序化工具调用所需的最低版本。要采用此版本,请将工具的 type 设置为 code_execution_20260120;无需 beta 标头。该版本适用于 Claude Fable 5、Claude Mythos 5、Claude Opus 4.5 及更新版本,以及 Claude Sonnet 4.5 及更新版本;请参阅模型兼容性表。
- 代码执行工具现已支持
code_execution_20260521,该版本在工具描述中披露了每个单元格 90 秒的执行时间限制,以便 Claude 能够为长时间运行的单元格分配预算。无需 beta 标头。
- 网络搜索工具和网页抓取工具现已支持
web_search_20260318 和 web_fetch_20260318,新增了 response_inclusion 参数,可在智能体工作流中从 API 响应中删除已消费的结果块。无需 beta 标头。
- 我们发布了 Claude Fable 5(
claude-fable-5),这是我们能力最强的广泛发布模型,同时为 Project Glasswing 参与者发布了 Claude Mythos 5(claude-mythos-5)。两个模型默认支持 100 万令牌上下文窗口、12.8 万最大输出令牌,以及始终开启的自适应思考。有关功能、API 变更和可用性,请参阅 Claude Fable 5 和 Claude Mythos 5 介绍。
- Claude Fable 5 和 Claude Mythos 5 使用随 Claude Opus 4.7 引入的分词器。与 Claude Opus 4.7 之前的模型相比,相同的文本会产生大约多 30% 的令牌。请使用令牌计数 API 并设置
model: "claude-fable-5" 来测量您的提示在新分词器下的令牌数。
- Claude Fable 5 会对请求和响应生成过程运行安全分类器。当分类器拒绝请求时,Messages API 会返回
stop_reason: "refusal"。如果请求在生成任何输出之前被拒绝,您不会被计费。可选的 fallbacks 参数(在 Claude API 和 Claude Platform on AWS 上处于 beta 阶段;Message Batches API 不支持)会在另一个模型上重新运行被拒绝的请求,并按回退模型的费率计费。请参阅处理停止原因。
- 拒绝响应中的
stop_details.category 字段现在在 Claude Fable 5 上包含 "reasoning_extraction",当请求因违反 Anthropic 服务条款中关于逆向工程或复制模型输出的限制而被阻止时返回此值。现有的 "cyber" 和 "bio" 类别保持不变。无需 beta 标头。
- 在 Claude Fable 5 和 Claude Mythos 5 上,自适应思考是唯一的思考模式:不支持
thinking: {"type": "disabled"},也不支持手动扩展思考预算和助手预填充(两者均返回 400 错误)。请参阅从 Claude Mythos Preview 迁移到 Claude Mythos 5。
- 在 Claude Fable 5 和 Claude Mythos 5 上,
thinking.display 默认为 "omitted",与 Claude Opus 4.8、Claude Opus 4.7 和 Claude Mythos Preview 相同;设置 display: "summarized" 可接收可读的思考摘要。原始思维链永远不会返回;在同一模型的多轮对话中,请原样传回思考块。请参阅 Claude Fable 5 和 Claude Mythos 5 上的思考输出。
- Claude Fable 5 在 Claude API 上需要 30 天数据保留,在零数据保留设置下不可用。请参阅特定模型的数据保留要求。
- Claude Managed Agents 现已支持计划部署,让您可以按 cron 计划运行会话,而无需管理自己的调度器。
- Claude Managed Agents 保管库现已支持环境变量凭据,因此您可以安全地将密钥注入智能体的沙箱,供通过环境变量进行身份验证的 CLI、SDK 和其他服务使用。
session.thread_* webhook 事件现在包含 session_thread_id 字段,用于标识触发该事件的多智能体线程。
- 我们发布了一个 beta 版 Swift 包,可将 Claude 作为服务器端
LanguageModel 添加到 Apple 的 Foundation Models 框架中。在 iOS 27、macOS 27、visionOS 27 和 watchOS 27(beta)上,通过与 Apple 设备端模型相同的 LanguageModelSession API 调用 Claude。
- 我们宣布弃用 Claude Opus 4.1 模型(
claude-opus-4-1-20250805),计划于 2026 年 8 月 5 日在 Claude API 上停用。我们建议迁移到 Claude Opus 4.8。更多信息请参阅模型弃用。
- 顾问工具现已支持
max_tokens 参数,用于限制每次调用时顾问模型的输出,从而为不需要完整长度顾问响应的工作负载降低延迟和输出令牌成本。在顾问工具定义中设置 tools[].max_tokens;请参阅限制顾问输出。
- 在 Claude API 上,当请求返回
stop_reason: "refusal" 且 Claude 未生成任何输出时,您将不再被计费。有关检测和处理拒绝的信息,请参阅流式传输拒绝。
- 我们发布了 Claude Opus 4.8(claude-opus-4-8),这是我们能力最强的正式发布模型。Claude Opus 4.8 在 Claude API、Amazon Bedrock 和 Vertex AI 上默认支持 100 万令牌上下文窗口(Microsoft Foundry 上为 20 万)、12.8 万最大输出令牌,以及与 Claude Opus 4.7 相同的工具集和平台功能。有关功能改进、新特性和迁移指南,请参阅 Claude Opus 4.8 新特性。
- 我们发布了对话中系统消息功能。在 Claude Opus 4.8 上,您可以在
messages 数组中的用户轮次之后发送 role: "system" 消息(需遵守放置规则),从而在长时间运行的会话中更改指令时保留提示缓存命中。无需 beta 标头。
- 拒绝响应中的
stop_details 字段现已公开记录;它返回一个 category(cyber、bio 或 null)和一个人类可读的 explanation,以便您的应用程序可以将不同类别的拒绝路由到正确的后续步骤。无需 beta 标头。
- 在 Claude Opus 4.8 上,effort 参数在所有界面(包括 Claude Code 和 Messages API)上默认为
high。
- 在 Claude Opus 4.8 上,提示缓存的最小可缓存提示长度为 1,024 个令牌,低于 Claude Opus 4.7。
- 启用自适应思考后,Claude Opus 4.8 仅在某个轮次需要时才触发推理,与相同 effort 级别下的 Claude Opus 4.7 相比,减少了浪费的思考令牌。
- Claude Opus 4.8 支持高分辨率图像输入(长边最高 2576 像素),与 Claude Opus 4.7 相同。
- 任务预算现已支持 Claude Opus 4.8。
- 顾问工具现已支持 Claude Opus 4.8。
- 计算机使用现已支持 Claude Opus 4.8。
- Claude Opus 4.8 的快速模式仅在 Claude API 上作为研究预览版提供。
- 在 Claude Opus 4.8 上,将采样参数
temperature、top_p 或 top_k 设置为非默认值会返回 400 错误,与 Claude Opus 4.7 相同。详情请参阅迁移指南。
- 在 Claude Code 中,我们已将 Auto 模式扩展到更多用户,用于长时间运行的任务。请参阅 Claude Code 文档。
- 在 Claude Code 中,Max 套餐用户现在在 Claude Opus 4.8 上默认使用快速模式。请参阅 Claude Code 文档。
- 在 Claude Code 中,Workflows 作为研究预览版提供,让您可以定义和运行多步骤智能体计划。请参阅 Claude Code 文档。
- 我们已弃用 Claude Opus 4.6 的快速模式,将在发布后约 30 天移除。请迁移到 Claude Opus 4.8 或 Claude Opus 4.7 的快速模式。更多信息请参阅快速模式。
- 有关本次发布中 claude.ai、Cowork、Claude for Microsoft 365 和其他 Claude 应用的更新,请参阅 Claude 应用发布说明。
- MCP 隧道现已作为研究预览版提供,让您可以连接到私有网络中的 MCP 服务器。
- 自托管沙箱现已可用于 Claude Managed Agents,作为在 Anthropic 基础设施中运行工具执行的替代方案。请参阅自托管沙箱。
- 使用 Claude Managed Agents 时,您现在可以更新与活动会话关联的智能体 MCP 服务器和工具配置。
- 使用 Claude Managed Agents 时,来自
agent_toolset 和 MCP 工具的超过 10 万令牌的大型输出现在会自动溢出到沙箱中的文件。模型会收到带有文件路径的截断预览,并可以从该路径读取完整内容。
- 网络搜索工具现在返回更丰富的 SEC 文件数据,使金融研究智能体、财报分析和尽职调查工作流更容易基于带引用的原始来源。
- 我们发布了公开 beta 版的缓存诊断。在 Messages 请求中传递
diagnostics.previous_message_id,API 会报告 cache_miss_reason,解释提示缓存前缀与上一轮次的分歧位置。请在您的请求中包含 cache-diagnosis-2026-04-07 beta 标头。
- 快速模式(研究预览版)现已支持 Claude Opus 4.7。设置
speed: "fast" 和 model: "claude-opus-4-7" 并使用 fast-mode-2026-02-01 beta 标头,即可以高级定价获得显著更快的输出令牌生成速度。定价、速率限制和访问权限与 Opus 4.6 快速模式相同;感兴趣的客户请加入等候名单。
- 我们发布了 Claude Platform on AWS,将 Claude API 引入可通过 AWS 访问的 Anthropic 托管基础设施,并支持 AWS 计费和 IAM 身份验证。通过原生 AWS 端点访问完整的 Messages API、Files API、Message Batches API、Claude Managed Agents、Agent Skills、代码执行和工具使用。更多信息请参阅 Claude Platform on AWS。
- 多智能体会话和 Outcomes 现已在标准
managed-agents-2026-04-01 beta 标头下进入公开 beta 阶段。
- Claude Managed Agents 保管库凭据后台刷新现已支持
mcp_oauth 凭据。请参阅使用保管库进行身份验证。
- Claude Managed Agents 现已支持 Webhook。Webhook 事件类型包括会话和保管库生命周期事件。请参阅订阅 webhook。
- Claude Managed Agents 现已支持更多筛选和排序选项。会话可以按状态筛选,事件可以按类型筛选。事件现在可以按创建时间筛选。
- Claude Managed Agents 的 Dreams 现已作为研究预览版提供。Dream 会读取现有的记忆存储以及过去的会话记录,并生成一个重新组织的输出记忆存储,其中重复项已合并、过时条目已替换、新见解已浮现。Dreams 除了标准的
managed-agents-2026-04-01 标头外,还需要 dreaming-2026-04-21 beta 标头。申请访问权限以进行试用。
- 工作负载身份联合现已正式发布。使用来自您自己的身份提供商(AWS IAM、Google Cloud、GitHub Actions、Kubernetes、Microsoft Entra ID、Okta、SPIFFE 等)的短期 OIDC 令牌对 Claude API 的工作负载进行身份验证,而无需使用长期静态 API 密钥。在 Claude Console 中配置颁发者和联合规则,SDK 会自动处理令牌交换和刷新。请参阅身份验证。
- 我们已停用 Claude Sonnet 4.5 和 Claude Sonnet 4 的 100 万令牌上下文窗口 beta(
context-1m-2025-08-07)。该 beta 标头现在对这些模型不再生效,超过标准 20 万令牌上下文窗口的请求将返回错误。要使用 100 万上下文窗口,请迁移到 Claude Sonnet 4.6 或 Claude Opus 4.6,这些模型已正式支持该功能,采用标准定价且无需 beta 标头。
- 我们发布了速率限制 API,允许管理员以编程方式查询为其组织和工作区配置的速率限制。
- Claude Managed Agents 的记忆功能现已在标准
managed-agents-2026-04-01 标头下进入公开 beta 阶段。有关完整的集成指南,请参阅使用智能体记忆。
- 我们已停用 Claude Haiku 3 模型(
claude-3-haiku-20240307)。对该模型的所有请求现在将返回错误。我们建议升级到 Claude Haiku 4.5。
- 我们发布了 Claude Opus 4.7,这是我们在复杂推理和智能体编码方面能力最强的正式发布模型,定价与 Opus 4.6 相同,为每百万令牌 5 美元 / 25 美元。有关功能改进、新特性和更新的分词器,请参阅 Claude Opus 4.7 新特性。Opus 4.7 相对于 Opus 4.6 包含 API 破坏性变更;升级前请参阅迁移到 Claude Opus 4.7。
- Claude in Amazon Bedrock 现已向所有 Amazon Bedrock 客户开放。Claude Opus 4.7 和 Claude Haiku 4.5 可通过 Bedrock 控制台自助获取,使用位于
/anthropic/v1/messages 的 Messages API 端点,在 27 个 AWS 区域提供全球和区域端点。
- 我们在 Claude Opus 4.7 上发布了 beta 版任务预算。为 Claude 提供一个完整智能体循环(思考、工具调用、工具结果和输出)的建议性令牌预算,模型会看到一个实时倒计时,并利用它来确定工作优先级,在预算消耗时优雅地完成任务。请在您的请求中包含
task-budgets-2026-03-13 beta 标头。
- Claude Opus 4.7 支持高分辨率图像输入,将最大图像分辨率从长边 1568 像素提高到 2576 像素,以提升计算机使用、屏幕截图理解和文档分析的性能。高分辨率支持是自动的,无需 beta 标头;图像可能比之前的模型多使用约 3 倍的图像令牌。
- 我们在 Claude Opus 4.7 上新增了
xhigh effort 级别。xhigh 介于 high 和 max 之间,针对令牌预算达数百万的长时间运行智能体和编码任务(超过 30 分钟)进行了调优。无需 beta 标头。
- 我们宣布弃用 Claude Sonnet 4 模型(
claude-sonnet-4-20250514)和 Claude Opus 4 模型(claude-opus-4-20250514),计划于 2026 年 6 月 15 日在 Claude API 上停用。我们建议分别迁移到 Claude Sonnet 4.6 和 Claude Opus 4.8。更多信息请参阅模型弃用。
- 我们发布了公开 beta 版的顾问工具。将较快的执行器模型与更高智能的顾问模型配对,后者在生成过程中提供战略指导,使长周期智能体工作负载获得接近顾问单独运行的质量,同时大部分令牌生成以执行器模型的费率进行。请在您的请求中包含 beta 标头
advisor-tool-2026-03-01。
- 我们发布了公开 beta 版的 Claude Managed Agents,这是一个完全托管的智能体框架,用于将 Claude 作为自主智能体运行,具有安全沙箱、内置工具和服务器发送事件流式传输。通过 API 创建智能体、配置容器和运行会话。所有端点都需要
managed-agents-2026-04-01 beta 标头。更多信息请参阅 Claude Managed Agents 概述。
- 我们发布了
ant CLI,这是 Claude API 的命令行客户端,可实现与 Claude API 的更快交互、与 Claude Code 的原生集成,以及在 YAML 文件中对 API 资源进行版本控制。更多信息请参阅 CLI 快速入门。
- 我们已将 Message Batches API 上 Claude Opus 4.6 和 Sonnet 4.6 的
max_tokens 上限提高到 30 万。包含 output-300k-2026-03-24 beta 标头即可为长篇内容、结构化数据和大型代码生成任务生成更长的单轮输出。
- 我们将于 2026 年 4 月 30 日停用 Claude Sonnet 4.5 和 Claude Sonnet 4 的 100 万令牌上下文窗口 beta。在该日期之后,
context-1m-2025-08-07 beta 标头将对这些模型不再生效,超过标准 20 万令牌上下文窗口的请求将返回错误。要继续使用 100 万上下文窗口,请迁移到 Claude Sonnet 4.6 或 Claude Opus 4.6,这些模型以标准定价支持完整的 100 万令牌上下文窗口,无需 beta 标头。
- 我们已向 Models API 添加了模型能力字段。
GET /v1/models 和 GET /v1/models/{model_id} 现在返回 max_input_tokens、max_tokens 和一个 capabilities 对象。查询 API 以了解每个模型支持的功能。
- 我们为扩展思考推出了
display 字段,让您可以从响应中省略思考内容以实现更快的流式传输。设置 thinking.display: "omitted" 可接收 thinking 字段为空但保留 signature 的思考块,以实现多轮连续性。计费不变。更多信息请参阅控制思考显示。
- 100 万令牌上下文窗口现已在 Claude Opus 4.6 和 Sonnet 4.6 上以标准定价正式发布。对于这些模型,超过 20 万令牌的请求会自动生效,无需 beta 标头。100 万令牌上下文窗口在 Claude Sonnet 4.5 和 Sonnet 4 上仍处于 beta 阶段。
- 我们已移除所有支持模型的专用 100 万速率限制。您的标准账户限制现在适用于所有上下文长度。
- 使用 100 万令牌上下文窗口时,我们已将每个请求的媒体限制从 100 个图像或 PDF 页面提高到 600 个。
- 我们为 Messages API 推出了自动缓存。在请求正文中添加单个
cache_control 字段,系统会自动缓存最后一个可缓存块,并随着对话增长向前移动缓存点。无需手动管理断点。可与现有的块级缓存控制配合使用以进行细粒度优化。在 Claude API 和 Microsoft Foundry(预览版)上可用。更多信息请参阅提示缓存。
- 我们已停用 Claude Sonnet 3.7 模型(
claude-3-7-sonnet-20250219)和 Claude Haiku 3.5 模型(claude-3-5-haiku-20241022)。对这些模型的所有请求现在将返回错误。我们建议分别升级到 Claude Sonnet 4.6 和 Claude Haiku 4.5。研究人员可以通过外部研究人员访问计划申请持续访问权限。
- 我们宣布弃用 Claude Haiku 3 模型(
claude-3-haiku-20240307),计划于 2026 年 4 月 20 日停用。我们建议迁移到 Claude Haiku 4.5。更多信息请参阅模型弃用。
- 我们为 Opus 4.6 推出了研究预览版的快速模式,通过
speed 参数提供显著更快的输出令牌生成速度。快速模式速度最高可达 2.5 倍,采用高级定价。感兴趣的客户请加入等候名单。
- 我们发布了 Claude Opus 4.6,这是我们在复杂智能体任务和长周期工作方面最智能的模型。Opus 4.6 推荐使用自适应思考(
thinking: {type: "adaptive"});手动思考(带 budget_tokens 的 type: "enabled")已弃用。Opus 4.6 不支持预填充助手消息。更多信息请参阅 Claude 4.6 新特性。
- effort 参数现已正式发布(无需 beta 标头)并支持 Claude Opus 4.6。在新模型上,effort 取代
budget_tokens 用于控制思考深度。
- 我们发布了 beta 版的压缩 API,提供服务器端上下文摘要,实现实际上无限长的对话。在 Opus 4.6 上可用。
- 我们引入了数据驻留控制,允许您使用
inference_geo 参数指定模型推理的运行位置。对于 2026 年 2 月 1 日之后发布的模型,仅限美国的推理以 1.1 倍定价提供。
- 100 万令牌上下文窗口现已在 Claude Opus 4.6 上以 beta 版提供,此外还支持 Sonnet 4.5 和 Sonnet 4。长上下文定价适用于超过 20 万输入令牌的请求。
- 细粒度工具流式传输现已在所有模型和平台上正式发布(无需 beta 标头)。
- 结构化输出现已在 Claude API 上针对 Claude Sonnet 4.5、Claude Opus 4.5 和 Claude Haiku 4.5 正式发布。正式版包括扩展的 schema 支持、改进的语法编译延迟,以及无需 beta 标头的简化集成路径。
output_format 参数已移至 output_config.format。现有 beta 用户可以在过渡期内继续使用 beta 标头。结构化输出在 Amazon Bedrock 和 Microsoft Foundry 上仍处于公开 beta 阶段。
console.anthropic.com 现在重定向到 platform.claude.com。作为我们 Claude 品牌整合的一部分,Claude Console 已迁移到新地址。现有书签和链接将通过自动重定向继续有效。更多详情请参阅 2025 年 9 月 16 日公告。
- 我们已停用 Claude Opus 3 模型(
claude-3-opus-20240229)。对该模型的所有请求现在将返回错误。我们建议升级到 Claude Opus 4.5,它以三分之一的成本提供显著改进的智能。研究人员可以通过外部研究人员访问计划申请在 API 上持续访问 Claude Opus 3。
- 我们宣布弃用 Claude Haiku 3.5 模型。更多信息请参阅模型弃用。
- 结构化输出现已支持 Claude Haiku 4.5。
- 我们推出了 Claude Opus 4.5,这是我们最智能的模型,将最强能力与实用性能相结合。非常适合复杂的专业任务、专业软件工程和高级智能体。在视觉、编码和计算机使用方面实现了跨越式改进,且价格比之前的 Opus 模型更易于接受。请在模型概述中了解更多信息。
- 我们推出了程序化工具调用公开测试版,允许 Claude 在代码执行中调用工具,以减少多工具工作流中的延迟和令牌使用量。
- 我们推出了工具搜索工具公开测试版,使 Claude 能够从大型工具目录中动态发现并按需加载工具。
- 我们为 Claude Opus 4.5 推出了 effort 参数公开测试版,允许您通过在响应完整性和效率之间进行权衡来控制令牌使用量。
- 我们在 Python 和 TypeScript SDK 中添加了客户端压缩功能,在使用
tool_runner 时通过摘要自动管理对话上下文。
- 搜索结果内容块现已在 Amazon Bedrock 上正式发布。请在搜索结果中了解更多信息。
- 我们推出了 Microsoft Foundry 中的 Claude,通过 Azure 计费和 OAuth 身份验证为 Azure 客户提供 Claude 模型。可访问完整的 Messages API,包括扩展思考、提示缓存(5 分钟和 1 小时)、PDF 支持、Files API、Agent Skills 和工具使用。请在 Microsoft Foundry 中的 Claude 中了解更多信息。
- 我们推出了结构化输出公开测试版,为 Claude 的响应提供有保证的模式一致性。使用 JSON 输出获取结构化数据响应,或使用严格工具使用来验证工具输入。适用于 Claude Sonnet 4.5 和 Claude Opus 4.1。要启用此功能,请使用测试版标头
structured-outputs-2025-11-13。
- 我们宣布弃用 Claude Sonnet 3.7 模型。请在模型弃用中了解更多信息。
- 我们已停用 Claude Sonnet 3.5 模型。对这些模型的所有请求现在将返回错误。
- 我们通过思考块清除(
clear_thinking_20251015)扩展了上下文编辑功能,实现了对思考块的自动管理。请在上下文编辑中了解更多信息。
- 我们推出了 Agent Skills(
skills-2025-10-02 测试版),这是一种扩展 Claude 能力的新方式。Skills 是由指令、脚本和资源组成的有序文件夹,Claude 可动态加载这些内容以执行专业任务。初始版本包括:
- Anthropic 管理的 Skills:用于处理 PowerPoint (.pptx)、Excel (.xlsx)、Word (.docx) 和 PDF 文件的预构建 Skills
- 自定义 Skills:通过 Skills API(
/v1/skills 端点)上传您自己的 Skills,以打包领域专业知识和组织工作流
- Skills 需要启用代码执行工具
- 请在 Agent Skills 和 API 参考中了解更多信息
- 我们推出了 Claude Haiku 4.5,这是我们最快、最智能的 Haiku 模型,具有接近前沿的性能。非常适合实时应用、大批量处理以及需要强大推理能力的成本敏感型部署。请在模型概述中了解更多信息。
- 我们推出了 Claude Sonnet 4.5,这是我们用于复杂智能体和编码的最佳模型,在大多数任务中具有最高的智能水平。请在模型概述中了解更多信息。
- 我们为 Amazon Bedrock 和 Vertex AI 引入了全球端点定价。Claude API(第一方)定价不受影响。
- 我们引入了新的停止原因
model_context_window_exceeded,允许您在不计算输入大小的情况下请求最大可能的令牌数。请在处理停止原因中了解更多信息。
- 我们推出了记忆工具测试版,使 Claude 能够跨对话存储和查阅信息。请在记忆工具中了解更多信息。
- 我们推出了上下文编辑测试版,提供自动管理对话上下文的策略。初始版本支持在接近令牌限制时清除较早的工具结果和调用。请在上下文编辑中了解更多信息。
- 我们为 Python 和 TypeScript SDK 推出了工具辅助函数测试版,通过类型安全的输入验证和用于对话中自动处理工具的工具运行器,简化了工具的创建和执行。有关详细信息,请参阅 Python SDK 和 TypeScript SDK 的文档。
- 我们已将开发者产品统一到 Claude 品牌下。您将在我们的平台和文档中看到更新的命名和 URL,但我们的开发者接口将保持不变。以下是一些值得注意的变化:
- 我们在 Console 使用情况页面中推出了速率限制图表,允许您随时间监控 API 速率限制使用情况和缓存率。
- 我们推出了对客户端工具结果中可引用文档的支持。请在处理工具调用中了解更多信息。
- 我们推出了代码执行工具 v2 公开测试版,用 Bash 命令执行和直接文件操作功能(包括用其他语言编写代码)取代了原来仅支持 Python 的工具。
- 请求 ID 现在直接包含在错误响应正文中,与现有的
request-id 标头并存。请在错误中了解更多信息。
- 我们宣布弃用 Claude Sonnet 3.5 模型(
claude-3-5-sonnet-20240620 和 claude-3-5-sonnet-20241022)。这些模型将于 2025 年 10 月 28 日停用。我们建议迁移到 Claude Sonnet 4.5(claude-sonnet-4-5-20250929)以获得更好的性能和能力。请在模型弃用中了解更多信息。
- 提示缓存的 1 小时缓存持续时间现已正式发布。您现在可以在不使用测试版标头的情况下使用扩展缓存 TTL。请在提示缓存中了解更多信息。
- 我们在 Claude API 和 Amazon Bedrock 上为 Claude Sonnet 4 推出了 100 万令牌上下文窗口的测试版支持。
- 由于 API 上的加速限制,部分客户在 API 使用量急剧增加后可能会遇到 429(
rate_limit_error)错误。此前,在类似情况下会出现 529(overloaded_error)错误。
- 搜索结果内容块现已在 Claude API 和 Vertex AI 上正式发布。此功能为 RAG 应用程序提供带有正确来源归属的自然引用。不再需要测试版标头
search-results-2025-06-09。请在搜索结果中了解更多信息。
* - Opus 4.1 不允许同时指定 temperature 和 top_p 参数。请仅使用其中一个。
- 我们发布了
text_editor_20250728,这是一个更新的文本编辑器工具,修复了之前版本的一些问题,并添加了一个可选的 max_characters 参数,允许您在查看大文件时控制截断长度。
- 我们提高了 Claude API 上 Claude Opus 4 的速率限制,为您提供更多容量来使用 Claude 进行构建和扩展。对于具有使用层级 1-4 速率限制的客户,这些更改会立即应用于您的账户——无需任何操作。
- 我们已停用 Claude 2.0、Claude 2.1 和 Claude Sonnet 3 模型。对这些模型的所有请求现在将返回错误。请在模型弃用中了解更多信息。
- 我们提高了 Claude API 上 Claude Sonnet 4 的速率限制,为您提供更多容量来使用 Claude 进行构建和扩展。对于具有使用层级 1-4 速率限制的客户,这些更改会立即应用于您的账户——无需任何操作。
- 我们推出了搜索结果内容块测试版,为 RAG 应用程序提供自然引用。工具现在可以返回带有正确来源归属的搜索结果,Claude 将在其响应中自动引用这些来源——与网络搜索的引用质量相匹配。这消除了在自定义知识库应用程序中使用文档变通方法的需要。请在搜索结果中了解更多信息。要启用此功能,请使用测试版标头
search-results-2025-06-09。
- 我们宣布弃用 Claude Opus 3 模型。请在模型弃用中了解更多信息。
- 具有开发者角色的 Console 用户现在可以访问成本页面。此前,开发者角色允许访问使用情况页面,但不能访问成本页面。
- 我们推出了细粒度工具流式传输公开测试版,该功能使 Claude 能够在不进行缓冲/JSON 验证的情况下流式传输工具使用参数。要启用细粒度工具流式传输,请使用测试版标头
fine-grained-tool-streaming-2025-05-14。
- 我们推出了 Claude Opus 4 和 Claude Sonnet 4,这是我们具有扩展思考能力的最新模型。请在模型概述中了解更多信息。
- Claude 4 模型中扩展思考的默认行为会返回 Claude 完整思考过程的摘要,完整思考内容经过加密并在
thinking 块输出的 signature 字段中返回。
- 我们推出了交错思考公开测试版,该功能使 Claude 能够在工具调用之间进行思考。要启用交错思考,请使用测试版标头
interleaved-thinking-2025-05-14。
- 我们推出了 Files API 公开测试版,使您能够上传文件并在 Messages API 和代码执行工具中引用它们。
- 我们推出了代码执行工具公开测试版,该工具使 Claude 能够在安全的沙盒环境中执行 Python 代码。
- 我们推出了 MCP 连接器公开测试版,该功能允许您直接从 Messages API 连接到远程 MCP 服务器。
- 为了提高回答质量并减少工具错误,我们已将所有模型的 Messages API 中
top_p 核采样参数的默认值从 0.999 更改为 0.99。要恢复此更改,请将 top_p 设置为 0.999。
此外,当启用扩展思考时,您现在可以将 top_p 设置为 0.95 到 1 之间的值。
- 我们已将 Go SDK 从测试版升级为正式版。
- 我们在 Console 的使用情况页面中添加了分钟和小时级别的粒度,以及使用情况页面上的 429 错误率。
- 我们在 API 中推出了网络搜索工具,允许 Claude 访问来自网络的最新信息。请在网络搜索工具中了解更多信息。
- 缓存控制现在必须直接在
tool_result 和 document.source 的父 content 块中指定。为了向后兼容,如果在 tool_result.content 或 document.source.content 的最后一个块上检测到缓存控制,它将自动应用于父块。在 tool_result.content 和 document.source.content 中的任何其他块上设置缓存控制将导致验证错误。
- 我们在 Messages API 中为图像和 PDF 添加了 URL 源块。您现在可以直接通过 URL 引用图像和 PDF,而无需对其进行 base64 编码。请在视觉和 PDF 支持中了解更多信息。
- 我们在 Messages API 的
tool_choice 参数中添加了对 none 选项的支持,该选项可防止 Claude 调用任何工具。此外,在包含 tool_use 和 tool_result 块时,您不再需要提供任何 tools。
- 我们推出了与 OpenAI 兼容的 API 端点,允许您仅通过更改现有 OpenAI 集成中的 API 密钥、基础 URL 和模型名称来测试 Claude 模型。此兼容层支持核心聊天补全功能。请在 OpenAI SDK 兼容性中了解更多信息。
- 我们推出了 Claude Sonnet 3.7,这是我们迄今为止最智能的模型。Claude Sonnet 3.7 可以产生近乎即时的响应,或逐步展示其扩展思考过程。一个模型,两种思考方式。请在模型概述中了解所有 Claude 模型的更多信息。
- 我们为 Claude Haiku 3.5 添加了视觉支持,使该模型能够分析和理解图像。
- 我们发布了令牌高效的工具使用实现,提高了在 Claude 中使用工具时的整体性能。请在使用 Claude 进行工具使用中了解更多信息。
- 我们已将 Console 中新提示的默认温度从 0 更改为 1,以与 API 中的默认温度保持一致。现有已保存的提示不受影响。
- 我们发布了工具的更新版本,将文本编辑和 bash 工具与计算机使用系统提示解耦:
bash_20250124:功能与之前版本相同,但独立于计算机使用。不需要测试版标头。
text_editor_20250124:功能与之前版本相同,但独立于计算机使用。不需要测试版标头。
computer_20250124:更新的计算机使用工具,具有新的命令选项,包括 "hold_key"、"left_mouse_down"、"left_mouse_up"、"scroll"、"triple_click" 和 "wait"。此工具需要 "computer-use-2025-01-24" anthropic-beta 标头。
请在使用 Claude 进行工具使用中了解更多信息。
- 我们在所有 API 响应中添加了
anthropic-organization-id 响应标头。此标头提供与请求中使用的 API 密钥关联的组织 ID。
- 我们在 API 中推出了引用功能,允许 Claude 为信息提供来源归属。请在引用中了解更多信息。
- 我们在 Messages API 中添加了对纯文本文档和自定义内容文档的支持。
- 我们宣布弃用 Claude 2、Claude 2.1 和 Claude Sonnet 3 模型。请在模型弃用中了解更多信息。
- 我们更新了提示缓存,使其更易于使用。现在,当您设置缓存断点时,我们将自动从您最长的先前缓存前缀中读取。
- 您现在可以在使用工具时为 Claude 预设回复内容。
- 我们在消息批处理 API 中添加了对删除端点的支持。
以下功能现已在 Claude API 中正式发布:
我们还发布了新的官方 SDK:
- 我们更新了 Messages API 的速率限制。我们用新的每分钟输入令牌和每分钟输出令牌速率限制取代了每分钟令牌速率限制。请在速率限制中了解更多信息。
- 我们在 Workbench 中添加了对工具使用的支持。
- 我们为所有 Claude Sonnet 3.5 模型添加了 PDF 支持。请在 PDF 支持中了解更多信息。
- 我们已停用 Claude 1 和 Instant 模型。请在模型弃用中了解更多信息。
- 我们为新的 Claude Sonnet 3.5 添加了 PDF 支持。请在 PDF 支持中了解更多信息。
- 我们还添加了令牌计数功能,允许您在将消息发送给 Claude 之前确定消息中的令牌总数。请在令牌计数中了解更多信息。
- 我们在 API 中添加了 Anthropic 定义的计算机使用工具,可与新的 Claude Sonnet 3.5 配合使用。请在计算机使用工具中了解更多信息。
- Claude Sonnet 3.5,我们迄今为止最智能的模型,刚刚获得升级,现已在 Claude API 上可用。请在 Claude Sonnet 文档中了解更多信息。
- 消息批处理 API 现已推出测试版。在 Claude API 中以低 50% 的成本异步处理大批量查询。请在批处理中了解更多信息。
- 我们放宽了 Messages API 中
user/assistant 轮次顺序的限制。连续的 user/assistant 消息将被合并为单个消息而不是报错,并且我们不再要求第一条输入消息必须是 user 消息。
- 我们已弃用 Build 和 Scale 计划,转而采用标准功能套件(以前称为 Build),以及可通过销售获得的附加功能。请在我们的 API 定价信息中了解更多信息。
- 我们在 API 中添加了禁用并行工具使用的功能。在
tool_choice 字段中设置 disable_parallel_tool_use: true 以确保 Claude 最多使用一个工具。请在并行工具使用中了解更多信息。
- 我们在开发者控制台中添加了工作区功能。工作区允许您设置自定义支出或速率限制、对 API 密钥进行分组、按项目跟踪使用情况,以及通过用户角色控制访问权限。请在我们的博客文章中了解更多信息。
- 我们宣布弃用 Claude 1 模型。请在模型弃用中了解更多信息。
- 我们通过在 API 响应中返回 CORS 标头,添加了对在浏览器中使用 SDK 的支持。在 SDK 实例化中设置
dangerouslyAllowBrowser: true 以启用此功能。
- 我们已将 Claude Sonnet 3.5 的 8,192 令牌输出从测试版升级为正式版。
- 提示缓存现已作为测试版功能在 Claude API 中可用。缓存并重用提示,将延迟降低多达 80%,成本降低多达 90%。
- 使用新的
anthropic-beta: max-tokens-3-5-sonnet-2024-07-15 标头,从 Claude Sonnet 3.5 生成长度多达 8,192 令牌的输出。
- 在开发者控制台中使用 Claude 自动为您的提示生成测试用例。
- 在开发者控制台的新输出比较模式中并排比较不同提示的输出。
- 工具使用现已在 Claude API、Amazon Bedrock 和 Vertex AI 上正式发布。
- 我们的提示生成器工具现已在开发者控制台中可用。提示生成器可以轻松引导 Claude 生成针对您特定任务量身定制的高质量提示。请在我们的博客文章中了解更多信息。