本页面提供了 Anthropic 模型和功能的详细定价信息。所有价格均以美元计。
如需最新定价信息,请访问 claude.com/pricing。
下表显示了所有 Claude 模型在不同使用层级的定价:
| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.7 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.6 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.5 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.6 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
Opus 4.7 使用与之前模型相比的新分词器,有助于提高其在广泛任务上的性能。这个新分词器对于相同的固定文本可能会使用多达 35% 的令牌。
Claude 模型可在 AWS Bedrock、Google Vertex AI 和 Microsoft Foundry 上使用。如需官方定价,请访问:
Claude 4.5 及更新模型的区域和多区域端点定价
从 Claude Sonnet 4.5 和 Haiku 4.5 开始:
区域和多区域端点包括相对于全局端点的 10% 溢价。Claude API (1P) 默认是全局的;对于 1P 数据驻留选项和定价,请参阅下面的数据驻留定价。
范围: 此定价结构适用于 Claude Sonnet 4.5、Haiku 4.5 和所有未来模型。早期模型(Claude Sonnet 4(已弃用)、Opus 4(已弃用)及之前的版本)保留其现有定价。
有关实现详情和代码示例:
提示缓存通过在 API 调用中重用之前处理过的提示部分来降低成本和延迟。API 不是在每个请求上重新处理相同的大型系统提示、文档或对话历史,而是以标准输入价格的一小部分从缓存中读取。
有两种方式启用提示缓存:
cache_control 字段。系统在对话增长时自动管理缓存断点。这是大多数用例的推荐起点。cache_control 直接放在单个内容块上,以精细控制缓存的内容。提示缓存相对于基础输入令牌率使用以下定价倍数:
| 缓存操作 | 倍数 | 持续时间 |
|---|---|---|
| 5 分钟缓存写入 | 1.25x 基础输入价格 | 缓存有效期为 5 分钟 |
| 1 小时缓存写入 | 2x 基础输入价格 | 缓存有效期为 1 小时 |
| 缓存读取(命中) | 0.1x 基础输入价格 | 与前面的写入相同的持续时间 |
缓存写入令牌在内容首次存储时收费。缓存读取令牌在后续请求检索缓存内容时收费。缓存命中的成本是标准输入价格的 10%,这意味着对于 5 分钟的持续时间(1.25x 写入),仅在一次缓存读取后缓存就会付费,或对于 1 小时的持续时间(2x 写入),在两次缓存读取后付费。
这些倍数与其他定价修饰符叠加,包括 Batch API 折扣和数据驻留。
有关实现详情、支持的模型和代码示例,请参阅提示缓存文档。
对于 Claude Opus 4.7、Claude Opus 4.6 和更新的模型,通过 inference_geo 参数指定仅限美国的推理会对所有令牌定价类别(包括输入令牌、输出令牌、缓存写入和缓存读取)产生 1.1x 倍数。全局路由(默认)使用标准定价。
这仅适用于 Claude API (1P)。第三方平台有自己的区域定价。有关详情,请参阅 AWS Bedrock 和 Google Vertex AI。早期模型无论 inference_geo 设置如何都保留其现有定价。
有关更多信息,请参阅数据驻留文档。
快速模式(测试版:研究预览)对于 Claude Opus 4.6 提供显著更快的输出,价格为高级定价(6 倍标准费率)。快速模式定价适用于整个上下文窗口,包括超过 200k 输入令牌的请求。目前在 Opus 4.6 上支持:
| 输入 | 输出 |
|---|---|
| $30 / MTok | $150 / MTok |
快速模式定价与其他定价修饰符叠加:
快速模式不可用于 Batch API。
有关更多信息,请参阅快速模式文档。
Batch API 允许异步处理大量请求,对输入和输出令牌都享受 50% 的折扣。
| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.7 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.6 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.5 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.6 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
有关批处理的更多信息,请参阅批处理文档。
Claude Mythos Preview、Opus 4.7、Opus 4.6 和 Sonnet 4.6 包括完整的100 万令牌上下文窗口,价格为标准定价。(90 万令牌的请求按与 9k 令牌请求相同的每令牌费率计费。)提示缓存和批处理折扣在整个上下文窗口中按标准费率应用。
Tool use requests are priced based on:
tools parameter)Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
tools parameter in API requests (tool names, descriptions, and schemas)tool_use content blocks in API requests and responsestool_result content blocks in API requestsWhen you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.7 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
有关当前的每模型价格,请参阅模型定价部分。
有关工具使用实现和最佳实践的更多信息,请参阅工具使用文档。
The bash tool adds 245 input tokens to your API calls.
Additional tokens are consumed by:
有关完整的定价详情,请参阅工具使用定价。
Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.
When used without these tools, code execution is billed by execution time, tracked separately from token usage:
Code execution usage is tracked in the response:
"usage": {
"input_tokens": 105,
"output_tokens": 239,
"server_tool_use": {
"code_execution_requests": 1
}
}The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.
In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
有关完整的定价详情,请参阅工具使用定价。
Web search usage is charged in addition to token usage:
"usage": {
"input_tokens": 105,
"output_tokens": 6039,
"cache_read_input_tokens": 7123,
"cache_creation_input_tokens": 7345,
"server_tool_use": {
"web_search_requests": 1
}
}Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Web fetch usage has no additional charges beyond standard token costs:
"usage": {
"input_tokens": 25039,
"output_tokens": 931,
"cache_read_input_tokens": 0,
"cache_creation_input_tokens": 0,
"server_tool_use": {
"web_fetch_requests": 1
}
}The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.
To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
Additional token consumption:
If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Claude 托管代理按两个维度计费:令牌和会话运行时。
Claude 托管代理会话消耗的所有令牌按上面模型定价中显示的费率计费。提示缓存倍数同样适用。在会话内触发的网络搜索会产生标准的每 1,000 次搜索 $10 的费用。
以下 Messages API 修饰符不适用于 Claude 托管代理会话:
| 修饰符 | 为什么不适用 |
|---|---|
| Batch API 折扣 | 会话是有状态和交互式的。没有批处理模式。 |
| 快速模式高级 | 推理速度由运行时管理。 |
| 数据驻留倍数 | inference_geo 是 Messages API 请求字段。 |
| 长上下文高级 | 上下文窗口由运行时管理。 |
| 第三方平台定价 | Claude 托管代理仅通过 Claude API 直接提供。 |
| SKU | 费率 | 计量 |
|---|---|---|
| 会话运行时 | 每会话小时 $0.08 | running 状态持续时间 |
运行时精确到毫秒,仅在会话状态为 running 时累积。花费在 idle(等待您的下一条消息或工具确认)、rescheduling 或 terminated 上的时间不计入运行时。
使用 Claude 托管代理时,会话运行时替代了代码执行容器小时计费模式。您不会在会话运行时之外单独为容器小时计费。
一个使用 Claude Opus 4.7 的一小时编码会话,消耗 50,000 个输入令牌和 15,000 个输出令牌:
| 行项目 | 计算 | 成本 |
|---|---|---|
| 输入令牌 | 50,000 × $5 / 1,000,000 | $0.25 |
| 输出令牌 | 15,000 × $25 / 1,000,000 | $0.375 |
| 会话运行时 | 1.0 小时 × $0.08 | $0.08 |
| 总计 | $0.705 |
如果提示缓存处于活动状态且 40,000 个输入令牌是缓存读取:
| 行项目 | 计算 | 成本 |
|---|---|---|
| 未缓存的输入令牌 | 10,000 × $5 / 1,000,000 | $0.05 |
| 缓存读取令牌 | 40,000 × $5 × 0.1 / 1,000,000 | $0.02 |
| 输出令牌 | 15,000 × $25 / 1,000,000 | $0.375 |
| 会话运行时 | 1.0 小时 × $0.08 | $0.08 |
| 总计 | $0.525 |
处理 10,000 张支持工单的示例计算:
有关此计算的详细演练,请参阅客户支持代理指南。
在使用 Claude 构建代理时:
对于高容量代理应用,请联系企业销售团队以获取自定义定价安排。
速率限制因使用层级而异,影响您可以发出的请求数量:
有关详细的速率限制信息,请参阅速率限制文档。
如需更高的速率限制或自定义定价安排,请联系销售团队。
高容量用户可能可以获得批量折扣。这些是逐案例协商的。
对于有特定需求的企业客户:
通过销售@anthropic.com或通过 Claude Console 联系销售团队以讨论企业定价选项。
令牌使用如何计算?
令牌是模型处理的文本片段。粗略估计,1 个令牌约等于英文中的 4 个字符或 0.75 个单词。确切的计数因语言和内容类型而异。
是否有免费层或试用?
新用户获得少量免费积分来测试 API。联系销售以了解有关企业评估的扩展试用信息。
折扣如何叠加?
Batch API 和提示缓存折扣可以组合。例如,同时使用这两个功能与标准 API 调用相比可以提供显著的成本节省。有关倍数如何相互作用的信息,请参阅提示缓存定价。
接受哪些付款方式?
标准账户接受主要信用卡。企业客户可以安排发票和其他付款方式。
如有关于定价的其他问题,请联系 [email protected]。
Was this page helpful?