Loading...
  • 构建
  • 管理
  • 模型与定价
  • 客户端 SDK
  • API 参考
Search...
⌘K
模型
模型概览选择模型Claude Opus 4.7 新特性迁移指南模型弃用模型卡片系统提示
定价
定价
Log in
定价
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
模型与定价/定价

定价

了解 Anthropic 的模型和功能定价结构

本页面提供了 Anthropic 模型和功能的详细定价信息。所有价格均以美元计。

如需最新定价信息,请访问 claude.com/pricing。

模型定价

下表显示了所有 Claude 模型在不同使用层级的定价:

ModelBase Input Tokens5m Cache Writes1h Cache WritesCache Hits & RefreshesOutput Tokens
Claude Opus 4.7$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.6$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.5$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.1$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Opus 4$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Sonnet 4.6$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4.5$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 3.7 (deprecated)$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Haiku 4.5$1 / MTok$1.25 / MTok$2 / MTok$0.10 / MTok$5 / MTok
Claude Haiku 3.5$0.80 / MTok$1 / MTok$1.6 / MTok$0.08 / MTok$4 / MTok
Claude Opus 3 (deprecated)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Haiku 3$0.25 / MTok$0.30 / MTok$0.50 / MTok$0.03 / MTok$1.25 / MTok

MTok = 百万个令牌。"Base Input Tokens"(基础输入令牌)列显示标准输入定价,"Cache Writes"(缓存写入)和"Cache Hits"(缓存命中)特定于提示缓存,"Output Tokens"(输出令牌)显示输出定价。有关缓存列和定价倍数的说明,请参阅下面的提示缓存定价。

Opus 4.7 使用与之前模型相比的新分词器,有助于提高其在广泛任务上的性能。这个新分词器对于相同的固定文本可能会使用多达 35% 的令牌。

第三方平台定价

Claude 模型可在 AWS Bedrock、Google Vertex AI 和 Microsoft Foundry 上使用。如需官方定价,请访问:

  • AWS Bedrock 定价
  • Google Vertex AI 定价
  • Microsoft Foundry 定价

Claude 4.5 及更新模型的区域和多区域端点定价

从 Claude Sonnet 4.5 和 Haiku 4.5 开始:

  • AWS Bedrock 提供两种端点类型:全局端点(用于最大可用性的动态路由)和区域端点(保证通过特定地理区域的数据路由)。
  • Google Vertex AI 提供三种端点类型:全局端点、多区域端点(在地理区域内的动态路由)和区域端点。

区域和多区域端点包括相对于全局端点的 10% 溢价。Claude API (1P) 默认是全局的;对于 1P 数据驻留选项和定价,请参阅下面的数据驻留定价。

范围: 此定价结构适用于 Claude Sonnet 4.5、Haiku 4.5 和所有未来模型。早期模型(Claude Sonnet 4(已弃用)、Opus 4(已弃用)及之前的版本)保留其现有定价。

有关实现详情和代码示例:

  • AWS Bedrock 全局与区域端点
  • Google Vertex AI 全局、多区域和区域端点

功能特定定价

提示缓存

提示缓存通过在 API 调用中重用之前处理过的提示部分来降低成本和延迟。API 不是在每个请求上重新处理相同的大型系统提示、文档或对话历史,而是以标准输入价格的一小部分从缓存中读取。

有两种方式启用提示缓存:

  • 自动缓存: 在请求的顶级添加单个 cache_control 字段。系统在对话增长时自动管理缓存断点。这是大多数用例的推荐起点。
  • 显式缓存断点: 将 cache_control 直接放在单个内容块上,以精细控制缓存的内容。

提示缓存相对于基础输入令牌率使用以下定价倍数:

缓存操作倍数持续时间
5 分钟缓存写入1.25x 基础输入价格缓存有效期为 5 分钟
1 小时缓存写入2x 基础输入价格缓存有效期为 1 小时
缓存读取(命中)0.1x 基础输入价格与前面的写入相同的持续时间

缓存写入令牌在内容首次存储时收费。缓存读取令牌在后续请求检索缓存内容时收费。缓存命中的成本是标准输入价格的 10%,这意味着对于 5 分钟的持续时间(1.25x 写入),仅在一次缓存读取后缓存就会付费,或对于 1 小时的持续时间(2x 写入),在两次缓存读取后付费。

这些倍数与其他定价修饰符叠加,包括 Batch API 折扣和数据驻留。

有关实现详情、支持的模型和代码示例,请参阅提示缓存文档。

数据驻留定价

对于 Claude Opus 4.7、Claude Opus 4.6 和更新的模型,通过 inference_geo 参数指定仅限美国的推理会对所有令牌定价类别(包括输入令牌、输出令牌、缓存写入和缓存读取)产生 1.1x 倍数。全局路由(默认)使用标准定价。

这仅适用于 Claude API (1P)。第三方平台有自己的区域定价。有关详情,请参阅 AWS Bedrock 和 Google Vertex AI。早期模型无论 inference_geo 设置如何都保留其现有定价。

有关更多信息,请参阅数据驻留文档。

快速模式定价

快速模式(测试版:研究预览)对于 Claude Opus 4.6 提供显著更快的输出,价格为高级定价(6 倍标准费率)。快速模式定价适用于整个上下文窗口,包括超过 200k 输入令牌的请求。目前在 Opus 4.6 上支持:

输入输出
$30 / MTok$150 / MTok

快速模式定价与其他定价修饰符叠加:

  • 提示缓存倍数适用于快速模式定价之上
  • 数据驻留倍数适用于快速模式定价之上

快速模式不可用于 Batch API。

有关更多信息,请参阅快速模式文档。

批处理

Batch API 允许异步处理大量请求,对输入和输出令牌都享受 50% 的折扣。

ModelBatch inputBatch output
Claude Opus 4.7$2.50 / MTok$12.50 / MTok
Claude Opus 4.6$2.50 / MTok$12.50 / MTok
Claude Opus 4.5$2.50 / MTok$12.50 / MTok
Claude Opus 4.1$7.50 / MTok$37.50 / MTok
Claude Opus 4$7.50 / MTok$37.50 / MTok
Claude Sonnet 4.6$1.50 / MTok$7.50 / MTok
Claude Sonnet 4.5$1.50 / MTok$7.50 / MTok
Claude Sonnet 4$1.50 / MTok$7.50 / MTok
Claude Sonnet 3.7 (deprecated)$1.50 / MTok$7.50 / MTok
Claude Haiku 4.5$0.50 / MTok$2.50 / MTok
Claude Haiku 3.5$0.40 / MTok$2 / MTok
Claude Opus 3 (deprecated)$7.50 / MTok$37.50 / MTok
Claude Haiku 3$0.125 / MTok$0.625 / MTok

有关批处理的更多信息,请参阅批处理文档。

长上下文定价

Claude Mythos Preview、Opus 4.7、Opus 4.6 和 Sonnet 4.6 包括完整的100 万令牌上下文窗口,价格为标准定价。(90 万令牌的请求按与 9k 令牌请求相同的每令牌费率计费。)提示缓存和批处理折扣在整个上下文窗口中按标准费率应用。

工具使用定价

Tool use requests are priced based on:

  1. The total number of input tokens sent to the model (including in the tools parameter)
  2. The number of output tokens generated
  3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

The additional tokens from tool use come from:

  • The tools parameter in API requests (tool names, descriptions, and schemas)
  • tool_use content blocks in API requests and responses
  • tool_result content blocks in API requests

When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

ModelTool choiceTool use system prompt token count
Claude Opus 4.7auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.6auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.1auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.6auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 3.7 (deprecated)auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 3.5auto, none
any, tool
264 tokens
340 tokens
Claude Opus 3 (deprecated)auto, none
any, tool
530 tokens
281 tokens
Claude Sonnet 3auto, none
any, tool
159 tokens
235 tokens
Claude Haiku 3auto, none
any, tool
264 tokens
340 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request.

有关当前的每模型价格,请参阅模型定价部分。

有关工具使用实现和最佳实践的更多信息,请参阅工具使用文档。

特定工具定价

Bash 工具

The bash tool adds 245 input tokens to your API calls.

Additional tokens are consumed by:

  • Command outputs (stdout/stderr)
  • Error messages
  • Large file contents

有关完整的定价详情,请参阅工具使用定价。

代码执行工具

Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.

When used without these tools, code execution is billed by execution time, tracked separately from token usage:

  • Execution time has a minimum of 5 minutes
  • Each organization receives 1,550 free hours of usage per month
  • Additional usage beyond 1,550 hours is billed at $0.05 per hour, per container
  • If files are included in the request, execution time is billed even if the tool is not invoked, due to files being preloaded onto the container

Code execution usage is tracked in the response:

"usage": {
  "input_tokens": 105,
  "output_tokens": 239,
  "server_tool_use": {
    "code_execution_requests": 1
  }
}

文本编辑器工具

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.

In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

ToolAdditional input tokens
text_editor_20250429 (Claude 4.x)700 tokens
text_editor_20250124 (Claude Sonnet 3.7 (deprecated))700 tokens

有关完整的定价详情,请参阅工具使用定价。

网络搜索工具

Web search usage is charged in addition to token usage:

"usage": {
  "input_tokens": 105,
  "output_tokens": 6039,
  "cache_read_input_tokens": 7123,
  "cache_creation_input_tokens": 7345,
  "server_tool_use": {
    "web_search_requests": 1
  }
}

Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.

Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

网络获取工具

Web fetch usage has no additional charges beyond standard token costs:

"usage": {
  "input_tokens": 25039,
  "output_tokens": 931,
  "cache_read_input_tokens": 0,
  "cache_creation_input_tokens": 0,
  "server_tool_use": {
    "web_fetch_requests": 1
  }
}

The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.

To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.

Example token usage for typical content:

  • Average web page (10 kB): ~2,500 tokens
  • Large documentation page (100 kB): ~25,000 tokens
  • Research paper PDF (500 kB): ~125,000 tokens

计算机使用工具

Computer use follows the standard tool use pricing. When using the computer use tool:

System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

Computer use tool token usage:

ModelInput tokens per tool definition
Claude 4.x models735 tokens
Claude Sonnet 3.7 (deprecated)735 tokens

Additional token consumption:

  • Screenshot images (see Vision pricing)
  • Tool execution results returned to Claude

If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Claude 托管代理定价

Claude 托管代理按两个维度计费:令牌和会话运行时。

令牌

Claude 托管代理会话消耗的所有令牌按上面模型定价中显示的费率计费。提示缓存倍数同样适用。在会话内触发的网络搜索会产生标准的每 1,000 次搜索 $10 的费用。

以下 Messages API 修饰符不适用于 Claude 托管代理会话:

修饰符为什么不适用
Batch API 折扣会话是有状态和交互式的。没有批处理模式。
快速模式高级推理速度由运行时管理。
数据驻留倍数inference_geo 是 Messages API 请求字段。
长上下文高级上下文窗口由运行时管理。
第三方平台定价Claude 托管代理仅通过 Claude API 直接提供。

会话运行时

SKU费率计量
会话运行时每会话小时 $0.08running 状态持续时间

运行时精确到毫秒,仅在会话状态为 running 时累积。花费在 idle(等待您的下一条消息或工具确认)、rescheduling 或 terminated 上的时间不计入运行时。

使用 Claude 托管代理时,会话运行时替代了代码执行容器小时计费模式。您不会在会话运行时之外单独为容器小时计费。

工作示例

一个使用 Claude Opus 4.7 的一小时编码会话,消耗 50,000 个输入令牌和 15,000 个输出令牌:

行项目计算成本
输入令牌50,000 × $5 / 1,000,000$0.25
输出令牌15,000 × $25 / 1,000,000$0.375
会话运行时1.0 小时 × $0.08$0.08
总计$0.705

如果提示缓存处于活动状态且 40,000 个输入令牌是缓存读取:

行项目计算成本
未缓存的输入令牌10,000 × $5 / 1,000,000$0.05
缓存读取令牌40,000 × $5 × 0.1 / 1,000,000$0.02
输出令牌15,000 × $25 / 1,000,000$0.375
会话运行时1.0 小时 × $0.08$0.08
总计$0.525

处理 10,000 张支持工单的示例计算:

  • 每次对话平均约 3,700 个令牌
  • 使用 Claude Haiku 4.5,输入 $1/MTok,输出 $5/MTok
  • 总成本:每 10,000 张工单约 $37.00

有关此计算的详细演练,请参阅客户支持代理指南。

其他定价考虑

成本优化策略

在使用 Claude 构建代理时:

  1. 使用适当的模型: 为简单任务选择 Haiku,为复杂推理选择 Sonnet
  2. 实现提示缓存: 减少重复上下文的成本
  3. 批处理操作: 对非时间敏感的任务使用 Batch API
  4. 监控使用模式: 跟踪令牌消耗以识别优化机会

对于高容量代理应用,请联系企业销售团队以获取自定义定价安排。

速率限制

速率限制因使用层级而异,影响您可以发出的请求数量:

  • 第 1 层: 具有基本限制的入门级使用
  • 第 2 层: 为增长中的应用增加限制
  • 第 3 层: 为已建立的应用提供更高限制
  • 第 4 层: 最大标准限制
  • 企业: 可用自定义限制

有关详细的速率限制信息,请参阅速率限制文档。

如需更高的速率限制或自定义定价安排,请联系销售团队。

批量折扣

高容量用户可能可以获得批量折扣。这些是逐案例协商的。

  • 标准层使用上面显示的定价
  • 企业客户可以联系销售以获取自定义定价
  • 学术和研究折扣可能可用

企业定价

对于有特定需求的企业客户:

  • 自定义速率限制
  • 批量折扣
  • 专属支持
  • 自定义条款

通过销售@anthropic.com或通过 Claude Console 联系销售团队以讨论企业定价选项。

计费和付款

  • 计费基于实际月度使用情况
  • 所有付款均以美元计
  • 信用卡和发票选项可用
  • 使用情况跟踪可在 Claude Console 中获得

常见问题

令牌使用如何计算?

令牌是模型处理的文本片段。粗略估计,1 个令牌约等于英文中的 4 个字符或 0.75 个单词。确切的计数因语言和内容类型而异。

是否有免费层或试用?

新用户获得少量免费积分来测试 API。联系销售以了解有关企业评估的扩展试用信息。

折扣如何叠加?

Batch API 和提示缓存折扣可以组合。例如,同时使用这两个功能与标准 API 调用相比可以提供显著的成本节省。有关倍数如何相互作用的信息,请参阅提示缓存定价。

接受哪些付款方式?

标准账户接受主要信用卡。企业客户可以安排发票和其他付款方式。

如有关于定价的其他问题,请联系 [email protected]。

Was this page helpful?

  • Claude 托管代理定价