Loading...
    • 开发者指南
    • API 参考
    • MCP
    • 资源
    • 更新日志
    Search...
    ⌘K
    入门
    Claude 简介快速开始
    模型与定价
    模型概览选择模型Claude 4.6 新特性迁移指南模型弃用定价
    使用 Claude 构建
    功能概览使用 Messages API处理停止原因提示词最佳实践
    上下文管理
    上下文窗口压缩上下文编辑
    能力
    提示缓存扩展思考自适应思考推理力度流式消息批量处理引用多语言支持Token 计数嵌入视觉PDF 支持Files API搜索结果结构化输出
    工具
    概览如何实现工具使用细粒度工具流式传输Bash 工具代码执行工具程序化工具调用计算机使用工具文本编辑器工具网页抓取工具网页搜索工具记忆工具工具搜索工具
    Agent Skills
    概览快速开始最佳实践企业级 Skills通过 API 使用 Skills
    Agent SDK
    概览快速开始TypeScript SDKTypeScript V2(预览版)Python SDK迁移指南
    API 中的 MCP
    MCP 连接器远程 MCP 服务器
    第三方平台上的 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    提示工程
    概览提示词生成器使用提示词模板提示词优化器清晰直接使用示例(多样本提示)让 Claude 思考(思维链)使用 XML 标签赋予 Claude 角色(系统提示词)链式复杂提示长上下文技巧扩展思考技巧
    测试与评估
    定义成功标准开发测试用例使用评估工具降低延迟
    加强安全护栏
    减少幻觉提高输出一致性防范越狱攻击流式拒绝减少提示词泄露保持 Claude 角色设定
    管理与监控
    Admin API 概览数据驻留工作空间用量与成本 APIClaude Code Analytics API零数据留存
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    模型与定价

    定价

    了解 Anthropic 的模型和功能定价结构

    本页提供 Anthropic 模型和功能的详细定价信息。所有价格均以美元计。

    如需了解最新定价信息,请访问 claude.com/pricing。

    模型定价

    下表显示了所有 Claude 模型在不同使用层级的定价:

    ModelBase Input Tokens5m Cache Writes1h Cache WritesCache Hits & RefreshesOutput Tokens
    Claude Opus 4.6$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
    Claude Opus 4.5$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
    Claude Opus 4.1$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
    Claude Opus 4$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
    Claude Sonnet 4.5$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Sonnet 4$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Sonnet 3.7 (deprecated)$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Haiku 4.5$1 / MTok$1.25 / MTok$2 / MTok$0.10 / MTok$5 / MTok
    Claude Haiku 3.5$0.80 / MTok$1 / MTok$1.6 / MTok$0.08 / MTok$4 / MTok
    Claude Opus 3 (deprecated)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
    Claude Haiku 3$0.25 / MTok$0.30 / MTok$0.50 / MTok$0.03 / MTok$1.25 / MTok

    MTok = 百万 token。"Base Input Tokens"列显示标准输入定价,"Cache Writes"和"Cache Hits"专用于提示缓存,"Output Tokens"显示输出定价。提示缓存提供 5 分钟(默认)和 1 小时两种缓存时长,以针对不同用例优化成本。

    上表反映了以下提示缓存定价倍率:

    • 5 分钟缓存写入 token 为基础输入 token 价格的 1.25 倍
    • 1 小时缓存写入 token 为基础输入 token 价格的 2 倍
    • 缓存读取 token 为基础输入 token 价格的 0.1 倍

    第三方平台定价

    Claude 模型可在 AWS Bedrock、Google Vertex AI 和 Microsoft Foundry 上使用。如需了解官方定价,请访问:

    • AWS Bedrock 定价
    • Google Vertex AI 定价
    • Microsoft Foundry 定价

    Claude 4.5 及更新模型的区域端点定价

    从 Claude Sonnet 4.5 和 Haiku 4.5 开始,AWS Bedrock 和 Google Vertex AI 提供两种端点类型:

    • 全球端点:跨区域动态路由,实现最大可用性
    • 区域端点:保证数据在特定地理区域内路由

    区域端点相比全球端点有 10% 的溢价。Claude API(1P)默认为全球路由,不受此变更影响。 Claude API 仅提供全球路由(等同于其他提供商的全球端点产品和定价)。

    适用范围:此定价结构适用于 Claude Sonnet 4.5、Haiku 4.5 及所有未来模型。早期模型(Claude Sonnet 4、Opus 4 及之前的版本)保留其现有定价。

    如需了解实现细节和代码示例:

    • AWS Bedrock 全球端点与区域端点
    • Google Vertex AI 全球端点与区域端点

    功能专项定价

    数据驻留定价

    对于 Claude Opus 4.6 及更新模型,通过 inference_geo 参数指定仅限美国推理会对所有 token 定价类别(包括输入 token、输出 token、缓存写入和缓存读取)产生 1.1 倍的乘数。全球路由(默认)使用标准定价。

    此定价仅适用于 Claude API(1P)。第三方平台有各自的区域定价——详情请参阅 AWS Bedrock、Google Vertex AI 和 Microsoft Foundry。早期模型无论 inference_geo 设置如何,均保留其现有定价。

    如需了解更多信息,请参阅我们的数据驻留文档。

    批量处理

    Batch API 允许异步处理大量请求,输入和输出 token 均享受 50% 的折扣。

    ModelBatch inputBatch output
    Claude Opus 4.6$2.50 / MTok$12.50 / MTok
    Claude Opus 4.5$2.50 / MTok$12.50 / MTok
    Claude Opus 4.1$7.50 / MTok$37.50 / MTok
    Claude Opus 4$7.50 / MTok$37.50 / MTok
    Claude Sonnet 4.5$1.50 / MTok$7.50 / MTok
    Claude Sonnet 4$1.50 / MTok$7.50 / MTok
    Claude Sonnet 3.7 (deprecated)$1.50 / MTok$7.50 / MTok
    Claude Haiku 4.5$0.50 / MTok$2.50 / MTok
    Claude Haiku 3.5$0.40 / MTok$2 / MTok
    Claude Opus 3 (deprecated)$7.50 / MTok$37.50 / MTok
    Claude Haiku 3$0.125 / MTok$0.625 / MTok

    如需了解更多关于批量处理的信息,请参阅我们的批量处理文档。

    长上下文定价

    使用 Claude Opus 4.6、Sonnet 4.5 或 Sonnet 4 并启用 1M token 上下文窗口时,超过 200K 输入 token 的请求将自动按高级长上下文费率收费:

    1M token 上下文窗口目前处于 beta 阶段,适用于使用层级 4 的组织和具有自定义速率限制的组织。1M token 上下文窗口仅适用于 Claude Opus 4.6、Sonnet 4.5 和 Sonnet 4。

    模型≤ 200K 输入 token> 200K 输入 token
    Claude Opus 4.6输入:$5 / MTok输入:$10 / MTok
    输出:$25 / MTok输出:$37.50 / MTok
    Claude Sonnet 4.5 / 4输入:$3 / MTok输入:$6 / MTok
    输出:$15 / MTok输出:$22.50 / MTok

    长上下文定价与其他定价修饰符叠加:

    • Batch API 50% 折扣适用于长上下文定价
    • 提示缓存倍率在长上下文定价基础上叠加
    • 数据驻留 1.1 倍乘数在长上下文定价基础上叠加

    即使启用了 beta 标志,少于 200K 输入 token 的请求仍按标准费率收费。如果您的请求超过 200K 输入 token,所有 token 均按高级定价收费。

    200K 阈值仅基于输入 token(包括缓存读取/写入)。输出 token 数量不影响定价层级选择,但当超过输入阈值时,输出 token 将按较高费率收费。

    要检查您的 API 请求是否按 1M 上下文窗口费率收费,请查看 API 响应中的 usage 对象:

    {
      "usage": {
        "input_tokens": 250000,
        "cache_creation_input_tokens": 0,
        "cache_read_input_tokens": 0,
        "output_tokens": 500
      }
    }

    通过以下字段求和计算总输入 token:

    • input_tokens
    • cache_creation_input_tokens(如果使用提示缓存)
    • cache_read_input_tokens(如果使用提示缓存)

    如果总数超过 200,000 个 token,则整个请求按 1M 上下文费率计费。

    如需了解更多关于 usage 对象的信息,请参阅 API 响应文档。

    工具使用定价

    Tool use requests are priced based on:

    1. The total number of input tokens sent to the model (including in the tools parameter)
    2. The number of output tokens generated
    3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

    Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

    The additional tokens from tool use come from:

    • The tools parameter in API requests (tool names, descriptions, and schemas)
    • tool_use content blocks in API requests and responses
    • tool_result content blocks in API requests

    When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

    ModelTool choiceTool use system prompt token count
    Claude Opus 4.6auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Opus 4.5auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Opus 4.1auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Opus 4auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 4.5auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 4auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 3.7 (deprecated)auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Haiku 4.5auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Haiku 3.5auto, none
    any, tool
    264 tokens
    340 tokens
    Claude Opus 3 (deprecated)auto, none
    any, tool
    530 tokens
    281 tokens
    Claude Sonnet 3auto, none
    any, tool
    159 tokens
    235 tokens
    Claude Haiku 3auto, none
    any, tool
    264 tokens
    340 tokens

    These token counts are added to your normal input and output tokens to calculate the total cost of a request.

    如需了解当前各模型价格,请参阅上方的模型定价部分。

    如需了解更多关于工具使用的实现和最佳实践,请参阅我们的工具使用文档。

    特定工具定价

    Bash 工具

    The bash tool adds 245 input tokens to your API calls.

    Additional tokens are consumed by:

    • Command outputs (stdout/stderr)
    • Error messages
    • Large file contents

    完整定价详情请参阅工具使用定价。

    代码执行工具

    Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container.

    Each organization receives 1,550 free hours of usage with the code execution tool per month. Additional usage beyond the first 1,550 hours is billed at $0.05 per hour, per container.

    文本编辑器工具

    The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.

    In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

    ToolAdditional input tokens
    text_editor_20250429 (Claude 4.x)700 tokens
    text_editor_20250124 (Claude Sonnet 3.7 (deprecated))700 tokens

    完整定价详情请参阅工具使用定价。

    网页搜索工具

    Web search usage is charged in addition to token usage:

    "usage": {
      "input_tokens": 105,
      "output_tokens": 6039,
      "cache_read_input_tokens": 7123,
      "cache_creation_input_tokens": 7345,
      "server_tool_use": {
        "web_search_requests": 1
      }
    }

    Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.

    Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

    网页获取工具

    Web fetch usage has no additional charges beyond standard token costs:

    "usage": {
      "input_tokens": 25039,
      "output_tokens": 931,
      "cache_read_input_tokens": 0,
      "cache_creation_input_tokens": 0,
      "server_tool_use": {
        "web_fetch_requests": 1
      }
    }

    The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.

    To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.

    Example token usage for typical content:

    • Average web page (10KB): ~2,500 tokens
    • Large documentation page (100KB): ~25,000 tokens
    • Research paper PDF (500KB): ~125,000 tokens

    计算机使用工具

    Computer use follows the standard tool use pricing. When using the computer use tool:

    System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

    Computer use tool token usage:

    ModelInput tokens per tool definition
    Claude 4.x models735 tokens
    Claude Sonnet 3.7 (deprecated)735 tokens

    Additional token consumption:

    • Screenshot images (see Vision pricing)
    • Tool execution results returned to Claude

    If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

    智能体用例定价示例

    在使用 Claude 构建应用时,了解智能体应用的定价至关重要。这些真实示例可以帮助您估算不同智能体模式的成本。

    客户支持智能体示例

    构建客户支持智能体时,成本可能如下分解:

    处理 10,000 个支持工单的示例计算:

    • 每次对话平均约 3,700 个 token
    • 使用 Claude Opus 4.6,输入 $5/MTok,输出 $25/MTok
    • 总成本:每 10,000 个工单约 $37.00

    如需了解此计算的详细说明,请参阅我们的客户支持智能体指南。

    通用智能体工作流定价

    对于具有多个步骤的更复杂智能体架构:

    1. 初始请求处理

      • 典型输入:500-1,000 个 token
      • 处理成本:每次请求约 $0.003
    2. 记忆和上下文检索

      • 检索上下文:2,000-5,000 个 token
      • 每次检索成本:每次操作约 $0.015
    3. 行动规划和执行

      • 规划 token:1,000-2,000
      • 执行反馈:500-1,000
      • 综合成本:每次操作约 $0.045

    如需了解智能体定价模式的综合指南,请参阅我们的智能体用例指南。

    成本优化策略

    使用 Claude 构建智能体时:

    1. 使用合适的模型:简单任务选择 Haiku,复杂推理选择 Sonnet
    2. 实施提示缓存:降低重复上下文的成本
    3. 批量操作:对非时间敏感的任务使用 Batch API
    4. 监控使用模式:跟踪 token 消耗以发现优化机会

    对于高流量智能体应用,请考虑联系我们的企业销售团队获取定制定价方案。

    其他定价注意事项

    速率限制

    速率限制因使用层级而异,影响您可以发出的请求数量:

    • 层级 1:入门级使用,基本限制
    • 层级 2:为增长中的应用提供更高限制
    • 层级 3:为成熟应用提供更高限制
    • 层级 4:最高标准限制
    • 企业版:可提供自定义限制

    如需了解详细的速率限制信息,请参阅我们的速率限制文档。

    如需更高的速率限制或定制定价方案,请联系我们的销售团队。

    批量折扣

    高用量用户可能享有批量折扣。这些折扣按具体情况协商。

    • 标准层级使用上述定价
    • 企业客户可联系销售获取定制定价
    • 可能提供学术和研究折扣

    企业定价

    针对有特定需求的企业客户:

    • 自定义速率限制
    • 批量折扣
    • 专属支持
    • 定制条款

    请通过 [email protected] 或 Claude 控制台联系我们的销售团队,讨论企业定价方案。

    计费和付款

    • 按月根据实际使用量计费
    • 以美元结算
    • 提供信用卡和发票付款选项
    • 可在 Claude 控制台中查看使用量

    常见问题

    token 使用量如何计算?

    Token 是模型处理的文本片段。粗略估计,1 个 token 大约等于 4 个英文字符或 0.75 个英文单词。确切数量因语言和内容类型而异。

    是否有免费层级或试用?

    新用户会获得少量免费额度来测试 API。如需了解企业评估的延长试用信息,请联系销售。

    折扣如何叠加?

    Batch API 和提示缓存折扣可以组合使用。例如,同时使用这两项功能相比标准 API 调用可以显著节省成本。

    接受哪些付款方式?

    标准账户接受主要信用卡。企业客户可安排发票和其他付款方式。

    如有其他定价问题,请联系 [email protected]。

    Was this page helpful?