Loading...
  • 建構
  • 管理
  • 模型與定價
  • 客戶端 SDK
  • API 參考
Search...
⌘K
模型
模型概覽選擇模型Claude Opus 4.7 新功能遷移指南模型棄用模型卡系統提示
定價
定價
Log in
定價
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
模型與定價/定價

定價

了解 Anthropic 的模型和功能定價結構

本頁提供 Anthropic 模型和功能的詳細定價資訊。所有價格均以美元計。

如需最新定價資訊,請訪問 claude.com/pricing。

模型定價

下表顯示所有 Claude 模型在不同使用層級的定價:

ModelBase Input Tokens5m Cache Writes1h Cache WritesCache Hits & RefreshesOutput Tokens
Claude Opus 4.7$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.6$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.5$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.1$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Opus 4$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Sonnet 4.6$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4.5$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 3.7 (deprecated)$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Haiku 4.5$1 / MTok$1.25 / MTok$2 / MTok$0.10 / MTok$5 / MTok
Claude Haiku 3.5$0.80 / MTok$1 / MTok$1.6 / MTok$0.08 / MTok$4 / MTok
Claude Opus 3 (deprecated)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Haiku 3$0.25 / MTok$0.30 / MTok$0.50 / MTok$0.03 / MTok$1.25 / MTok

MTok = 百萬個 token。「基礎輸入 Token」欄位顯示標準輸入定價,「快取寫入」和「快取命中」特定於提示快取,「輸出 Token」顯示輸出定價。請參閱下面的提示快取定價以了解快取欄位和定價倍數的說明。

Opus 4.7 使用與先前模型相比的新 tokenizer,有助於提高其在各種任務上的性能。這個新 tokenizer 對於相同的固定文本可能會使用多達 35% 的 token。

第三方平台定價

Claude 模型可在 AWS Bedrock、Google Vertex AI 和 Microsoft Foundry 上使用。如需官方定價,請訪問:

  • AWS Bedrock 定價
  • Google Vertex AI 定價
  • Microsoft Foundry 定價

Claude 4.5 模型及更新版本的區域和多區域端點定價

從 Claude Sonnet 4.5 和 Haiku 4.5 開始:

  • AWS Bedrock 提供兩種端點類型:全球端點(用於最大可用性的動態路由)和區域端點(保證通過特定地理區域的數據路由)。
  • Google Vertex AI 提供三種端點類型:全球端點、多區域端點(在地理區域內的動態路由)和區域端點。

區域和多區域端點包括相對於全球端點的 10% 溢價。Claude API (1P) 預設為全球性;如需 1P 數據駐留選項和定價,請參閱下面的數據駐留定價。

範圍: 此定價結構適用於 Claude Sonnet 4.5、Haiku 4.5 和所有未來模型。較早的模型(Claude Sonnet 4(已棄用)、Opus 4(已棄用)和之前的版本)保留其現有定價。

如需實施詳情和代碼示例:

  • AWS Bedrock 全球與區域端點
  • Google Vertex AI 全球、多區域和區域端點

功能特定定價

提示快取

提示快取通過在 API 呼叫中重複使用先前處理的提示部分來降低成本和延遲。API 不是在每次請求時重新處理相同的大型系統提示、文檔或對話歷史記錄,而是以標準輸入價格的一小部分從快取中讀取。

有兩種方式可以啟用提示快取:

  • 自動快取: 在請求的頂層添加單個 cache_control 欄位。系統會在對話增長時自動管理快取斷點。這是大多數使用情況的推薦起點。
  • 顯式快取斷點: 將 cache_control 直接放在各個內容塊上,以精細控制確切的快取內容。

提示快取相對於基礎輸入 token 速率使用以下定價倍數:

快取操作倍數持續時間
5 分鐘快取寫入1.25 倍基礎輸入價格快取有效期為 5 分鐘
1 小時快取寫入2 倍基礎輸入價格快取有效期為 1 小時
快取讀取(命中)0.1 倍基礎輸入價格與前面寫入相同的持續時間

快取寫入 token 在內容首次存儲時計費。快取讀取 token 在後續請求檢索快取內容時計費。快取命中成本為標準輸入價格的 10%,這意味著對於 5 分鐘持續時間(1.25 倍寫入),快取在一次快取讀取後就能獲得回報,或對於 1 小時持續時間(2 倍寫入),在兩次快取讀取後就能獲得回報。

這些倍數與其他定價修飾符堆疊,包括 Batch API 折扣和數據駐留。

如需實施詳情、支持的模型和代碼示例,請參閱提示快取文檔。

數據駐留定價

對於 Claude Opus 4.7、Claude Opus 4.6 和更新的模型,通過 inference_geo 參數指定僅限美國的推理會對所有 token 定價類別(包括輸入 token、輸出 token、快取寫入和快取讀取)產生 1.1 倍的倍數。全球路由(預設值)使用標準定價。

這僅適用於 Claude API (1P)。第三方平台有自己的區域定價。有關詳情,請參閱 AWS Bedrock 和 Google Vertex AI。較早的模型無論 inference_geo 設置如何都保留其現有定價。

如需更多資訊,請參閱數據駐留文檔。

快速模式定價

快速模式(測試版:研究預覽)適用於 Claude Opus 4.6,提供顯著更快的輸出,但價格為高級定價(6 倍標準費率)。快速模式定價適用於整個上下文窗口,包括超過 200k 輸入 token 的請求。目前在 Opus 4.6 上支持:

輸入輸出
$30 / MTok$150 / MTok

快速模式定價與其他定價修飾符堆疊:

  • 提示快取倍數適用於快速模式定價之上
  • 數據駐留倍數適用於快速模式定價之上

快速模式不適用於 Batch API。

如需更多資訊,請參閱快速模式文檔。

批次處理

Batch API 允許以 50% 的輸入和輸出 token 折扣進行大量請求的非同步處理。

ModelBatch inputBatch output
Claude Opus 4.7$2.50 / MTok$12.50 / MTok
Claude Opus 4.6$2.50 / MTok$12.50 / MTok
Claude Opus 4.5$2.50 / MTok$12.50 / MTok
Claude Opus 4.1$7.50 / MTok$37.50 / MTok
Claude Opus 4$7.50 / MTok$37.50 / MTok
Claude Sonnet 4.6$1.50 / MTok$7.50 / MTok
Claude Sonnet 4.5$1.50 / MTok$7.50 / MTok
Claude Sonnet 4$1.50 / MTok$7.50 / MTok
Claude Sonnet 3.7 (deprecated)$1.50 / MTok$7.50 / MTok
Claude Haiku 4.5$0.50 / MTok$2.50 / MTok
Claude Haiku 3.5$0.40 / MTok$2 / MTok
Claude Opus 3 (deprecated)$7.50 / MTok$37.50 / MTok
Claude Haiku 3$0.125 / MTok$0.625 / MTok

如需有關批次處理的更多資訊,請參閱批次處理文檔。

長上下文定價

Claude Mythos Preview、Opus 4.7、Opus 4.6 和 Sonnet 4.6 包括完整的100 萬 token 上下文窗口,價格為標準定價。(90 萬 token 請求的計費方式與 9k token 請求相同的每 token 費率。)提示快取和批次處理折扣在整個上下文窗口中以標準費率應用。

工具使用定價

Tool use requests are priced based on:

  1. The total number of input tokens sent to the model (including in the tools parameter)
  2. The number of output tokens generated
  3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

The additional tokens from tool use come from:

  • The tools parameter in API requests (tool names, descriptions, and schemas)
  • tool_use content blocks in API requests and responses
  • tool_result content blocks in API requests

When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

ModelTool choiceTool use system prompt token count
Claude Opus 4.7auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.6auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.1auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.6auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 3.7 (deprecated)auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 3.5auto, none
any, tool
264 tokens
340 tokens
Claude Opus 3 (deprecated)auto, none
any, tool
530 tokens
281 tokens
Claude Sonnet 3auto, none
any, tool
159 tokens
235 tokens
Claude Haiku 3auto, none
any, tool
264 tokens
340 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request.

如需當前的每個模型價格,請參閱模型定價部分。

如需有關工具使用實施和最佳實踐的更多資訊,請參閱工具使用文檔。

特定工具定價

Bash 工具

The bash tool adds 245 input tokens to your API calls.

Additional tokens are consumed by:

  • Command outputs (stdout/stderr)
  • Error messages
  • Large file contents

請參閱工具使用定價以了解完整的定價詳情。

代碼執行工具

Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.

When used without these tools, code execution is billed by execution time, tracked separately from token usage:

  • Execution time has a minimum of 5 minutes
  • Each organization receives 1,550 free hours of usage per month
  • Additional usage beyond 1,550 hours is billed at $0.05 per hour, per container
  • If files are included in the request, execution time is billed even if the tool is not invoked, due to files being preloaded onto the container

Code execution usage is tracked in the response:

"usage": {
  "input_tokens": 105,
  "output_tokens": 239,
  "server_tool_use": {
    "code_execution_requests": 1
  }
}

文本編輯器工具

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.

In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

ToolAdditional input tokens
text_editor_20250429 (Claude 4.x)700 tokens
text_editor_20250124 (Claude Sonnet 3.7 (deprecated))700 tokens

請參閱工具使用定價以了解完整的定價詳情。

網絡搜索工具

Web search usage is charged in addition to token usage:

"usage": {
  "input_tokens": 105,
  "output_tokens": 6039,
  "cache_read_input_tokens": 7123,
  "cache_creation_input_tokens": 7345,
  "server_tool_use": {
    "web_search_requests": 1
  }
}

Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.

Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

網絡獲取工具

Web fetch usage has no additional charges beyond standard token costs:

"usage": {
  "input_tokens": 25039,
  "output_tokens": 931,
  "cache_read_input_tokens": 0,
  "cache_creation_input_tokens": 0,
  "server_tool_use": {
    "web_fetch_requests": 1
  }
}

The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.

To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.

Example token usage for typical content:

  • Average web page (10 kB): ~2,500 tokens
  • Large documentation page (100 kB): ~25,000 tokens
  • Research paper PDF (500 kB): ~125,000 tokens

計算機使用工具

Computer use follows the standard tool use pricing. When using the computer use tool:

System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

Computer use tool token usage:

ModelInput tokens per tool definition
Claude 4.x models735 tokens
Claude Sonnet 3.7 (deprecated)735 tokens

Additional token consumption:

  • Screenshot images (see Vision pricing)
  • Tool execution results returned to Claude

If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Claude 託管代理定價

Claude 託管代理按兩個維度計費:token 和會話運行時間。

Token

Claude 託管代理會話消耗的所有 token 按上面模型定價中顯示的費率計費。提示快取倍數以相同方式應用。在會話內觸發的網絡搜索會產生標準的每 1,000 次搜索 $10 費用。

以下 Messages API 修飾符不適用於 Claude 託管代理會話:

修飾符為什麼不適用
Batch API 折扣會話是有狀態和互動式的。沒有批次模式。
快速模式高級推理速度由運行時管理。
數據駐留倍數inference_geo 是 Messages API 請求欄位。
長上下文高級上下文窗口由運行時管理。
第三方平台定價Claude 託管代理僅通過 Claude API 直接提供。

會話運行時間

SKU費率計量
會話運行時間每會話小時 $0.08running 狀態持續時間

運行時以毫秒為單位測量,僅在會話狀態為 running 時累積。花費在 idle(等待您的下一條消息或工具確認)、rescheduling 或 terminated 上的時間不計入運行時。

使用 Claude 託管代理時,會話運行時間取代代碼執行容器小時計費模型。您不會在會話運行時間之上單獨計費容器小時。

工作示例

使用 Claude Opus 4.7 的一小時編碼會話,消耗 50,000 個輸入 token 和 15,000 個輸出 token:

行項目計算成本
輸入 token50,000 × $5 / 1,000,000$0.25
輸出 token15,000 × $25 / 1,000,000$0.375
會話運行時間1.0 小時 × $0.08$0.08
總計$0.705

如果提示快取處於活動狀態且 40,000 個輸入 token 是快取讀取:

行項目計算成本
未快取的輸入 token10,000 × $5 / 1,000,000$0.05
快取讀取 token40,000 × $5 × 0.1 / 1,000,000$0.02
輸出 token15,000 × $25 / 1,000,000$0.375
會話運行時間1.0 小時 × $0.08$0.08
總計$0.525

處理 10,000 個支持工單的示例計算:

  • 每次對話平均約 3,700 個 token
  • 使用 Claude Haiku 4.5,輸入 $1/MTok,輸出 $5/MTok
  • 總成本:每 10,000 個工單約 $37.00

如需此計算的詳細演練,請參閱客戶支持代理指南。

其他定價考慮因素

成本優化策略

在使用 Claude 構建代理時:

  1. 使用適當的模型: 為簡單任務選擇 Haiku,為複雜推理選擇 Sonnet
  2. 實施提示快取: 減少重複上下文的成本
  3. 批次操作: 對非時間敏感的任務使用 Batch API
  4. 監控使用模式: 追蹤 token 消耗以識別優化機會

對於大容量代理應用程序,請聯繫企業銷售團隊以獲取自訂定價安排。

速率限制

速率限制因使用層級而異,影響您可以進行的請求數量:

  • 第 1 層: 入門級使用,具有基本限制
  • 第 2 層: 為成長中的應用程序增加限制
  • 第 3 層: 為已建立的應用程序提高限制
  • 第 4 層: 最大標準限制
  • 企業: 提供自訂限制

如需詳細的速率限制資訊,請參閱速率限制文檔。

如需更高的速率限制或自訂定價安排,請聯繫銷售團隊。

批量折扣

大容量用戶可能可以獲得批量折扣。這些是根據具體情況協商的。

  • 標準層級使用上面顯示的定價
  • 企業客戶可以聯繫銷售以獲取自訂定價
  • 可能提供學術和研究折扣

企業定價

對於具有特定需求的企業客戶:

  • 自訂速率限制
  • 批量折扣
  • 專門支持
  • 自訂條款

通過 Claude Console 聯繫銷售團隊 [email protected] 或討論企業定價選項。

計費和付款

  • 計費基於實際月度使用情況
  • 所有付款均以美元計
  • 信用卡和發票選項可用
  • 使用情況追蹤可在 Claude Console 中獲得

常見問題

Token 使用情況如何計算?

Token 是模型處理的文本片段。粗略估計,1 個 token 在英文中大約相當於 4 個字符或 0.75 個單詞。確切計數因語言和內容類型而異。

是否有免費層級或試用版?

新用戶獲得少量免費積分來測試 API。聯繫銷售以了解有關企業評估的延長試用版資訊。

折扣如何堆疊?

Batch API 和提示快取折扣可以組合。例如,同時使用兩個功能可提供與標準 API 呼叫相比的顯著成本節省。請參閱提示快取定價以了解倍數如何相互作用。

接受哪些付款方式?

標準帳戶接受主要信用卡。企業客戶可以安排發票和其他付款方式。

如需有關定價的其他問題,請聯繫 [email protected]。

Was this page helpful?

  • Claude 託管代理定價
  • Token