이 페이지는 Anthropic의 모델 및 기능에 대한 자세한 가격 책정 정보를 제공합니다. 모든 가격은 USD입니다.
가장 최신의 가격 책정 정보는 claude.com/pricing을 방문하세요.
다음 표는 다양한 사용 계층에 걸친 모든 Claude 모델의 가격 책정을 보여줍니다:
| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.5 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = 백만 토큰. "Base Input Tokens" 열은 표준 입력 가격을 보여주고, "Cache Writes"와 "Cache Hits"는 프롬프트 캐싱에 특정하며, "Output Tokens"는 출력 가격을 보여줍니다. 프롬프트 캐싱은 다양한 사용 사례에 대한 비용을 최적화하기 위해 5분(기본값) 및 1시간 캐시 지속 시간을 모두 제공합니다.
위의 표는 프롬프트 캐싱에 대한 다음 가격 책정 승수를 반영합니다:
Claude 모델은 AWS Bedrock, Google Vertex AI, 및 Microsoft Foundry에서 사용할 수 있습니다. 공식 가격 책정은 다음을 방문하세요:
Claude 4.5 모델 이상의 지역 엔드포인트 가격 책정
Claude Sonnet 4.5 및 Haiku 4.5부터 AWS Bedrock과 Google Vertex AI는 두 가지 엔드포인트 유형을 제공합니다:
지역 엔드포인트는 글로벌 엔드포인트보다 10% 프리미엄을 포함합니다. Claude API (1P)는 기본적으로 글로벌이며 이 변경의 영향을 받지 않습니다. Claude API는 글로벌 전용입니다(다른 제공자의 글로벌 엔드포인트 제공 및 가격 책정과 동등함).
범위: 이 가격 책정 구조는 Claude Sonnet 4.5, Haiku 4.5 및 모든 향후 모델에 적용됩니다. 이전 모델(Claude Sonnet 4, Opus 4 및 이전 릴리스)은 기존 가격 책정을 유지합니다.
구현 세부 사항 및 코드 예제:
Batch API는 입력 및 출력 토큰 모두에 대해 50% 할인으로 대량의 요청을 비동기식으로 처리할 수 있습니다.
| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.5 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
배치 처리에 대한 자세한 정보는 배치 처리 문서를 참조하세요.
Claude Sonnet 4 또는 Sonnet 4.5를 1M 토큰 컨텍스트 윈도우 활성화와 함께 사용할 때, 200K 입력 토큰을 초과하는 요청은 자동으로 프리미엄 긴 컨텍스트 요금으로 청구됩니다:
1M 토큰 컨텍스트 윈도우는 현재 사용 계층 4의 조직 및 사용자 정의 속도 제한이 있는 조직에 대해 베타 버전입니다. 1M 토큰 컨텍스트 윈도우는 Claude Sonnet 4 및 Sonnet 4.5에서만 사용할 수 있습니다.
| ≤ 200K 입력 토큰 | > 200K 입력 토큰 |
|---|---|
| 입력: $3 / MTok | 입력: $6 / MTok |
| 출력: $15 / MTok | 출력: $22.50 / MTok |
긴 컨텍스트 가격 책정은 다른 가격 책정 수정자와 함께 적용됩니다:
베타 플래그가 활성화된 경우에도 200K 미만의 입력 토큰이 있는 요청은 표준 요금으로 청구됩니다. 요청이 200K 입력 토큰을 초과하면 모든 토큰이 프리미엄 가격으로 청구됩니다.
200K 임계값은 입력 토큰(캐시 읽기/쓰기 포함)에만 기반합니다. 출력 토큰 수는 가격 책정 계층 선택에 영향을 주지 않지만, 입력 임계값을 초과할 때 출력 토큰은 더 높은 요금으로 청구됩니다.
API 요청이 1M 컨텍스트 윈도우 요금으로 청구되었는지 확인하려면 API 응답의 usage 객체를 검토하세요:
{
"usage": {
"input_tokens": 250000,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"output_tokens": 500
}
}다음을 합산하여 총 입력 토큰을 계산하세요:
input_tokenscache_creation_input_tokens (프롬프트 캐싱을 사용하는 경우)cache_read_input_tokens (프롬프트 캐싱을 사용하는 경우)합계가 200,000 토큰을 초과하면 전체 요청이 1M 컨텍스트 요금으로 청구되었습니다.
usage 객체에 대한 자세한 정보는 API 응답 문서를 참조하세요.
Tool use requests are priced based on:
tools parameter)Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
tools parameter in API requests (tool names, descriptions, and schemas)tool_use content blocks in API requests and responsestool_result content blocks in API requestsWhen you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
현재 모델별 가격은 위의 모델 가격 책정 섹션을 참조하세요.
도구 사용 구현 및 모범 사례에 대한 자세한 정보는 도구 사용 문서를 참조하세요.
The bash tool adds 245 input tokens to your API calls.
Additional tokens are consumed by:
완전한 가격 책정 세부 사항은 도구 사용 가격 책정을 참조하세요.
Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container.
Each organization receives 1,550 free hours of usage with the code execution tool per month. Additional usage beyond the first 1,550 hours is billed at $0.05 per hour, per container.
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.
In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
완전한 가격 책정 세부 사항은 도구 사용 가격 책정을 참조하세요.
Web search usage is charged in addition to token usage:
"usage": {
"input_tokens": 105,
"output_tokens": 6039,
"cache_read_input_tokens": 7123,
"cache_creation_input_tokens": 7345,
"server_tool_use": {
"web_search_requests": 1
}
}Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Web fetch usage has no additional charges beyond standard token costs:
"usage": {
"input_tokens": 25039,
"output_tokens": 931,
"cache_read_input_tokens": 0,
"cache_creation_input_tokens": 0,
"server_tool_use": {
"web_fetch_requests": 1
}
}The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.
To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
Additional token consumption:
If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
에이전트 애플리케이션의 가격 책정을 이해하는 것은 Claude로 구축할 때 중요합니다. 이러한 실제 예제는 다양한 에이전트 패턴에 대한 비용을 추정하는 데 도움이 될 수 있습니다.
고객 지원 에이전트를 구축할 때 비용이 어떻게 분류될 수 있는지는 다음과 같습니다:
10,000개의 지원 티켓 처리를 위한 예제 계산:
이 계산에 대한 자세한 설명은 고객 지원 에이전트 가이드를 참조하세요.
여러 단계가 있는 더 복잡한 에이전트 아키텍처의 경우:
초기 요청 처리
메모리 및 컨텍스트 검색
작업 계획 및 실행
에이전트 가격 책정 패턴에 대한 포괄적인 가이드는 에이전트 사용 사례 가이드를 참조하세요.
Claude로 에이전트를 구축할 때:
대량의 에이전트 애플리케이션의 경우 사용자 정의 가격 책정 약정을 위해 엔터프라이즈 영업팀에 문의하는 것을 고려하세요.
속도 제한은 사용 계층에 따라 다르며 수행할 수 있는 요청 수에 영향을 줍니다:
자세한 속도 제한 정보는 속도 제한 문서를 참조하세요.
더 높은 속도 제한 또는 사용자 정의 가격 책정 약정을 원하면 영업팀에 문의하세요.
대량 사용자에게 볼륨 할인을 사용할 수 있습니다. 이는 경우별로 협상됩니다.
특정 요구 사항이 있는 엔터프라이즈 고객의 경우:
[email protected]의 영업팀에 문의하거나 Claude Console을 통해 엔터프라이즈 가격 책정 옵션을 논의하세요.
토큰 사용량은 어떻게 계산되나요?
토큰은 모델이 처리하는 텍스트 조각입니다. 대략적인 추정으로 1 토큰은 영어로 약 4자 또는 0.75단어입니다. 정확한 수는 언어 및 콘텐츠 유형에 따라 다릅니다.
무료 계층이나 평가판이 있나요?
신규 사용자는 API를 테스트할 수 있는 소량의 무료 크레딧을 받습니다. 엔터프라이즈 평가를 위한 연장된 평가판에 대한 정보는 영업팀에 문의하세요.
할인은 어떻게 적용되나요?
Batch API 및 프롬프트 캐싱 할인을 결합할 수 있습니다. 예를 들어 두 기능을 함께 사용하면 표준 API 호출과 비교하여 상당한 비용 절감을 제공합니다.
어떤 결제 방법이 허용되나요?
표준 계정의 경우 주요 신용 카드를 허용합니다. 엔터프라이즈 고객은 송장 및 기타 결제 방법을 준비할 수 있습니다.
가격 책정에 대한 추가 질문은 [email protected]에 문의하세요.