이 페이지는 Anthropic의 모델 및 기능에 대한 상세한 가격 정보를 제공합니다. 모든 가격은 USD 기준입니다.
최신 가격 정보는 claude.com/pricing을 방문해 주세요.
다음 표는 다양한 사용 티어에 걸친 모든 Claude 모델의 가격을 보여줍니다:
| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.6 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.5 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = 백만 토큰. "Base Input Tokens" 열은 표준 입력 가격을 보여주며, "Cache Writes"와 "Cache Hits"는 프롬프트 캐싱에 해당하고, "Output Tokens"는 출력 가격을 보여줍니다. 프롬프트 캐싱은 다양한 사용 사례에 대한 비용 최적화를 위해 5분(기본값) 및 1시간 캐시 지속 시간을 모두 제공합니다.
위 표는 프롬프트 캐싱에 대한 다음 가격 배수를 반영합니다:
Claude 모델은 AWS Bedrock, Google Vertex AI, 및 Microsoft Foundry에서 사용할 수 있습니다. 공식 가격은 다음을 방문하세요:
Claude 4.5 모델 이후의 리전 엔드포인트 가격
Claude Sonnet 4.5 및 Haiku 4.5부터 AWS Bedrock과 Google Vertex AI는 두 가지 엔드포인트 유형을 제공합니다:
리전 엔드포인트는 글로벌 엔드포인트 대비 10% 프리미엄이 포함됩니다. Claude API(1P)는 기본적으로 글로벌이며 이 변경의 영향을 받지 않습니다. Claude API는 글로벌 전용입니다(다른 제공업체의 글로벌 엔드포인트 제공 및 가격과 동일).
적용 범위: 이 가격 구조는 Claude Sonnet 4.5, Haiku 4.5 및 모든 향후 모델에 적용됩니다. 이전 모델(Claude Sonnet 4, Opus 4 및 이전 릴리스)은 기존 가격을 유지합니다.
구현 세부 사항 및 코드 예제:
Claude Opus 4.6 이상 모델의 경우, inference_geo 매개변수를 통해 미국 전용 추론을 지정하면 입력 토큰, 출력 토큰, 캐시 쓰기, 캐시 읽기를 포함한 모든 토큰 가격 카테고리에 1.1배 배수가 적용됩니다. 글로벌 라우팅(기본값)은 표준 가격을 사용합니다.
이는 Claude API(1P)에만 적용됩니다. 서드파티 플랫폼은 자체 리전 가격을 가지고 있습니다 — 자세한 내용은 AWS Bedrock, Google Vertex AI, Microsoft Foundry를 참조하세요. 이전 모델은 inference_geo 설정에 관계없이 기존 가격을 유지합니다.
자세한 내용은 데이터 레지던시 문서를 참조하세요.
Batch API는 입력 및 출력 토큰 모두에 50% 할인을 적용하여 대량의 요청을 비동기적으로 처리할 수 있습니다.
| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.6 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.5 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
배치 처리에 대한 자세한 내용은 배치 처리 문서를 참조하세요.
Claude Opus 4.6, Sonnet 4.5 또는 Sonnet 4를 1M 토큰 컨텍스트 윈도우 활성화 상태로 사용할 때, 200K 입력 토큰을 초과하는 요청은 자동으로 프리미엄 긴 컨텍스트 요금이 부과됩니다:
1M 토큰 컨텍스트 윈도우는 현재 사용 티어 4의 조직 및 맞춤 요금 제한이 있는 조직을 대상으로 베타 중입니다. 1M 토큰 컨텍스트 윈도우는 Claude Opus 4.6, Sonnet 4.5, Sonnet 4에서만 사용할 수 있습니다.
| 모델 | ≤ 200K 입력 토큰 | > 200K 입력 토큰 |
|---|---|---|
| Claude Opus 4.6 | 입력: $5 / MTok | 입력: $10 / MTok |
| 출력: $25 / MTok | 출력: $37.50 / MTok | |
| Claude Sonnet 4.5 / 4 | 입력: $3 / MTok | 입력: $6 / MTok |
| 출력: $15 / MTok | 출력: $22.50 / MTok |
긴 컨텍스트 가격은 다른 가격 수정자와 중첩됩니다:
베타 플래그가 활성화되어 있더라도 200K 미만의 입력 토큰을 가진 요청은 표준 요금이 부과됩니다. 요청이 200K 입력 토큰을 초과하면 모든 토큰에 프리미엄 가격이 적용됩니다.
200K 임계값은 입력 토큰(캐시 읽기/쓰기 포함)만을 기준으로 합니다. 출력 토큰 수는 가격 티어 선택에 영향을 미치지 않지만, 입력 임계값을 초과하면 출력 토큰에도 더 높은 요금이 부과됩니다.
API 요청이 1M 컨텍스트 윈도우 요금으로 청구되었는지 확인하려면 API 응답의 usage 객체를 확인하세요:
{
"usage": {
"input_tokens": 250000,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"output_tokens": 500
}
}다음을 합산하여 총 입력 토큰을 계산하세요:
input_tokenscache_creation_input_tokens (프롬프트 캐싱 사용 시)cache_read_input_tokens (프롬프트 캐싱 사용 시)합계가 200,000 토큰을 초과하면 전체 요청이 1M 컨텍스트 요금으로 청구된 것입니다.
usage 객체에 대한 자세한 내용은 API 응답 문서를 참조하세요.
Tool use requests are priced based on:
tools parameter)Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
tools parameter in API requests (tool names, descriptions, and schemas)tool_use content blocks in API requests and responsestool_result content blocks in API requestsWhen you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
현재 모델별 가격은 위의 모델 가격 섹션을 참조하세요.
도구 사용 구현 및 모범 사례에 대한 자세한 내용은 도구 사용 문서를 참조하세요.
The bash tool adds 245 input tokens to your API calls.
Additional tokens are consumed by:
전체 가격 세부 사항은 도구 사용 가격을 참조하세요.
Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container.
Each organization receives 1,550 free hours of usage with the code execution tool per month. Additional usage beyond the first 1,550 hours is billed at $0.05 per hour, per container.
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.
In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
전체 가격 세부 사항은 도구 사용 가격을 참조하세요.
Web search usage is charged in addition to token usage:
"usage": {
"input_tokens": 105,
"output_tokens": 6039,
"cache_read_input_tokens": 7123,
"cache_creation_input_tokens": 7345,
"server_tool_use": {
"web_search_requests": 1
}
}Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Web fetch usage has no additional charges beyond standard token costs:
"usage": {
"input_tokens": 25039,
"output_tokens": 931,
"cache_read_input_tokens": 0,
"cache_creation_input_tokens": 0,
"server_tool_use": {
"web_fetch_requests": 1
}
}The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.
To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
Additional token consumption:
If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
에이전트 애플리케이션의 가격을 이해하는 것은 Claude로 구축할 때 매우 중요합니다. 이러한 실제 예시는 다양한 에이전트 패턴에 대한 비용을 추정하는 데 도움이 될 수 있습니다.
고객 지원 에이전트를 구축할 때 비용이 어떻게 분류되는지 살펴보겠습니다:
10,000건의 지원 티켓 처리에 대한 예시 계산:
이 계산의 상세한 안내는 고객 지원 에이전트 가이드를 참조하세요.
여러 단계가 있는 더 복잡한 에이전트 아키텍처의 경우:
초기 요청 처리
메모리 및 컨텍스트 검색
행동 계획 및 실행
에이전트 가격 패턴에 대한 종합 가이드는 에이전트 사용 사례 가이드를 참조하세요.
Claude로 에이전트를 구축할 때:
대량 에이전트 애플리케이션의 경우, 맞춤 가격 협의를 위해 엔터프라이즈 영업팀에 문의하는 것을 고려하세요.
요금 제한은 사용 티어에 따라 다르며 요청할 수 있는 횟수에 영향을 미칩니다:
자세한 요금 제한 정보는 요금 제한 문서를 참조하세요.
더 높은 요금 제한이나 맞춤 가격 협의를 원하시면 영업팀에 문의하세요.
대량 사용자에게는 대량 할인이 제공될 수 있습니다. 이는 사례별로 협상됩니다.
특정 요구 사항이 있는 엔터프라이즈 고객을 위해:
엔터프라이즈 가격 옵션을 논의하려면 [email protected]으로 영업팀에 문의하거나 Claude Console을 통해 연락하세요.
토큰 사용량은 어떻게 계산되나요?
토큰은 모델이 처리하는 텍스트 조각입니다. 대략적인 추정으로, 영어에서 1 토큰은 약 4자 또는 0.75단어에 해당합니다. 정확한 수는 언어와 콘텐츠 유형에 따라 다릅니다.
무료 티어나 체험판이 있나요?
신규 사용자는 API를 테스트할 수 있는 소량의 무료 크레딧을 받습니다. 엔터프라이즈 평가를 위한 연장 체험에 대한 정보는 영업팀에 문의하세요.
할인은 어떻게 중첩되나요?
Batch API와 프롬프트 캐싱 할인은 결합할 수 있습니다. 예를 들어, 두 기능을 함께 사용하면 표준 API 호출에 비해 상당한 비용 절감을 제공합니다.
어떤 결제 방법이 허용되나요?
표준 계정에는 주요 신용카드를 허용합니다. 엔터프라이즈 고객은 청구서 발행 및 기타 결제 방법을 협의할 수 있습니다.
가격에 대한 추가 질문은 [email protected]으로 문의하세요.
Was this page helpful?