Was this page helpful?
이 페이지는 Anthropic의 모델 및 기능에 대한 자세한 가격 책정 정보를 제공합니다. 모든 가격은 USD입니다.
최신 가격 책정 정보는 claude.com/pricing을 방문하세요.
다음 표는 다양한 사용 계층에 걸친 모든 Claude 모델의 가격 책정을 보여줍니다:
| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.6 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.5 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.6 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = 백만 토큰. "Base Input Tokens" 열은 표준 입력 가격을 보여주고, "Cache Writes"와 "Cache Hits"는 프롬프트 캐싱에 특정하며, "Output Tokens"는 출력 가격을 보여줍니다. 캐시 열과 가격 책정 승수에 대한 설명은 아래의 프롬프트 캐싱 가격 책정을 참조하세요.
Claude 모델은 AWS Bedrock, Google Vertex AI, Microsoft Foundry에서 사용할 수 있습니다. 공식 가격 책정은 다음을 방문하세요:
Claude 4.5 모델 이상의 지역 및 다중 지역 엔드포인트 가격 책정
Claude Sonnet 4.5 및 Haiku 4.5부터:
지역 및 다중 지역 엔드포인트는 글로벌 엔드포인트보다 10% 프리미엄을 포함합니다. Claude API(1P)는 기본적으로 글로벌입니다. 1P 데이터 거주지 옵션 및 가격 책정은 아래의 데이터 거주지 가격 책정을 참조하세요.
범위: 이 가격 책정 구조는 Claude Sonnet 4.5, Haiku 4.5 및 모든 향후 모델에 적용됩니다. 이전 모델(Claude Sonnet 4, Opus 4 및 이전 릴리스)은 기존 가격 책정을 유지합니다.
구현 세부 사항 및 코드 예제:
프롬프트 캐싱은 API 호출 전반에 걸쳐 이전에 처리된 프롬프트 부분을 재사용하여 비용과 지연 시간을 줄입니다. 모든 요청에서 동일한 큰 시스템 프롬프트, 문서 또는 대화 기록을 다시 처리하는 대신, API는 표준 입력 가격의 일부로 캐시에서 읽습니다.
프롬프트 캐싱을 활성화하는 두 가지 방법이 있습니다:
cache_control 필드를 추가합니다. 시스템은 대화가 증가함에 따라 캐시 중단점을 자동으로 관리합니다. 이는 대부분의 사용 사례에 권장되는 시작점입니다.cache_control을 배치하여 정확히 무엇이 캐시되는지에 대한 세밀한 제어를 수행합니다.프롬프트 캐싱은 기본 입력 토큰 요금에 상대적으로 다음 가격 책정 승수를 사용합니다:
| 캐시 작업 | 승수 | 기간 |
|---|---|---|
| 5분 캐시 쓰기 | 1.25배 기본 입력 가격 | 캐시는 5분 동안 유효 |
| 1시간 캐시 쓰기 | 2배 기본 입력 가격 | 캐시는 1시간 동안 유효 |
| 캐시 읽기(히트) | 0.1배 기본 입력 가격 | 이전 쓰기와 동일한 기간 |
캐시 쓰기 토큰은 콘텐츠가 처음 저장될 때 청구됩니다. 캐시 읽기 토큰은 후속 요청이 캐시된 콘텐츠를 검색할 때 청구됩니다. 캐시 히트는 표준 입력 가격의 10% 비용이 들므로, 5분 기간의 경우 단 하나의 캐시 읽기 후에(1.25배 쓰기), 또는 1시간 기간의 경우 두 번의 캐시 읽기 후에(2배 쓰기) 캐싱이 수익성이 있습니다.
이러한 승수는 Batch API 할인 및 데이터 거주지를 포함한 다른 가격 책정 수정자와 함께 누적됩니다.
구현 세부 사항, 지원되는 모델 및 코드 예제는 프롬프트 캐싱 설명서를 참조하세요.
Claude Opus 4.6 이상의 모델의 경우, inference_geo 매개변수를 통해 US 전용 추론을 지정하면 입력 토큰, 출력 토큰, 캐시 쓰기 및 캐시 읽기를 포함한 모든 토큰 가격 책정 범주에 1.1배 승수가 발생합니다. 글로벌 라우팅(기본값)은 표준 가격 책정을 사용합니다.
이는 Claude API(1P)에만 적용됩니다. 제3자 플랫폼은 자체 지역 가격 책정을 가지고 있습니다. 세부 사항은 AWS Bedrock 및 Google Vertex AI를 참조하세요. 이전 모델은 inference_geo 설정에 관계없이 기존 가격 책정을 유지합니다.
자세한 내용은 데이터 거주지 설명서를 참조하세요.
Claude Opus 4.6의 빠른 모드(베타: 연구 미리보기)는 프리미엄 가격(표준 요금의 6배)으로 훨씬 더 빠른 출력을 제공합니다. 빠른 모드 가격 책정은 200k 입력 토큰을 초과하는 요청을 포함한 전체 컨텍스트 윈도우에 적용됩니다. 현재 Opus 4.6에서 지원됨:
| 입력 | 출력 |
|---|---|
| $30 / MTok | $150 / MTok |
빠른 모드 가격 책정은 다른 가격 책정 수정자와 함께 누적됩니다:
빠른 모드는 Batch API에서 사용할 수 없습니다.
자세한 내용은 빠른 모드 설명서를 참조하세요.
Batch API는 입력 및 출력 토큰 모두에 50% 할인으로 대량의 요청을 비동기적으로 처리할 수 있습니다.
| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.6 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.5 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.6 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 |
배치 처리에 대한 자세한 내용은 배치 처리 설명서를 참조하세요.
Claude Mythos Preview, Opus 4.6 및 Sonnet 4.6은 표준 가격 책정으로 전체 1M 토큰 컨텍스트 윈도우를 포함합니다. (900k 토큰 요청은 9k 토큰 요청과 동일한 토큰당 요금으로 청구됩니다.) 프롬프트 캐싱 및 배치 처리 할인은 전체 컨텍스트 윈도우에 걸쳐 표준 요금으로 적용됩니다.
Tool use requests are priced based on:
tools parameter)Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
tools parameter in API requests (tool names, descriptions, and schemas)tool_use content blocks in API requests and responsestool_result content blocks in API requestsWhen you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.1 | auto, noneany, tool |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
현재 모델별 가격은 모델 가격 책정 섹션을 참조하세요.
도구 사용 구현 및 모범 사례에 대한 자세한 내용은 도구 사용 설명서를 참조하세요.
The bash tool adds 245 input tokens to your API calls.
Additional tokens are consumed by:
완전한 가격 책정 세부 사항은 도구 사용 가격 책정을 참조하세요.
Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.
When used without these tools, code execution is billed by execution time, tracked separately from token usage:
Code execution usage is tracked in the response:
"usage": {
"input_tokens": 105,
"output_tokens": 239,
"server_tool_use": {
"code_execution_requests": 1
}
}The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.
In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
완전한 가격 책정 세부 사항은 도구 사용 가격 책정을 참조하세요.
Web search usage is charged in addition to token usage:
"usage": {
"input_tokens": 105,
"output_tokens": 6039,
"cache_read_input_tokens": 7123,
"cache_creation_input_tokens": 7345,
"server_tool_use": {
"web_search_requests": 1
}
}Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Web fetch usage has no additional charges beyond standard token costs:
"usage": {
"input_tokens": 25039,
"output_tokens": 931,
"cache_read_input_tokens": 0,
"cache_creation_input_tokens": 0,
"server_tool_use": {
"web_fetch_requests": 1
}
}The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.
To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
Additional token consumption:
If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Claude Managed Agents는 두 가지 차원으로 청구됩니다: 토큰 및 세션 런타임.
Claude Managed Agents 세션에서 소비된 모든 토큰은 위의 모델 가격 책정에 표시된 요금으로 청구됩니다. 프롬프트 캐싱 승수는 동일하게 적용됩니다. 세션 내에서 트리거된 웹 검색은 표준 1,000개 검색당 $10을 발생시킵니다.
다음 Messages API 수정자는 Claude Managed Agents 세션에 적용되지 않습니다:
| 수정자 | 적용되지 않는 이유 |
|---|---|
| Batch API 할인 | 세션은 상태 저장 및 대화형입니다. 배치 모드가 없습니다. |
| 빠른 모드 프리미엄 | 추론 속도는 런타임에 의해 관리됩니다. |
| 데이터 거주지 승수 | inference_geo는 Messages API 요청 필드입니다. |
| 긴 컨텍스트 프리미엄 | 컨텍스트 윈도우는 런타임에 의해 관리됩니다. |
| 제3자 플랫폼 가격 책정 | Claude Managed Agents는 Claude API를 통해서만 직접 사용할 수 있습니다. |
| SKU | 요금 | 측정 |
|---|---|---|
| 세션 런타임 | 세션당 시간당 $0.08 | running 상태 기간 |
런타임은 밀리초 단위로 측정되며 세션의 상태가 running인 동안에만 누적됩니다. idle(다음 메시지 또는 도구 확인 대기), rescheduling 또는 terminated 상태에서 소비된 시간은 런타임에 포함되지 않습니다.
세션 런타임은 Claude Managed Agents를 사용할 때 코드 실행 컨테이너 시간 청구 모델을 대체합니다. 세션 런타임 위에 컨테이너 시간에 대해 별도로 청구되지 않습니다.
Claude Opus 4.6을 사용하는 1시간 코딩 세션으로 50,000개의 입력 토큰과 15,000개의 출력 토큰을 소비합니다:
| 항목 | 계산 | 비용 |
|---|---|---|
| 입력 토큰 | 50,000 × $5 / 1,000,000 | $0.25 |
| 출력 토큰 | 15,000 × $25 / 1,000,000 | $0.375 |
| 세션 런타임 | 1.0 시간 × $0.08 | $0.08 |
| 합계 | $0.705 |
프롬프트 캐싱이 활성화되고 40,000개의 입력 토큰이 캐시 읽기인 경우:
| 항목 | 계산 | 비용 |
|---|---|---|
| 캐시되지 않은 입력 토큰 | 10,000 × $5 / 1,000,000 | $0.05 |
| 캐시 읽기 토큰 | 40,000 × $5 × 0.1 / 1,000,000 | $0.02 |
| 출력 토큰 | 15,000 × $25 / 1,000,000 | $0.375 |
| 세션 런타임 | 1.0 시간 × $0.08 | $0.08 |
| 합계 | $0.525 |
10,000개의 지원 티켓 처리에 대한 예제 계산:
이 계산에 대한 자세한 설명은 고객 지원 에이전트 가이드를 참조하세요.
Claude로 에이전트를 구축할 때:
대량의 에이전트 애플리케이션의 경우, 사용자 정의 가격 책정 약정을 위해 엔터프라이즈 영업팀에 문의하세요.
요청 제한은 사용 계층에 따라 다르며 수행할 수 있는 요청 수에 영향을 미칩니다:
자세한 요청 제한 정보는 요청 제한 설명서를 참조하세요.
더 높은 요청 제한 또는 사용자 정의 가격 책정 약정을 위해 영업팀에 문의하세요.
대량 사용자를 위해 볼륨 할인을 사용할 수 있습니다. 이는 사례별로 협상됩니다.
특정 요구 사항이 있는 엔터프라이즈 고객의 경우:
[email protected]의 영업팀에 문의하거나 Claude Console을 통해 엔터프라이즈 가격 책정 옵션을 논의하세요.
토큰 사용량은 어떻게 계산되나요?
토큰은 모델이 처리하는 텍스트 조각입니다. 대략적인 추정으로, 1 토큰은 영어로 약 4자 또는 0.75단어입니다. 정확한 개수는 언어 및 콘텐츠 유형에 따라 다릅니다.
무료 계층이나 평가판이 있나요?
신규 사용자는 API를 테스트할 수 있는 소량의 무료 크레딧을 받습니다. 엔터프라이즈 평가를 위한 연장 평가판에 대한 정보는 영업팀에 문의하세요.
할인은 어떻게 누적되나요?
Batch API 및 프롬프트 캐싱 할인을 결합할 수 있습니다. 예를 들어, 두 기능을 함께 사용하면 표준 API 호출에 비해 상당한 비용 절감을 제공합니다. 승수가 상호 작용하는 방식은 프롬프트 캐싱 가격 책정을 참조하세요.
어떤 결제 방법이 허용되나요?
주요 신용 카드는 표준 계정에 대해 허용됩니다. 엔터프라이즈 고객은 청구 및 기타 결제 방법을 준비할 수 있습니다.
가격 책정에 대한 추가 질문은 [email protected]에 문의하세요.
| $0.50 / MTok |
| $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
| 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |