Loading...
    • 빌드
    • 관리
    • 모델 및 가격
    • 클라이언트 SDK
    • API 참조
    Search...
    ⌘K
    모델
    모델 개요모델 선택Claude 4.6의 새로운 기능마이그레이션 가이드모델 지원 종료모델 카드시스템 프롬프트
    가격
    가격
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    가격

    가격 책정

    Anthropic의 모델 및 기능에 대한 가격 책정 구조 알아보기

    Was this page helpful?

    • 제3자 플랫폼 가격 책정
    • Claude Managed Agents 가격 책정

    이 페이지는 Anthropic의 모델 및 기능에 대한 자세한 가격 책정 정보를 제공합니다. 모든 가격은 USD입니다.

    최신 가격 책정 정보는 claude.com/pricing을 방문하세요.

    모델 가격 책정

    다음 표는 다양한 사용 계층에 걸친 모든 Claude 모델의 가격 책정을 보여줍니다:

    ModelBase Input Tokens5m Cache Writes1h Cache WritesCache Hits & RefreshesOutput Tokens
    Claude Opus 4.6$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
    Claude Opus 4.5$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
    Claude Opus 4.1$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
    Claude Opus 4$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
    Claude Sonnet 4.6$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Sonnet 4.5$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Sonnet 4$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Sonnet 3.7 (deprecated)$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Haiku 4.5$1 / MTok$1.25 / MTok$2 / MTok$0.10 / MTok$5 / MTok
    Claude Haiku 3.5$0.80 / MTok$1 / MTok$1.6 / MTok$0.08 / MTok$4 / MTok
    Claude Opus 3 (deprecated)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
    Claude Haiku 3$0.25 / MTok$0.30 / MTok$0.50 / MTok$0.03 / MTok$1.25 / MTok

    MTok = 백만 토큰. "Base Input Tokens" 열은 표준 입력 가격을 보여주고, "Cache Writes"와 "Cache Hits"는 프롬프트 캐싱에 특정하며, "Output Tokens"는 출력 가격을 보여줍니다. 캐시 열과 가격 책정 승수에 대한 설명은 아래의 프롬프트 캐싱 가격 책정을 참조하세요.

    제3자 플랫폼 가격 책정

    Claude 모델은 AWS Bedrock, Google Vertex AI, Microsoft Foundry에서 사용할 수 있습니다. 공식 가격 책정은 다음을 방문하세요:

    • AWS Bedrock 가격 책정
    • Google Vertex AI 가격 책정
    • Microsoft Foundry 가격 책정

    Claude 4.5 모델 이상의 지역 및 다중 지역 엔드포인트 가격 책정

    Claude Sonnet 4.5 및 Haiku 4.5부터:

    • AWS Bedrock은 두 가지 엔드포인트 유형을 제공합니다: 글로벌 엔드포인트(최대 가용성을 위한 동적 라우팅) 및 지역 엔드포인트(특정 지리적 지역을 통한 보장된 데이터 라우팅).
    • Google Vertex AI는 세 가지 엔드포인트 유형을 제공합니다: 글로벌 엔드포인트, 다중 지역 엔드포인트(지리적 영역 내 동적 라우팅), 지역 엔드포인트.

    지역 및 다중 지역 엔드포인트는 글로벌 엔드포인트보다 10% 프리미엄을 포함합니다. Claude API(1P)는 기본적으로 글로벌입니다. 1P 데이터 거주지 옵션 및 가격 책정은 아래의 데이터 거주지 가격 책정을 참조하세요.

    범위: 이 가격 책정 구조는 Claude Sonnet 4.5, Haiku 4.5 및 모든 향후 모델에 적용됩니다. 이전 모델(Claude Sonnet 4, Opus 4 및 이전 릴리스)은 기존 가격 책정을 유지합니다.

    구현 세부 사항 및 코드 예제:

    • AWS Bedrock 글로벌 vs 지역 엔드포인트
    • Google Vertex AI 글로벌, 다중 지역 및 지역 엔드포인트

    기능별 가격 책정

    프롬프트 캐싱

    프롬프트 캐싱은 API 호출 전반에 걸쳐 이전에 처리된 프롬프트 부분을 재사용하여 비용과 지연 시간을 줄입니다. 모든 요청에서 동일한 큰 시스템 프롬프트, 문서 또는 대화 기록을 다시 처리하는 대신, API는 표준 입력 가격의 일부로 캐시에서 읽습니다.

    프롬프트 캐싱을 활성화하는 두 가지 방법이 있습니다:

    • 자동 캐싱: 요청의 최상위 수준에 단일 cache_control 필드를 추가합니다. 시스템은 대화가 증가함에 따라 캐시 중단점을 자동으로 관리합니다. 이는 대부분의 사용 사례에 권장되는 시작점입니다.
    • 명시적 캐시 중단점: 개별 콘텐츠 블록에 직접 cache_control을 배치하여 정확히 무엇이 캐시되는지에 대한 세밀한 제어를 수행합니다.

    프롬프트 캐싱은 기본 입력 토큰 요금에 상대적으로 다음 가격 책정 승수를 사용합니다:

    캐시 작업승수기간
    5분 캐시 쓰기1.25배 기본 입력 가격캐시는 5분 동안 유효
    1시간 캐시 쓰기2배 기본 입력 가격캐시는 1시간 동안 유효
    캐시 읽기(히트)0.1배 기본 입력 가격이전 쓰기와 동일한 기간

    캐시 쓰기 토큰은 콘텐츠가 처음 저장될 때 청구됩니다. 캐시 읽기 토큰은 후속 요청이 캐시된 콘텐츠를 검색할 때 청구됩니다. 캐시 히트는 표준 입력 가격의 10% 비용이 들므로, 5분 기간의 경우 단 하나의 캐시 읽기 후에(1.25배 쓰기), 또는 1시간 기간의 경우 두 번의 캐시 읽기 후에(2배 쓰기) 캐싱이 수익성이 있습니다.

    이러한 승수는 Batch API 할인 및 데이터 거주지를 포함한 다른 가격 책정 수정자와 함께 누적됩니다.

    구현 세부 사항, 지원되는 모델 및 코드 예제는 프롬프트 캐싱 설명서를 참조하세요.

    데이터 거주지 가격 책정

    Claude Opus 4.6 이상의 모델의 경우, inference_geo 매개변수를 통해 US 전용 추론을 지정하면 입력 토큰, 출력 토큰, 캐시 쓰기 및 캐시 읽기를 포함한 모든 토큰 가격 책정 범주에 1.1배 승수가 발생합니다. 글로벌 라우팅(기본값)은 표준 가격 책정을 사용합니다.

    이는 Claude API(1P)에만 적용됩니다. 제3자 플랫폼은 자체 지역 가격 책정을 가지고 있습니다. 세부 사항은 AWS Bedrock 및 Google Vertex AI를 참조하세요. 이전 모델은 inference_geo 설정에 관계없이 기존 가격 책정을 유지합니다.

    자세한 내용은 데이터 거주지 설명서를 참조하세요.

    빠른 모드 가격 책정

    Claude Opus 4.6의 빠른 모드(베타: 연구 미리보기)는 프리미엄 가격(표준 요금의 6배)으로 훨씬 더 빠른 출력을 제공합니다. 빠른 모드 가격 책정은 200k 입력 토큰을 초과하는 요청을 포함한 전체 컨텍스트 윈도우에 적용됩니다. 현재 Opus 4.6에서 지원됨:

    입력출력
    $30 / MTok$150 / MTok

    빠른 모드 가격 책정은 다른 가격 책정 수정자와 함께 누적됩니다:

    • 프롬프트 캐싱 승수는 빠른 모드 가격 책정 위에 적용됩니다
    • 데이터 거주지 승수는 빠른 모드 가격 책정 위에 적용됩니다

    빠른 모드는 Batch API에서 사용할 수 없습니다.

    자세한 내용은 빠른 모드 설명서를 참조하세요.

    배치 처리

    Batch API는 입력 및 출력 토큰 모두에 50% 할인으로 대량의 요청을 비동기적으로 처리할 수 있습니다.

    ModelBatch inputBatch output
    Claude Opus 4.6$2.50 / MTok$12.50 / MTok
    Claude Opus 4.5$2.50 / MTok$12.50 / MTok
    Claude Opus 4.1$7.50 / MTok$37.50 / MTok
    Claude Opus 4$7.50 / MTok$37.50 / MTok
    Claude Sonnet 4.6$1.50 / MTok$7.50 / MTok
    Claude Sonnet 4.5$1.50 / MTok$7.50 / MTok
    Claude Sonnet 4$1.50 / MTok$7.50 / MTok
    Claude Sonnet 3.7 (deprecated)$1.50 / MTok$7.50 / MTok
    Claude Haiku 4.5

    배치 처리에 대한 자세한 내용은 배치 처리 설명서를 참조하세요.

    긴 컨텍스트 가격 책정

    Claude Mythos Preview, Opus 4.6 및 Sonnet 4.6은 표준 가격 책정으로 전체 1M 토큰 컨텍스트 윈도우를 포함합니다. (900k 토큰 요청은 9k 토큰 요청과 동일한 토큰당 요금으로 청구됩니다.) 프롬프트 캐싱 및 배치 처리 할인은 전체 컨텍스트 윈도우에 걸쳐 표준 요금으로 적용됩니다.

    도구 사용 가격 책정

    Tool use requests are priced based on:

    1. The total number of input tokens sent to the model (including in the tools parameter)
    2. The number of output tokens generated
    3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

    Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

    The additional tokens from tool use come from:

    • The tools parameter in API requests (tool names, descriptions, and schemas)
    • tool_use content blocks in API requests and responses
    • tool_result content blocks in API requests

    When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

    ModelTool choiceTool use system prompt token count
    Claude Opus 4.6auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Opus 4.5auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Opus 4.1auto, none
    any, tool

    These token counts are added to your normal input and output tokens to calculate the total cost of a request.

    현재 모델별 가격은 모델 가격 책정 섹션을 참조하세요.

    도구 사용 구현 및 모범 사례에 대한 자세한 내용은 도구 사용 설명서를 참조하세요.

    특정 도구 가격 책정

    Bash 도구

    The bash tool adds 245 input tokens to your API calls.

    Additional tokens are consumed by:

    • Command outputs (stdout/stderr)
    • Error messages
    • Large file contents

    완전한 가격 책정 세부 사항은 도구 사용 가격 책정을 참조하세요.

    코드 실행 도구

    Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.

    When used without these tools, code execution is billed by execution time, tracked separately from token usage:

    • Execution time has a minimum of 5 minutes
    • Each organization receives 1,550 free hours of usage per month
    • Additional usage beyond 1,550 hours is billed at $0.05 per hour, per container
    • If files are included in the request, execution time is billed even if the tool is not invoked, due to files being preloaded onto the container

    Code execution usage is tracked in the response:

    "usage": {
      "input_tokens": 105,
      "output_tokens": 239,
      "server_tool_use": {
        "code_execution_requests": 1
      }
    }

    텍스트 편집기 도구

    The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.

    In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

    ToolAdditional input tokens
    text_editor_20250429 (Claude 4.x)700 tokens
    text_editor_20250124 (Claude Sonnet 3.7 (deprecated))700 tokens

    완전한 가격 책정 세부 사항은 도구 사용 가격 책정을 참조하세요.

    웹 검색 도구

    Web search usage is charged in addition to token usage:

    "usage": {
      "input_tokens": 105,
      "output_tokens": 6039,
      "cache_read_input_tokens": 7123,
      "cache_creation_input_tokens": 7345,
      "server_tool_use": {
        "web_search_requests": 1
      }
    }

    Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.

    Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

    웹 가져오기 도구

    Web fetch usage has no additional charges beyond standard token costs:

    "usage": {
      "input_tokens": 25039,
      "output_tokens": 931,
      "cache_read_input_tokens": 0,
      "cache_creation_input_tokens": 0,
      "server_tool_use": {
        "web_fetch_requests": 1
      }
    }

    The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.

    To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.

    Example token usage for typical content:

    • Average web page (10 kB): ~2,500 tokens
    • Large documentation page (100 kB): ~25,000 tokens
    • Research paper PDF (500 kB): ~125,000 tokens

    컴퓨터 사용 도구

    Computer use follows the standard tool use pricing. When using the computer use tool:

    System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

    Computer use tool token usage:

    ModelInput tokens per tool definition
    Claude 4.x models735 tokens
    Claude Sonnet 3.7 (deprecated)735 tokens

    Additional token consumption:

    • Screenshot images (see Vision pricing)
    • Tool execution results returned to Claude

    If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

    Claude Managed Agents 가격 책정

    Claude Managed Agents는 두 가지 차원으로 청구됩니다: 토큰 및 세션 런타임.

    토큰

    Claude Managed Agents 세션에서 소비된 모든 토큰은 위의 모델 가격 책정에 표시된 요금으로 청구됩니다. 프롬프트 캐싱 승수는 동일하게 적용됩니다. 세션 내에서 트리거된 웹 검색은 표준 1,000개 검색당 $10을 발생시킵니다.

    다음 Messages API 수정자는 Claude Managed Agents 세션에 적용되지 않습니다:

    수정자적용되지 않는 이유
    Batch API 할인세션은 상태 저장 및 대화형입니다. 배치 모드가 없습니다.
    빠른 모드 프리미엄추론 속도는 런타임에 의해 관리됩니다.
    데이터 거주지 승수inference_geo는 Messages API 요청 필드입니다.
    긴 컨텍스트 프리미엄컨텍스트 윈도우는 런타임에 의해 관리됩니다.
    제3자 플랫폼 가격 책정Claude Managed Agents는 Claude API를 통해서만 직접 사용할 수 있습니다.

    세션 런타임

    SKU요금측정
    세션 런타임세션당 시간당 $0.08running 상태 기간

    런타임은 밀리초 단위로 측정되며 세션의 상태가 running인 동안에만 누적됩니다. idle(다음 메시지 또는 도구 확인 대기), rescheduling 또는 terminated 상태에서 소비된 시간은 런타임에 포함되지 않습니다.

    세션 런타임은 Claude Managed Agents를 사용할 때 코드 실행 컨테이너 시간 청구 모델을 대체합니다. 세션 런타임 위에 컨테이너 시간에 대해 별도로 청구되지 않습니다.

    작업 예제

    Claude Opus 4.6을 사용하는 1시간 코딩 세션으로 50,000개의 입력 토큰과 15,000개의 출력 토큰을 소비합니다:

    항목계산비용
    입력 토큰50,000 × $5 / 1,000,000$0.25
    출력 토큰15,000 × $25 / 1,000,000$0.375
    세션 런타임1.0 시간 × $0.08$0.08
    합계$0.705

    프롬프트 캐싱이 활성화되고 40,000개의 입력 토큰이 캐시 읽기인 경우:

    항목계산비용
    캐시되지 않은 입력 토큰10,000 × $5 / 1,000,000$0.05
    캐시 읽기 토큰40,000 × $5 × 0.1 / 1,000,000$0.02
    출력 토큰15,000 × $25 / 1,000,000$0.375
    세션 런타임1.0 시간 × $0.08$0.08
    합계$0.525

    10,000개의 지원 티켓 처리에 대한 예제 계산:

    • 대화당 평균 ~3,700 토큰
    • Claude Opus 4.6을 $5/MTok 입력, $25/MTok 출력으로 사용
    • 총 비용: 10,000개 티켓당 약 $37.00

    이 계산에 대한 자세한 설명은 고객 지원 에이전트 가이드를 참조하세요.

    추가 가격 책정 고려 사항

    비용 최적화 전략

    Claude로 에이전트를 구축할 때:

    1. 적절한 모델 사용: 간단한 작업에는 Haiku, 복잡한 추론에는 Sonnet 선택
    2. 프롬프트 캐싱 구현: 반복되는 컨텍스트의 비용 감소
    3. 배치 작업: 시간에 민감하지 않은 작업에 Batch API 사용
    4. 사용 패턴 모니터링: 토큰 소비를 추적하여 최적화 기회 파악

    대량의 에이전트 애플리케이션의 경우, 사용자 정의 가격 책정 약정을 위해 엔터프라이즈 영업팀에 문의하세요.

    요청 제한

    요청 제한은 사용 계층에 따라 다르며 수행할 수 있는 요청 수에 영향을 미칩니다:

    • 계층 1: 기본 제한이 있는 진입 수준 사용
    • 계층 2: 증가하는 애플리케이션을 위한 증가된 제한
    • 계층 3: 확립된 애플리케이션을 위한 더 높은 제한
    • 계층 4: 최대 표준 제한
    • 엔터프라이즈: 사용자 정의 제한 사용 가능

    자세한 요청 제한 정보는 요청 제한 설명서를 참조하세요.

    더 높은 요청 제한 또는 사용자 정의 가격 책정 약정을 위해 영업팀에 문의하세요.

    볼륨 할인

    대량 사용자를 위해 볼륨 할인을 사용할 수 있습니다. 이는 사례별로 협상됩니다.

    • 표준 계층은 위에 표시된 가격 책정을 사용합니다
    • 엔터프라이즈 고객은 사용자 정의 가격 책정을 위해 영업팀에 문의할 수 있습니다
    • 학술 및 연구 할인을 사용할 수 있습니다

    엔터프라이즈 가격 책정

    특정 요구 사항이 있는 엔터프라이즈 고객의 경우:

    • 사용자 정의 요청 제한
    • 볼륨 할인
    • 전담 지원
    • 사용자 정의 약정

    [email protected]의 영업팀에 문의하거나 Claude Console을 통해 엔터프라이즈 가격 책정 옵션을 논의하세요.

    청구 및 결제

    • 청구는 실제 월간 사용량을 기반으로 합니다
    • 모든 결제는 USD입니다
    • 신용 카드 및 청구 옵션 사용 가능
    • Claude Console에서 사용 현황 추적 가능

    자주 묻는 질문

    토큰 사용량은 어떻게 계산되나요?

    토큰은 모델이 처리하는 텍스트 조각입니다. 대략적인 추정으로, 1 토큰은 영어로 약 4자 또는 0.75단어입니다. 정확한 개수는 언어 및 콘텐츠 유형에 따라 다릅니다.

    무료 계층이나 평가판이 있나요?

    신규 사용자는 API를 테스트할 수 있는 소량의 무료 크레딧을 받습니다. 엔터프라이즈 평가를 위한 연장 평가판에 대한 정보는 영업팀에 문의하세요.

    할인은 어떻게 누적되나요?

    Batch API 및 프롬프트 캐싱 할인을 결합할 수 있습니다. 예를 들어, 두 기능을 함께 사용하면 표준 API 호출에 비해 상당한 비용 절감을 제공합니다. 승수가 상호 작용하는 방식은 프롬프트 캐싱 가격 책정을 참조하세요.

    어떤 결제 방법이 허용되나요?

    주요 신용 카드는 표준 계정에 대해 허용됩니다. 엔터프라이즈 고객은 청구 및 기타 결제 방법을 준비할 수 있습니다.

    가격 책정에 대한 추가 질문은 [email protected]에 문의하세요.

    $0.50 / MTok
    $2.50 / MTok
    Claude Haiku 3.5$0.40 / MTok$2 / MTok
    Claude Opus 3 (deprecated)$7.50 / MTok$37.50 / MTok
    Claude Haiku 3$0.125 / MTok$0.625 / MTok
    346 tokens
    313 tokens
    Claude Opus 4auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 4.6auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 4.5auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 4auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 3.7 (deprecated)auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Haiku 4.5auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Haiku 3.5auto, none
    any, tool
    264 tokens
    340 tokens
    Claude Opus 3 (deprecated)auto, none
    any, tool
    530 tokens
    281 tokens
    Claude Sonnet 3auto, none
    any, tool
    159 tokens
    235 tokens
    Claude Haiku 3auto, none
    any, tool
    264 tokens
    340 tokens