Loading...
    • 개발자 가이드
    • API 레퍼런스
    • MCP
    • 리소스
    • 릴리스 노트
    Search...
    ⌘K
    시작하기
    Claude 소개빠른 시작
    모델 및 가격
    모델 개요모델 선택Claude 4.6의 새로운 기능마이그레이션 가이드모델 지원 중단가격
    Claude로 구축하기
    기능 개요Messages API 사용중지 사유 처리프롬프트 모범 사례
    컨텍스트 관리
    컨텍스트 윈도우압축컨텍스트 편집
    기능
    프롬프트 캐싱확장 사고적응형 사고노력 수준메시지 스트리밍배치 처리인용다국어 지원토큰 카운팅임베딩비전PDF 지원Files API검색 결과구조화된 출력
    도구
    개요도구 사용 구현 방법세분화된 도구 스트리밍Bash 도구코드 실행 도구프로그래밍 방식 도구 호출컴퓨터 사용 도구텍스트 편집기 도구웹 페치 도구웹 검색 도구메모리 도구도구 검색 도구
    Agent Skills
    개요빠른 시작모범 사례엔터프라이즈용 SkillsAPI로 Skills 사용
    Agent SDK
    개요빠른 시작TypeScript SDKTypeScript V2 (미리보기)Python SDK마이그레이션 가이드
    API에서 MCP
    MCP 커넥터원격 MCP 서버
    서드파티 플랫폼의 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    프롬프트 엔지니어링
    개요프롬프트 생성기프롬프트 템플릿 사용프롬프트 개선기명확하고 직접적으로 작성예시 사용 (멀티샷 프롬프팅)Claude에게 생각하게 하기 (CoT)XML 태그 사용Claude에게 역할 부여 (시스템 프롬프트)복잡한 프롬프트 연결긴 컨텍스트 팁확장 사고 팁
    테스트 및 평가
    성공 기준 정의테스트 케이스 개발평가 도구 사용지연 시간 줄이기
    가드레일 강화
    환각 줄이기출력 일관성 높이기탈옥 방지스트리밍 거부프롬프트 유출 줄이기Claude 캐릭터 유지
    관리 및 모니터링
    Admin API 개요데이터 상주워크스페이스사용량 및 비용 APIClaude Code Analytics API제로 데이터 보존
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    관리 및 모니터링

    데이터 레지던시

    지리적 제어를 통해 모델 추론이 실행되는 위치와 데이터가 저장되는 위치를 관리합니다.

    데이터 레지던시 제어를 통해 데이터가 처리되고 저장되는 위치를 관리할 수 있습니다. 두 가지 독립적인 설정이 이를 제어합니다:

    • 추론 지역(Inference geo): 요청별로 모델 추론이 실행되는 위치를 제어합니다. inference_geo API 매개변수 또는 워크스페이스 기본값으로 설정합니다.
    • 워크스페이스 지역(Workspace geo): 데이터가 저장되는 위치와 엔드포인트 처리(이미지 트랜스코딩, 코드 실행 등)가 수행되는 위치를 제어합니다. Console에서 워크스페이스 수준으로 구성됩니다.

    추론 지역(Inference geo)

    inference_geo 매개변수는 특정 API 요청에 대해 모델 추론이 실행되는 위치를 제어합니다. 모든 POST /v1/messages 호출에 추가할 수 있습니다.

    값설명
    "global"기본값. 최적의 성능과 가용성을 위해 사용 가능한 모든 지역에서 추론이 실행될 수 있습니다.
    "us"미국 기반 인프라에서만 추론이 실행됩니다.

    API 사용법

    curl https://api.anthropic.com/v1/messages \
        --header "x-api-key: $ANTHROPIC_API_KEY" \
        --header "anthropic-version: 2023-06-01" \
        --header "content-type: application/json" \
        --data '{
            "model": "claude-opus-4-6",
            "max_tokens": 1024,
            "inference_geo": "us",
            "messages": [{
                "role": "user",
                "content": "Summarize the key points of this document."
            }]
        }'

    응답

    응답 usage 객체에는 추론이 실행된 위치를 나타내는 inference_geo 필드가 포함됩니다:

    {
      "usage": {
        "input_tokens": 25,
        "output_tokens": 150,
        "inference_geo": "us"
      }
    }

    모델 가용성

    inference_geo 매개변수는 Claude Opus 4.6 및 이후 모든 모델에서 지원됩니다. Opus 4.6 이전에 출시된 이전 모델은 이 매개변수를 지원하지 않습니다. 레거시 모델에서 inference_geo를 사용한 요청은 400 오류를 반환합니다.

    inference_geo 매개변수는 Claude API(1P)에서만 사용할 수 있습니다. 서드파티 플랫폼(AWS Bedrock, Google Vertex AI)에서는 추론 리전이 엔드포인트 URL 또는 추론 프로필에 의해 결정되므로 inference_geo가 적용되지 않습니다. inference_geo 매개변수는 OpenAI SDK 호환 엔드포인트를 통해서도 사용할 수 없습니다.

    워크스페이스 수준 제한

    워크스페이스 설정에서도 사용 가능한 추론 지역을 제한할 수 있습니다:

    • allowed_inference_geos: 워크스페이스에서 사용할 수 있는 지역을 제한합니다. 요청이 이 목록에 없는 inference_geo를 지정하면 API가 오류를 반환합니다.
    • default_inference_geo: 요청에서 inference_geo가 생략된 경우 대체 지역을 설정합니다. 개별 요청은 inference_geo를 명시적으로 설정하여 이를 재정의할 수 있습니다.

    이러한 설정은 Console 또는 data_residency 필드 아래의 Admin API를 통해 구성할 수 있습니다.

    워크스페이스 지역(Workspace geo)

    워크스페이스 지역은 워크스페이스를 생성할 때 설정되며 이후에는 변경할 수 없습니다. 현재 "us"만 사용 가능한 워크스페이스 지역입니다.

    워크스페이스 지역을 설정하려면 Console에서 새 워크스페이스를 생성하세요:

    1. Settings > Workspaces로 이동합니다.
    2. 새 워크스페이스를 생성합니다.
    3. 워크스페이스 지역을 선택합니다.

    가격

    데이터 레지던시 가격은 모델 세대에 따라 다릅니다:

    • Claude Opus 4.6 이상: 미국 전용 추론(inference_geo: "us")은 모든 토큰 가격 카테고리(입력 토큰, 출력 토큰, 캐시 쓰기, 캐시 읽기)에서 표준 요금의 1.1배로 책정됩니다.
    • 글로벌 라우팅 (inference_geo: "global" 또는 생략): 표준 가격이 적용됩니다.
    • 이전 모델: inference_geo 설정에 관계없이 기존 가격이 변경되지 않습니다.

    이 가격은 Claude API(1P)에만 적용됩니다. 서드파티 플랫폼(AWS Bedrock, Google Vertex AI, Microsoft Foundry)은 자체 리전별 가격이 있습니다. 자세한 내용은 가격 페이지를 참조하세요.

    Priority Tier를 사용하는 경우, 미국 전용 추론에 대한 1.1배 승수는 Priority Tier 용량에 대한 토큰 계산에도 영향을 미칩니다. inference_geo: "us"로 소비된 각 토큰은 커밋된 TPM에서 1.1 토큰을 차감하며, 이는 다른 가격 승수(프롬프트 캐싱, 긴 컨텍스트)가 소진율에 영향을 미치는 방식과 일치합니다.

    Batch API 지원

    inference_geo 매개변수는 Batch API에서 지원됩니다. 배치의 각 요청은 자체 inference_geo 값을 지정할 수 있습니다.

    레거시 옵트아웃에서의 마이그레이션

    조직이 이전에 추론을 미국에 유지하기 위해 글로벌 라우팅을 옵트아웃한 경우, 워크스페이스가 allowed_inference_geos: ["us"] 및 default_inference_geo: "us"로 자동 구성되었습니다. 코드 변경이 필요하지 않습니다. 기존 데이터 레지던시 요구 사항은 새로운 지역 제어를 통해 계속 적용됩니다.

    변경된 사항

    레거시 옵트아웃은 모든 요청을 미국 기반 인프라로 제한하는 조직 수준 설정이었습니다. 새로운 데이터 레지던시 제어는 이를 두 가지 메커니즘으로 대체합니다:

    • 요청별 제어: inference_geo 매개변수를 사용하면 각 API 호출에서 "us" 또는 "global"을 지정할 수 있어 요청 수준의 유연성을 제공합니다.
    • 워크스페이스 제어: Console의 default_inference_geo 및 allowed_inference_geos 설정을 통해 워크스페이스의 모든 키에 대해 지역 정책을 적용할 수 있습니다.

    워크스페이스에 적용된 변경 사항

    워크스페이스가 자동으로 마이그레이션되었습니다:

    레거시 설정새로운 동등 설정
    글로벌 라우팅 옵트아웃(미국 전용)allowed_inference_geos: ["us"], default_inference_geo: "us"

    워크스페이스의 키를 사용하는 모든 API 요청은 계속 미국 기반 인프라에서 실행됩니다. 현재 동작을 유지하기 위해 별도의 조치가 필요하지 않습니다.

    글로벌 라우팅을 사용하려는 경우

    데이터 레지던시 요구 사항이 변경되어 더 나은 성능과 가용성을 위해 글로벌 라우팅을 활용하려면, 워크스페이스의 추론 지역 설정을 업데이트하여 허용된 지역에 "global"을 포함하고 default_inference_geo를 "global"로 설정하세요. 자세한 내용은 워크스페이스 수준 제한을 참조하세요.

    가격 영향

    레거시 모델은 이 마이그레이션의 영향을 받지 않습니다. 최신 모델의 현재 가격은 가격을 참조하세요.

    현재 제한 사항

    • 공유 속도 제한: 속도 제한은 모든 지역에서 공유됩니다.
    • 추론 지역: 출시 시 "us"와 "global"만 사용할 수 있습니다. 추가 리전은 시간이 지남에 따라 추가될 예정입니다.
    • 워크스페이스 지역: 현재 "us"만 사용할 수 있습니다. 워크스페이스 지역은 워크스페이스 생성 후 변경할 수 없습니다.

    다음 단계

    가격

    데이터 레지던시 가격 세부 정보를 확인하세요.

    워크스페이스

    워크스페이스 구성에 대해 알아보세요.

    사용량 및 비용 API

    데이터 레지던시별 사용량과 비용을 추적하세요.

    Was this page helpful?

    • 추론 지역(Inference geo)
    • API 사용법
    • 워크스페이스 지역(Workspace geo)
    • Batch API 지원