데이터 레지던시 제어를 통해 데이터가 처리되고 저장되는 위치를 관리할 수 있습니다. 두 가지 독립적인 설정이 이를 제어합니다:
inference_geo API 매개변수 또는 워크스페이스 기본값으로 설정합니다.inference_geo 매개변수는 특정 API 요청에 대해 모델 추론이 실행되는 위치를 제어합니다. 모든 POST /v1/messages 호출에 추가할 수 있습니다.
| 값 | 설명 |
|---|---|
"global" | 기본값. 최적의 성능과 가용성을 위해 사용 가능한 모든 지역에서 추론이 실행될 수 있습니다. |
"us" | 미국 기반 인프라에서만 추론이 실행됩니다. |
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-6",
"max_tokens": 1024,
"inference_geo": "us",
"messages": [{
"role": "user",
"content": "Summarize the key points of this document."
}]
}'응답 usage 객체에는 추론이 실행된 위치를 나타내는 inference_geo 필드가 포함됩니다:
{
"usage": {
"input_tokens": 25,
"output_tokens": 150,
"inference_geo": "us"
}
}inference_geo 매개변수는 Claude Opus 4.6 및 이후 모든 모델에서 지원됩니다. Opus 4.6 이전에 출시된 이전 모델은 이 매개변수를 지원하지 않습니다. 레거시 모델에서 inference_geo를 사용한 요청은 400 오류를 반환합니다.
inference_geo 매개변수는 Claude API(1P)에서만 사용할 수 있습니다. 서드파티 플랫폼(AWS Bedrock, Google Vertex AI)에서는 추론 리전이 엔드포인트 URL 또는 추론 프로필에 의해 결정되므로 inference_geo가 적용되지 않습니다. inference_geo 매개변수는 OpenAI SDK 호환 엔드포인트를 통해서도 사용할 수 없습니다.
워크스페이스 설정에서도 사용 가능한 추론 지역을 제한할 수 있습니다:
allowed_inference_geos: 워크스페이스에서 사용할 수 있는 지역을 제한합니다. 요청이 이 목록에 없는 inference_geo를 지정하면 API가 오류를 반환합니다.default_inference_geo: 요청에서 inference_geo가 생략된 경우 대체 지역을 설정합니다. 개별 요청은 inference_geo를 명시적으로 설정하여 이를 재정의할 수 있습니다.이러한 설정은 Console 또는 data_residency 필드 아래의 Admin API를 통해 구성할 수 있습니다.
워크스페이스 지역은 워크스페이스를 생성할 때 설정되며 이후에는 변경할 수 없습니다. 현재 "us"만 사용 가능한 워크스페이스 지역입니다.
워크스페이스 지역을 설정하려면 Console에서 새 워크스페이스를 생성하세요:
데이터 레지던시 가격은 모델 세대에 따라 다릅니다:
inference_geo: "us")은 모든 토큰 가격 카테고리(입력 토큰, 출력 토큰, 캐시 쓰기, 캐시 읽기)에서 표준 요금의 1.1배로 책정됩니다.inference_geo: "global" 또는 생략): 표준 가격이 적용됩니다.inference_geo 설정에 관계없이 기존 가격이 변경되지 않습니다.이 가격은 Claude API(1P)에만 적용됩니다. 서드파티 플랫폼(AWS Bedrock, Google Vertex AI, Microsoft Foundry)은 자체 리전별 가격이 있습니다. 자세한 내용은 가격 페이지를 참조하세요.
Priority Tier를 사용하는 경우, 미국 전용 추론에 대한 1.1배 승수는 Priority Tier 용량에 대한 토큰 계산에도 영향을 미칩니다. inference_geo: "us"로 소비된 각 토큰은 커밋된 TPM에서 1.1 토큰을 차감하며, 이는 다른 가격 승수(프롬프트 캐싱, 긴 컨텍스트)가 소진율에 영향을 미치는 방식과 일치합니다.
inference_geo 매개변수는 Batch API에서 지원됩니다. 배치의 각 요청은 자체 inference_geo 값을 지정할 수 있습니다.
조직이 이전에 추론을 미국에 유지하기 위해 글로벌 라우팅을 옵트아웃한 경우, 워크스페이스가 allowed_inference_geos: ["us"] 및 default_inference_geo: "us"로 자동 구성되었습니다. 코드 변경이 필요하지 않습니다. 기존 데이터 레지던시 요구 사항은 새로운 지역 제어를 통해 계속 적용됩니다.
레거시 옵트아웃은 모든 요청을 미국 기반 인프라로 제한하는 조직 수준 설정이었습니다. 새로운 데이터 레지던시 제어는 이를 두 가지 메커니즘으로 대체합니다:
inference_geo 매개변수를 사용하면 각 API 호출에서 "us" 또는 "global"을 지정할 수 있어 요청 수준의 유연성을 제공합니다.default_inference_geo 및 allowed_inference_geos 설정을 통해 워크스페이스의 모든 키에 대해 지역 정책을 적용할 수 있습니다.워크스페이스가 자동으로 마이그레이션되었습니다:
| 레거시 설정 | 새로운 동등 설정 |
|---|---|
| 글로벌 라우팅 옵트아웃(미국 전용) | allowed_inference_geos: ["us"], default_inference_geo: "us" |
워크스페이스의 키를 사용하는 모든 API 요청은 계속 미국 기반 인프라에서 실행됩니다. 현재 동작을 유지하기 위해 별도의 조치가 필요하지 않습니다.
데이터 레지던시 요구 사항이 변경되어 더 나은 성능과 가용성을 위해 글로벌 라우팅을 활용하려면, 워크스페이스의 추론 지역 설정을 업데이트하여 허용된 지역에 "global"을 포함하고 default_inference_geo를 "global"로 설정하세요. 자세한 내용은 워크스페이스 수준 제한을 참조하세요.
레거시 모델은 이 마이그레이션의 영향을 받지 않습니다. 최신 모델의 현재 가격은 가격을 참조하세요.
"us"와 "global"만 사용할 수 있습니다. 추가 리전은 시간이 지남에 따라 추가될 예정입니다."us"만 사용할 수 있습니다. 워크스페이스 지역은 워크스페이스 생성 후 변경할 수 없습니다.Was this page helpful?