Was this page helpful?
This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
데이터 거주지 제어를 통해 데이터가 처리되고 저장되는 위치를 관리할 수 있습니다. 두 가지 독립적인 설정이 이를 관리합니다:
inference_geo API 매개변수를 통해 또는 워크스페이스 기본값으로 설정합니다.inference_geo 매개변수는 특정 API 요청에 대해 모델 추론이 실행되는 위치를 제어합니다. 모든 POST /v1/messages 호출에 추가할 수 있습니다.
| 값 | 설명 |
|---|---|
"global" | 기본값입니다. 추론은 최적의 성능과 가용성을 위해 사용 가능한 모든 지역에서 실행될 수 있습니다. |
"us" | 추론은 US 기반 인프라에서만 실행됩니다. |
응답 usage 객체에는 추론이 실행된 위치를 나타내는 inference_geo 필드가 포함됩니다:
{
"usage": {
"input_tokens": 25,
"output_tokens": 150,
"inference_geo": "us"
}
}inference_geo 매개변수는 Claude Opus 4.6 이상의 모든 후속 모델에서 지원됩니다. Opus 4.6 이전에 출시된 이전 모델은 이 매개변수를 지원하지 않습니다. 레거시 모델에서 inference_geo를 사용한 요청은 400 오류를 반환합니다.
inference_geo 매개변수는 Claude API(1P)에서만 사용 가능합니다. 타사 플랫폼(AWS Bedrock, Google Vertex AI)에서는 추론 영역이 엔드포인트 URL 또는 추론 프로필에 의해 결정되므로 inference_geo는 적용되지 않습니다. inference_geo 매개변수는 OpenAI SDK 호환성 엔드포인트를 통해서도 사용할 수 없습니다.
워크스페이스 설정은 또한 사용 가능한 추론 지역을 제한하는 것을 지원합니다:
allowed_inference_geos: 워크스페이스가 사용할 수 있는 지역을 제한합니다. 요청이 이 목록에 없는 inference_geo를 지정하면 API는 오류를 반환합니다.default_inference_geo: 요청에서 inference_geo가 생략될 때 폴백 지역을 설정합니다. 개별 요청은 inference_geo를 명시적으로 설정하여 이를 재정의할 수 있습니다.이러한 설정은 Console을 통해 또는 data_residency 필드 아래의 Admin API를 통해 구성할 수 있습니다.
워크스페이스 지역은 워크스페이스를 생성할 때 설정되며 이후에는 변경할 수 없습니다. 현재 "us"만 사용 가능한 워크스페이스 지역입니다.
워크스페이스 지역을 설정하려면 Console에서 새 워크스페이스를 생성합니다:
데이터 거주지 가격 책정은 모델 세대에 따라 다릅니다:
inference_geo: "us")은 모든 토큰 가격 책정 범주(입력 토큰, 출력 토큰, 캐시 쓰기 및 캐시 읽기)에서 표준 요금의 1.1배로 책정됩니다.inference_geo: "global" 또는 생략): 표준 가격 책정이 적용됩니다.inference_geo 설정에 관계없이 변경되지 않습니다.이 가격 책정은 Claude API(1P)에만 적용됩니다. 타사 플랫폼(AWS Bedrock, Google Vertex AI)은 자체 지역별 가격 책정을 가지고 있습니다. 자세한 내용은 가격 책정 페이지를 참조하세요.
Priority Tier를 사용하는 경우, US 전용 추론에 대한 1.1배 승수도 Priority Tier 용량에 대해 계산되는 토큰 방식에 영향을 미칩니다. inference_geo: "us"로 소비된 각 토큰은 프롬프트 캐싱과 같은 다른 가격 책정 승수가 소진율에 영향을 미치는 방식과 일치하게 커밋된 TPM에서 1.1개의 토큰을 소진합니다.
inference_geo 매개변수는 Batch API에서 지원됩니다. 배치의 각 요청은 자체 inference_geo 값을 지정할 수 있습니다.
조직이 이전에 글로벌 라우팅을 거부하여 추론을 US에 유지하기로 선택한 경우, 워크스페이스는 자동으로 allowed_inference_geos: ["us"] 및 default_inference_geo: "us"로 구성되었습니다. 코드 변경이 필요하지 않습니다. 기존 데이터 거주지 요구 사항은 새로운 지역 제어를 통해 계속 적용됩니다.
레거시 옵트아웃은 모든 요청을 US 기반 인프라로 제한하는 조직 수준의 설정이었습니다. 새로운 데이터 거주지 제어는 이를 두 가지 메커니즘으로 대체합니다:
inference_geo 매개변수를 통해 각 API 호출에서 "us" 또는 "global"을 지정할 수 있으므로 요청 수준의 유연성을 제공합니다.default_inference_geo 및 allowed_inference_geos 설정을 통해 워크스페이스의 모든 키에 걸쳐 지역 정책을 적용할 수 있습니다.워크스페이스는 자동으로 마이그레이션되었습니다:
| 레거시 설정 | 새로운 동등 설정 |
|---|---|
| 글로벌 라우팅 옵트아웃(US만) | allowed_inference_geos: ["us"], default_inference_geo: "us" |
워크스페이스의 키를 사용하는 모든 API 요청은 계속 US 기반 인프라에서 실행됩니다. 현재 동작을 유지하기 위해 조치가 필요하지 않습니다.
데이터 거주지 요구 사항이 변경되었고 더 나은 성능과 가용성을 위해 글로벌 라우팅을 활용하려는 경우, 워크스페이스의 추론 지역 설정을 업데이트하여 허용된 지역에 "global"을 포함하고 default_inference_geo를 "global"로 설정합니다. 자세한 내용은 워크스페이스 수준 제한을 참조하세요.
레거시 모델은 이 마이그레이션의 영향을 받지 않습니다. 최신 모델의 현재 가격 책정은 가격 책정을 참조하세요.
"us" 및 "global"만 사용 가능합니다. 추가 지역은 시간이 지남에 따라 추가될 것입니다."us"만 사용 가능합니다. 워크스페이스 지역은 워크스페이스 생성 후 변경할 수 없습니다.client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
inference_geo="us",
messages=[
{"role": "user", "content": "Summarize the key points of this document."}
],
)
print(response.content[0].text)
# Check where inference actually ran
print(f"Inference geo: {response.usage.inference_geo}")