이 기능은 Zero Data Retention (ZDR)의 적용 대상입니다. 조직에 ZDR 계약이 체결되어 있는 경우, 이 기능을 통해 전송된 데이터는 API 응답이 반환된 후 저장되지 않습니다.
데이터 레지던시 제어를 통해 데이터가 처리되고 저장되는 위치를 관리할 수 있습니다. 두 가지 독립적인 설정이 이를 제어합니다:
inference_geo API 매개변수를 통해 설정하거나 워크스페이스 기본값으로 설정합니다.Claude Managed Agents는 inference_geo 매개변수를 지원하지 않지만, Console에서 구성된 Workspace geo를 따릅니다. 자체 호스팅 샌드박스를 사용하면 도구 실행과 샌드박스 파일 시스템이 사용자가 제어하는 인프라에 유지됩니다.
inference_geo 매개변수는 특정 API 요청에 대해 모델 추론이 실행되는 위치를 제어합니다. 모든 POST /v1/messages 호출에 추가하세요.
| 값 | 설명 |
|---|---|
"global" | 기본값. 최적의 성능과 가용성을 위해 사용 가능한 모든 지역에서 추론이 실행될 수 있습니다. |
"us" | 미국 기반 인프라에서만 추론이 실행됩니다. |
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
inference_geo="us",
messages=[
{"role": "user", "content": "Summarize the key points of this document."}
],
)
print(response.content[0].text)
# 추론이 실제로 실행된 위치 확인
print(f"Inference geo: {response.usage.inference_geo}")응답의 usage 객체에는 추론이 실행된 위치를 나타내는 inference_geo 필드가 포함됩니다:
{
"usage": {
"input_tokens": 25,
"output_tokens": 150,
"inference_geo": "us"
}
}inference_geo 매개변수는 Claude Opus 4.6, Claude Sonnet 4.6 및 이후 모델에서 지원됩니다. Claude Opus 4.5, Claude Sonnet 4.5, Claude Haiku 4.5 또는 이전 모델에서 inference_geo를 포함한 요청은 400 오류를 반환합니다.
inference_geo 매개변수는 Claude API(퍼스트파티) 및 Claude Platform on AWS에서 사용할 수 있습니다. Amazon Bedrock, Vertex AI 및 Microsoft Foundry에서는 추론 지역이 엔드포인트 URL 또는 추론 프로필에 의해 결정되므로 inference_geo가 적용되지 않습니다. inference_geo 매개변수는 OpenAI SDK 호환 엔드포인트를 통해서도 사용할 수 없습니다.
워크스페이스 설정은 사용 가능한 추론 지역을 제한하는 기능도 지원합니다:
allowed_inference_geos: 워크스페이스에서 사용할 수 있는 지역을 제한합니다. 요청이 이 목록에 없는 inference_geo를 지정하면 API가 오류를 반환합니다.default_inference_geo: 요청에서 inference_geo가 생략된 경우 사용할 대체 지역을 설정합니다. 개별 요청은 inference_geo를 명시적으로 설정하여 이를 재정의할 수 있습니다.이러한 설정은 Console 또는 Admin API의 data_residency 필드를 통해 구성할 수 있습니다.
Workspace geo는 워크스페이스를 생성할 때 설정되며 이후에는 변경할 수 없습니다. 현재 "us"가 유일하게 사용 가능한 workspace geo입니다.
Workspace geo를 설정하려면 Console에서 새 워크스페이스를 생성하세요:
Claude Platform on AWS: Workspace geo는 구성할 수 없습니다. 워크스페이스는 AWS Console을 통해 프로비저닝되며, Claude Console의 Workspaces 페이지는 읽기 전용입니다. 이 플랫폼의 Claude Managed Agents 세션은 현재 유일하게 사용 가능한 workspace geo인 "us"를 유효 Workspace geo로 사용하여 실행됩니다. 해당 플랫폼에 특화된 데이터 레지던시 고려 사항은 Claude Platform on AWS를 참조하세요.
데이터 레지던시 가격은 모델 세대에 따라 다릅니다:
inference_geo: "us")은 모든 토큰 가격 카테고리(입력 토큰, 출력 토큰, 캐시 쓰기, 캐시 읽기)에서 표준 요금의 1.1배로 책정됩니다.inference_geo: "global"): 표준 가격이 적용됩니다.inference_geo를 지원하지 않으며(모델 가용성 참조), 표준 가격이 적용됩니다. 이 매개변수를 포함한 요청은 400 오류를 반환합니다.이 가격은 Claude API(퍼스트파티) 및 Claude Platform on AWS에 적용됩니다. 파트너 운영 플랫폼(Bedrock 및 Vertex AI)은 자체 지역별 가격을 적용합니다. 자세한 내용은 데이터 레지던시 가격을 참조하세요.
Priority Tier를 사용하는 경우, 미국 전용 추론에 대한 1.1배 승수는 Priority Tier 용량에 대한 토큰 계산 방식에도 영향을 미칩니다. inference_geo: "us"로 소비된 각 토큰은 약정된 TPM에서 1.1 토큰을 차감하며, 이는 다른 가격 승수(프롬프트 캐싱 등)가 소진율에 영향을 미치는 방식과 일치합니다.
inference_geo 매개변수는 Batch API에서 지원됩니다. 배치의 각 요청은 자체 inference_geo 값을 지정할 수 있습니다.
조직이 이전에 미국 내 추론을 유지하기 위해 글로벌 라우팅을 옵트아웃한 경우, 워크스페이스가 자동으로 allowed_inference_geos: ["us"] 및 default_inference_geo: "us"로 구성되었습니다. 코드 변경이 필요하지 않습니다. 기존 데이터 레지던시 요구 사항은 새로운 지역 제어를 통해 계속 적용됩니다.
레거시 옵트아웃은 모든 요청을 미국 기반 인프라로 제한하는 조직 수준 설정이었습니다. 새로운 데이터 레지던시 제어는 이를 두 가지 메커니즘으로 대체합니다:
inference_geo 매개변수를 통해 각 API 호출에서 "us" 또는 "global"을 지정할 수 있어 요청 수준의 유연성을 제공합니다.default_inference_geo 및 allowed_inference_geos 설정을 통해 워크스페이스의 모든 키에 걸쳐 지역 정책을 적용할 수 있습니다.워크스페이스가 자동으로 마이그레이션되었습니다:
| 레거시 설정 | 새로운 동등 설정 |
|---|---|
| 글로벌 라우팅 옵트아웃(미국 전용) | allowed_inference_geos: ["us"], default_inference_geo: "us" |
워크스페이스의 키를 사용하는 모든 API 요청은 계속해서 미국 기반 인프라에서 실행됩니다. 현재 동작을 유지하기 위해 별도의 조치가 필요하지 않습니다.
데이터 레지던시 요구 사항이 변경되어 더 나은 성능과 가용성을 위해 글로벌 라우팅을 활용하려는 경우, 워크스페이스의 inference geo 설정을 업데이트하여 허용된 지역에 "global"을 포함하고 default_inference_geo를 "global"로 설정하세요. 자세한 내용은 워크스페이스 수준 제한을 참조하세요.
레거시 모델은 이 마이그레이션의 영향을 받지 않습니다. 최신 모델의 현재 가격은 가격 책정을 참조하세요.
"us"와 "global"만 사용할 수 있습니다."us"만 사용할 수 있습니다. Workspace geo는 워크스페이스 생성 후 변경할 수 없습니다.데이터 레지던시 가격 세부 정보를 확인하세요.
워크스페이스 구성에 대해 알아보세요.
데이터 레지던시별 사용량 및 비용을 추적하세요.
Was this page helpful?