此功能符合零数据保留(ZDR)的条件。当您的组织签订了 ZDR 协议时,通过此功能发送的数据在 API 响应返回后不会被存储。
数据驻留控制让您能够管理数据的处理和存储位置。这由两个独立的设置来管理:
inference_geo API 参数设置,或作为工作区默认值进行配置。Claude Managed Agents 不支持 inference_geo 参数,但会遵循在 Console 中配置的 Workspace geo。使用自托管沙箱时,工具执行和沙箱文件系统会保留在您控制的基础设施上。
inference_geo 参数控制特定 API 请求的模型推理运行位置。将其添加到任何 POST /v1/messages 调用中即可。
| 值 | 描述 |
|---|---|
"global" | 默认值。推理可以在任何可用的地理位置运行,以获得最佳性能和可用性。 |
"us" | 推理仅在位于美国的基础设施上运行。 |
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
inference_geo="us",
messages=[
{"role": "user", "content": "Summarize the key points of this document."}
],
)
print(response.content[0].text)
# 检查推理实际运行的位置
print(f"Inference geo: {response.usage.inference_geo}")响应的 usage 对象包含一个 inference_geo 字段,指示推理的运行位置:
{
"usage": {
"input_tokens": 25,
"output_tokens": 150,
"inference_geo": "us"
}
}inference_geo 参数在 Claude Opus 4.6、Claude Sonnet 4.6 及更高版本的模型上受支持。在 Claude Opus 4.5、Claude Sonnet 4.5、Claude Haiku 4.5 或更早版本的模型上使用 inference_geo 的请求将返回 400 错误。
inference_geo 参数可在 Claude API(第一方)和 Claude Platform on AWS 上使用。在 Amazon Bedrock、Vertex AI 和 Microsoft Foundry 上,推理区域由端点 URL 或推理配置文件决定,因此 inference_geo 不适用。inference_geo 参数也无法通过 OpenAI SDK 兼容端点使用。
工作区设置还支持限制可用的推理地理位置:
allowed_inference_geos: 限制工作区可以使用的地理位置。如果请求指定的 inference_geo 不在此列表中,API 将返回错误。default_inference_geo: 设置当请求中省略 inference_geo 时的回退地理位置。单个请求可以通过显式设置 inference_geo 来覆盖此设置。这些设置可以通过 Console 或 Admin API 中的 data_residency 字段进行配置。
Workspace geo 在您创建工作区时设置,之后无法更改。目前,"us" 是唯一可用的工作区地理位置。
要设置 Workspace geo,请在 Console 中创建新工作区:
Claude Platform on AWS: Workspace geo 不可配置。工作区通过 AWS Console 进行配置,Claude Console 的 Workspaces 页面为只读。此平台上的 Claude Managed Agents 会话以 "us" 作为有效的 Workspace geo 运行,这也是目前唯一可用的工作区地理位置。有关该平台特定的数据驻留注意事项,请参阅 Claude Platform on AWS。
数据驻留定价因模型版本而异:
inference_geo: "us")在所有令牌定价类别(输入令牌、输出令牌、缓存写入和缓存读取)中按标准费率的 1.1 倍计价。inference_geo: "global"):适用标准定价。inference_geo(请参阅模型可用性);适用标准定价。包含该参数的请求将返回 400 错误。此定价适用于 Claude API(第一方)和 Claude Platform on AWS。合作伙伴运营的平台(Bedrock 和 Vertex AI)有各自的区域定价。详情请参阅数据驻留定价。
如果您使用 Priority Tier,仅限美国推理的 1.1 倍乘数也会影响令牌在您的 Priority Tier 容量中的计算方式。使用 inference_geo: "us" 消耗的每个令牌将从您承诺的 TPM 中扣除 1.1 个令牌,这与其他定价乘数(例如提示缓存)影响消耗速率的方式一致。
Batch API 支持 inference_geo 参数。批处理中的每个请求都可以指定自己的 inference_geo 值。
如果您的组织之前选择退出全球路由以将推理保留在美国,您的工作区已自动配置为 allowed_inference_geos: ["us"] 和 default_inference_geo: "us"。无需更改代码。您现有的数据驻留要求将继续通过新的地理位置控制来强制执行。
旧版退出选项是一个组织级别的设置,将所有请求限制在位于美国的基础设施上。新的数据驻留控制通过两种机制取代了这一设置:
inference_geo 参数让您可以在每个 API 调用中指定 "us" 或 "global",为您提供请求级别的灵活性。default_inference_geo 和 allowed_inference_geos 设置让您可以对工作区中的所有密钥强制执行地理位置策略。您的工作区已自动迁移:
| 旧版设置 | 新的等效设置 |
|---|---|
| 全球路由退出选项(仅限美国) | allowed_inference_geos: ["us"],default_inference_geo: "us" |
使用您工作区密钥的所有 API 请求将继续在位于美国的基础设施上运行。无需采取任何操作即可保持当前行为。
如果您的数据驻留要求已发生变化,并且您希望利用全球路由来获得更好的性能和可用性,请更新工作区的推理地理位置设置,在允许的地理位置中包含 "global",并将 default_inference_geo 设置为 "global"。详情请参阅工作区级别限制。
旧版模型不受此迁移影响。有关较新模型的当前定价,请参阅定价。
"us" 和 "global" 可用。"us" 可用。工作区创建后无法更改 Workspace geo。Was this page helpful?