This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
数据驻留控制让您管理数据的处理和存储位置。两个独立的设置控制这一点:
inference_geo API 参数或作为工作区默认值设置。inference_geo 参数控制特定 API 请求的模型推理运行位置。将其添加到任何 POST /v1/messages 调用中。
| 值 | 描述 |
|---|---|
"global" | 默认值。推理可能在任何可用的地理位置运行,以获得最佳性能和可用性。 |
"us" | 推理仅在基于美国的基础设施上运行。 |
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
inference_geo="us",
messages=[
{"role": "user", "content": "Summarize the key points of this document."}
],
)
print(response.content[0].text)
# Check where inference actually ran
print(f"Inference geo: {response.usage.inference_geo}")响应 usage 对象包含一个 inference_geo 字段,指示推理运行的位置:
{
"usage": {
"input_tokens": 25,
"output_tokens": 150,
"inference_geo": "us"
}
}inference_geo 参数在 Claude Opus 4.6 及所有后续模型上受支持。在 Opus 4.6 之前发布的较旧模型不支持该参数。在旧版模型上使用 inference_geo 的请求会返回 400 错误。
inference_geo 参数仅在 Claude API (1P) 上可用。在第三方平台(AWS Bedrock、Google Vertex AI)上,推理区域由端点 URL 或推理配置文件确定,因此 inference_geo 不适用。inference_geo 参数也不能通过 OpenAI SDK 兼容性端点 使用。
工作区设置还支持限制哪些推理地理位置可用:
allowed_inference_geos: 限制工作区可以使用的地理位置。如果请求指定的 inference_geo 不在此列表中,API 会返回错误。default_inference_geo: 设置当请求中省略 inference_geo 时的回退地理位置。单个请求可以通过显式设置 inference_geo 来覆盖此设置。这些设置可以通过 Console 或 Admin API 在 data_residency 字段下配置。
工作区地理位置在创建工作区时设置,之后无法更改。目前,"us" 是唯一可用的工作区地理位置。
要设置工作区地理位置,请在 Console 中创建新工作区:
数据驻留定价因模型代数而异:
inference_geo: "us")的定价为标准费率的 1.1 倍,适用于所有代币定价类别(输入代币、输出代币、缓存写入和缓存读取)。inference_geo: "global" 或省略):适用标准定价。inference_geo 设置如何,现有定价保持不变。此定价仅适用于 Claude API (1P)。第三方平台(AWS Bedrock、Google Vertex AI)有自己的区域定价。有关详细信息,请参阅 定价页面。
如果您使用 Priority Tier,仅限美国推理的 1.1 倍乘数也会影响代币如何计入您的 Priority Tier 容量。使用 inference_geo: "us" 消耗的每个代币会从您承诺的 TPM 中扣除 1.1 个代币,与其他定价乘数(如提示缓存)影响消耗率的方式一致。
inference_geo 参数在 Batch API 上受支持。批处理中的每个请求都可以指定自己的 inference_geo 值。
如果您的组织之前选择退出全球路由以将推理保持在美国,您的工作区已自动配置为 allowed_inference_geos: ["us"] 和 default_inference_geo: "us"。无需更改代码。您现有的数据驻留要求继续通过新的地理位置控制强制执行。
旧版选择退出是一个组织级别的设置,限制所有请求仅在基于美国的基础设施上运行。新的数据驻留控制用两种机制替代了这一点:
inference_geo 参数让您在每个 API 调用上指定 "us" 或 "global",为您提供请求级别的灵活性。default_inference_geo 和 allowed_inference_geos 设置让您在工作区中的所有密钥上强制执行地理位置策略。您的工作区已自动迁移:
| 旧版设置 | 新的等效设置 |
|---|---|
| 全球路由选择退出(仅限美国) | allowed_inference_geos: ["us"]、default_inference_geo: "us" |
使用来自您工作区的密钥的所有 API 请求继续在基于美国的基础设施上运行。无需采取任何操作来维持您当前的行为。
如果您的数据驻留要求已更改,并且您想利用全球路由来获得更好的性能和可用性,请更新您工作区的推理地理位置设置,以在允许的地理位置中包含 "global",并将 default_inference_geo 设置为 "global"。有关详细信息,请参阅 工作区级别的限制。
旧版模型不受此迁移的影响。有关较新模型的当前定价,请参阅 定价。
"us" 和 "global" 可用。随着时间的推移,将添加其他区域。"us" 可用。工作区创建后无法更改工作区地理位置。Was this page helpful?