Эта функция соответствует требованиям Zero Data Retention (ZDR) (нулевого хранения данных). Если у вашей организации действует соглашение ZDR, данные, отправленные через эту функцию, не сохраняются после возврата ответа API.
Настройки резидентности данных позволяют управлять тем, где обрабатываются и хранятся ваши данные. За это отвечают два независимых параметра:
inference_geo или как значение по умолчанию для рабочего пространства.Claude Managed Agents не поддерживает параметр inference_geo, но учитывает Workspace geo, настроенную в Console. При использовании самостоятельно размещаемых песочниц выполнение инструментов и файловая система песочницы остаются на инфраструктуре, которую вы контролируете.
Параметр inference_geo определяет, где выполняется инференс модели для конкретного запроса к API. Добавьте его в любой вызов POST /v1/messages.
| Значение | Описание |
|---|---|
"global" | По умолчанию. Инференс может выполняться в любой доступной географии для оптимальной производительности и доступности. |
"us" | Инференс выполняется только на инфраструктуре, расположенной в США. |
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
inference_geo="us",
messages=[
{"role": "user", "content": "Summarize the key points of this document."}
],
)
print(response.content[0].text)
# Проверяем, где фактически выполнился инференс
print(f"Inference geo: {response.usage.inference_geo}")Объект usage в ответе содержит поле inference_geo, указывающее, где был выполнен инференс:
{
"usage": {
"input_tokens": 25,
"output_tokens": 150,
"inference_geo": "us"
}
}Параметр inference_geo поддерживается в Claude Opus 4.6, Claude Sonnet 4.6 и более поздних моделях. Запросы с inference_geo к Claude Opus 4.5, Claude Sonnet 4.5, Claude Haiku 4.5 или более ранним моделям возвращают ошибку 400.
Параметр inference_geo доступен в Claude API (собственном) и Claude Platform on AWS. В Amazon Bedrock, Vertex AI и Microsoft Foundry регион инференса определяется URL-адресом конечной точки или профилем инференса, поэтому inference_geo неприменим. Параметр inference_geo также недоступен через конечную точку совместимости с OpenAI SDK.
Настройки рабочего пространства также позволяют ограничить доступные географии инференса:
allowed_inference_geos: Ограничивает, какие географии может использовать рабочее пространство. Если в запросе указан inference_geo, отсутствующий в этом списке, API возвращает ошибку.default_inference_geo: Задаёт географию по умолчанию, когда inference_geo не указан в запросе. Отдельные запросы могут переопределить это значение, явно указав inference_geo.Эти настройки можно задать через Console или Admin API в поле data_residency.
Workspace geo задаётся при создании рабочего пространства и не может быть изменена впоследствии. В настоящее время "us" — единственная доступная география рабочего пространства.
Чтобы задать Workspace geo, создайте новое рабочее пространство в Console:
Claude Platform on AWS: Workspace geo не настраивается. Рабочие пространства создаются через AWS Console, а страница Workspaces в Claude Console доступна только для чтения. Сессии Claude Managed Agents на этой платформе выполняются с фактической Workspace geo, равной "us", — в настоящее время это единственная доступная география рабочего пространства. См. Claude Platform on AWS для получения информации о резидентности данных, специфичной для этой платформы.
Цены на резидентность данных зависят от поколения модели:
inference_geo: "us") тарифицируется по ставке 1,1x от стандартной во всех категориях цен на токены (входные токены, выходные токены, запись в кэш и чтение из кэша).inference_geo: "global"): Применяются стандартные цены.inference_geo (см. Доступность моделей); применяются стандартные цены. Запросы, содержащие этот параметр, возвращают ошибку 400.Эти цены применяются к Claude API (собственному) и Claude Platform on AWS. Платформы, управляемые партнёрами (Bedrock и Vertex AI), имеют собственные региональные цены. Подробнее см. в разделе Цены на резидентность данных.
Если вы используете Priority Tier, множитель 1,1x для инференса только в США также влияет на то, как токены учитываются в вашей ёмкости Priority Tier. Каждый токен, потреблённый с inference_geo: "us", списывает 1,1 токена из вашего зарезервированного TPM — аналогично тому, как другие ценовые множители (например, кэширование подсказок) влияют на скорость расходования.
Параметр inference_geo поддерживается в Batch API. Каждый запрос в пакете может указывать собственное значение inference_geo.
Если ваша организация ранее отказалась от глобальной маршрутизации, чтобы инференс выполнялся только в США, ваше рабочее пространство было автоматически настроено с параметрами allowed_inference_geos: ["us"] и default_inference_geo: "us". Изменения в коде не требуются. Ваши существующие требования к резидентности данных продолжают соблюдаться через новые географические настройки.
Устаревший отказ был настройкой уровня организации, которая ограничивала все запросы инфраструктурой, расположенной в США. Новые настройки резидентности данных заменяют её двумя механизмами:
inference_geo позволяет указывать "us" или "global" в каждом вызове API, обеспечивая гибкость на уровне отдельных запросов.default_inference_geo и allowed_inference_geos в Console позволяют применять географические политики ко всем ключам в рабочем пространстве.Ваше рабочее пространство было мигрировано автоматически:
| Устаревшая настройка | Новый эквивалент |
|---|---|
| Отказ от глобальной маршрутизации (только США) | allowed_inference_geos: ["us"], default_inference_geo: "us" |
Все запросы к API с использованием ключей из вашего рабочего пространства продолжают выполняться на инфраструктуре, расположенной в США. Для сохранения текущего поведения никаких действий не требуется.
Если ваши требования к резидентности данных изменились и вы хотите воспользоваться глобальной маршрутизацией для повышения производительности и доступности, обновите настройки географии инференса вашего рабочего пространства: добавьте "global" в список разрешённых географий и установите default_inference_geo в значение "global". Подробнее см. в разделе Ограничения на уровне рабочего пространства.
Устаревшие модели не затронуты этой миграцией. Актуальные цены для новых моделей см. в разделе Цены.
"us" и "global"."us". Workspace geo нельзя изменить после создания рабочего пространства.Посмотреть подробности о ценах на резидентность данных.
Узнать о настройке рабочих пространств.
Отслеживать использование и затраты по резидентности данных.
Was this page helpful?