This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
Элементы управления размещением данных позволяют вам управлять местом обработки и хранения ваших данных. Два независимых параметра управляют этим:
inference_geo или как значение по умолчанию для рабочей области.Параметр inference_geo управляет местом выполнения вывода модели для конкретного запроса API. Добавьте его к любому вызову POST /v1/messages.
| Значение | Описание |
|---|---|
"global" | По умолчанию. Вывод может выполняться в любой доступной географии для оптимальной производительности и доступности. |
"us" | Вывод выполняется только в инфраструктуре на основе США. |
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
inference_geo="us",
messages=[
{"role": "user", "content": "Summarize the key points of this document."}
],
)
print(response.content[0].text)
# Check where inference actually ran
print(f"Inference geo: {response.usage.inference_geo}")Объект usage в ответе включает поле inference_geo, указывающее, где был выполнен вывод:
{
"usage": {
"input_tokens": 25,
"output_tokens": 150,
"inference_geo": "us"
}
}Параметр inference_geo поддерживается на Claude Opus 4.6 и всех последующих моделях. Более старые модели, выпущенные до Opus 4.6, не поддерживают этот параметр. Запросы с inference_geo к устаревшим моделям возвращают ошибку 400.
Параметр inference_geo доступен только в Claude API (1P). На сторонних платформах (AWS Bedrock, Google Vertex AI) регион вывода определяется URL конечной точки или профилем вывода, поэтому inference_geo неприменим. Параметр inference_geo также недоступен через конечную точку совместимости OpenAI SDK.
Параметры рабочей области также поддерживают ограничение доступных географий вывода:
allowed_inference_geos: Ограничивает, какие географии может использовать рабочая область. Если запрос указывает inference_geo, отсутствующий в этом списке, API возвращает ошибку.default_inference_geo: Устанавливает географию по умолчанию, когда inference_geo опущен в запросе. Отдельные запросы могут переопределить это, явно установив inference_geo.Эти параметры можно настроить через Console или Admin API в поле data_residency.
Workspace geo устанавливается при создании рабочей области и не может быть изменен впоследствии. В настоящее время "us" — единственная доступная workspace geo.
Чтобы установить workspace geo, создайте новую рабочую область в Console:
Ценообразование размещения данных варьируется в зависимости от поколения модели:
inference_geo: "us") оценивается в 1,1x стандартной ставки по всем категориям ценообразования токенов (входные токены, выходные токены, записи кэша и чтения кэша).inference_geo: "global" или опущено): Применяется стандартное ценообразование.inference_geo.Это ценообразование применяется только к Claude API (1P). Сторонние платформы (AWS Bedrock, Google Vertex AI) имеют собственное региональное ценообразование. Подробности см. на странице ценообразования.
Если вы используете Priority Tier, множитель 1,1x для вывода только в США также влияет на то, как токены учитываются в отношении емкости Priority Tier. Каждый токен, потребленный с inference_geo: "us", использует 1,1 токена из вашего выделенного TPM, что соответствует тому, как другие множители ценообразования (такие как кэширование подсказок) влияют на скорость расходования.
Параметр inference_geo поддерживается в Batch API. Каждый запрос в пакете может указать свое собственное значение inference_geo.
Если ваша организация ранее отказалась от глобальной маршрутизации, чтобы сохранить вывод в США, ваша рабочая область была автоматически настроена с allowed_inference_geos: ["us"] и default_inference_geo: "us". Изменения кода не требуются. Ваши существующие требования к размещению данных продолжают применяться через новые элементы управления географией.
Устаревший отказ был параметром на уровне организации, который ограничивал все запросы инфраструктурой на основе США. Новые элементы управления размещением данных заменяют это двумя механизмами:
inference_geo позволяет вам указать "us" или "global" в каждом вызове API, предоставляя гибкость на уровне запроса.default_inference_geo и allowed_inference_geos в Console позволяют вам применять политики географии ко всем ключам в рабочей области.Ваша рабочая область была автоматически перенесена:
| Устаревший параметр | Новый эквивалент |
|---|---|
| Отказ от глобальной маршрутизации (только США) | allowed_inference_geos: ["us"], default_inference_geo: "us" |
Все запросы API, использующие ключи из вашей рабочей области, продолжают выполняться в инфраструктуре на основе США. Никаких действий не требуется для сохранения вашего текущего поведения.
Если ваши требования к размещению данных изменились и вы хотите воспользоваться глобальной маршрутизацией для лучшей производительности и доступности, обновите параметры inference geo вашей рабочей области, чтобы включить "global" в разрешенные географии и установите default_inference_geo на "global". Подробности см. в разделе Ограничения на уровне рабочей области.
Устаревшие модели не затронуты этой миграцией. Для текущего ценообразования на более новых моделях см. Ценообразование.
"us" и "global". Дополнительные регионы будут добавлены со временем."us". Workspace geo не может быть изменена после создания рабочей области.Просмотрите детали ценообразования размещения данных.
Узнайте о конфигурации рабочей области.
Отслеживайте использование и затраты по размещению данных.
Was this page helpful?