Элементы управления размещением данных позволяют управлять местом обработки и хранения ваших данных. Два независимых параметра управляют этим:
inference_geo или как значение по умолчанию для рабочей области.Параметр inference_geo управляет местом выполнения вывода модели для конкретного запроса API. Добавьте его к любому вызову POST /v1/messages.
| Значение | Описание |
|---|---|
"global" | По умолчанию. Вывод может выполняться в любой доступной географии для оптимальной производительности и доступности. |
"us" | Вывод выполняется только в инфраструктуре на основе США. |
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-6",
"max_tokens": 1024,
"inference_geo": "us",
"messages": [{
"role": "user",
"content": "Summarize the key points of this document."
}]
}'Объект usage в ответе включает поле inference_geo, указывающее, где был выполнен вывод:
{
"usage": {
"input_tokens": 25,
"output_tokens": 150,
"inference_geo": "us"
}
}Параметр inference_geo поддерживается на Claude Opus 4.6 и всех последующих моделях. Более старые модели, выпущенные до Opus 4.6, не поддерживают этот параметр. Запросы с inference_geo к устаревшим моделям возвращают ошибку 400.
Параметр inference_geo доступен только в Claude API (1P). На сторонних платформах (AWS Bedrock, Google Vertex AI) регион вывода определяется URL конечной точки или профилем вывода, поэтому inference_geo неприменим. Параметр inference_geo также недоступен через конечную точку совместимости OpenAI SDK.
Параметры рабочей области также поддерживают ограничение доступных географий вывода:
allowed_inference_geos: Ограничивает, какие географии может использовать рабочая область. Если запрос указывает inference_geo, отсутствующий в этом списке, API возвращает ошибку.default_inference_geo: Устанавливает географию по умолчанию, когда inference_geo опущен из запроса. Отдельные запросы могут переопределить это, явно установив inference_geo.Эти параметры можно настроить через Console или Admin API в поле data_residency.
Workspace geo устанавливается при создании рабочей области и не может быть изменен впоследствии. В настоящее время "us" является единственной доступной географией рабочей области.
Чтобы установить workspace geo, создайте новую рабочую область в Console:
Цены на размещение данных варьируются в зависимости от поколения модели:
inference_geo: "us") оценивается в 1,1x стандартной ставки по всем категориям ценообразования токенов (входные токены, выходные токены, записи кэша и чтение кэша).inference_geo: "global" или опущено): Применяется стандартное ценообразование.inference_geo.Это ценообразование применяется только к Claude API (1P). Сторонние платформы (AWS Bedrock, Google Vertex AI, Microsoft Foundry) имеют собственное региональное ценообразование. Подробности см. на странице цен.
Если вы используете Priority Tier, множитель 1,1x для вывода только для США также влияет на то, как токены учитываются в отношении вашей емкости Priority Tier. Каждый токен, потребленный с inference_geo: "us", уменьшает 1,1 токена из вашего зафиксированного TPM, что соответствует тому, как другие множители ценообразования (кэширование подсказок, длинный контекст) влияют на скорость сжигания.
Параметр inference_geo поддерживается в Batch API. Каждый запрос в пакете может указать свое собственное значение inference_geo.
Если ваша организация ранее отказалась от глобальной маршрутизации, чтобы сохранить вывод в США, ваша рабочая область была автоматически настроена с allowed_inference_geos: ["us"] и default_inference_geo: "us". Изменения кода не требуются. Ваши существующие требования к размещению данных продолжают применяться через новые элементы управления географией.
Устаревший отказ был параметром на уровне организации, который ограничивал все запросы инфраструктурой на основе США. Новые элементы управления размещением данных заменяют это двумя механизмами:
inference_geo позволяет указать "us" или "global" в каждом вызове API, предоставляя вам гибкость на уровне запроса.default_inference_geo и allowed_inference_geos в Console позволяют вам применять политики географии ко всем ключам в рабочей области.Ваша рабочая область была перенесена автоматически:
| Устаревший параметр | Новый эквивалент |
|---|---|
| Отказ от глобальной маршрутизации (только США) | allowed_inference_geos: ["us"], default_inference_geo: "us" |
Все запросы API, использующие ключи из вашей рабочей области, продолжают выполняться в инфраструктуре на основе США. Никаких действий не требуется для сохранения вашего текущего поведения.
Если ваши требования к размещению данных изменились и вы хотите воспользоваться преимуществами глобальной маршрутизации для лучшей производительности и доступности, обновите параметры географии вывода вашей рабочей области, чтобы включить "global" в разрешенные географии и установить default_inference_geo на "global". Подробности см. в разделе Ограничения на уровне рабочей области.
Устаревшие модели не затронуты этой миграцией. Для текущего ценообразования на более новые модели см. Цены.
"us" и "global". Дополнительные регионы будут добавлены со временем."us". Workspace geo не может быть изменена после создания рабочей области.Просмотрите детали ценообразования размещения данных.
Узнайте о конфигурации рабочей области.
Отслеживайте использование и затраты по размещению данных.
Was this page helpful?