Loading...
  • Разработка
  • Администрирование
  • Модели и цены
  • Клиентские SDK
  • Справочник API
Search...
⌘K
Log in
Резидентность данных
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Администрирование

Размещение данных

Управляйте местом выполнения вывода модели и хранением данных с помощью географических элементов управления.

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Элементы управления размещением данных позволяют вам управлять местом обработки и хранения ваших данных. Два независимых параметра управляют этим:

  • Inference geo: Управляет местом выполнения вывода модели на основе каждого запроса. Устанавливается через параметр API inference_geo или как значение по умолчанию для рабочей области.
  • Workspace geo: Управляет местом хранения данных в состоянии покоя и где происходит обработка конечной точки (перекодирование изображений, выполнение кода и т. д.). Настраивается на уровне рабочей области в Console.

Inference geo

Параметр inference_geo управляет местом выполнения вывода модели для конкретного запроса API. Добавьте его к любому вызову POST /v1/messages.

ЗначениеОписание
"global"По умолчанию. Вывод может выполняться в любой доступной географии для оптимальной производительности и доступности.
"us"Вывод выполняется только в инфраструктуре на основе США.

Использование API

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    inference_geo="us",
    messages=[
        {"role": "user", "content": "Summarize the key points of this document."}
    ],
)

print(response.content[0].text)
# Check where inference actually ran
print(f"Inference geo: {response.usage.inference_geo}")

Ответ

Объект usage в ответе включает поле inference_geo, указывающее, где был выполнен вывод:

Output
{
  "usage": {
    "input_tokens": 25,
    "output_tokens": 150,
    "inference_geo": "us"
  }
}

Доступность модели

Параметр inference_geo поддерживается на Claude Opus 4.6 и всех последующих моделях. Более старые модели, выпущенные до Opus 4.6, не поддерживают этот параметр. Запросы с inference_geo к устаревшим моделям возвращают ошибку 400.

Параметр inference_geo доступен только в Claude API (1P). На сторонних платформах (AWS Bedrock, Google Vertex AI) регион вывода определяется URL конечной точки или профилем вывода, поэтому inference_geo неприменим. Параметр inference_geo также недоступен через конечную точку совместимости OpenAI SDK.

Ограничения на уровне рабочей области

Параметры рабочей области также поддерживают ограничение доступных географий вывода:

  • allowed_inference_geos: Ограничивает, какие географии может использовать рабочая область. Если запрос указывает inference_geo, отсутствующий в этом списке, API возвращает ошибку.
  • default_inference_geo: Устанавливает географию по умолчанию, когда inference_geo опущен в запросе. Отдельные запросы могут переопределить это, явно установив inference_geo.

Эти параметры можно настроить через Console или Admin API в поле data_residency.

Workspace geo

Workspace geo устанавливается при создании рабочей области и не может быть изменен впоследствии. В настоящее время "us" — единственная доступная workspace geo.

Чтобы установить workspace geo, создайте новую рабочую область в Console:

  1. Перейдите в Settings > Workspaces.
  2. Создайте новую рабочую область.
  3. Выберите workspace geo.

Ценообразование

Ценообразование размещения данных варьируется в зависимости от поколения модели:

  • Claude Opus 4.6 и новее: Вывод только в США (inference_geo: "us") оценивается в 1,1x стандартной ставки по всем категориям ценообразования токенов (входные токены, выходные токены, записи кэша и чтения кэша).
  • Глобальная маршрутизация (inference_geo: "global" или опущено): Применяется стандартное ценообразование.
  • Более старые модели: Существующее ценообразование не изменяется независимо от параметров inference_geo.

Это ценообразование применяется только к Claude API (1P). Сторонние платформы (AWS Bedrock, Google Vertex AI) имеют собственное региональное ценообразование. Подробности см. на странице ценообразования.

Если вы используете Priority Tier, множитель 1,1x для вывода только в США также влияет на то, как токены учитываются в отношении емкости Priority Tier. Каждый токен, потребленный с inference_geo: "us", использует 1,1 токена из вашего выделенного TPM, что соответствует тому, как другие множители ценообразования (такие как кэширование подсказок) влияют на скорость расходования.

Поддержка Batch API

Параметр inference_geo поддерживается в Batch API. Каждый запрос в пакете может указать свое собственное значение inference_geo.

Миграция с устаревших отказов

Если ваша организация ранее отказалась от глобальной маршрутизации, чтобы сохранить вывод в США, ваша рабочая область была автоматически настроена с allowed_inference_geos: ["us"] и default_inference_geo: "us". Изменения кода не требуются. Ваши существующие требования к размещению данных продолжают применяться через новые элементы управления географией.

Что изменилось

Устаревший отказ был параметром на уровне организации, который ограничивал все запросы инфраструктурой на основе США. Новые элементы управления размещением данных заменяют это двумя механизмами:

  • Управление на уровне запроса: Параметр inference_geo позволяет вам указать "us" или "global" в каждом вызове API, предоставляя гибкость на уровне запроса.
  • Элементы управления рабочей областью: Параметры default_inference_geo и allowed_inference_geos в Console позволяют вам применять политики географии ко всем ключам в рабочей области.

Что произошло с вашей рабочей областью

Ваша рабочая область была автоматически перенесена:

Устаревший параметрНовый эквивалент
Отказ от глобальной маршрутизации (только США)allowed_inference_geos: ["us"], default_inference_geo: "us"

Все запросы API, использующие ключи из вашей рабочей области, продолжают выполняться в инфраструктуре на основе США. Никаких действий не требуется для сохранения вашего текущего поведения.

Если вы хотите использовать глобальную маршрутизацию

Если ваши требования к размещению данных изменились и вы хотите воспользоваться глобальной маршрутизацией для лучшей производительности и доступности, обновите параметры inference geo вашей рабочей области, чтобы включить "global" в разрешенные географии и установите default_inference_geo на "global". Подробности см. в разделе Ограничения на уровне рабочей области.

Влияние на ценообразование

Устаревшие модели не затронуты этой миграцией. Для текущего ценообразования на более новых моделях см. Ценообразование.

Текущие ограничения

  • Общие ограничения скорости: Ограничения скорости распределяются по всем географиям.
  • Inference geo: При запуске доступны только "us" и "global". Дополнительные регионы будут добавлены со временем.
  • Workspace geo: В настоящее время доступна только "us". Workspace geo не может быть изменена после создания рабочей области.

Следующие шаги

Ценообразование

Просмотрите детали ценообразования размещения данных.

Рабочие области

Узнайте о конфигурации рабочей области.

API использования и затрат

Отслеживайте использование и затраты по размещению данных.

Was this page helpful?

  • Inference geo
  • Использование API
  • Ответ
  • Доступность модели
  • Ограничения на уровне рабочей области
  • Workspace geo
  • Ценообразование
  • Поддержка Batch API
  • Миграция с устаревших отказов
  • Что изменилось
  • Что произошло с вашей рабочей областью
  • Если вы хотите использовать глобальную маршрутизацию
  • Влияние на ценообразование
  • Текущие ограничения
  • Следующие шаги