Loading...
    • Руководство разработчика
    • Справочник API
    • MCP
    • Ресурсы
    • Примечания к выпуску
    Search...
    ⌘K
    Первые шаги
    Введение в ClaudeБыстрый старт
    Модели и цены
    Обзор моделейВыбор моделиЧто нового в Claude 4.6Руководство миграцииУстаревшие моделиЦены
    Разработка с Claude
    Обзор функцийИспользование Messages APIОбработка причин остановкиЛучшие практики промптирования
    Возможности модели
    Extended thinkingAdaptive thinkingУсилиеБыстрый режим (preview)Структурированные выходные данныеЦитированияПотоковая передача сообщенийПакетная обработкаПоддержка PDFРезультаты поискаМногоязычная поддержкаEmbeddingsЗрение
    Инструменты
    ОбзорКак реализовать использование инструментовИнструмент веб-поискаИнструмент веб-загрузкиИнструмент выполнения кодаИнструмент памятиИнструмент BashИнструмент управления компьютеромИнструмент текстового редактора
    Инфраструктура инструментов
    Поиск инструментовПрограммный вызов инструментовПотоковая передача инструментов с детализацией
    Управление контекстом
    Контекстные окнаСжатиеРедактирование контекстаКэширование промптовПодсчет токенов
    Файлы и ресурсы
    Files API
    Agent Skills
    ОбзорБыстрый стартЛучшие практикиSkills для предприятийИспользование Skills с API
    Agent SDK
    ОбзорБыстрый стартTypeScript SDKTypeScript V2 (preview)Python SDKРуководство миграции
    MCP в API
    MCP коннекторУдаленные MCP серверы
    Claude на платформах третьих сторон
    Amazon BedrockMicrosoft FoundryVertex AI
    Инженерия промптов
    ОбзорГенератор промптовИспользование шаблонов промптовУлучшитель промптовБудьте ясны и прямолинейныИспользуйте примеры (многошаговое промптирование)Дайте Claude думать (CoT)Используйте XML тегиДайте Claude роль (системные промпты)Цепочка сложных промптовСоветы для длинного контекстаСоветы для Extended thinking
    Тестирование и оценка
    Определение критериев успехаРазработка тестовых случаевИспользование инструмента оценкиСнижение задержки
    Укрепление защиты
    Снижение галлюцинацийУвеличение согласованности выходных данныхСмягчение jailbreaksПотоковая передача отказовСнижение утечки промптаДержите Claude в образе
    Администрирование и мониторинг
    Обзор Admin APIРезидентность данныхРабочие пространстваUsage and Cost APIClaude Code Analytics APIZero Data Retention
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Администрирование и мониторинг

    Размещение данных

    Управляйте местом выполнения вывода модели и хранением данных с помощью географических элементов управления.

    Элементы управления размещением данных позволяют управлять местом обработки и хранения ваших данных. Два независимых параметра управляют этим:

    • Inference geo: Управляет местом выполнения вывода модели на основе каждого запроса. Устанавливается через параметр API inference_geo или как значение по умолчанию для рабочей области.
    • Workspace geo: Управляет местом хранения данных в состоянии покоя и местом обработки конечной точки (перекодирование изображений, выполнение кода и т. д.). Настраивается на уровне рабочей области в Console.

    Inference geo

    Параметр inference_geo управляет местом выполнения вывода модели для конкретного запроса API. Добавьте его к любому вызову POST /v1/messages.

    ЗначениеОписание
    "global"По умолчанию. Вывод может выполняться в любой доступной географии для оптимальной производительности и доступности.
    "us"Вывод выполняется только в инфраструктуре на основе США.

    Использование API

    curl https://api.anthropic.com/v1/messages \
        --header "x-api-key: $ANTHROPIC_API_KEY" \
        --header "anthropic-version: 2023-06-01" \
        --header "content-type: application/json" \
        --data '{
            "model": "claude-opus-4-6",
            "max_tokens": 1024,
            "inference_geo": "us",
            "messages": [{
                "role": "user",
                "content": "Summarize the key points of this document."
            }]
        }'

    Ответ

    Объект usage в ответе включает поле inference_geo, указывающее, где был выполнен вывод:

    {
      "usage": {
        "input_tokens": 25,
        "output_tokens": 150,
        "inference_geo": "us"
      }
    }

    Доступность модели

    Параметр inference_geo поддерживается на Claude Opus 4.6 и всех последующих моделях. Более старые модели, выпущенные до Opus 4.6, не поддерживают этот параметр. Запросы с inference_geo к устаревшим моделям возвращают ошибку 400.

    Параметр inference_geo доступен только в Claude API (1P). На сторонних платформах (AWS Bedrock, Google Vertex AI) регион вывода определяется URL конечной точки или профилем вывода, поэтому inference_geo неприменим. Параметр inference_geo также недоступен через конечную точку совместимости OpenAI SDK.

    Ограничения на уровне рабочей области

    Параметры рабочей области также поддерживают ограничение доступных географий вывода:

    • allowed_inference_geos: Ограничивает, какие географии может использовать рабочая область. Если запрос указывает inference_geo, отсутствующий в этом списке, API возвращает ошибку.
    • default_inference_geo: Устанавливает географию по умолчанию, когда inference_geo опущен из запроса. Отдельные запросы могут переопределить это, явно установив inference_geo.

    Эти параметры можно настроить через Console или Admin API в поле data_residency.

    Workspace geo

    Workspace geo устанавливается при создании рабочей области и не может быть изменен впоследствии. В настоящее время "us" является единственной доступной географией рабочей области.

    Чтобы установить workspace geo, создайте новую рабочую область в Console:

    1. Перейдите в Settings > Workspaces.
    2. Создайте новую рабочую область.
    3. Выберите географию рабочей области.

    Цены

    Цены на размещение данных варьируются в зависимости от поколения модели:

    • Claude Opus 4.6 и новее: Вывод только для США (inference_geo: "us") оценивается в 1,1x стандартной ставки по всем категориям ценообразования токенов (входные токены, выходные токены, записи кэша и чтение кэша).
    • Глобальная маршрутизация (inference_geo: "global" или опущено): Применяется стандартное ценообразование.
    • Более старые модели: Существующее ценообразование не изменяется независимо от параметров inference_geo.

    Это ценообразование применяется только к Claude API (1P). Сторонние платформы (AWS Bedrock, Google Vertex AI, Microsoft Foundry) имеют собственное региональное ценообразование. Подробности см. на странице цен.

    Если вы используете Priority Tier, множитель 1,1x для вывода только для США также влияет на то, как токены учитываются в отношении вашей емкости Priority Tier. Каждый токен, потребленный с inference_geo: "us", уменьшает 1,1 токена из вашего зафиксированного TPM, что соответствует тому, как другие множители ценообразования (кэширование подсказок, длинный контекст) влияют на скорость сжигания.

    Поддержка Batch API

    Параметр inference_geo поддерживается в Batch API. Каждый запрос в пакете может указать свое собственное значение inference_geo.

    Миграция с устаревших отказов

    Если ваша организация ранее отказалась от глобальной маршрутизации, чтобы сохранить вывод в США, ваша рабочая область была автоматически настроена с allowed_inference_geos: ["us"] и default_inference_geo: "us". Изменения кода не требуются. Ваши существующие требования к размещению данных продолжают применяться через новые элементы управления географией.

    Что изменилось

    Устаревший отказ был параметром на уровне организации, который ограничивал все запросы инфраструктурой на основе США. Новые элементы управления размещением данных заменяют это двумя механизмами:

    • Управление на основе каждого запроса: Параметр inference_geo позволяет указать "us" или "global" в каждом вызове API, предоставляя вам гибкость на уровне запроса.
    • Элементы управления рабочей областью: Параметры default_inference_geo и allowed_inference_geos в Console позволяют вам применять политики географии ко всем ключам в рабочей области.

    Что произошло с вашей рабочей областью

    Ваша рабочая область была перенесена автоматически:

    Устаревший параметрНовый эквивалент
    Отказ от глобальной маршрутизации (только США)allowed_inference_geos: ["us"], default_inference_geo: "us"

    Все запросы API, использующие ключи из вашей рабочей области, продолжают выполняться в инфраструктуре на основе США. Никаких действий не требуется для сохранения вашего текущего поведения.

    Если вы хотите использовать глобальную маршрутизацию

    Если ваши требования к размещению данных изменились и вы хотите воспользоваться преимуществами глобальной маршрутизации для лучшей производительности и доступности, обновите параметры географии вывода вашей рабочей области, чтобы включить "global" в разрешенные географии и установить default_inference_geo на "global". Подробности см. в разделе Ограничения на уровне рабочей области.

    Влияние на цены

    Устаревшие модели не затронуты этой миграцией. Для текущего ценообразования на более новые модели см. Цены.

    Текущие ограничения

    • Общие ограничения скорости: Ограничения скорости распределяются по всем географиям.
    • Inference geo: При запуске доступны только "us" и "global". Дополнительные регионы будут добавлены со временем.
    • Workspace geo: В настоящее время доступна только "us". Workspace geo не может быть изменена после создания рабочей области.

    Следующие шаги

    Цены

    Просмотрите детали ценообразования размещения данных.

    Рабочие области

    Узнайте о конфигурации рабочей области.

    API использования и затрат

    Отслеживайте использование и затраты по размещению данных.

    Was this page helpful?

    • Inference geo
    • Использование API
    • Ответ
    • Доступность модели
    • Ограничения на уровне рабочей области
    • Workspace geo
    • Цены
    • Поддержка Batch API
    • Миграция с устаревших отказов
    • Что изменилось
    • Что произошло с вашей рабочей областью
    • Если вы хотите использовать глобальную маршрутизацию
    • Влияние на цены
    • Текущие ограничения
    • Следующие шаги