Loading...
  • Разработка
  • Администрирование
  • Модели и цены
  • Клиентские SDK
  • Справочник API
Search...
⌘K
Модели
Обзор моделейВыбор моделиЧто нового в Claude Opus 4.7Руководство по миграцииУстаревание моделейКарточки моделейСистемные промпты
Цены
Цены
Log in
Цены
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Модели и цены/Цены

Ценообразование

Узнайте о структуре ценообразования Anthropic для моделей и функций

На этой странице представлена подробная информация о ценообразовании моделей и функций Anthropic. Все цены указаны в USD.

Для получения наиболее актуальной информации о ценах посетите claude.com/pricing.

Ценообразование моделей

В следующей таблице показаны цены для всех моделей Claude в различных ценовых уровнях:

ModelBase Input Tokens5m Cache Writes1h Cache WritesCache Hits & RefreshesOutput Tokens
Claude Opus 4.7$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.6$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.5$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.1$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Opus 4 (deprecated)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Sonnet 4.6$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4.5$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4 (deprecated)$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Haiku 4.5$1 / MTok$1.25 / MTok$2 / MTok$0.10 / MTok$5 / MTok
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)$0.80 / MTok$1 / MTok$1.60 / MTok$0.08 / MTok$4 / MTok

MTok = миллион токенов. Столбец "Base Input Tokens" показывает стандартное ценообразование входных данных, "Cache Writes" и "Cache Hits" относятся к кэшированию подсказок, а "Output Tokens" показывает ценообразование выходных данных. Объяснение столбцов кэша и множителей ценообразования см. в разделе ценообразование кэширования подсказок ниже.

Opus 4.7 использует новый токенизатор по сравнению с предыдущими моделями, что способствует его улучшенной производительности на широком спектре задач. Этот новый токенизатор может использовать на 35% больше токенов для одного и того же фиксированного текста.

Ценообразование сторонних платформ

Модели Claude доступны на AWS Bedrock, Google Vertex AI и Microsoft Foundry. Для получения официальных цен посетите:

  • Ценообразование AWS Bedrock
  • Ценообразование Google Vertex AI
  • Ценообразование Microsoft Foundry

Ценообразование региональных и мультирегиональных конечных точек для моделей Claude 4.5 и более поздних версий

Начиная с Claude Sonnet 4.5 и Haiku 4.5:

  • AWS Bedrock предлагает два типа конечных точек: глобальные конечные точки (динамическая маршрутизация для максимальной доступности) и региональные конечные точки (гарантированная маршрутизация данных через определенные географические регионы).
  • Google Vertex AI предлагает три типа конечных точек: глобальные конечные точки, мультирегиональные конечные точки (динамическая маршрутизация в пределах географической области) и региональные конечные точки.

Региональные и мультирегиональные конечные точки включают надбавку в 10% к глобальным конечным точкам. Claude API (1P) по умолчанию является глобальным; для опций и ценообразования резидентности данных 1P см. раздел Ценообразование резидентности данных ниже.

Область применения: Эта структура ценообразования применяется к Claude Sonnet 4.5, Haiku 4.5 и всем будущим моделям. Более ранние модели (Claude Sonnet 4 (устарело), Opus 4 (устарело) и более ранние выпуски) сохраняют свое существующее ценообразование.

Для деталей реализации и примеров кода:

  • AWS Bedrock глобальные и региональные конечные точки
  • Google Vertex AI глобальные, мультирегиональные и региональные конечные точки

Ценообразование функций

Кэширование подсказок

Кэширование подсказок снижает затраты и задержку путем повторного использования ранее обработанных частей вашей подсказки в вызовах API. Вместо повторной обработки одной и той же большой системной подсказки, документа или истории разговора при каждом запросе API читает из кэша по цене, составляющей часть стандартной цены входных данных.

Есть два способа включить кэширование подсказок:

  • Автоматическое кэширование: Добавьте одно поле cache_control на верхний уровень вашего запроса. Система автоматически управляет точками разрыва кэша по мере роста разговоров. Это рекомендуемая отправная точка для большинства случаев использования.
  • Явные точки разрыва кэша: Поместите cache_control непосредственно на отдельные блоки контента для точного управления тем, что именно кэшируется.

Кэширование подсказок использует следующие множители ценообразования относительно базовых ставок входных токенов:

Операция кэшаМножительДлительность
Запись в кэш на 5 минут1,25x базовая цена входных данныхКэш действителен 5 минут
Запись в кэш на 1 час2x базовая цена входных данныхКэш действителен 1 час
Чтение из кэша (попадание)0,1x базовая цена входных данныхТа же длительность, что и предыдущая запись

Токены записи в кэш взимаются при первом сохранении контента. Токены чтения из кэша взимаются, когда последующий запрос извлекает кэшированный контент. Попадание в кэш стоит 10% от стандартной цены входных данных, что означает, что кэширование окупается после всего одного чтения из кэша для 5-минутной длительности (1,25x запись) или после двух чтений из кэша для 1-часовой длительности (2x запись).

Эти множители складываются с другими модификаторами ценообразования, включая скидку Batch API и резидентность данных.

Для деталей реализации, поддерживаемых моделей и примеров кода см. документацию кэширования подсказок.

Ценообразование резидентности данных

Для Claude Opus 4.7, Claude Opus 4.6 и более новых моделей указание вывода только для США через параметр inference_geo влечет множитель 1,1x для всех категорий ценообразования токенов, включая входные токены, выходные токены, записи в кэш и чтения из кэша. Глобальная маршрутизация (по умолчанию) использует стандартное ценообразование.

Это применяется только к Claude API (1P). Сторонние платформы имеют собственное региональное ценообразование. Подробности см. в AWS Bedrock и Google Vertex AI. Более ранние модели сохраняют свое существующее ценообразование независимо от параметров inference_geo.

Для получения дополнительной информации см. документацию резидентности данных.

Ценообразование быстрого режима

Быстрый режим (бета: исследовательский предпросмотр) для Claude Opus 4.6 обеспечивает значительно более быстрый вывод по премиальному ценообразованию (6x стандартные ставки). Ценообразование быстрого режима применяется ко всему контекстному окну, включая запросы с более чем 200k входных токенов. В настоящее время поддерживается на Opus 4.6:

Входные данныеВыходные данные
$30 / MTok$150 / MTok

Ценообразование быстрого режима складывается с другими модификаторами ценообразования:

  • Множители кэширования подсказок применяются поверх ценообразования быстрого режима
  • Множители резидентности данных применяются поверх ценообразования быстрого режима

Быстрый режим недоступен с Batch API.

Для получения дополнительной информации см. документацию быстрого режима.

Пакетная обработка

Batch API позволяет асинхронно обрабатывать большие объемы запросов со скидкой 50% на входные и выходные токены.

ModelBatch inputBatch output
Claude Opus 4.7$2.50 / MTok$12.50 / MTok
Claude Opus 4.6$2.50 / MTok$12.50 / MTok
Claude Opus 4.5$2.50 / MTok$12.50 / MTok
Claude Opus 4.1$7.50 / MTok$37.50 / MTok
Claude Opus 4 (deprecated)$7.50 / MTok$37.50 / MTok
Claude Sonnet 4.6$1.50 / MTok$7.50 / MTok
Claude Sonnet 4.5$1.50 / MTok$7.50 / MTok
Claude Sonnet 4 (deprecated)$1.50 / MTok$7.50 / MTok
Claude Haiku 4.5$0.50 / MTok$2.50 / MTok
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)$0.40 / MTok$2 / MTok

Для получения дополнительной информации о пакетной обработке см. документацию пакетной обработки.

Ценообразование длинного контекста

Claude Mythos Preview, Opus 4.7, Opus 4.6 и Sonnet 4.6 включают полное контекстное окно в 1M токенов по стандартному ценообразованию. (Запрос с 900k токенами выставляется по той же ставке за токен, что и запрос с 9k токенами.) Скидки кэширования подсказок и пакетной обработки применяются по стандартным ставкам ко всему контекстному окну.

Ценообразование использования инструментов

Tool use requests are priced based on:

  1. The total number of input tokens sent to the model (including in the tools parameter)
  2. The number of output tokens generated
  3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

The additional tokens from tool use come from:

  • The tools parameter in API requests (tool names, descriptions, and schemas)
  • tool_use content blocks in API requests and responses
  • tool_result content blocks in API requests

When you use tools, the API also automatically includes a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

ModelTool choiceTool use system prompt token count
Claude Opus 4.7auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.6auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.1auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4 (deprecated)auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.6auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4 (deprecated)auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)auto, none
any, tool
264 tokens
340 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request.

Для текущих цен по моделям см. раздел ценообразование моделей.

Для получения дополнительной информации о реализации использования инструментов и лучших практиках см. документацию использования инструментов.

Ценообразование конкретных инструментов

Инструмент Bash

The bash tool adds 245 input tokens to your API calls.

Additional tokens are consumed by:

  • Command outputs (stdout/stderr)
  • Error messages
  • Large file contents

Полные детали ценообразования см. в разделе ценообразование использования инструментов.

Инструмент выполнения кода

Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.

When used without these tools, code execution is billed by execution time, tracked separately from token usage:

  • Execution time has a minimum of 5 minutes
  • Each organization receives 1,550 free hours of usage per month
  • Additional usage beyond 1,550 hours is billed at $0.05 per hour, per container
  • If files are included in the request, execution time is billed even if the tool is not invoked, due to files being preloaded onto the container

Code execution usage is tracked in the response:

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 239,
    "server_tool_use": {
      "code_execution_requests": 1
    }
  }
}

Инструмент текстового редактора

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.

In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

ToolAdditional input tokens
text_editor_20250429 (Claude 4.x)700 tokens

Полные детали ценообразования см. в разделе ценообразование использования инструментов.

Инструмент веб-поиска

Web search usage is charged in addition to token usage:

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 6039,
    "cache_read_input_tokens": 7123,
    "cache_creation_input_tokens": 7345,
    "server_tool_use": {
      "web_search_requests": 1
    }
  }
}

Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.

Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

Инструмент веб-выборки

Web fetch usage has no additional charges beyond standard token costs:

{
  "usage": {
    "input_tokens": 25039,
    "output_tokens": 931,
    "cache_read_input_tokens": 0,
    "cache_creation_input_tokens": 0,
    "server_tool_use": {
      "web_fetch_requests": 1
    }
  }
}

The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.

To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.

Example token usage for typical content:

  • Average web page (10 kB): ~2,500 tokens
  • Large documentation page (100 kB): ~25,000 tokens
  • Research paper PDF (500 kB): ~125,000 tokens

Инструмент компьютерного использования

Computer use follows the standard tool use pricing. When using the computer use tool:

System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

Computer use tool token usage:

ModelInput tokens per tool definition
Claude 4.x models735 tokens

Additional token consumption:

  • Screenshot images (see Vision pricing)
  • Tool execution results returned to Claude

If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Ценообразование Claude Managed Agents

Claude Managed Agents выставляется по двум параметрам: токены и время выполнения сеанса.

Токены

Все токены, потребленные сеансом Claude Managed Agents, выставляются по ставкам, показанным в разделе Ценообразование моделей выше. Множители кэширования подсказок применяются идентично. Веб-поиск, инициированный внутри сеанса, влечет стандартную плату в размере $10 за 1000 поисков.

Следующие модификаторы Messages API не применяются к сеансам Claude Managed Agents:

МодификаторПочему он не применяется
Скидка Batch APIСеансы являются состояние-зависимыми и интерактивными. Нет режима пакетной обработки.
Премия быстрого режимаСкорость вывода управляется средой выполнения.
Множитель резидентности данныхinference_geo — это поле запроса Messages API.
Премия длинного контекстаКонтекстное окно управляется средой выполнения.
Ценообразование сторонних платформClaude Managed Agents доступен только через Claude API напрямую.

Время выполнения сеанса

SKUСтавкаИзмерение
Время выполнения сеанса$0,08 за час сеансаДлительность статуса running

Время выполнения измеряется с точностью до миллисекунды и начисляется только во время статуса сеанса running. Время, проведенное в статусе idle (ожидание вашего следующего сообщения или подтверждения инструмента), rescheduling или terminated, не учитывается в время выполнения.

Время выполнения сеанса заменяет модель выставления счетов за часы контейнера Code Execution при использовании Claude Managed Agents. Вам не выставляются отдельные счета за часы контейнера в дополнение к времени выполнения сеанса.

Рабочий пример

Одночасовой сеанс кодирования с использованием Claude Opus 4.7, который потребляет 50 000 входных токенов и 15 000 выходных токенов:

СтрокаРасчетСтоимость
Входные токены50 000 × $5 / 1 000 000$0,25
Выходные токены15 000 × $25 / 1 000 000$0,375
Время выполнения сеанса1,0 час × $0,08$0,08
Итого$0,705

Если кэширование подсказок активно и 40 000 входных токенов являются чтениями из кэша:

СтрокаРасчетСтоимость
Некэшированные входные токены10 000 × $5 / 1 000 000$0,05
Токены чтения из кэша40 000 × $5 × 0,1 / 1 000 000$0,02
Выходные токены15 000 × $25 / 1 000 000$0,375
Время выполнения сеанса1,0 час × $0,08$0,08
Итого$0,525

Пример расчета для обработки 10 000 запросов в службу поддержки:

  • В среднем ~3700 токенов на разговор
  • Использование Claude Haiku 4.5 по цене $1/MTok входных данных, $5/MTok выходных данных
  • Общая стоимость: ~$37,00 за 10 000 запросов

Для подробного пошагового разбора этого расчета см. руководство агента поддержки клиентов.

Дополнительные соображения по ценообразованию

Стратегии оптимизации затрат

При создании агентов с Claude:

  1. Используйте подходящие модели: Выберите Haiku для простых задач, Sonnet для сложного рассуждения
  2. Реализуйте кэширование подсказок: Снизьте затраты для повторяющегося контекста
  3. Пакетные операции: Используйте Batch API для не чувствительных ко времени задач
  4. Мониторьте паттерны использования: Отслеживайте потребление токенов, чтобы выявить возможности оптимизации

Для приложений агентов с высоким объемом обратитесь в команду продаж предприятия для получения пользовательских договоренностей по ценообразованию.

Ограничения скорости

Ограничения скорости варьируются в зависимости от уровня использования и влияют на количество запросов, которые вы можете сделать:

  • Уровень 1: Начальное использование с базовыми ограничениями
  • Уровень 2: Увеличенные ограничения для растущих приложений
  • Уровень 3: Более высокие ограничения для установленных приложений
  • Уровень 4: Максимальные стандартные ограничения
  • Enterprise: Доступны пользовательские ограничения

Для подробной информации об ограничениях скорости см. документацию ограничений скорости.

Для более высоких ограничений скорости или пользовательских договоренностей по ценообразованию свяжитесь с командой продаж.

Скидки за объем

Скидки за объем могут быть доступны для пользователей с высоким объемом. Они согласовываются в каждом конкретном случае.

  • Стандартные уровни используют ценообразование, показанное выше
  • Корпоративные клиенты могут связаться с отделом продаж для получения пользовательского ценообразования
  • Скидки для академических и исследовательских целей могут быть доступны

Корпоративное ценообразование

Для корпоративных клиентов со специфическими потребностями:

  • Пользовательские ограничения скорости
  • Скидки за объем
  • Выделенная поддержка
  • Пользовательские условия

Свяжитесь с командой продаж по адресу [email protected] или через Claude Console для обсуждения опций корпоративного ценообразования.

Выставление счетов и платежи

  • Выставление счетов основано на фактическом ежемесячном использовании
  • Все платежи в USD
  • Доступны опции кредитной карты и выставления счетов
  • Отслеживание использования доступно в Claude Console

Часто задаваемые вопросы

Как рассчитывается использование токенов?

Токены — это части текста, которые обрабатывают модели. Как приблизительная оценка, 1 токен составляет примерно 4 символа или 0,75 слова на английском языке. Точное количество варьируется в зависимости от языка и типа контента.

Есть ли бесплатные уровни или пробные версии?

Новые пользователи получают небольшое количество бесплатных кредитов для тестирования API. Свяжитесь с отделом продаж для получения информации о расширенных пробных версиях для оценки предприятия.

Как складываются скидки?

Скидки Batch API и кэширования подсказок можно комбинировать. Например, использование обеих функций вместе обеспечивает значительную экономию затрат по сравнению со стандартными вызовами API. См. ценообразование кэширования подсказок для получения информации о том, как взаимодействуют множители.

Какие способы оплаты принимаются?

Основные кредитные карты принимаются для стандартных учетных записей. Корпоративные клиенты могут организовать выставление счетов и другие способы оплаты.

Для дополнительных вопросов о ценообразовании свяжитесь с [email protected].

Was this page helpful?

  • Ценообразование моделей
  • Ценообразование сторонних платформ
  • Ценообразование функций
  • Кэширование подсказок
  • Ценообразование резидентности данных
  • Ценообразование быстрого режима
  • Пакетная обработка
  • Ценообразование длинного контекста
  • Ценообразование использования инструментов
  • Ценообразование конкретных инструментов
  • Ценообразование Claude Managed Agents
  • Токены
  • Время выполнения сеанса
  • Рабочий пример
  • Дополнительные соображения по ценообразованию
  • Стратегии оптимизации затрат
  • Ограничения скорости
  • Скидки за объем
  • Корпоративное ценообразование
  • Выставление счетов и платежи
  • Часто задаваемые вопросы