На этой странице представлена подробная информация о ценообразовании моделей и функций Anthropic. Все цены указаны в USD.
Для получения самой актуальной информации о ценах посетите claude.com/pricing.
В следующей таблице показаны цены для всех моделей Claude в различных ценовых уровнях:
| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.6 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.5 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok |
Was this page helpful?
| $1.50 / MTok |
| $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.6 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = миллион токенов. Столбец "Base Input Tokens" показывает стандартное ценообразование входных данных, "Cache Writes" и "Cache Hits" относятся к кэшированию подсказок, а "Output Tokens" показывает ценообразование выходных данных. Кэширование подсказок предлагает как кэш на 5 минут (по умолчанию), так и кэш на 1 час для оптимизации затрат в различных сценариях использования.
Таблица выше отражает следующие множители ценообразования для кэширования подсказок:
Модели Claude доступны на AWS Bedrock, Google Vertex AI и Microsoft Foundry. Для получения официальной информации о ценах посетите:
Ценообразование региональных конечных точек для моделей Claude 4.5 и более новых
Начиная с Claude Sonnet 4.5 и Haiku 4.5, AWS Bedrock и Google Vertex AI предлагают два типа конечных точек:
Региональные конечные точки включают надбавку в 10% по сравнению с глобальными конечными точками. Claude API (1P) является глобальным по умолчанию и не затронут этим изменением. Claude API является только глобальным (эквивалентно предложению глобальной конечной точки и ценообразованию от других поставщиков).
Область применения: эта структура ценообразования применяется к Claude Sonnet 4.5, Haiku 4.5 и всем будущим моделям. Более ранние модели (Claude Sonnet 4, Opus 4 и более ранние выпуски) сохраняют своё существующее ценообразование.
Для деталей реализации и примеров кода:
Для Claude Opus 4.6 и более новых моделей указание вывода только для США через параметр inference_geo влечёт множитель 1,1x на все категории ценообразования токенов, включая входные токены, выходные токены, записи в кэш и чтения из кэша. Глобальная маршрутизация (по умолчанию) использует стандартное ценообразование.
Это применяется только к Claude API (1P). Платформы третьих сторон имеют своё собственное региональное ценообразование — см. AWS Bedrock, Google Vertex AI и Microsoft Foundry для деталей. Более ранние модели сохраняют своё существующее ценообразование независимо от параметров inference_geo.
Для получения дополнительной информации см. нашу документацию по размещению данных.
Batch API позволяет асинхронно обрабатывать большие объёмы запросов со скидкой 50% на входные и выходные токены.
| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.6 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.5 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.6 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Для получения дополнительной информации о пакетной обработке см. нашу документацию по пакетной обработке.
При использовании Claude Opus 4.6, Sonnet 4.5 или Sonnet 4 с включённым окном контекста в 1M токенов запросы, превышающие 200K входных токенов, автоматически взимаются по премиум-ставкам для длинного контекста:
Окно контекста в 1M токенов в настоящее время находится в бета-версии для организаций в уровне использования 4 и организаций с пользовательскими ограничениями скорости. Окно контекста в 1M токенов доступно только для Claude Opus 4.6, Sonnet 4.5 и Sonnet 4.
| Модель | ≤ 200K входных токенов | > 200K входных токенов |
|---|---|---|
| Claude Opus 4.6 | Входные: $5 / MTok | Входные: $10 / MTok |
| Выходные: $25 / MTok | Выходные: $37.50 / MTok | |
| Claude Sonnet 4.5 / 4 | Входные: $3 / MTok | Входные: $6 / MTok |
| Выходные: $15 / MTok | Выходные: $22.50 / MTok |
Ценообразование для длинного контекста складывается с другими модификаторами ценообразования:
Даже с включённым флагом бета-версии запросы с менее чем 200K входных токенов взимаются по стандартным ставкам. Если ваш запрос превышает 200K входных токенов, все токены взимаются по премиум-ценам.
Порог 200K основан исключительно на входных токенах (включая чтения/записи в кэш). Количество выходных токенов не влияет на выбор уровня ценообразования, хотя выходные токены взимаются по более высокой ставке, когда превышен порог входных данных.
Чтобы проверить, был ли ваш запрос API взимается по ставкам окна контекста в 1M, изучите объект usage в ответе API:
{
"usage": {
"input_tokens": 250000,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"output_tokens": 500
}
}Рассчитайте общее количество входных токенов путём суммирования:
input_tokenscache_creation_input_tokens (если используется кэширование подсказок)cache_read_input_tokens (если используется кэширование подсказок)Если общее количество превышает 200 000 токенов, весь запрос был выставлен по ставкам контекста в 1M.
Для получения дополнительной информации об объекте usage см. документацию по ответу API.
Tool use requests are priced based on:
tools parameter)Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
tools parameter in API requests (tool names, descriptions, and schemas)tool_use content blocks in API requests and responsestool_result content blocks in API requestsWhen you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
Для получения текущих цен для каждой модели обратитесь к разделу ценообразование моделей выше.
Для получения дополнительной информации о реализации использования инструментов и лучших практиках см. нашу документацию по использованию инструментов.
The bash tool adds 245 input tokens to your API calls.
Additional tokens are consumed by:
См. ценообразование использования инструментов для получения полной информации о ценах.
Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.
When used without these tools, code execution is billed by execution time, tracked separately from token usage:
Code execution usage is tracked in the response:
"usage": {
"input_tokens": 105,
"output_tokens": 239,
"server_tool_use": {
"code_execution_requests": 1
}
}The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.
In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
См. ценообразование использования инструментов для получения полной информации о ценах.
Web search usage is charged in addition to token usage:
"usage": {
"input_tokens": 105,
"output_tokens": 6039,
"cache_read_input_tokens": 7123,
"cache_creation_input_tokens": 7345,
"server_tool_use": {
"web_search_requests": 1
}
}Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Web fetch usage has no additional charges beyond standard token costs:
"usage": {
"input_tokens": 25039,
"output_tokens": 931,
"cache_read_input_tokens": 0,
"cache_creation_input_tokens": 0,
"server_tool_use": {
"web_fetch_requests": 1
}
}The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.
To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
Additional token consumption:
If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Понимание ценообразования для приложений агентов имеет решающее значение при разработке с Claude. Эти примеры из реальной жизни могут помочь вам оценить затраты для различных паттернов агентов.
При разработке агента поддержки клиентов вот как могут распределяться затраты:
Пример расчёта для обработки 10 000 билетов поддержки:
Для подробного пошагового разбора этого расчёта см. наше руководство по агенту поддержки клиентов.
Для более сложных архитектур агентов с несколькими шагами:
Обработка начального запроса
Извлечение памяти и контекста
Планирование и выполнение действий
Для получения подробного руководства по паттернам ценообразования агентов см. наше руководство по сценариям использования агентов.
При разработке агентов с Claude:
Для приложений агентов с высоким объёмом рассмотрите возможность связаться с нашей командой корпоративных продаж для получения пользовательских договоренностей по ценообразованию.
Ограничения скорости варьируются в зависимости от уровня использования и влияют на количество запросов, которые вы можете сделать:
Для получения подробной информации об ограничениях скорости см. нашу документацию по ограничениям скорости.
Для получения более высоких ограничений скорости или пользовательских договоренностей по ценообразованию свяжитесь с нашей командой продаж.
Скидки за объём могут быть доступны для пользователей с высоким объёмом. Они согласовываются в индивидуальном порядке.
Для корпоративных клиентов со специфическими потребностями:
Свяжитесь с нашей командой продаж по адресу [email protected] или через Claude Console для обсуждения вариантов корпоративного ценообразования.
Как рассчитывается использование токенов?
Токены — это части текста, которые обрабатывают модели. Как приблизительная оценка, 1 токен составляет примерно 4 символа или 0,75 слова на английском языке. Точное количество варьируется в зависимости от языка и типа контента.
Есть ли бесплатные уровни или пробные версии?
Новые пользователи получают небольшое количество бесплатных кредитов для тестирования API. Свяжитесь с отделом продаж для получения информации о расширенных пробных версиях для оценки предприятия.
Как складываются скидки?
Скидки Batch API и кэширования подсказок можно комбинировать. Например, использование обеих функций вместе обеспечивает значительную экономию затрат по сравнению со стандартными вызовами API.
Какие способы оплаты принимаются?
Мы принимаем основные кредитные карты для стандартных учётных записей. Корпоративные клиенты могут организовать выставление счётов и другие способы оплаты.
Для получения дополнительных вопросов о ценообразовании свяжитесь с [email protected].