На этой странице представлена подробная информация о ценообразовании моделей и функций Anthropic. Все цены указаны в USD.
Для получения наиболее актуальной информации о ценах посетите claude.com/pricing.
В следующей таблице показаны цены для всех моделей Claude в различных ценовых уровнях:
| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.5 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = миллион токенов. Столбец "Base Input Tokens" показывает стандартное ценообразование входных данных, "Cache Writes" и "Cache Hits" относятся к кэшированию подсказок, а "Output Tokens" показывает ценообразование выходных данных. Кэширование подсказок предлагает как 5-минутное (по умолчанию), так и 1-часовое кэширование для оптимизации затрат в различных сценариях использования.
Таблица выше отражает следующие множители ценообразования для кэширования подсказок:
Модели Claude доступны на AWS Bedrock, Google Vertex AI и Microsoft Foundry. Для получения официальной информации о ценах посетите:
Ценообразование региональных конечных точек для моделей Claude 4.5 и более новых
Начиная с Claude Sonnet 4.5 и Haiku 4.5, AWS Bedrock и Google Vertex AI предлагают два типа конечных точек:
Региональные конечные точки включают 10% надбавку к глобальным конечным точкам. Claude API (1P) по умолчанию является глобальным и не затронут этим изменением. Claude API является глобальным (эквивалентно предложению глобальной конечной точки и ценообразованию от других поставщиков).
Область применения: эта структура ценообразования применяется к Claude Sonnet 4.5, Haiku 4.5 и всем будущим моделям. Более ранние модели (Claude Sonnet 4, Opus 4 и более ранние выпуски) сохраняют своё существующее ценообразование.
Для деталей реализации и примеров кода:
Batch API позволяет асинхронно обрабатывать большие объёмы запросов со скидкой 50% на входные и выходные токены.
| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.5 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Для получения дополнительной информации о пакетной обработке см. нашу документацию по пакетной обработке.
При использовании Claude Sonnet 4 или Sonnet 4.5 с включённым окном контекста в 1M токенов запросы, превышающие 200K входных токенов, автоматически взимаются по премиум-ставкам для больших контекстов:
Окно контекста в 1M токенов в настоящее время находится в бета-версии для организаций на уровне использования 4 и организаций с пользовательскими ограничениями скорости. Окно контекста в 1M токенов доступно только для Claude Sonnet 4 и Sonnet 4.5.
| ≤ 200K входных токенов | > 200K входных токенов |
|---|---|
| Входные: $3 / MTok | Входные: $6 / MTok |
| Выходные: $15 / MTok | Выходные: $22.50 / MTok |
Ценообразование для больших контекстов складывается с другими модификаторами ценообразования:
Даже с включённым флагом бета-версии запросы с менее чем 200K входных токенов взимаются по стандартным ставкам. Если ваш запрос превышает 200K входных токенов, все токены взимаются по премиум-ставкам.
Порог 200K основан исключительно на входных токенах (включая чтение/запись кэша). Количество выходных токенов не влияет на выбор ценового уровня, но выходные токены взимаются по более высокой ставке, когда превышен порог входных данных.
Чтобы проверить, был ли ваш запрос API взимается по ставкам окна контекста 1M, изучите объект usage в ответе API:
{
"usage": {
"input_tokens": 250000,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"output_tokens": 500
}
}Рассчитайте общее количество входных токенов путём суммирования:
input_tokenscache_creation_input_tokens (если используется кэширование подсказок)cache_read_input_tokens (если используется кэширование подсказок)Если общее количество превышает 200 000 токенов, весь запрос был выставлен по ставкам контекста 1M.
Для получения дополнительной информации об объекте usage см. документацию ответа API.
Tool use requests are priced based on:
tools parameter)Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
tools parameter in API requests (tool names, descriptions, and schemas)tool_use content blocks in API requests and responsestool_result content blocks in API requestsWhen you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
Для текущих цен по моделям обратитесь к разделу ценообразование моделей выше.
Для получения дополнительной информации о реализации использования инструментов и лучших практиках см. нашу документацию по использованию инструментов.
The bash tool adds 245 input tokens to your API calls.
Additional tokens are consumed by:
См. ценообразование использования инструментов для получения полной информации о ценах.
Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container.
Each organization receives 1,550 free hours of usage with the code execution tool per month. Additional usage beyond the first 1,550 hours is billed at $0.05 per hour, per container.
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.
In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
См. ценообразование использования инструментов для получения полной информации о ценах.
Web search usage is charged in addition to token usage:
"usage": {
"input_tokens": 105,
"output_tokens": 6039,
"cache_read_input_tokens": 7123,
"cache_creation_input_tokens": 7345,
"server_tool_use": {
"web_search_requests": 1
}
}Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Web fetch usage has no additional charges beyond standard token costs:
"usage": {
"input_tokens": 25039,
"output_tokens": 931,
"cache_read_input_tokens": 0,
"cache_creation_input_tokens": 0,
"server_tool_use": {
"web_fetch_requests": 1
}
}The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.
To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
Additional token consumption:
If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Понимание ценообразования для приложений агентов имеет решающее значение при разработке с Claude. Эти примеры из реальной жизни могут помочь вам оценить затраты для различных паттернов агентов.
При разработке агента поддержки клиентов вот как могут распределиться затраты:
Пример расчёта для обработки 10 000 билетов поддержки:
Для подробного пошагового руководства этого расчёта см. наше руководство по агенту поддержки клиентов.
Для более сложных архитектур агентов с несколькими шагами:
Обработка начального запроса
Извлечение памяти и контекста
Планирование и выполнение действий
Для получения подробного руководства по паттернам ценообразования агентов см. наше руководство по случаям использования агентов.
При разработке агентов с Claude:
Для приложений агентов с высоким объёмом рассмотрите возможность обращения к нашей команде корпоративных продаж для согласования пользовательского ценообразования.
Ограничения скорости варьируются в зависимости от уровня использования и влияют на количество запросов, которые вы можете сделать:
Для получения подробной информации об ограничениях скорости см. нашу документацию по ограничениям скорости.
Для более высоких ограничений скорости или пользовательских соглашений о ценообразовании свяжитесь с нашей командой продаж.
Скидки за объём могут быть доступны для пользователей с высоким объёмом. Они согласовываются в индивидуальном порядке.
Для корпоративных клиентов со специфическими потребностями:
Свяжитесь с нашей командой продаж по адресу [email protected] или через Claude Console для обсуждения вариантов корпоративного ценообразования.
Как рассчитывается использование токенов?
Токены — это части текста, которые обрабатывают модели. Как приблизительная оценка, 1 токен составляет примерно 4 символа или 0,75 слова на английском языке. Точное количество варьируется в зависимости от языка и типа контента.
Есть ли бесплатные уровни или пробные версии?
Новые пользователи получают небольшое количество бесплатных кредитов для тестирования API. Свяжитесь с отделом продаж для получения информации о расширенных пробных версиях для корпоративной оценки.
Как складываются скидки?
Скидки Batch API и кэширования подсказок можно комбинировать. Например, использование обеих функций вместе обеспечивает значительную экономию затрат по сравнению со стандартными вызовами API.
Какие методы оплаты принимаются?
Мы принимаем основные кредитные карты для стандартных учётных записей. Корпоративные клиенты могут организовать выставление счётов и другие методы оплаты.
Для получения дополнительных вопросов о ценообразовании свяжитесь с [email protected].