Preços

Modelos e preçosPreços

Preços

Saiba mais sobre a estrutura de preços da Anthropic para modelos e recursos

Esta página fornece informações detalhadas de preços para os modelos e recursos da Anthropic. Todos os preços estão em USD.

Para as informações de preços mais atualizadas, visite claude.com/pricing.

Preços dos modelos

A tabela a seguir mostra os preços para todos os modelos Claude em diferentes níveis de uso:

Model	Base Input Tokens	5m Cache Writes	1h Cache Writes	Cache Hits & Refreshes	Output Tokens
Claude Opus 4.7	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.6	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.5	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.1	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Opus 4 (deprecated)	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Sonnet 4.6	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 4.5	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 4 (deprecated)	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Haiku 4.5	$1 / MTok	$1.25 / MTok	$2 / MTok	$0.10 / MTok	$5 / MTok
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)	$0.80 / MTok	$1 / MTok	$1.60 / MTok	$0.08 / MTok	$4 / MTok

MTok = Milhões de tokens. A coluna "Base Input Tokens" mostra preços de entrada padrão, "Cache Writes" e "Cache Hits" são específicos para cache de prompt, e "Output Tokens" mostra preços de saída. Veja preços de cache de prompt abaixo para uma explicação das colunas de cache e multiplicadores de preço.

Opus 4.7 usa um novo tokenizador em comparação com modelos anteriores, contribuindo para seu desempenho melhorado em uma ampla gama de tarefas. Este novo tokenizador pode usar até 35% mais tokens para o mesmo texto fixo.

Preços de plataformas de terceiros

Os modelos Claude estão disponíveis em AWS Bedrock, Google Vertex AI e Microsoft Foundry. Para preços oficiais, visite:

Preços de endpoint regional e multi-região para modelos Claude 4.5 e posteriores

A partir do Claude Sonnet 4.5 e Haiku 4.5:

AWS Bedrock oferece dois tipos de endpoint: endpoints globais (roteamento dinâmico para máxima disponibilidade) e endpoints regionais (roteamento de dados garantido através de regiões geográficas específicas).
Google Vertex AI oferece três tipos de endpoint: endpoints globais, endpoints multi-região (roteamento dinâmico dentro de uma área geográfica) e endpoints regionais.

Endpoints regionais e multi-região incluem um prêmio de 10% sobre endpoints globais. A Claude API (1P) é global por padrão; para opções de residência de dados 1P e preços, veja Preços de residência de dados abaixo.

Escopo: Esta estrutura de preços se aplica ao Claude Sonnet 4.5, Haiku 4.5 e todos os modelos futuros. Modelos anteriores (Claude Sonnet 4 (descontinuado), Opus 4 (descontinuado) e versões anteriores) mantêm seus preços existentes.

Para detalhes de implementação e exemplos de código:

Preços específicos de recursos

Cache de prompt

O cache de prompt reduz custos e latência ao reutilizar porções previamente processadas do seu prompt em chamadas de API. Em vez de reprocessar o mesmo prompt de sistema grande, documento ou histórico de conversa a cada solicitação, a API lê do cache por uma fração do preço de entrada padrão.

Existem duas maneiras de ativar o cache de prompt:

Cache automático: Adicione um único campo cache_control no nível superior da sua solicitação. O sistema gerencia automaticamente os pontos de quebra de cache conforme as conversas crescem. Este é o ponto de partida recomendado para a maioria dos casos de uso.
Pontos de quebra de cache explícitos: Coloque cache_control diretamente em blocos de conteúdo individuais para controle fino sobre exatamente o que é armazenado em cache.

O cache de prompt usa os seguintes multiplicadores de preço em relação às taxas de token de entrada base:

Operação de cache	Multiplicador	Duração
Cache write de 5 minutos	1.25x preço de entrada base	Cache válido por 5 minutos
Cache write de 1 hora	2x preço de entrada base	Cache válido por 1 hora
Cache read (acerto)	0.1x preço de entrada base	Mesma duração que o write anterior

Tokens de cache write são cobrados quando o conteúdo é armazenado pela primeira vez. Tokens de cache read são cobrados quando uma solicitação subsequente recupera o conteúdo em cache. Um acerto de cache custa 10% do preço de entrada padrão, o que significa que o cache se paga após apenas uma leitura de cache para a duração de 5 minutos (1.25x write), ou após duas leituras de cache para a duração de 1 hora (2x write).

Esses multiplicadores se acumulam com outros modificadores de preço, incluindo o desconto da Batch API e residência de dados.

Para detalhes de implementação, modelos suportados e exemplos de código, veja a documentação de cache de prompt.

Preços de residência de dados

Para Claude Opus 4.7, Claude Opus 4.6 e modelos mais novos, especificar inferência apenas para EUA através do parâmetro inference_geo incorre em um multiplicador de 1.1x em todas as categorias de preço de token, incluindo tokens de entrada, tokens de saída, cache writes e cache reads. Roteamento global (o padrão) usa preços padrão.

Isto se aplica apenas à Claude API (1P). Plataformas de terceiros têm seus próprios preços regionais. Veja AWS Bedrock e Google Vertex AI para detalhes. Modelos anteriores mantêm seus preços existentes independentemente das configurações de inference_geo.

Para mais informações, veja a documentação de residência de dados.

Preços do modo rápido

Modo rápido (beta: visualização de pesquisa) para Claude Opus 4.6 fornece saída significativamente mais rápida com preços premium (6x taxas padrão). Os preços do modo rápido se aplicam em toda a janela de contexto, incluindo solicitações com mais de 200k tokens de entrada. Atualmente suportado em Opus 4.6:

Entrada	Saída
$30 / MTok	$150 / MTok

Os preços do modo rápido se acumulam com outros modificadores de preço:

Multiplicadores de cache de prompt se aplicam sobre os preços do modo rápido
Multiplicadores de residência de dados se aplicam sobre os preços do modo rápido

O modo rápido não está disponível com a Batch API.

Para mais informações, veja a documentação do modo rápido.

Processamento em lote

A Batch API permite o processamento assíncrono de grandes volumes de solicitações com um desconto de 50% em tokens de entrada e saída.

Model	Batch input	Batch output
Claude Opus 4.7	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.6	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.5	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.1	$7.50 / MTok	$37.50 / MTok
Claude Opus 4 (deprecated)	$7.50 / MTok	$37.50 / MTok
Claude Sonnet 4.6	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 4.5	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 4 (deprecated)	$1.50 / MTok	$7.50 / MTok
Claude Haiku 4.5	$0.50 / MTok	$2.50 / MTok
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)	$0.40 / MTok	$2 / MTok

Para mais informações sobre processamento em lote, veja a documentação de processamento em lote.

Preços de contexto longo

Claude Mythos Preview, Opus 4.7, Opus 4.6 e Sonnet 4.6 incluem a janela de contexto completa de 1M tokens com preços padrão. (Uma solicitação de 900k tokens é cobrada na mesma taxa por token que uma solicitação de 9k tokens.) Descontos de cache de prompt e processamento em lote se aplicam em taxas padrão em toda a janela de contexto.

Preços de uso de ferramentas

Tool use requests are priced based on:

The total number of input tokens sent to the model (including in the tools parameter)
The number of output tokens generated
For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

The additional tokens from tool use come from:

The tools parameter in API requests (tool names, descriptions, and schemas)
tool_use content blocks in API requests and responses
tool_result content blocks in API requests

When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

Model	Tool choice	Tool use system prompt token count
Claude Opus 4.7	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Opus 4.6	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Opus 4.5	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Opus 4.1	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Opus 4 (deprecated)	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 4.6	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 4.5	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 4 (deprecated)	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Haiku 4.5	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)	`auto`, `none` `any`, `tool`	264 tokens 340 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request.

Para preços atuais por modelo, consulte a seção preços dos modelos.

Para mais informações sobre implementação de uso de ferramentas e melhores práticas, veja a documentação de uso de ferramentas.

Preços de ferramentas específicas

Ferramenta Bash

The bash tool adds 245 input tokens to your API calls.

Additional tokens are consumed by:

Command outputs (stdout/stderr)
Error messages
Large file contents

Veja preços de uso de ferramentas para detalhes completos de preços.

Ferramenta de execução de código

Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.

When used without these tools, code execution is billed by execution time, tracked separately from token usage:

Execution time has a minimum of 5 minutes
Each organization receives 1,550 free hours of usage per month
Additional usage beyond 1,550 hours is billed at $0.05 per hour, per container
If files are included in the request, execution time is billed even if the tool is not invoked, due to files being preloaded onto the container

Code execution usage is tracked in the response:

"usage": {
  "input_tokens": 105,
  "output_tokens": 239,
  "server_tool_use": {
    "code_execution_requests": 1
  }
}

Ferramenta de editor de texto

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.

In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

Tool	Additional input tokens
`text_editor_20250429` (Claude 4.x)	700 tokens

Veja preços de uso de ferramentas para detalhes completos de preços.

Ferramenta de busca na web

Web search usage is charged in addition to token usage:

"usage": {
  "input_tokens": 105,
  "output_tokens": 6039,
  "cache_read_input_tokens": 7123,
  "cache_creation_input_tokens": 7345,
  "server_tool_use": {
    "web_search_requests": 1
  }
}

Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.

Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

Ferramenta de busca web

Web fetch usage has no additional charges beyond standard token costs:

"usage": {
  "input_tokens": 25039,
  "output_tokens": 931,
  "cache_read_input_tokens": 0,
  "cache_creation_input_tokens": 0,
  "server_tool_use": {
    "web_fetch_requests": 1
  }
}

The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.

To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.

Example token usage for typical content:

Average web page (10 kB): ~2,500 tokens
Large documentation page (100 kB): ~25,000 tokens
Research paper PDF (500 kB): ~125,000 tokens

Ferramenta de uso de computador

Computer use follows the standard tool use pricing. When using the computer use tool:

System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

Computer use tool token usage:

Model	Input tokens per tool definition
Claude 4.x models	735 tokens

Additional token consumption:

Screenshot images (see Vision pricing)
Tool execution results returned to Claude

If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Preços de Claude Managed Agents

Claude Managed Agents é cobrado em duas dimensões: tokens e tempo de execução da sessão.

Tokens

Todos os tokens consumidos por uma sessão de Claude Managed Agents são cobrados nas taxas mostradas em Preços dos modelos acima. Multiplicadores de cache de prompt se aplicam de forma idêntica. Busca na web acionada dentro de uma sessão incorre no padrão de $10 por 1.000 buscas.

Os seguintes modificadores da Messages API não se aplicam a sessões de Claude Managed Agents:

Modificador	Por que não se aplica
Desconto da Batch API	Sessões são com estado e interativas. Não há modo de lote.
Prêmio do modo rápido	A velocidade de inferência é gerenciada pelo tempo de execução.
Multiplicador de residência de dados	`inference_geo` é um campo de solicitação da Messages API.
Prêmio de contexto longo	A janela de contexto é gerenciada pelo tempo de execução.
Preços de plataforma de terceiros	Claude Managed Agents está disponível apenas através da Claude API diretamente.

Tempo de execução da sessão

SKU	Taxa	Medição
Tempo de execução da sessão	$0.08 por hora de sessão	Duração do status `running`

O tempo de execução é medido ao milissegundo e se acumula apenas enquanto o status da sessão é running. O tempo gasto idle (aguardando sua próxima mensagem ou confirmação de ferramenta), rescheduling ou terminated não conta para o tempo de execução.

O tempo de execução da sessão substitui o modelo de cobrança de horas de contêiner de execução de código ao usar Claude Managed Agents. Você não é cobrado separadamente por horas de contêiner além do tempo de execução da sessão.

Exemplo trabalhado

Uma sessão de codificação de uma hora usando Claude Opus 4.7 que consome 50.000 tokens de entrada e 15.000 tokens de saída:

Item de linha	Cálculo	Custo
Tokens de entrada	50.000 × $5 / 1.000.000	$0.25
Tokens de saída	15.000 × $25 / 1.000.000	$0.375
Tempo de execução da sessão	1.0 hora × $0.08	$0.08
Total		$0.705

Se o cache de prompt está ativo e 40.000 dos tokens de entrada são leituras de cache:

Item de linha	Cálculo	Custo
Tokens de entrada não armazenados em cache	10.000 × $5 / 1.000.000	$0.05
Tokens de leitura de cache	40.000 × $5 × 0.1 / 1.000.000	$0.02
Tokens de saída	15.000 × $25 / 1.000.000	$0.375
Tempo de execução da sessão	1.0 hora × $0.08	$0.08
Total		$0.525

Cálculo de exemplo para processar 10.000 tickets de suporte:

Média de ~3.700 tokens por conversa
Usando Claude Haiku 4.5 em $1/MTok entrada, $5/MTok saída
Custo total: ~$37.00 por 10.000 tickets

Para um passo a passo detalhado deste cálculo, veja o guia de agente de suporte ao cliente.

Considerações adicionais de preços

Estratégias de otimização de custos

Ao construir agentes com Claude:

Use modelos apropriados: Escolha Haiku para tarefas simples, Sonnet para raciocínio complexo
Implemente cache de prompt: Reduza custos para contexto repetido
Operações em lote: Use a Batch API para tarefas não sensíveis ao tempo
Monitore padrões de uso: Rastreie o consumo de tokens para identificar oportunidades de otimização

Para aplicações de agentes de alto volume, entre em contato com a equipe de vendas corporativas para arranjos de preços personalizados.

Limites de taxa

Os limites de taxa variam por nível de uso e afetam quantas solicitações você pode fazer:

Nível 1: Uso de nível de entrada com limites básicos
Nível 2: Limites aumentados para aplicações em crescimento
Nível 3: Limites mais altos para aplicações estabelecidas
Nível 4: Limites padrão máximos
Enterprise: Limites personalizados disponíveis

Para informações detalhadas sobre limites de taxa, veja a documentação de limites de taxa.

Para limites de taxa mais altos ou arranjos de preços personalizados, entre em contato com a equipe de vendas.

Descontos por volume

Descontos por volume podem estar disponíveis para usuários de alto volume. Estes são negociados caso a caso.

Níveis padrão usam os preços mostrados acima
Clientes corporativos podem entrar em contato com vendas para preços personalizados
Descontos acadêmicos e de pesquisa podem estar disponíveis

Preços corporativos

Para clientes corporativos com necessidades específicas:

Limites de taxa personalizados
Descontos por volume
Suporte dedicado
Termos personalizados

Entre em contato com a equipe de vendas em [email protected] ou através do Claude Console para discutir opções de preços corporativos.

Cobrança e pagamento

A cobrança é baseada no uso mensal real
Todos os pagamentos estão em USD
Opções de cartão de crédito e faturamento disponíveis
Rastreamento de uso disponível no Claude Console

Perguntas frequentes

Como o uso de tokens é calculado?

Tokens são pedaços de texto que os modelos processam. Como uma estimativa aproximada, 1 token é aproximadamente 4 caracteres ou 0,75 palavras em inglês. A contagem exata varia por idioma e tipo de conteúdo.

Existem níveis gratuitos ou testes?

Novos usuários recebem uma pequena quantidade de créditos gratuitos para testar a API. Entre em contato com vendas para informações sobre testes estendidos para avaliação corporativa.

Como os descontos se acumulam?

Descontos de Batch API e cache de prompt podem ser combinados. Por exemplo, usar ambos os recursos juntos fornece economias de custo significativas em comparação com chamadas de API padrão. Veja preços de cache de prompt para como os multiplicadores interagem.

Quais métodos de pagamento são aceitos?

Cartões de crédito principais são aceitos para contas padrão. Clientes corporativos podem organizar faturamento e outros métodos de pagamento.

Para perguntas adicionais sobre preços, entre em contato com [email protected].

Was this page helpful?

Modelos e preçosPreços

Preços

Saiba mais sobre a estrutura de preços da Anthropic para modelos e recursos

Esta página fornece informações detalhadas de preços para os modelos e recursos da Anthropic. Todos os preços estão em USD.

Para as informações de preços mais atualizadas, visite claude.com/pricing.

Preços dos modelos

A tabela a seguir mostra os preços para todos os modelos Claude em diferentes níveis de uso:

Model	Base Input Tokens	5m Cache Writes	1h Cache Writes	Cache Hits & Refreshes	Output Tokens
Claude Opus 4.7	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.6	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.5	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.1	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Opus 4 (deprecated)	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Sonnet 4.6	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 4.5	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 4 (deprecated)	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Haiku 4.5	$1 / MTok	$1.25 / MTok	$2 / MTok	$0.10 / MTok	$5 / MTok
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)	$0.80 / MTok	$1 / MTok	$1.60 / MTok	$0.08 / MTok	$4 / MTok

Preços de plataformas de terceiros

Os modelos Claude estão disponíveis em AWS Bedrock, Google Vertex AI e Microsoft Foundry. Para preços oficiais, visite:

Preços de endpoint regional e multi-região para modelos Claude 4.5 e posteriores

A partir do Claude Sonnet 4.5 e Haiku 4.5:

AWS Bedrock oferece dois tipos de endpoint: endpoints globais (roteamento dinâmico para máxima disponibilidade) e endpoints regionais (roteamento de dados garantido através de regiões geográficas específicas).
Google Vertex AI oferece três tipos de endpoint: endpoints globais, endpoints multi-região (roteamento dinâmico dentro de uma área geográfica) e endpoints regionais.

Para detalhes de implementação e exemplos de código:

Preços específicos de recursos

Cache de prompt

Existem duas maneiras de ativar o cache de prompt:

Cache automático: Adicione um único campo cache_control no nível superior da sua solicitação. O sistema gerencia automaticamente os pontos de quebra de cache conforme as conversas crescem. Este é o ponto de partida recomendado para a maioria dos casos de uso.
Pontos de quebra de cache explícitos: Coloque cache_control diretamente em blocos de conteúdo individuais para controle fino sobre exatamente o que é armazenado em cache.

O cache de prompt usa os seguintes multiplicadores de preço em relação às taxas de token de entrada base:

Operação de cache	Multiplicador	Duração
Cache write de 5 minutos	1.25x preço de entrada base	Cache válido por 5 minutos
Cache write de 1 hora	2x preço de entrada base	Cache válido por 1 hora
Cache read (acerto)	0.1x preço de entrada base	Mesma duração que o write anterior

Esses multiplicadores se acumulam com outros modificadores de preço, incluindo o desconto da Batch API e residência de dados.

Para detalhes de implementação, modelos suportados e exemplos de código, veja a documentação de cache de prompt.

Preços de residência de dados

Para mais informações, veja a documentação de residência de dados.

Preços do modo rápido

Entrada	Saída
$30 / MTok	$150 / MTok

Os preços do modo rápido se acumulam com outros modificadores de preço:

Multiplicadores de cache de prompt se aplicam sobre os preços do modo rápido
Multiplicadores de residência de dados se aplicam sobre os preços do modo rápido

O modo rápido não está disponível com a Batch API.

Para mais informações, veja a documentação do modo rápido.

Processamento em lote

A Batch API permite o processamento assíncrono de grandes volumes de solicitações com um desconto de 50% em tokens de entrada e saída.

Model	Batch input	Batch output
Claude Opus 4.7	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.6	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.5	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.1	$7.50 / MTok	$37.50 / MTok
Claude Opus 4 (deprecated)	$7.50 / MTok	$37.50 / MTok
Claude Sonnet 4.6	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 4.5	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 4 (deprecated)	$1.50 / MTok	$7.50 / MTok
Claude Haiku 4.5	$0.50 / MTok	$2.50 / MTok
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)	$0.40 / MTok	$2 / MTok

Para mais informações sobre processamento em lote, veja a documentação de processamento em lote.

Preços de contexto longo

Preços de uso de ferramentas

Tool use requests are priced based on:

The total number of input tokens sent to the model (including in the tools parameter)
The number of output tokens generated
For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

The additional tokens from tool use come from:

The tools parameter in API requests (tool names, descriptions, and schemas)
tool_use content blocks in API requests and responses
tool_result content blocks in API requests

Model	Tool choice	Tool use system prompt token count
Claude Opus 4.7	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Opus 4.6	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Opus 4.5	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Opus 4.1	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Opus 4 (deprecated)	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 4.6	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 4.5	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 4 (deprecated)	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Haiku 4.5	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Haiku 3.5 (retired, except on Bedrock and Vertex AI)	`auto`, `none` `any`, `tool`	264 tokens 340 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request.

Para preços atuais por modelo, consulte a seção preços dos modelos.

Para mais informações sobre implementação de uso de ferramentas e melhores práticas, veja a documentação de uso de ferramentas.

Preços de ferramentas específicas

Ferramenta Bash

The bash tool adds 245 input tokens to your API calls.

Additional tokens are consumed by:

Command outputs (stdout/stderr)
Error messages
Large file contents

Veja preços de uso de ferramentas para detalhes completos de preços.

Ferramenta de execução de código

When used without these tools, code execution is billed by execution time, tracked separately from token usage:

Execution time has a minimum of 5 minutes
Each organization receives 1,550 free hours of usage per month
Additional usage beyond 1,550 hours is billed at $0.05 per hour, per container
If files are included in the request, execution time is billed even if the tool is not invoked, due to files being preloaded onto the container

Code execution usage is tracked in the response:

"usage": {
  "input_tokens": 105,
  "output_tokens": 239,
  "server_tool_use": {
    "code_execution_requests": 1
  }
}

Ferramenta de editor de texto

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.

In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

Tool	Additional input tokens
`text_editor_20250429` (Claude 4.x)	700 tokens

Veja preços de uso de ferramentas para detalhes completos de preços.

Ferramenta de busca na web

Web search usage is charged in addition to token usage:

"usage": {
  "input_tokens": 105,
  "output_tokens": 6039,
  "cache_read_input_tokens": 7123,
  "cache_creation_input_tokens": 7345,
  "server_tool_use": {
    "web_search_requests": 1
  }
}

Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

Ferramenta de busca web

Web fetch usage has no additional charges beyond standard token costs:

"usage": {
  "input_tokens": 25039,
  "output_tokens": 931,
  "cache_read_input_tokens": 0,
  "cache_creation_input_tokens": 0,
  "server_tool_use": {
    "web_fetch_requests": 1
  }
}

The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.

Example token usage for typical content:

Average web page (10 kB): ~2,500 tokens
Large documentation page (100 kB): ~25,000 tokens
Research paper PDF (500 kB): ~125,000 tokens

Ferramenta de uso de computador

Computer use follows the standard tool use pricing. When using the computer use tool:

System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

Computer use tool token usage:

Model	Input tokens per tool definition
Claude 4.x models	735 tokens

Additional token consumption:

Screenshot images (see Vision pricing)
Tool execution results returned to Claude

If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Preços de Claude Managed Agents

Claude Managed Agents é cobrado em duas dimensões: tokens e tempo de execução da sessão.

Tokens

Os seguintes modificadores da Messages API não se aplicam a sessões de Claude Managed Agents:

Modificador	Por que não se aplica
Desconto da Batch API	Sessões são com estado e interativas. Não há modo de lote.
Prêmio do modo rápido	A velocidade de inferência é gerenciada pelo tempo de execução.
Multiplicador de residência de dados	`inference_geo` é um campo de solicitação da Messages API.
Prêmio de contexto longo	A janela de contexto é gerenciada pelo tempo de execução.
Preços de plataforma de terceiros	Claude Managed Agents está disponível apenas através da Claude API diretamente.

Tempo de execução da sessão

SKU	Taxa	Medição
Tempo de execução da sessão	$0.08 por hora de sessão	Duração do status `running`

Exemplo trabalhado

Uma sessão de codificação de uma hora usando Claude Opus 4.7 que consome 50.000 tokens de entrada e 15.000 tokens de saída:

Item de linha	Cálculo	Custo
Tokens de entrada	50.000 × $5 / 1.000.000	$0.25
Tokens de saída	15.000 × $25 / 1.000.000	$0.375
Tempo de execução da sessão	1.0 hora × $0.08	$0.08
Total		$0.705

Se o cache de prompt está ativo e 40.000 dos tokens de entrada são leituras de cache:

Item de linha	Cálculo	Custo
Tokens de entrada não armazenados em cache	10.000 × $5 / 1.000.000	$0.05
Tokens de leitura de cache	40.000 × $5 × 0.1 / 1.000.000	$0.02
Tokens de saída	15.000 × $25 / 1.000.000	$0.375
Tempo de execução da sessão	1.0 hora × $0.08	$0.08
Total		$0.525

Cálculo de exemplo para processar 10.000 tickets de suporte:

Média de ~3.700 tokens por conversa
Usando Claude Haiku 4.5 em $1/MTok entrada, $5/MTok saída
Custo total: ~$37.00 por 10.000 tickets

Para um passo a passo detalhado deste cálculo, veja o guia de agente de suporte ao cliente.

Considerações adicionais de preços

Estratégias de otimização de custos

Ao construir agentes com Claude:

Use modelos apropriados: Escolha Haiku para tarefas simples, Sonnet para raciocínio complexo
Implemente cache de prompt: Reduza custos para contexto repetido
Operações em lote: Use a Batch API para tarefas não sensíveis ao tempo
Monitore padrões de uso: Rastreie o consumo de tokens para identificar oportunidades de otimização

Para aplicações de agentes de alto volume, entre em contato com a equipe de vendas corporativas para arranjos de preços personalizados.

Limites de taxa

Os limites de taxa variam por nível de uso e afetam quantas solicitações você pode fazer:

Nível 1: Uso de nível de entrada com limites básicos
Nível 2: Limites aumentados para aplicações em crescimento
Nível 3: Limites mais altos para aplicações estabelecidas
Nível 4: Limites padrão máximos
Enterprise: Limites personalizados disponíveis

Para informações detalhadas sobre limites de taxa, veja a documentação de limites de taxa.

Para limites de taxa mais altos ou arranjos de preços personalizados, entre em contato com a equipe de vendas.

Descontos por volume

Descontos por volume podem estar disponíveis para usuários de alto volume. Estes são negociados caso a caso.

Níveis padrão usam os preços mostrados acima
Clientes corporativos podem entrar em contato com vendas para preços personalizados
Descontos acadêmicos e de pesquisa podem estar disponíveis

Preços corporativos

Para clientes corporativos com necessidades específicas:

Limites de taxa personalizados
Descontos por volume
Suporte dedicado
Termos personalizados

Entre em contato com a equipe de vendas em [email protected] ou através do Claude Console para discutir opções de preços corporativos.

Cobrança e pagamento

A cobrança é baseada no uso mensal real
Todos os pagamentos estão em USD
Opções de cartão de crédito e faturamento disponíveis
Rastreamento de uso disponível no Claude Console

Perguntas frequentes

Como o uso de tokens é calculado?

Existem níveis gratuitos ou testes?

Novos usuários recebem uma pequena quantidade de créditos gratuitos para testar a API. Entre em contato com vendas para informações sobre testes estendidos para avaliação corporativa.

Como os descontos se acumulam?

Quais métodos de pagamento são aceitos?

Cartões de crédito principais são aceitos para contas padrão. Clientes corporativos podem organizar faturamento e outros métodos de pagamento.

Para perguntas adicionais sobre preços, entre em contato com [email protected].

Was this page helpful?