Claude Platform Docs
  • Messages
  • Managed Agents
  • Admin

Search...
⌘K
Modelos
Visão geral dos modelosIDs de modelo e versionamentoEscolhendo um modeloApresentando Claude Fable 5 e Claude Mythos 5Novidades no Claude Opus 4.8Novidades no Claude Sonnet 5Atualizar entre versões de modeloDescontinuações de modelosCartões de modeloPrompts do sistemaPreços

Log in
Preços
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Modelos e preços/Modelos

Preços

Saiba mais sobre a estrutura de preços da Anthropic para modelos e recursos

Esta página fornece informações detalhadas de preços para os modelos e recursos da Anthropic. Todos os preços estão em USD.

Para obter as informações de preços mais atuais, visite claude.com/pricing.

Preços dos modelos

A tabela a seguir mostra os preços de todos os modelos Claude:

ModeloTokens de Entrada BaseGravações de Cache de 5mGravações de Cache de 1hAcertos e Atualizações de CacheTokens de Saída
Claude Fable 5$10 / MTok$12.50 / MTok$20 / MTok$1 / MTok$50 / MTok
Claude Mythos 5 (disponibilidade limitada)$10 / MTok$12.50 / MTok$20 / MTok$1 / MTok$50 / MTok
Claude Opus 4.8$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.7$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.6$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.5$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.1 (descontinuado)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Opus 4 (retirado, exceto no Google Cloud)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Sonnet 5
até 31 de agosto de 2026
$2 / MTok$2.50 / MTok$4 / MTok$0.20 / MTok$10 / MTok
Claude Sonnet 5
a partir de 1º de setembro de 2026
$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4.6$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4.5$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4 (retirado, exceto no Bedrock e Google Cloud)$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Haiku 4.5$1 / MTok$1.25 / MTok$2 / MTok$0.10 / MTok$5 / MTok
Claude Haiku 3.5 (retirado, exceto no Bedrock e Google Cloud)$0.80 / MTok$1 / MTok$1.60 / MTok$0.08 / MTok$4 / MTok


O preço introdutório de $2/$10 por milhão de tokens de entrada/saída está em vigor até 31 de agosto de 2026, após o qual o preço padrão de $3/$15 por milhão de tokens de entrada/saída entrará em vigor.



MTok = Milhão de tokens. A coluna "Base Input Tokens" mostra o preço padrão de entrada, as colunas "5m Cache Writes", "1h Cache Writes" e "Cache Hits & Refreshes" são específicas do cache de prompt, e "Output Tokens" mostra o preço de saída. Consulte preços de cache de prompt para uma explicação das colunas de cache e multiplicadores de preços.



Claude Opus 4.7 e modelos Opus posteriores, Claude Fable 5, Claude Mythos 5, Claude Mythos Preview e Claude Sonnet 5 usam um tokenizador mais recente que contribui para seu desempenho aprimorado em uma ampla gama de tarefas. Esse tokenizador produz aproximadamente 30% mais tokens para o mesmo texto. Claude Sonnet 4.6 e modelos anteriores usam o tokenizador anterior.

Para preços da Claude Platform on AWS, consulte Preços da Claude Platform on AWS.

Preços de plataformas de nuvem

Esta seção aborda plataformas de nuvem operadas por parceiros, nas quais o provedor de nuvem fatura você. Para plataformas de nuvem operadas pela Anthropic e faturadas por meio de um marketplace, consulte Preços da Claude Platform on AWS e Preços do Claude in Microsoft Foundry.

Os modelos Claude estão disponíveis no Amazon Bedrock e no Google Cloud. Para preços oficiais, visite:

  • Preços do Amazon Bedrock
  • Preços do Google Cloud


Preços de endpoints regionais e multirregionais para modelos Claude 4.5 e posteriores

A partir do Claude Sonnet 4.5, Haiku 4.5 e Opus 4.5:

  • O Bedrock oferece dois tipos de endpoint: endpoints globais (roteamento dinâmico para máxima disponibilidade) e endpoints regionais (roteamento de dados garantido por regiões geográficas específicas).
  • O Google Cloud oferece três tipos de endpoint: endpoints globais, endpoints multirregionais (roteamento dinâmico dentro de uma área geográfica) e endpoints regionais.

Endpoints regionais e multirregionais incluem um acréscimo de 10% em relação aos endpoints globais. A API do Claude (primária) é global por padrão; para opções e preços de residência de dados primária, consulte Preços de residência de dados.

Escopo: Essa estrutura de preços se aplica ao Claude Sonnet 4.5, Haiku 4.5, Opus 4.5 e todos os modelos futuros. Modelos anteriores (Claude Opus 4.1 (descontinuado) e versões anteriores) mantêm seus preços existentes.

Para detalhes de implementação e exemplos de código:

  • Endpoints globais vs regionais do Amazon Bedrock para Opus 4.7, Haiku 4.5 e modelos posteriores, ou a integração legada para todos os outros modelos no Bedrock
  • Endpoints globais, multirregionais e regionais do Google Cloud

Preços da Claude Platform on AWS

A Claude Platform on AWS fatura por meio do AWS Marketplace usando "Claude Consumption Units" (Unidades de Consumo do Claude), ou CCUs. A Anthropic calcula seu uso de tokens em USD com base nas taxas padrão por modelo e por recurso, aplica qualquer desconto negociado, converte o resultado em CCUs a $0,01 por CCU e reporta a quantidade de CCUs ao AWS Marketplace a cada hora. Sua fatura da AWS mostra um único item de linha de CCU.

ConceitoDetalhes
Unidade de faturamentoClaude Consumption Unit (CCU)
Preço da CCU$0,01 por CCU (fixo; descontos são aplicados na conversão de tokens para CCUs, não ao preço da CCU)
ConversãoUso de tokens calculado em USD com base nas taxas padrão por modelo e por recurso (iguais aos preços da API do Claude), depois convertido em CCUs a $0,01 por CCU
Cadência de faturamentoMedição por hora para o AWS Marketplace; faturas mensais
Modelo de pagamentoSomente pós-pago; sem créditos pré-pagos
DescontosAplicados como menos CCUs medidas
ImpostosMedição antes de impostos; o AWS Marketplace gerencia os impostos
Visibilidade de custosDetalhamento em tempo real no Claude Console (acesso pelo AWS Console); o AWS Cost Explorer mostra CCUs agregadas


Claude Consumption Units. Se o Cliente acessar os Serviços por meio de determinadas Plataformas de Marketplace (por exemplo, Claude Platform on AWS), o uso será faturado em Claude Consumption Units ("CCU") em vez de por MTok. Uma CCU é uma unidade de medida usada exclusivamente para faturamento em Plataformas de Marketplace. Cem (100) CCUs representam $1,00 USD de taxas devidas pelos Serviços, calculadas com base nos preços aplicáveis em claude.com/pricing#api, após a aplicação de quaisquer descontos.

Geografia de inferência

Para Claude Opus 4.6, Claude Sonnet 4.6 e modelos posteriores, usar inference_geo: "us" aplica um multiplicador de preço de 1,1x. inference_geo: "global" (padrão) usa o preço padrão. Consulte Residência de dados para mais detalhes.

Ofertas privadas

Quando você se inscreve na página de serviço Claude Platform on AWS do AWS Console, o AWS Console procura qualquer oferta privada associada à sua conta e solicita que você a aceite no AWS Marketplace. Entre em contato com seu representante de conta da Anthropic para obter os termos da oferta privada.



Se você tiver uma oferta privada existente do Amazon Bedrock, entre em contato com seu representante de conta da Anthropic ou da AWS antes de começar a usar a Claude Platform on AWS para garantir que seus descontos sejam aplicados corretamente. Descontos não podem ser aplicados retroativamente ao uso incorrido antes da aceitação da sua oferta privada.

Preços do Claude in Microsoft Foundry

O Claude in Microsoft Foundry fatura por meio do Azure Marketplace usando Claude Consumption Units (CCUs). A Anthropic calcula seu uso de tokens em USD com base nas taxas padrão por modelo e por recurso, aplica qualquer desconto negociado, converte o resultado em CCUs a $0,01 por CCU e reporta a quantidade de CCUs ao Azure Marketplace a cada hora. Sua fatura do Azure mostra um único item de linha de CCU.

ConceitoDetalhes
Unidade de faturamentoClaude Consumption Unit (CCU)
Preço da CCU$0,01 por CCU (fixo; descontos são aplicados na conversão de tokens para CCUs, não ao preço da CCU)
ConversãoUso de tokens calculado em USD com base nas taxas padrão por modelo e por recurso (iguais aos preços da API do Claude), depois convertido em CCUs a $0,01 por CCU
Cadência de faturamentoMedição por hora para o Azure Marketplace; faturas mensais
Modelo de pagamentoSomente pós-pago; sem créditos pré-pagos
DescontosAplicados como menos CCUs medidas
ImpostosMedição antes de impostos; o Azure Marketplace gerencia os impostos
Visibilidade de custosO Azure Cost Management mostra CCUs agregadas


Claude Consumption Units. Se o Cliente acessar os Serviços por meio de determinadas Plataformas de Marketplace (por exemplo, Claude Platform on AWS, Claude in Microsoft Foundry), o uso será faturado em Claude Consumption Units ("CCU") em vez de por MTok. Uma CCU é uma unidade de medida usada exclusivamente para faturamento em Plataformas de Marketplace. Cem (100) CCUs representam $1,00 USD de taxas devidas pelos Serviços, calculadas com base nos preços aplicáveis em claude.com/pricing#api, após a aplicação de quaisquer descontos.

Geografia de inferência

Implantações hospedadas no Azure podem usar o tipo de implantação US Data Zone Standard, que mantém a inferência dentro dos Estados Unidos. Isso é equivalente a inference_geo: "us" na API do Claude e aplica o mesmo multiplicador de preço de 1,1x. Consulte Residência de dados para mais detalhes.

Preços específicos por recurso

Cache de prompt

O "prompt caching" (cache de prompt) reduz custos e latência ao reutilizar partes do seu prompt processadas anteriormente entre chamadas de API. Em vez de reprocessar o mesmo prompt do sistema extenso, documento ou histórico de conversa em cada requisição, a API lê do cache por uma fração do preço padrão de entrada.

Há duas maneiras de habilitar o cache de prompt:

  • Cache automático: Adicione um único campo cache_control no nível superior da sua requisição. O sistema gerencia automaticamente os pontos de interrupção de cache conforme as conversas crescem. Este é o ponto de partida recomendado para a maioria dos casos de uso.
  • Pontos de interrupção de cache explícitos: Coloque cache_control diretamente em blocos de conteúdo individuais para controle refinado sobre exatamente o que é armazenado em cache.

O cache de prompt usa os seguintes multiplicadores de preço em relação às taxas base de tokens de entrada:

Operação de cacheMultiplicadorDuração
Escrita de cache de 5 minutos1,25x o preço base de entradaCache válido por 5 minutos
Escrita de cache de 1 hora2x o preço base de entradaCache válido por 1 hora
Leitura de cache (acerto)0,1x o preço base de entradaMesma duração da escrita anterior

Tokens de escrita de cache são cobrados quando o conteúdo é armazenado pela primeira vez. Tokens de leitura de cache são cobrados quando uma requisição subsequente recupera o conteúdo em cache. Um acerto de cache custa 10% do preço padrão de entrada, o que significa que o cache se paga após apenas uma leitura de cache para a duração de 5 minutos (escrita de 1,25x), ou após duas leituras de cache para a duração de 1 hora (escrita de 2x).

Esses multiplicadores se acumulam com outros modificadores de preço, incluindo o desconto da Batch API e residência de dados.

Para detalhes de implementação, modelos suportados e exemplos de código, consulte Cache de prompt.

Preços de residência de dados

Para Claude Opus 4.6, Claude Sonnet 4.6 e modelos posteriores, especificar inferência somente nos EUA por meio do parâmetro inference_geo incorre em um multiplicador de 1,1x em todas as categorias de preços de tokens, incluindo tokens de entrada, tokens de saída, escritas de cache e leituras de cache. O roteamento global (o padrão) usa o preço padrão.

Isso se aplica à API do Claude (primária) e à Claude Platform on AWS. No Claude in Microsoft Foundry, o mesmo multiplicador de 1,1x se aplica a implantações que usam o tipo de implantação US Data Zone Standard (consulte Geografia de inferência). Plataformas operadas por parceiros (Bedrock e Google Cloud) têm preços regionais independentes. Consulte Bedrock e Google Cloud para mais detalhes. Modelos anteriores não suportam o parâmetro inference_geo e sempre usam o preço padrão; requisições que incluem o parâmetro nesses modelos retornam um erro 400.

Para mais informações, consulte Residência de dados.

Preços do modo rápido

O modo rápido, em prévia de pesquisa, fornece saída significativamente mais rápida para Claude Opus 4.8 e Claude Opus 4.7 com preço premium. O preço do modo rápido se aplica a toda a janela de contexto, incluindo requisições com mais de 200k tokens de entrada. O modo rápido não está disponível na Claude Platform on AWS.

ModeloEntradaSaída
Claude Opus 4.8$10 / MTok$50 / MTok
Claude Opus 4.7$30 / MTok$150 / MTok

O modo rápido para Claude Opus 4.7 está descontinuado e será removido em 24 de julho de 2026. A partir de 29 de junho de 2026, o modo rápido não está disponível no Claude Opus 4.6: requisições para claude-opus-4-6 com speed: "fast" são executadas em velocidade padrão e faturadas com taxas padrão. Consulte Modo rápido.

O preço do modo rápido se acumula com outros modificadores de preço:

  • Multiplicadores de cache de prompt são aplicados sobre o preço do modo rápido
  • Multiplicadores de residência de dados são aplicados sobre o preço do modo rápido

O modo rápido não está disponível com a Batch API.

Para mais informações, consulte Modo rápido.

Processamento em lote

A Batch API permite o processamento assíncrono de grandes volumes de requisições com um desconto de 50% em tokens de entrada e de saída.

ModeloEntrada em loteSaída em lote
Claude Fable 5$5 / MTok$25 / MTok
Claude Mythos 5 (disponibilidade limitada)$5 / MTok$25 / MTok
Claude Opus 4.8$2.50 / MTok$12.50 / MTok
Claude Opus 4.7$2.50 / MTok$12.50 / MTok
Claude Opus 4.6$2.50 / MTok$12.50 / MTok
Claude Opus 4.5$2.50 / MTok$12.50 / MTok
Claude Opus 4.1 (descontinuado)$7.50 / MTok$37.50 / MTok
Claude Opus 4 (retirado, exceto no Google Cloud)$7.50 / MTok$37.50 / MTok
Claude Sonnet 5
até 31 de agosto de 2026
$1 / MTok$5 / MTok
Claude Sonnet 5
a partir de 1º de setembro de 2026
$1.50 / MTok$7.50 / MTok
Claude Sonnet 4.6$1.50 / MTok$7.50 / MTok
Claude Sonnet 4.5$1.50 / MTok$7.50 / MTok
Claude Sonnet 4 (retirado, exceto no Bedrock e Google Cloud)$1.50 / MTok$7.50 / MTok
Claude Haiku 4.5$0.50 / MTok$2.50 / MTok
Claude Haiku 3.5 (retirado, exceto no Bedrock e Google Cloud)$0.40 / MTok$2 / MTok

Para mais informações sobre processamento em lote, consulte Processamento em lote.

Preços de contexto longo

Claude Fable 5, Claude Mythos 5, Claude Mythos Preview, Claude Opus 4.8, Opus 4.7, Opus 4.6, Sonnet 5 e Sonnet 4.6 incluem a janela de contexto de 1M de tokens completa com preço padrão. (Uma requisição de 900k tokens é faturada com a mesma taxa por token que uma requisição de 9k tokens.) Descontos de cache de prompt e processamento em lote se aplicam com taxas padrão em toda a janela de contexto.

Preços de uso de ferramentas

As requisições de uso de ferramentas são precificadas com base em:

  1. O número total de tokens de entrada enviados ao modelo (incluindo no parâmetro tools)
  2. O número de tokens de saída gerados
  3. Para ferramentas do lado do servidor, precificação adicional baseada em uso (por exemplo, a busca na web cobra por busca realizada)

Ferramentas do lado do cliente são precificadas da mesma forma que qualquer outra requisição à API do Claude, enquanto ferramentas do lado do servidor podem incorrer em cobranças adicionais com base em seu uso específico.

Os tokens adicionais do uso de ferramentas vêm de:

  • O parâmetro tools nas requisições de API (nomes, descrições e esquemas de ferramentas)
  • Blocos de conteúdo tool_use em requisições e respostas de API
  • Blocos de conteúdo tool_result em requisições de API

Quando você usa tools, a API também inclui automaticamente um prompt do sistema especial para o modelo que habilita o uso de ferramentas. O número de tokens de uso de ferramentas necessários para cada modelo está listado abaixo (excluindo os tokens adicionais listados acima). Observe que a tabela pressupõe que pelo menos 1 ferramenta seja fornecida. Se nenhuma tools for fornecida, então uma escolha de ferramenta none usa 0 tokens adicionais de prompt do sistema.

ModeloEscolha de ferramentaContagem de tokens do prompt do sistema de uso de ferramentas
Claude Opus 4.8auto, none
any, tool
290 tokens
410 tokens
Claude Opus 4.7auto, none
any, tool
675 tokens
804 tokens
Claude Opus 4.6auto, none
any, tool
497 tokens
589 tokens
Claude Opus 4.5auto, none
any, tool
496 tokens
588 tokens
Claude Opus 4.1 (descontinuado)auto, none
any, tool
313 tokens
315 tokens
Claude Opus 4 (desativado, exceto no Google Cloud)auto, none
any, tool
313 tokens
315 tokens
Claude Sonnet 5auto, none
any, tool
354 tokens
474 tokens
Claude Sonnet 4.6auto, none
any, tool
497 tokens
589 tokens
Claude Sonnet 4.5auto, none
any, tool
496 tokens
588 tokens
Claude Sonnet 4 (desativado, exceto no Bedrock e Google Cloud)auto, none
any, tool
313 tokens
315 tokens
Claude Haiku 4.5auto, none
any, tool
496 tokens
588 tokens
Claude Haiku 3.5 (desativado, exceto no Bedrock e Google Cloud)auto, none
any, tool
264 tokens
355 tokens

Essas contagens de tokens são adicionadas aos seus tokens normais de entrada e saída para calcular o custo total de uma requisição.

Para preços atuais por modelo, consulte a seção de preços dos modelos.

Para mais informações sobre implementação de uso de ferramentas e melhores práticas, consulte Uso de ferramentas.

Preços de ferramentas específicas

Ferramenta Bash

A ferramenta bash adiciona 245 tokens de entrada às suas chamadas de API.

Tokens adicionais são consumidos por:

  • Saídas de comando (stdout/stderr)
  • Mensagens de erro
  • Conteúdos de arquivos grandes

Consulte preços de uso de ferramentas para detalhes completos de preços.

Ferramenta de execução de código

A execução de código é gratuita quando usada com busca na web ou web fetch. Quando web_search_20260209 (ou posterior) ou web_fetch_20260209 (ou posterior) está incluído na sua solicitação de API, não há cobranças adicionais para chamadas da ferramenta de execução de código além dos custos padrão de tokens de entrada e saída.

Quando usada sem essas ferramentas, a execução de código é cobrada por tempo de execução, rastreado separadamente do uso de tokens:

  • O tempo de execução tem um mínimo de 5 minutos
  • Cada organização recebe 1.550 horas gratuitas de uso por mês
  • O uso adicional além de 1.550 horas é cobrado a US$ 0,05 por hora, por contêiner
  • Se arquivos forem incluídos na solicitação, o tempo de execução é cobrado mesmo que a ferramenta não seja invocada, devido aos arquivos serem pré-carregados no contêiner

O uso da execução de código é rastreado na resposta:

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 239,
    "server_tool_use": {
      "code_execution_requests": 1
    }
  }
}

Ferramenta de editor de texto

A ferramenta de editor de texto usa a mesma estrutura de preços que outras ferramentas usadas com o Claude. Ela segue a precificação padrão de tokens de entrada e saída com base no modelo do Claude que você está usando.

Além dos tokens base, os seguintes tokens de entrada adicionais são necessários para a ferramenta de editor de texto:

FerramentaTokens de entrada adicionais
text_editor_20250429 (Claude 4.x)700 tokens

Consulte preços de uso de ferramentas para detalhes completos de preços.

Ferramenta de busca na web

O uso da pesquisa na web é cobrado além do uso de tokens:

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 6039,
    "cache_read_input_tokens": 7123,
    "cache_creation_input_tokens": 7345,
    "server_tool_use": {
      "web_search_requests": 1
    }
  }
}

A pesquisa na web está disponível na API do Claude por US$ 10 por 1.000 pesquisas, além dos custos padrão de tokens para conteúdo gerado por pesquisa. Os resultados de pesquisa na web recuperados ao longo de uma conversa são contados como tokens de entrada, tanto nas iterações de pesquisa executadas durante um único turno quanto nos turnos subsequentes da conversa.

Cada pesquisa na web conta como um uso, independentemente do número de resultados retornados. Se ocorrer um erro durante a pesquisa na web, ela não será cobrada.

Ferramenta de busca de conteúdo web

O uso do web fetch não tem cobranças adicionais além dos custos padrão de tokens:

{
  "usage": {
    "input_tokens": 25039,
    "output_tokens": 931,
    "cache_read_input_tokens": 0,
    "cache_creation_input_tokens": 0,
    "server_tool_use": {
      "web_fetch_requests": 1
    }
  }
}

A ferramenta web fetch está disponível na API do Claude sem custo adicional. Você paga apenas os custos padrão de tokens pelo conteúdo buscado que se torna parte do contexto da sua conversa.

Para se proteger contra a busca inadvertida de conteúdo grande que consumiria tokens excessivos, use o parâmetro max_content_tokens para definir limites apropriados com base no seu caso de uso e considerações de orçamento.

Exemplo de uso de tokens para conteúdo típico:

  • Página web média (10 kB): ~2.500 tokens
  • Página de documentação grande (100 kB): ~25.000 tokens
  • PDF de artigo de pesquisa (500 kB): ~125.000 tokens

Ferramenta de uso de computador

O uso do computador segue a precificação padrão de uso de ferramentas. Ao usar a ferramenta de uso do computador:

Sobrecarga do prompt do sistema: O beta de uso do computador adiciona de 466 a 499 tokens ao prompt do sistema

Uso de tokens da ferramenta de uso do computador:

ModeloTokens de entrada por definição de ferramenta
Modelos Claude 4.x735 tokens

Consumo adicional de tokens:

  • Imagens de captura de tela (consulte Precificação de Visão)
  • Resultados de execução de ferramentas retornados ao Claude


Se você também estiver usando as ferramentas bash ou editor de texto junto com o uso do computador, essas ferramentas têm seus próprios custos de tokens, conforme documentado em suas respectivas páginas.

Preços do Claude Managed Agents

O Claude Managed Agents é faturado em duas dimensões: tokens e tempo de execução da sessão.

Tokens

Todos os tokens consumidos por uma sessão do Claude Managed Agents são faturados com as taxas mostradas em Preços dos modelos. Os multiplicadores de cache de prompt se aplicam de forma idêntica. A busca na web acionada dentro de uma sessão incorre no custo padrão de $10 por 1.000 buscas. Na Claude Platform on AWS, as cobranças de tokens e tempo de execução da sessão são convertidas em Claude Consumption Units com a taxa padrão.

Os seguintes modificadores da Messages API não se aplicam a sessões do Claude Managed Agents:

ModificadorPor que não se aplica
Desconto da Batch APISessões são stateful e interativas. Não há modo de lote.
Premium do modo rápidoA velocidade de inferência é gerenciada pelo runtime.
Multiplicador de residência de dadosinference_geo é um campo de requisição da Messages API.
Preços de plataformas de nuvemNão disponível em plataformas de nuvem operadas por parceiros.

Tempo de execução da sessão

SKUTaxaMedição
Tempo de execução da sessão$0,08 por sessão-horaDuração do status running

O tempo de execução é medido em milissegundos e acumula apenas enquanto o status da sessão é running. O tempo gasto em idle (aguardando sua próxima mensagem ou uma confirmação de ferramenta), rescheduling ou terminated não conta para o tempo de execução.



O tempo de execução da sessão substitui o modelo de faturamento por hora de contêiner da Execução de Código ao usar o Claude Managed Agents. Você não é faturado separadamente por horas de contêiner além do tempo de execução da sessão.

Exemplo prático

Uma sessão de codificação de uma hora usando Claude Opus 4.8 que consome 50.000 tokens de entrada e 15.000 tokens de saída:

Item de linhaCálculoCusto
Tokens de entrada50.000 × $5 / 1.000.000$0,25
Tokens de saída15.000 × $25 / 1.000.000$0,375
Tempo de execução da sessão1,0 hora × $0,08$0,08
Total$0,705

Se o cache de prompt estiver ativo e 40.000 dos tokens de entrada forem leituras de cache:

Item de linhaCálculoCusto
Tokens de entrada sem cache10.000 × $5 / 1.000.000$0,05
Tokens de leitura de cache40.000 × $5 × 0,1 / 1.000.000$0,02
Tokens de saída15.000 × $25 / 1.000.000$0,375
Tempo de execução da sessão1,0 hora × $0,08$0,08
Total$0,525


Exemplo de cálculo para processar 10.000 tickets de suporte:

  • Média de ~3.700 tokens por conversa
  • Usando Claude Haiku 4.5 a $1/MTok de entrada, $5/MTok de saída
  • Custo total: ~$37,00 por 10.000 tickets

Para um passo a passo detalhado desse cálculo, consulte o guia de agente de suporte ao cliente.

Considerações adicionais sobre preços

Estratégias de otimização de custos

Ao construir agentes com Claude:

  1. Use modelos apropriados: Escolha Haiku para tarefas simples, Sonnet para a maioria das cargas de trabalho de produção e Opus para o raciocínio mais complexo
  2. Implemente cache de prompt: Reduza custos para contexto repetido
  3. Agrupe operações em lote: Use a Batch API para tarefas não sensíveis ao tempo
  4. Monitore padrões de uso: Acompanhe o consumo de tokens para identificar oportunidades de otimização


Para aplicações de agentes de alto volume, entre em contato com a equipe de vendas empresariais para acordos de preços personalizados.

Limites de taxa

Os limites de taxa variam por nível de uso e afetam quantas requisições você pode fazer:

  • Nível Start: Limites de entrada para começar
  • Nível Build: Limites aumentados para aplicações em crescimento
  • Nível Scale: Limites padrão mais altos para cargas de trabalho de produção

Para informações detalhadas sobre limites de taxa, consulte Limites de taxa.

Para limites além do nível Scale ou acordos de preços personalizados, entre em contato com a equipe de vendas.

Descontos por volume

Descontos por volume podem estar disponíveis para usuários de alto volume. Eles são negociados caso a caso.

  • Níveis de uso padrão usam os preços mostrados em Preços dos modelos
  • Clientes empresariais podem entrar em contato com vendas para preços personalizados
  • Descontos acadêmicos e de pesquisa podem estar disponíveis

Preços empresariais

Para clientes empresariais com necessidades específicas:

  • Limites de taxa personalizados
  • Descontos por volume
  • Suporte dedicado
  • Termos personalizados

Entre em contato com a equipe de vendas em [email protected] ou por meio do Claude Console para discutir opções de preços empresariais.

Faturamento e pagamento

  • O faturamento é baseado no uso mensal real
  • Todos os pagamentos são em USD
  • Opções de cartão de crédito e faturamento disponíveis
  • Acompanhamento de uso disponível no Claude Console

Perguntas frequentes

Como o uso de tokens é calculado?

Tokens são pedaços de texto que os modelos processam. Como estimativa aproximada, 1 token equivale a aproximadamente 4 caracteres ou 0,75 palavras em inglês. A contagem exata varia por idioma e tipo de conteúdo.

Existem níveis gratuitos ou avaliações?

Novos usuários recebem uma pequena quantidade de créditos gratuitos para testar a API. Entre em contato com vendas para informações sobre avaliações estendidas para análise empresarial.

Como os descontos se acumulam?

Os descontos da Batch API e do cache de prompt podem ser combinados. Por exemplo, usar ambos os recursos juntos proporciona economia significativa de custos em comparação com chamadas de API padrão. Consulte preços de cache de prompt para saber como os multiplicadores interagem.

Quais métodos de pagamento são aceitos?

Os principais cartões de crédito são aceitos para contas padrão. Clientes empresariais podem organizar faturamento e outros métodos de pagamento.

Para perguntas adicionais sobre preços, entre em contato com [email protected].

Was this page helpful?

  • Preços dos modelos
  • Preços de plataformas de nuvem
  • Preços da Claude Platform on AWS
  • Geografia de inferência
  • Ofertas privadas
  • Preços do Claude in Microsoft Foundry
  • Geografia de inferência
  • Preços específicos por recurso
  • Cache de prompt
  • Preços de residência de dados
  • Preços do modo rápido
  • Processamento em lote
  • Preços de contexto longo
  • Preços de uso de ferramentas
  • Preços de ferramentas específicas
  • Preços do Claude Managed Agents
  • Tokens
  • Tempo de execução da sessão
  • Exemplo prático
  • Considerações adicionais sobre preços
  • Estratégias de otimização de custos
  • Limites de taxa
  • Descontos por volume
  • Preços empresariais
  • Faturamento e pagamento
  • Perguntas frequentes