Claude Platform Docs
  • Mensagens
  • Agentes Gerenciados
  • Administração

Search...
⌘K
Primeiros passos
Introdução ao ClaudeInício rápido
Desenvolvendo com o Claude
Visão geral dos recursosUsando a API de MensagensMotivos de parada e fallbackRecusas e fallbackCrédito de fallback
Capacidades do modelo
Pensamento estendidoPensamento adaptativoEsforçoOrçamentos de tarefas (beta)Modo rápido (prévia de pesquisa)Saídas estruturadasCitaçõesStreaming de MensagensProcessamento em loteResultados de pesquisaStreaming de recusasSuporte multilíngueEmbeddings
Ferramentas
Visão geralComo funciona o uso de ferramentasTutorial: Crie um agente que usa ferramentasDefinir ferramentasLidar com chamadas de ferramentasUso de ferramentas em paraleloTool Runner (SDK)Uso de ferramentas estritoFerramentas de servidorFerramenta de pesquisa na webFerramenta de busca na webFerramenta de execução de códigoFerramenta de consultoriaFerramenta de busca de ferramentasFerramenta de memóriaFerramenta BashFerramenta de editor de textoFerramenta de uso de computadorSolução de problemas
Infraestrutura de ferramentas
Referência de ferramentasGerenciar contexto de ferramentasCombinações de ferramentasUso de ferramentas com cache de promptChamada programática de ferramentasStreaming granular de ferramentas
Gerenciamento de contexto
Janelas de contextoCompactaçãoEdição de contextoCache de promptMensagens de sistema no meio da conversaCriar um modo de orquestraçãoDiagnóstico de cache (beta)Contagem de tokens
Trabalhando com arquivos
API de ArquivosSuporte a PDF
Habilidades
Visão geralInício rápidoPráticas recomendadasHabilidades para empresasHabilidades na API
MCP
Servidores MCP remotosConector MCP
Claude em plataformas de nuvem
Amazon BedrockAmazon Bedrock (legado)Claude Platform na AWSGoogle CloudMicrosoft Foundry

Log in
Contagem de tokens
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Mensagens/Gerenciamento de contexto

Contagem de tokens

Conte os tokens em uma mensagem antes de enviá-la ao Claude. Use contagens de tokens para gerenciar limites de taxa e custos, tomar decisões de roteamento de modelo e ajustar prompts a um comprimento desejado.

A contagem de tokens permite que você determine o número de tokens em uma mensagem antes de enviá-la ao Claude. Isso ajuda você a tomar decisões informadas sobre seus prompts e uso. Com a contagem de tokens, você pode:

  • Gerenciar proativamente limites de taxa e custos
  • Tomar decisões inteligentes de roteamento de modelo
  • Otimizar prompts para um comprimento específico


Este recurso é elegível para Zero Data Retention (ZDR). Quando sua organização possui um acordo de ZDR, os dados enviados por meio deste recurso não são armazenados após a resposta da API ser retornada.


Como contar tokens de mensagens

O endpoint de contagem de tokens aceita a mesma lista estruturada de entradas usada para criar uma mensagem, incluindo suporte para prompts do sistema, ferramentas, imagens e PDFs. A resposta contém o número total de tokens de entrada.



A contagem de tokens deve ser considerada uma estimativa. Em alguns casos, o número real de tokens de entrada usados ao criar uma mensagem pode diferir por uma pequena quantidade.

As contagens de tokens podem incluir tokens adicionados automaticamente pela Anthropic para otimizações do sistema. Você não é cobrado por tokens adicionados pelo sistema. A cobrança reflete apenas o seu conteúdo.

Modelos compatíveis

Todos os modelos ativos oferecem suporte à contagem de tokens, incluindo o Claude Sonnet 5.



O Claude Opus 4.7 e modelos Opus posteriores, o Claude Fable 5, o Claude Mythos 5, o Claude Mythos Preview e o Claude Sonnet 5 usam um tokenizador mais recente. O mesmo texto de entrada produz aproximadamente 30% mais tokens do que em modelos anteriores. Reconte os prompts usando o modelo que você planeja usar, em vez de reutilizar contagens medidas em modelos anteriores.

Contar tokens em mensagens básicas

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    system="You are a scientist",
    messages=[{"role": "user", "content": "Hello, Claude"}],
)

print(response.json())
Output
{ "input_tokens": 14 }

Contar tokens em mensagens com ferramentas



As contagens de tokens de ferramentas de servidor aplicam-se apenas à primeira chamada de amostragem.

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    tools=[
        {
            "name": "get_weather",
            "description": "Get the current weather in a given location",
            "input_schema": {
                "type": "object",
                "properties": {
                    "location": {
                        "type": "string",
                        "description": "The city and state, e.g. San Francisco, CA",
                    }
                },
                "required": ["location"],
            },
        }
    ],
    messages=[{"role": "user", "content": "What's the weather like in San Francisco?"}],
)

print(response.json())
Output
{ "input_tokens": 403 }

Contar tokens em mensagens com imagens

import base64
import httpx

image_url = "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
image_media_type = "image/jpeg"
image_data = base64.standard_b64encode(httpx.get(image_url).content).decode("utf-8")

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image_media_type,
                        "data": image_data,
                    },
                },
                {"type": "text", "text": "Describe this image"},
            ],
        }
    ],
)
print(response.json())
Output
{ "input_tokens": 1551 }

Contar tokens em mensagens com pensamento estendido



Consulte como a janela de contexto é calculada com pensamento estendido para mais detalhes

  • Blocos de pensamento de turnos anteriores do assistente são ignorados e não contam para seus tokens de entrada
  • O pensamento do turno atual do assistente conta para seus tokens de entrada
client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-sonnet-4-6",
    thinking={"type": "enabled", "budget_tokens": 16000},
    messages=[
        {
            "role": "user",
            "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?",
        },
        {
            "role": "assistant",
            "content": [
                {
                    "type": "thinking",
                    "thinking": "This is a nice number theory question. Let's think about it step by step...",
                    "signature": "EuYBCkQYAiJAgCs1le6/Pol5Z4/JMomVOouGrWdhYNsH3ukzUECbB6iWrSQtsQuRHJID6lWV...",
                },
                {
                    "type": "text",
                    "text": "Yes, there are infinitely many prime numbers p such that p mod 4 = 3...",
                },
            ],
        },
        {"role": "user", "content": "Can you write a formal proof?"},
    ],
)

print(response.json())
Output
{ "input_tokens": 88 }

Contar tokens em mensagens com PDFs



A contagem de tokens oferece suporte a PDFs com as mesmas limitações da Messages API.

import base64
import anthropic

client = anthropic.Anthropic()

with open("/path/to/document.pdf", "rb") as pdf_file:
    pdf_base64 = base64.standard_b64encode(pdf_file.read()).decode("utf-8")

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_base64,
                    },
                },
                {"type": "text", "text": "Please summarize this document."},
            ],
        }
    ],
)

print(response.json())
Output
{ "input_tokens": 2188 }

Contagens de tokens no Claude Fable 5 e Claude Mythos 5

O Claude Fable 5 e o Claude Mythos 5 usam o tokenizador introduzido com o Claude Opus 4.7, que produz aproximadamente 30% mais tokens do que modelos anteriores ao Claude Opus 4.7 para o mesmo texto. O endpoint de contagem de tokens retorna a contagem com base no tokenizador do model que você passa, então, para medir a diferença para sua carga de trabalho, conte a mesma requisição duas vezes: uma vez com seu modelo atual e uma vez com model: "claude-fable-5" (ou "claude-mythos-5"), e compare os dois valores de input_tokens.



Cobrança e migração: O uso e a cobrança no Claude Fable 5 e no Claude Mythos 5 refletem as contagens deste tokenizador. Se você estiver migrando de um modelo anterior ao Claude Opus 4.7, o mesmo conteúdo consome aproximadamente 30% mais tokens. Ao migrar uma carga de trabalho para o Claude Fable 5 e o Claude Mythos 5, não reutilize contagens de tokens medidas em um modelo anterior ao Claude Opus 4.7 para estimar custos ou adequação à janela de contexto. Conte seus prompts com model: "claude-fable-5" (ou "claude-mythos-5").


Preços e limites de taxa

A contagem de tokens é gratuita, mas está sujeita a limites de taxa de requisições por minuto com base no seu nível de uso. Se você precisar de limites mais altos, use Request rate limit increase na página Limits.

Nível de usoRequisições por minuto (RPM)
Start2.000
Build4.000
Scale8.000


A contagem de tokens e a criação de mensagens têm limites de taxa separados e independentes. O uso de um não conta para os limites do outro.


Perguntas frequentes


Próximos passos


Contar tokens de mensagens

Leia a referência completa da API para o endpoint de contagem de tokens.

Janelas de contexto

Use contagens de tokens para manter prompts dentro da janela de contexto de um modelo.

Limites de taxa

Verifique as contagens de tokens antes de enviar uma requisição para permanecer dentro do seu nível de uso.

Cache de prompt

Reduza custo e latência em prompts repetidos armazenando prefixos de prompt em cache.

Was this page helpful?

  • Como contar tokens de mensagens
  • Modelos compatíveis
  • Contar tokens em mensagens básicas
  • Contar tokens em mensagens com ferramentas
  • Contar tokens em mensagens com imagens
  • Contar tokens em mensagens com pensamento estendido
  • Contar tokens em mensagens com PDFs
  • Contagens de tokens no Claude Fable 5 e Claude Mythos 5
  • Preços e limites de taxa
  • Perguntas frequentes
  • Próximos passos