Gerenciamento de contexto

Contagem de tokens

Determine o número de tokens em uma mensagem antes de enviá-la para Claude, ajudando você a tomar decisões informadas sobre seus prompts e uso.

A contagem de tokens permite que você determine o número de tokens em uma mensagem antes de enviá-la para Claude, ajudando você a tomar decisões informadas sobre seus prompts e uso. Com a contagem de tokens, você pode

Gerenciar proativamente limites de taxa e custos
Tomar decisões inteligentes de roteamento de modelos
Otimizar prompts para ter um comprimento específico

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Como contar tokens de mensagens

O endpoint de contagem de tokens aceita a mesma lista estruturada de entradas para criar uma mensagem, incluindo suporte para prompts de sistema, ferramentas, imagens e PDFs. A resposta contém o número total de tokens de entrada.

A contagem de tokens deve ser considerada uma estimativa. Em alguns casos, o número real de tokens de entrada usados ao criar uma mensagem pode diferir por uma pequena quantidade.

As contagens de tokens podem incluir tokens adicionados automaticamente pela Anthropic para otimizações do sistema. Você não é cobrado por tokens adicionados pelo sistema. A cobrança reflete apenas seu conteúdo.

Modelos suportados

Todos os modelos ativos suportam contagem de tokens.

Contar tokens em mensagens básicas

import anthropic

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-6",
    system="You are a scientist",
    messages=[{"role": "user", "content": "Hello, Claude"}],
)

print(response.json())

JSON

{ "input_tokens": 14 }

Contar tokens em mensagens com ferramentas

As contagens de tokens de ferramentas de servidor se aplicam apenas à primeira chamada de amostragem.

import anthropic

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-6",
    tools=[
        {
            "name": "get_weather",
            "description": "Get the current weather in a given location",
            "input_schema": {
                "type": "object",
                "properties": {
                    "location": {
                        "type": "string",
                        "description": "The city and state, e.g. San Francisco, CA",
                    }
                },
                "required": ["location"],
            },
        }
    ],
    messages=[{"role": "user", "content": "What's the weather like in San Francisco?"}],
)

print(response.json())

JSON

{ "input_tokens": 403 }

Contar tokens em mensagens com imagens

#!/bin/sh

IMAGE_URL="https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
IMAGE_MEDIA_TYPE="image/jpeg"
IMAGE_BASE64=$(curl "$IMAGE_URL" | base64)

curl https://api.anthropic.com/v1/messages/count_tokens \
     --header "x-api-key: $ANTHROPIC_API_KEY" \
     --header "anthropic-version: 2023-06-01" \
     --header "content-type: application/json" \
     --data \
'{
    "model": "claude-opus-4-6",
    "messages": [
        {"role": "user", "content": [
            {"type": "image", "source": {
                "type": "base64",
                "media_type": "'$IMAGE_MEDIA_TYPE'",
                "data": "'$IMAGE_BASE64'"
            }},
            {"type": "text", "text": "Describe this image"}
        ]}
    ]
}'

JSON

{ "input_tokens": 1551 }

Contar tokens em mensagens com pensamento estendido

Veja aqui para mais detalhes sobre como a janela de contexto é calculada com pensamento estendido

Blocos de pensamento de turnos assistentes anteriores são ignorados e não contam para seus tokens de entrada
O pensamento da turnada assistente atual conta para seus tokens de entrada

curl https://api.anthropic.com/v1/messages/count_tokens \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "content-type: application/json" \
    --header "anthropic-version: 2023-06-01" \
    --data '{
      "model": "claude-sonnet-4-6",
      "thinking": {
        "type": "enabled",
        "budget_tokens": 16000
      },
      "messages": [
        {
          "role": "user",
          "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?"
        },
        {
          "role": "assistant",
          "content": [
            {
              "type": "thinking",
              "thinking": "This is a nice number theory question. Lets think about it step by step...",
              "signature": "EuYBCkQYAiJAgCs1le6/Pol5Z4/JMomVOouGrWdhYNsH3ukzUECbB6iWrSQtsQuRHJID6lWV..."
            },
            {
              "type": "text",
              "text": "Yes, there are infinitely many prime numbers p such that p mod 4 = 3..."
            }
          ]
        },
        {
          "role": "user",
          "content": "Can you write a formal proof?"
        }
      ]
    }'

JSON

{ "input_tokens": 88 }

Contar tokens em mensagens com PDFs

A contagem de tokens suporta PDFs com as mesmas limitações que a API de Mensagens.

curl https://api.anthropic.com/v1/messages/count_tokens \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "content-type: application/json" \
    --header "anthropic-version: 2023-06-01" \
    --data '{
      "model": "claude-opus-4-6",
      "messages": [{
        "role": "user",
        "content": [
          {
            "type": "document",
            "source": {
              "type": "base64",
              "media_type": "application/pdf",
              "data": "'$(base64 -i document.pdf)'"
            }
          },
          {
            "type": "text",
            "text": "Please summarize this document."
          }
        ]
      }]
    }'

JSON

{ "input_tokens": 2188 }

Preços e limites de taxa

A contagem de tokens é gratuita, mas sujeita a limites de taxa de solicitações por minuto com base em seu nível de uso. Se você precisar de limites mais altos, entre em contato com vendas através do Console Claude.

Nível de uso	Solicitações por minuto (RPM)
1	100
2	2.000
3	4.000
4	8.000

A contagem de tokens e a criação de mensagens têm limites de taxa separados e independentes -- o uso de um não conta contra os limites do outro.

Perguntas frequentes

Was this page helpful?

Gerenciamento de contexto

Contagem de tokens

Determine o número de tokens em uma mensagem antes de enviá-la para Claude, ajudando você a tomar decisões informadas sobre seus prompts e uso.

Gerenciar proativamente limites de taxa e custos
Tomar decisões inteligentes de roteamento de modelos
Otimizar prompts para ter um comprimento específico

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Como contar tokens de mensagens

A contagem de tokens deve ser considerada uma estimativa. Em alguns casos, o número real de tokens de entrada usados ao criar uma mensagem pode diferir por uma pequena quantidade.

Modelos suportados

Todos os modelos ativos suportam contagem de tokens.

Contar tokens em mensagens básicas

import anthropic

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-6",
    system="You are a scientist",
    messages=[{"role": "user", "content": "Hello, Claude"}],
)

print(response.json())

JSON

{ "input_tokens": 14 }

Contar tokens em mensagens com ferramentas

As contagens de tokens de ferramentas de servidor se aplicam apenas à primeira chamada de amostragem.

import anthropic

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-6",
    tools=[
        {
            "name": "get_weather",
            "description": "Get the current weather in a given location",
            "input_schema": {
                "type": "object",
                "properties": {
                    "location": {
                        "type": "string",
                        "description": "The city and state, e.g. San Francisco, CA",
                    }
                },
                "required": ["location"],
            },
        }
    ],
    messages=[{"role": "user", "content": "What's the weather like in San Francisco?"}],
)

print(response.json())

JSON

{ "input_tokens": 403 }

Contar tokens em mensagens com imagens

#!/bin/sh

IMAGE_URL="https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
IMAGE_MEDIA_TYPE="image/jpeg"
IMAGE_BASE64=$(curl "$IMAGE_URL" | base64)

curl https://api.anthropic.com/v1/messages/count_tokens \
     --header "x-api-key: $ANTHROPIC_API_KEY" \
     --header "anthropic-version: 2023-06-01" \
     --header "content-type: application/json" \
     --data \
'{
    "model": "claude-opus-4-6",
    "messages": [
        {"role": "user", "content": [
            {"type": "image", "source": {
                "type": "base64",
                "media_type": "'$IMAGE_MEDIA_TYPE'",
                "data": "'$IMAGE_BASE64'"
            }},
            {"type": "text", "text": "Describe this image"}
        ]}
    ]
}'

JSON

{ "input_tokens": 1551 }

Contar tokens em mensagens com pensamento estendido

Veja aqui para mais detalhes sobre como a janela de contexto é calculada com pensamento estendido

Blocos de pensamento de turnos assistentes anteriores são ignorados e não contam para seus tokens de entrada
O pensamento da turnada assistente atual conta para seus tokens de entrada

curl https://api.anthropic.com/v1/messages/count_tokens \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "content-type: application/json" \
    --header "anthropic-version: 2023-06-01" \
    --data '{
      "model": "claude-sonnet-4-6",
      "thinking": {
        "type": "enabled",
        "budget_tokens": 16000
      },
      "messages": [
        {
          "role": "user",
          "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?"
        },
        {
          "role": "assistant",
          "content": [
            {
              "type": "thinking",
              "thinking": "This is a nice number theory question. Lets think about it step by step...",
              "signature": "EuYBCkQYAiJAgCs1le6/Pol5Z4/JMomVOouGrWdhYNsH3ukzUECbB6iWrSQtsQuRHJID6lWV..."
            },
            {
              "type": "text",
              "text": "Yes, there are infinitely many prime numbers p such that p mod 4 = 3..."
            }
          ]
        },
        {
          "role": "user",
          "content": "Can you write a formal proof?"
        }
      ]
    }'

JSON

{ "input_tokens": 88 }

Contar tokens em mensagens com PDFs

A contagem de tokens suporta PDFs com as mesmas limitações que a API de Mensagens.

curl https://api.anthropic.com/v1/messages/count_tokens \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "content-type: application/json" \
    --header "anthropic-version: 2023-06-01" \
    --data '{
      "model": "claude-opus-4-6",
      "messages": [{
        "role": "user",
        "content": [
          {
            "type": "document",
            "source": {
              "type": "base64",
              "media_type": "application/pdf",
              "data": "'$(base64 -i document.pdf)'"
            }
          },
          {
            "type": "text",
            "text": "Please summarize this document."
          }
        ]
      }]
    }'

JSON

{ "input_tokens": 2188 }

Preços e limites de taxa

Nível de uso	Solicitações por minuto (RPM)
1	100
2	2.000
3	4.000
4	8.000

A contagem de tokens e a criação de mensagens têm limites de taxa separados e independentes -- o uso de um não conta contra os limites do outro.

Perguntas frequentes

Was this page helpful?

Como contar tokens de mensagens

Modelos suportados

Contar tokens em mensagens básicas

Contar tokens em mensagens com ferramentas

Contar tokens em mensagens com imagens

Contar tokens em mensagens com pensamento estendido

Contar tokens em mensagens com PDFs

Preços e limites de taxa

Perguntas frequentes

A contagem de tokens usa cache de prompt?

Como contar tokens de mensagens

Modelos suportados

Contar tokens em mensagens básicas

Contar tokens em mensagens com ferramentas

Contar tokens em mensagens com imagens

Contar tokens em mensagens com pensamento estendido

Contar tokens em mensagens com PDFs

Preços e limites de taxa

Perguntas frequentes

A contagem de tokens usa cache de prompt?