Gestione del contesto

Conteggio dei token

Determina il numero di token in un messaggio prima di inviarlo a Claude per prendere decisioni consapevoli sui tuoi prompt e utilizzo.

Il conteggio dei token ti consente di determinare il numero di token in un messaggio prima di inviarlo a Claude, aiutandoti a prendere decisioni consapevoli sui tuoi prompt e utilizzo. Con il conteggio dei token, puoi

Gestire proattivamente i limiti di velocità e i costi
Prendere decisioni intelligenti di routing dei modelli
Ottimizzare i prompt per avere una lunghezza specifica

This feature is Zero Data Retention (ZDR) eligible. When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Come contare i token dei messaggi

L'endpoint di conteggio dei token accetta lo stesso elenco strutturato di input per la creazione di un messaggio, incluso il supporto per i prompt di sistema, gli strumenti, le immagini e i PDF. La risposta contiene il numero totale di token di input.

Il conteggio dei token deve essere considerato una stima. In alcuni casi, il numero effettivo di token di input utilizzati durante la creazione di un messaggio può differire di una piccola quantità.

I conteggi dei token possono includere token aggiunti automaticamente da Anthropic per ottimizzazioni di sistema. Non ti viene addebitato per i token aggiunti dal sistema. La fatturazione riflette solo il tuo contenuto.

Modelli supportati

Tutti i modelli attivi supportano il conteggio dei token.

Contare i token nei messaggi di base

import anthropic

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-6",
    system="You are a scientist",
    messages=[{"role": "user", "content": "Hello, Claude"}],
)

print(response.json())

JSON

{ "input_tokens": 14 }

Contare i token nei messaggi con strumenti

I conteggi dei token dello strumento server si applicano solo alla prima chiamata di campionamento.

import anthropic

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-6",
    tools=[
        {
            "name": "get_weather",
            "description": "Get the current weather in a given location",
            "input_schema": {
                "type": "object",
                "properties": {
                    "location": {
                        "type": "string",
                        "description": "The city and state, e.g. San Francisco, CA",
                    }
                },
                "required": ["location"],
            },
        }
    ],
    messages=[{"role": "user", "content": "What's the weather like in San Francisco?"}],
)

print(response.json())

JSON

{ "input_tokens": 403 }

Contare i token nei messaggi con immagini

#!/bin/sh

IMAGE_URL="https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
IMAGE_MEDIA_TYPE="image/jpeg"
IMAGE_BASE64=$(curl "$IMAGE_URL" | base64)

curl https://api.anthropic.com/v1/messages/count_tokens \
     --header "x-api-key: $ANTHROPIC_API_KEY" \
     --header "anthropic-version: 2023-06-01" \
     --header "content-type: application/json" \
     --data \
'{
    "model": "claude-opus-4-6",
    "messages": [
        {"role": "user", "content": [
            {"type": "image", "source": {
                "type": "base64",
                "media_type": "'$IMAGE_MEDIA_TYPE'",
                "data": "'$IMAGE_BASE64'"
            }},
            {"type": "text", "text": "Describe this image"}
        ]}
    ]
}'

JSON

{ "input_tokens": 1551 }

Contare i token nei messaggi con il pensiero esteso

Vedi qui per maggiori dettagli su come viene calcolata la finestra di contesto con il pensiero esteso

I blocchi di pensiero dai turni dell'assistente precedenti vengono ignorati e non contano verso i tuoi token di input
Il pensiero del turno dell'assistente attuale conta verso i tuoi token di input

curl https://api.anthropic.com/v1/messages/count_tokens \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "content-type: application/json" \
    --header "anthropic-version: 2023-06-01" \
    --data '{
      "model": "claude-sonnet-4-6",
      "thinking": {
        "type": "enabled",
        "budget_tokens": 16000
      },
      "messages": [
        {
          "role": "user",
          "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?"
        },
        {
          "role": "assistant",
          "content": [
            {
              "type": "thinking",
              "thinking": "This is a nice number theory question. Lets think about it step by step...",
              "signature": "EuYBCkQYAiJAgCs1le6/Pol5Z4/JMomVOouGrWdhYNsH3ukzUECbB6iWrSQtsQuRHJID6lWV..."
            },
            {
              "type": "text",
              "text": "Yes, there are infinitely many prime numbers p such that p mod 4 = 3..."
            }
          ]
        },
        {
          "role": "user",
          "content": "Can you write a formal proof?"
        }
      ]
    }'

JSON

{ "input_tokens": 88 }

Contare i token nei messaggi con PDF

Il conteggio dei token supporta i PDF con le stesse limitazioni dell'API Messages.

curl https://api.anthropic.com/v1/messages/count_tokens \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "content-type: application/json" \
    --header "anthropic-version: 2023-06-01" \
    --data '{
      "model": "claude-opus-4-6",
      "messages": [{
        "role": "user",
        "content": [
          {
            "type": "document",
            "source": {
              "type": "base64",
              "media_type": "application/pdf",
              "data": "'$(base64 -i document.pdf)'"
            }
          },
          {
            "type": "text",
            "text": "Please summarize this document."
          }
        ]
      }]
    }'

JSON

{ "input_tokens": 2188 }

Prezzi e limiti di velocità

Il conteggio dei token è gratuito ma soggetto a limiti di velocità delle richieste al minuto in base al tuo livello di utilizzo. Se hai bisogno di limiti più elevati, contatta il team di vendita tramite la Console Claude.

Livello di utilizzo	Richieste al minuto (RPM)
1	100
2	2.000
3	4.000
4	8.000

Il conteggio dei token e la creazione dei messaggi hanno limiti di velocità separati e indipendenti -- l'utilizzo di uno non conta rispetto ai limiti dell'altro.

Domande frequenti

Was this page helpful?

Gestione del contesto

Conteggio dei token

Determina il numero di token in un messaggio prima di inviarlo a Claude per prendere decisioni consapevoli sui tuoi prompt e utilizzo.

Gestire proattivamente i limiti di velocità e i costi
Prendere decisioni intelligenti di routing dei modelli
Ottimizzare i prompt per avere una lunghezza specifica

This feature is Zero Data Retention (ZDR) eligible. When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Come contare i token dei messaggi

Modelli supportati

Tutti i modelli attivi supportano il conteggio dei token.

Contare i token nei messaggi di base

import anthropic

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-6",
    system="You are a scientist",
    messages=[{"role": "user", "content": "Hello, Claude"}],
)

print(response.json())

JSON

{ "input_tokens": 14 }

Contare i token nei messaggi con strumenti

I conteggi dei token dello strumento server si applicano solo alla prima chiamata di campionamento.

import anthropic

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-6",
    tools=[
        {
            "name": "get_weather",
            "description": "Get the current weather in a given location",
            "input_schema": {
                "type": "object",
                "properties": {
                    "location": {
                        "type": "string",
                        "description": "The city and state, e.g. San Francisco, CA",
                    }
                },
                "required": ["location"],
            },
        }
    ],
    messages=[{"role": "user", "content": "What's the weather like in San Francisco?"}],
)

print(response.json())

JSON

{ "input_tokens": 403 }

Contare i token nei messaggi con immagini

#!/bin/sh

IMAGE_URL="https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
IMAGE_MEDIA_TYPE="image/jpeg"
IMAGE_BASE64=$(curl "$IMAGE_URL" | base64)

curl https://api.anthropic.com/v1/messages/count_tokens \
     --header "x-api-key: $ANTHROPIC_API_KEY" \
     --header "anthropic-version: 2023-06-01" \
     --header "content-type: application/json" \
     --data \
'{
    "model": "claude-opus-4-6",
    "messages": [
        {"role": "user", "content": [
            {"type": "image", "source": {
                "type": "base64",
                "media_type": "'$IMAGE_MEDIA_TYPE'",
                "data": "'$IMAGE_BASE64'"
            }},
            {"type": "text", "text": "Describe this image"}
        ]}
    ]
}'

JSON

{ "input_tokens": 1551 }

Contare i token nei messaggi con il pensiero esteso

Vedi qui per maggiori dettagli su come viene calcolata la finestra di contesto con il pensiero esteso

I blocchi di pensiero dai turni dell'assistente precedenti vengono ignorati e non contano verso i tuoi token di input
Il pensiero del turno dell'assistente attuale conta verso i tuoi token di input

curl https://api.anthropic.com/v1/messages/count_tokens \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "content-type: application/json" \
    --header "anthropic-version: 2023-06-01" \
    --data '{
      "model": "claude-sonnet-4-6",
      "thinking": {
        "type": "enabled",
        "budget_tokens": 16000
      },
      "messages": [
        {
          "role": "user",
          "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?"
        },
        {
          "role": "assistant",
          "content": [
            {
              "type": "thinking",
              "thinking": "This is a nice number theory question. Lets think about it step by step...",
              "signature": "EuYBCkQYAiJAgCs1le6/Pol5Z4/JMomVOouGrWdhYNsH3ukzUECbB6iWrSQtsQuRHJID6lWV..."
            },
            {
              "type": "text",
              "text": "Yes, there are infinitely many prime numbers p such that p mod 4 = 3..."
            }
          ]
        },
        {
          "role": "user",
          "content": "Can you write a formal proof?"
        }
      ]
    }'

JSON

{ "input_tokens": 88 }

Contare i token nei messaggi con PDF

Il conteggio dei token supporta i PDF con le stesse limitazioni dell'API Messages.

curl https://api.anthropic.com/v1/messages/count_tokens \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "content-type: application/json" \
    --header "anthropic-version: 2023-06-01" \
    --data '{
      "model": "claude-opus-4-6",
      "messages": [{
        "role": "user",
        "content": [
          {
            "type": "document",
            "source": {
              "type": "base64",
              "media_type": "application/pdf",
              "data": "'$(base64 -i document.pdf)'"
            }
          },
          {
            "type": "text",
            "text": "Please summarize this document."
          }
        ]
      }]
    }'

JSON

{ "input_tokens": 2188 }

Prezzi e limiti di velocità

Livello di utilizzo	Richieste al minuto (RPM)
1	100
2	2.000
3	4.000
4	8.000

Il conteggio dei token e la creazione dei messaggi hanno limiti di velocità separati e indipendenti -- l'utilizzo di uno non conta rispetto ai limiti dell'altro.

Domande frequenti

Was this page helpful?

Come contare i token dei messaggi

Modelli supportati

Contare i token nei messaggi di base

Contare i token nei messaggi con strumenti

Contare i token nei messaggi con immagini

Contare i token nei messaggi con il pensiero esteso

Contare i token nei messaggi con PDF

Prezzi e limiti di velocità

Domande frequenti

Il conteggio dei token utilizza la memorizzazione nella cache dei prompt?

Come contare i token dei messaggi

Modelli supportati

Contare i token nei messaggi di base

Contare i token nei messaggi con strumenti

Contare i token nei messaggi con immagini

Contare i token nei messaggi con il pensiero esteso

Contare i token nei messaggi con PDF

Prezzi e limiti di velocità

Domande frequenti

Il conteggio dei token utilizza la memorizzazione nella cache dei prompt?