Claude Platform Docs
  • Messages
  • Agents gérés
  • Administration

Search...
⌘K
Premiers pas
Introduction à ClaudeDémarrage rapide
Développer avec Claude
Aperçu des fonctionnalitésUtilisation de l'API MessagesRaisons d'arrêt et repliRefus et repliCrédit de repli
Capacités du modèle
Réflexion étendueRéflexion adaptativeEffortBudgets de tâches (bêta)Mode rapide (aperçu de recherche)Sorties structuréesCitationsStreaming des messagesTraitement par lotsRésultats de rechercheStreaming des refusPrise en charge multilingueEmbeddings
Outils
AperçuFonctionnement de l'utilisation d'outilsTutoriel : Créer un agent utilisant des outilsDéfinir des outilsGérer les appels d'outilsUtilisation d'outils en parallèleTool Runner (SDK)Utilisation d'outils stricteUtilisation d'outils avec mise en cache des promptsOutils serveurDépannageOutil de recherche webOutil de récupération webOutil d'exécution de codeOutil conseillerOutil de mémoireOutil BashOutil d'utilisation de l'ordinateurOutil d'éditeur de texte
Infrastructure des outils
Référence des outilsGérer le contexte des outilsCombinaisons d'outilsRecherche d'outilsAppel d'outils programmatiqueStreaming d'outils granulaire
Gestion du contexte
Fenêtres de contexteCompactageÉdition du contexteMise en cache des promptsMessages système en cours de conversationCréer un mode d'orchestrationDiagnostics de cache (bêta)Comptage de tokens
Travailler avec des fichiers
API FilesPrise en charge des PDFImages et vision
Compétences
AperçuDémarrage rapideBonnes pratiquesCompétences pour l'entrepriseCompétences dans l'API
MCP
Serveurs MCP distantsConnecteur MCP
Claude sur les plateformes cloud
Amazon BedrockAmazon Bedrock (ancien)Claude Platform sur AWSMicrosoft FoundryVertex AI

Log in
Comptage de tokens
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Messages/Gestion du contexte

Comptage de tokens

Comptez les tokens d'un message avant de l'envoyer à Claude. Utilisez le nombre de tokens pour gérer les limites de débit et les coûts, prendre des décisions de routage de modèle et adapter les prompts à une longueur cible.

Le comptage de tokens vous permet de déterminer le nombre de tokens dans un message avant de l'envoyer à Claude. Cela vous aide à prendre des décisions éclairées concernant vos prompts et votre utilisation. Avec le comptage de tokens, vous pouvez :

  • Gérer de manière proactive les limites de débit et les coûts
  • Prendre des décisions intelligentes de routage de modèle
  • Optimiser les prompts pour une longueur spécifique


Cette fonctionnalité est éligible à la Zero Data Retention (ZDR). Lorsque votre organisation dispose d'un accord ZDR, les données envoyées via cette fonctionnalité ne sont pas stockées après le retour de la réponse de l'API.


Comment compter les tokens d'un message

Le point de terminaison de comptage de tokens accepte la même liste structurée d'entrées que pour la création d'un message, y compris la prise en charge des invites système, des outils, des images et des PDF. La réponse contient le nombre total de tokens d'entrée.



Le nombre de tokens doit être considéré comme une estimation. Dans certains cas, le nombre réel de tokens d'entrée utilisés lors de la création d'un message peut différer légèrement.

Le nombre de tokens peut inclure des tokens ajoutés automatiquement par Anthropic pour des optimisations système. Vous n'êtes pas facturé pour les tokens ajoutés par le système. La facturation reflète uniquement votre contenu.

Modèles pris en charge

Tous les modèles actifs prennent en charge le comptage de tokens.

Compter les tokens dans des messages basiques

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    system="You are a scientist",
    messages=[{"role": "user", "content": "Hello, Claude"}],
)

print(response.json())
Output
{ "input_tokens": 14 }

Compter les tokens dans des messages avec outils



Les nombres de tokens des outils serveur s'appliquent uniquement au premier appel d'échantillonnage.

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    tools=[
        {
            "name": "get_weather",
            "description": "Get the current weather in a given location",
            "input_schema": {
                "type": "object",
                "properties": {
                    "location": {
                        "type": "string",
                        "description": "The city and state, e.g. San Francisco, CA",
                    }
                },
                "required": ["location"],
            },
        }
    ],
    messages=[{"role": "user", "content": "What's the weather like in San Francisco?"}],
)

print(response.json())
Output
{ "input_tokens": 403 }

Compter les tokens dans des messages avec images

import base64
import httpx

image_url = "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
image_media_type = "image/jpeg"
image_data = base64.standard_b64encode(httpx.get(image_url).content).decode("utf-8")

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image_media_type,
                        "data": image_data,
                    },
                },
                {"type": "text", "text": "Describe this image"},
            ],
        }
    ],
)
print(response.json())
Output
{ "input_tokens": 1551 }

Compter les tokens dans des messages avec réflexion étendue



Consultez comment la fenêtre de contexte est calculée avec la réflexion étendue pour plus de détails.

  • Les blocs de réflexion des tours d'assistant précédents sont ignorés et ne comptent pas dans vos tokens d'entrée.
  • La réflexion du tour d'assistant actuel compte dans vos tokens d'entrée.
client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-sonnet-4-6",
    thinking={"type": "enabled", "budget_tokens": 16000},
    messages=[
        {
            "role": "user",
            "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?",
        },
        {
            "role": "assistant",
            "content": [
                {
                    "type": "thinking",
                    "thinking": "This is a nice number theory question. Let's think about it step by step...",
                    "signature": "EuYBCkQYAiJAgCs1le6/Pol5Z4/JMomVOouGrWdhYNsH3ukzUECbB6iWrSQtsQuRHJID6lWV...",
                },
                {
                    "type": "text",
                    "text": "Yes, there are infinitely many prime numbers p such that p mod 4 = 3...",
                },
            ],
        },
        {"role": "user", "content": "Can you write a formal proof?"},
    ],
)

print(response.json())
Output
{ "input_tokens": 88 }

Compter les tokens dans des messages avec PDF



Le comptage de tokens prend en charge les PDF avec les mêmes limitations que l'API Messages.

import base64
import anthropic

client = anthropic.Anthropic()

with open("document.pdf", "rb") as pdf_file:
    pdf_base64 = base64.standard_b64encode(pdf_file.read()).decode("utf-8")

response = client.messages.count_tokens(
    model="claude-opus-4-8",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_base64,
                    },
                },
                {"type": "text", "text": "Please summarize this document."},
            ],
        }
    ],
)

print(response.json())
Output
{ "input_tokens": 2188 }

Nombres de tokens sur Claude Fable 5 et Claude Mythos 5

Claude Fable 5 et Claude Mythos 5 utilisent le tokenizer introduit avec Claude Opus 4.7, qui produit environ 30 % de tokens de plus que les modèles antérieurs à Claude Opus 4.7 pour le même texte. Le point de terminaison de comptage de tokens renvoie le nombre selon le tokenizer du model que vous passez. Ainsi, pour mesurer la différence pour votre charge de travail, comptez la même requête deux fois : une fois avec votre modèle actuel et une fois avec model: "claude-fable-5" (ou "claude-mythos-5"), puis comparez les deux valeurs input_tokens.



Facturation et migration : L'utilisation et la facturation sur Claude Fable 5 et Claude Mythos 5 reflètent les comptages de ce tokenizer. Si vous migrez depuis un modèle antérieur à Claude Opus 4.7, le même contenu consomme environ 30 % de tokens de plus. Lors de la migration d'une charge de travail vers Claude Fable 5 et Claude Mythos 5, ne réutilisez pas les nombres de tokens mesurés sur un modèle antérieur à Claude Opus 4.7 pour estimer les coûts ou l'adéquation à la fenêtre de contexte. Comptez vos prompts avec model: "claude-fable-5" (ou "claude-mythos-5").


Tarification et limites de débit

Le comptage de tokens est gratuit mais soumis à des limites de débit en requêtes par minute basées sur votre niveau d'utilisation. Si vous avez besoin de limites plus élevées, contactez l'équipe commerciale via la Claude Console.

Niveau d'utilisationRequêtes par minute (RPM)
1100
22 000
34 000
48 000


Le comptage de tokens et la création de messages ont des limites de débit distinctes et indépendantes. L'utilisation de l'un ne compte pas dans les limites de l'autre.


FAQ


Étapes suivantes


Compter les tokens d'un message

Consultez la référence complète de l'API pour le point de terminaison de comptage de tokens.

Fenêtres de contexte

Utilisez les nombres de tokens pour maintenir les prompts dans la fenêtre de contexte d'un modèle.

Limites de débit

Vérifiez les nombres de tokens avant d'envoyer une requête pour rester dans votre niveau d'utilisation.

Mise en cache des prompts

Réduisez les coûts et la latence sur les prompts répétés en mettant en cache les préfixes de prompts.

Was this page helpful?

  • Comment compter les tokens d'un message
  • Modèles pris en charge
  • Compter les tokens dans des messages basiques
  • Compter les tokens dans des messages avec outils
  • Compter les tokens dans des messages avec images
  • Compter les tokens dans des messages avec réflexion étendue
  • Compter les tokens dans des messages avec PDF
  • Nombres de tokens sur Claude Fable 5 et Claude Mythos 5
  • Tarification et limites de débit
  • FAQ
  • Étapes suivantes