Cette page fournit des informations détaillées sur la tarification des modèles et des fonctionnalités d'Anthropic. Tous les prix sont en USD.
Pour les informations tarifaires les plus récentes, veuillez consulter claude.com/pricing.
Le tableau suivant montre la tarification de tous les modèles Claude selon les différents niveaux d'utilisation :
| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.7 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.6 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.5 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.6 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Millions de tokens. La colonne « Base Input Tokens » affiche la tarification standard des entrées, « Cache Writes » et « Cache Hits » sont spécifiques à la mise en cache des invites, et « Output Tokens » affiche la tarification des sorties. Consultez la section tarification de la mise en cache des invites ci-dessous pour une explication des colonnes de cache et des multiplicateurs de tarification.
Opus 4.7 utilise un nouveau tokenizer par rapport aux modèles précédents, contribuant à ses performances améliorées sur un large éventail de tâches. Ce nouveau tokenizer peut utiliser jusqu'à 35 % de tokens supplémentaires pour le même texte fixe.
Les modèles Claude sont disponibles sur AWS Bedrock, Google Vertex AI, et Microsoft Foundry. Pour la tarification officielle, consultez :
Tarification des points de terminaison régionaux et multi-régionaux pour les modèles Claude 4.5 et versions ultérieures
À partir de Claude Sonnet 4.5 et Haiku 4.5 :
Les points de terminaison régionaux et multi-régionaux incluent une prime de 10 % par rapport aux points de terminaison globaux. L'API Claude (1P) est globale par défaut ; pour les options de résidence des données 1P et la tarification, consultez la section Tarification de la résidence des données ci-dessous.
Portée : Cette structure tarifaire s'applique à Claude Sonnet 4.5, Haiku 4.5 et à tous les modèles futurs. Les modèles antérieurs (Claude Sonnet 4 (déprécié), Opus 4 (déprécié) et les versions antérieures) conservent leur tarification existante.
Pour les détails d'implémentation et les exemples de code :
La mise en cache des invites réduit les coûts et la latence en réutilisant les portions précédemment traitées de votre invite dans les appels API. Au lieu de retraiter la même grande invite système, le même document ou le même historique de conversation à chaque demande, l'API lit à partir du cache à une fraction du prix d'entrée standard.
Il y a deux façons d'activer la mise en cache des invites :
cache_control au niveau supérieur de votre demande. Le système gère automatiquement les points d'arrêt du cache à mesure que les conversations se développent. C'est le point de départ recommandé pour la plupart des cas d'utilisation.cache_control directement sur les blocs de contenu individuels pour un contrôle granulaire sur exactement ce qui est mis en cache.La mise en cache des invites utilise les multiplicateurs de tarification suivants par rapport aux taux de tokens d'entrée de base :
| Opération de cache | Multiplicateur | Durée |
|---|---|---|
| Écriture de cache de 5 minutes | 1,25x prix d'entrée de base | Cache valide pendant 5 minutes |
| Écriture de cache d'1 heure | 2x prix d'entrée de base | Cache valide pendant 1 heure |
| Lecture de cache (accès) | 0,1x prix d'entrée de base | Même durée que l'écriture précédente |
Les tokens d'écriture de cache sont facturés lorsque le contenu est d'abord stocké. Les tokens de lecture de cache sont facturés lorsqu'une demande ultérieure récupère le contenu mis en cache. Un accès au cache coûte 10 % du prix d'entrée standard, ce qui signifie que la mise en cache est rentable après un seul accès au cache pour la durée de 5 minutes (écriture 1,25x), ou après deux accès au cache pour la durée d'1 heure (écriture 2x).
Ces multiplicateurs s'empilent avec d'autres modificateurs de tarification, y compris la remise de l'API Batch et la résidence des données.
Pour les détails d'implémentation, les modèles pris en charge et les exemples de code, consultez la documentation de mise en cache des invites.
Pour Claude Opus 4.7, Claude Opus 4.6 et les modèles plus récents, la spécification de l'inférence réservée aux États-Unis via le paramètre inference_geo entraîne un multiplicateur de 1,1x sur toutes les catégories de tarification des tokens, y compris les tokens d'entrée, les tokens de sortie, les écritures de cache et les lectures de cache. Le routage global (par défaut) utilise la tarification standard.
Cela s'applique uniquement à l'API Claude (1P). Les plateformes tierces ont leur propre tarification régionale. Consultez AWS Bedrock et Google Vertex AI pour plus de détails. Les modèles antérieurs conservent leur tarification existante indépendamment des paramètres inference_geo.
Pour plus d'informations, consultez la documentation de résidence des données.
Le mode rapide (bêta : aperçu de recherche) pour Claude Opus 4.6 fournit une sortie considérablement plus rapide à une tarification premium (6x les tarifs standard). La tarification du mode rapide s'applique sur toute la fenêtre de contexte, y compris les demandes de plus de 200k tokens d'entrée. Actuellement pris en charge sur Opus 4.6 :
| Entrée | Sortie |
|---|---|
| 30 $ / MTok | 150 $ / MTok |
La tarification du mode rapide s'empile avec d'autres modificateurs de tarification :
Le mode rapide n'est pas disponible avec l'API Batch.
Pour plus d'informations, consultez la documentation du mode rapide.
L'API Batch permet le traitement asynchrone de grands volumes de demandes avec une remise de 50 % sur les tokens d'entrée et de sortie.
| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.7 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.6 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.5 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.6 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Pour plus d'informations sur le traitement par lots, consultez la documentation du traitement par lots.
Claude Mythos Preview, Opus 4.7, Opus 4.6 et Sonnet 4.6 incluent la fenêtre de contexte complète de 1M tokens à la tarification standard. (Une demande de 900k tokens est facturée au même taux par token qu'une demande de 9k tokens.) Les remises de mise en cache des invites et de traitement par lots s'appliquent aux tarifs standard sur toute la fenêtre de contexte.
Tool use requests are priced based on:
tools parameter)Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
tools parameter in API requests (tool names, descriptions, and schemas)tool_use content blocks in API requests and responsestool_result content blocks in API requestsWhen you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.7 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
Pour les prix actuels par modèle, consultez la section tarification des modèles.
Pour plus d'informations sur l'implémentation et les meilleures pratiques de l'utilisation des outils, consultez la documentation de l'utilisation des outils.
The bash tool adds 245 input tokens to your API calls.
Additional tokens are consumed by:
Consultez la tarification de l'utilisation des outils pour les détails complets de la tarification.
Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.
When used without these tools, code execution is billed by execution time, tracked separately from token usage:
Code execution usage is tracked in the response:
"usage": {
"input_tokens": 105,
"output_tokens": 239,
"server_tool_use": {
"code_execution_requests": 1
}
}The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.
In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
Consultez la tarification de l'utilisation des outils pour les détails complets de la tarification.
Web search usage is charged in addition to token usage:
"usage": {
"input_tokens": 105,
"output_tokens": 6039,
"cache_read_input_tokens": 7123,
"cache_creation_input_tokens": 7345,
"server_tool_use": {
"web_search_requests": 1
}
}Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Web fetch usage has no additional charges beyond standard token costs:
"usage": {
"input_tokens": 25039,
"output_tokens": 931,
"cache_read_input_tokens": 0,
"cache_creation_input_tokens": 0,
"server_tool_use": {
"web_fetch_requests": 1
}
}The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.
To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
Additional token consumption:
If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Les agents gérés Claude sont facturés selon deux dimensions : les tokens et le temps d'exécution de la session.
Tous les tokens consommés par une session d'agents gérés Claude sont facturés aux tarifs indiqués dans la section Tarification des modèles ci-dessus. Les multiplicateurs de mise en cache des invites s'appliquent de manière identique. La recherche web déclenchée dans une session entraîne la tarification standard de 10 $ pour 1 000 recherches.
Les modificateurs suivants de l'API Messages ne s'appliquent pas aux sessions d'agents gérés Claude :
| Modificateur | Raison pour laquelle il ne s'applique pas |
|---|---|
| Remise de l'API Batch | Les sessions sont avec état et interactives. Il n'y a pas de mode batch. |
| Prime du mode rapide | La vitesse d'inférence est gérée par le runtime. |
| Multiplicateur de résidence des données | inference_geo est un champ de demande de l'API Messages. |
| Prime du contexte long | La fenêtre de contexte est gérée par le runtime. |
| Tarification des plateformes tierces | Les agents gérés Claude sont disponibles uniquement via l'API Claude directement. |
| SKU | Taux | Mesure |
|---|---|---|
| Temps d'exécution de la session | 0,08 $ par heure de session | Durée du statut running |
Le temps d'exécution est mesuré à la milliseconde et s'accumule uniquement lorsque le statut de la session est running. Le temps passé idle (en attente de votre prochain message ou d'une confirmation d'outil), rescheduling ou terminated ne compte pas vers le temps d'exécution.
Le temps d'exécution de la session remplace le modèle de facturation par heure de conteneur de l'exécution de code lors de l'utilisation des agents gérés Claude. Vous n'êtes pas facturé séparément pour les heures de conteneur en plus du temps d'exécution de la session.
Une session de codage d'une heure utilisant Claude Opus 4.7 qui consomme 50 000 tokens d'entrée et 15 000 tokens de sortie :
| Élément de ligne | Calcul | Coût |
|---|---|---|
| Tokens d'entrée | 50 000 × 5 $ / 1 000 000 | 0,25 $ |
| Tokens de sortie | 15 000 × 25 $ / 1 000 000 | 0,375 $ |
| Temps d'exécution de la session | 1,0 heure × 0,08 $ | 0,08 $ |
| Total | 0,705 $ |
Si la mise en cache des invites est active et que 40 000 des tokens d'entrée sont des lectures de cache :
| Élément de ligne | Calcul | Coût |
|---|---|---|
| Tokens d'entrée non mis en cache | 10 000 × 5 $ / 1 000 000 | 0,05 $ |
| Tokens de lecture de cache | 40 000 × 5 $ × 0,1 / 1 000 000 | 0,02 $ |
| Tokens de sortie | 15 000 × 25 $ / 1 000 000 | 0,375 $ |
| Temps d'exécution de la session | 1,0 heure × 0,08 $ | 0,08 $ |
| Total | 0,525 $ |
Exemple de calcul pour traiter 10 000 tickets d'assistance :
Pour une explication détaillée de ce calcul, consultez le guide d'agent d'assistance client.
Lors de la création d'agents avec Claude :
Pour les applications d'agents à haut volume, contactez l'équipe de ventes d'entreprise pour des arrangements tarifaires personnalisés.
Les limites de débit varient selon le niveau d'utilisation et affectent le nombre de demandes que vous pouvez effectuer :
Pour des informations détaillées sur les limites de débit, consultez la documentation des limites de débit.
Pour des limites de débit plus élevées ou des arrangements tarifaires personnalisés, contactez l'équipe de ventes.
Des remises de volume peuvent être disponibles pour les utilisateurs à haut volume. Celles-ci sont négociées au cas par cas.
Pour les clients d'entreprise ayant des besoins spécifiques :
Contactez l'équipe de ventes à [email protected] ou via la Claude Console pour discuter des options de tarification d'entreprise.
Comment l'utilisation des tokens est-elle calculée ?
Les tokens sont des morceaux de texte que les modèles traitent. En tant qu'estimation approximative, 1 token représente environ 4 caractères ou 0,75 mots en anglais. Le nombre exact varie selon la langue et le type de contenu.
Y a-t-il des niveaux gratuits ou des essais ?
Les nouveaux utilisateurs reçoivent une petite quantité de crédits gratuits pour tester l'API. Contactez les ventes pour des informations sur les essais prolongés pour l'évaluation d'entreprise.
Comment les remises s'empilent-elles ?
Les remises de l'API Batch et de la mise en cache des invites peuvent être combinées. Par exemple, l'utilisation des deux fonctionnalités ensemble offre des économies de coûts importantes par rapport aux appels API standard. Consultez la tarification de la mise en cache des invites pour voir comment les multiplicateurs interagissent.
Quels modes de paiement sont acceptés ?
Les principales cartes de crédit sont acceptées pour les comptes standard. Les clients d'entreprise peuvent organiser la facturation et d'autres modes de paiement.
Pour des questions supplémentaires sur la tarification, contactez [email protected].
Was this page helpful?