Cette page fournit des informations tarifaires détaillées pour les modèles et les fonctionnalités d'Anthropic. Tous les prix sont en USD.
Pour les informations tarifaires les plus actuelles, veuillez visiter claude.com/pricing.
Le tableau suivant montre la tarification de tous les modèles Claude selon différents niveaux d'utilisation :
| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.5 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Millions de tokens. La colonne « Base Input Tokens » affiche la tarification d'entrée standard, « Cache Writes » et « Cache Hits » sont spécifiques à la mise en cache des invites, et « Output Tokens » affiche la tarification de sortie. La mise en cache des invites offre des durées de cache de 5 minutes (par défaut) et 1 heure pour optimiser les coûts selon les cas d'utilisation.
Le tableau ci-dessus reflète les multiplicateurs de tarification suivants pour la mise en cache des invites :
Les modèles Claude sont disponibles sur AWS Bedrock, Google Vertex AI et Microsoft Foundry. Pour la tarification officielle, visitez :
Tarification des points de terminaison régionaux pour les modèles Claude 4.5 et versions ultérieures
À partir de Claude Sonnet 4.5 et Haiku 4.5, AWS Bedrock et Google Vertex AI offrent deux types de points de terminaison :
Les points de terminaison régionaux incluent une prime de 10 % par rapport aux points de terminaison mondiaux. L'API Claude (1P) est mondiale par défaut et n'est pas affectée par ce changement. L'API Claude est mondiale uniquement (équivalente à l'offre de point de terminaison mondial et à la tarification d'autres fournisseurs).
Portée : Cette structure tarifaire s'applique à Claude Sonnet 4.5, Haiku 4.5 et à tous les modèles futurs. Les modèles antérieurs (Claude Sonnet 4, Opus 4 et les versions antérieures) conservent leur tarification existante.
Pour les détails de mise en œuvre et les exemples de code :
L'API Batch permet le traitement asynchrone de grands volumes de requêtes avec une réduction de 50 % sur les tokens d'entrée et de sortie.
| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.5 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 () |
Pour plus d'informations sur le traitement par lots, consultez notre documentation sur le traitement par lots.
Lors de l'utilisation de Claude Sonnet 4 ou Sonnet 4.5 avec la fenêtre de contexte de 1M tokens activée, les requêtes qui dépassent 200K tokens d'entrée sont automatiquement facturées aux tarifs premium du contexte long :
La fenêtre de contexte de 1M tokens est actuellement en version bêta pour les organisations au niveau d'utilisation 4 et les organisations avec des limites de débit personnalisées. La fenêtre de contexte de 1M tokens n'est disponible que pour Claude Sonnet 4 et Sonnet 4.5.
| ≤ 200K tokens d'entrée | > 200K tokens d'entrée |
|---|---|
| Entrée : 3 $ / MTok | Entrée : 6 $ / MTok |
| Sortie : 15 $ / MTok | Sortie : 22,50 $ / MTok |
La tarification du contexte long s'ajoute à d'autres modificateurs de tarification :
Même avec l'indicateur bêta activé, les requêtes avec moins de 200K tokens d'entrée sont facturées aux tarifs standard. Si votre requête dépasse 200K tokens d'entrée, tous les tokens sont facturés à la tarification premium.
Le seuil de 200K est basé uniquement sur les tokens d'entrée (y compris les lectures/écritures de cache). Le nombre de tokens de sortie n'affecte pas la sélection du niveau de tarification, bien que les tokens de sortie soient facturés au tarif plus élevé lorsque le seuil d'entrée est dépassé.
Pour vérifier si votre requête API a été facturée aux tarifs de la fenêtre de contexte 1M, examinez l'objet usage dans la réponse API :
{
"usage": {
"input_tokens": 250000,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"output_tokens": 500
}
}Calculez le nombre total de tokens d'entrée en additionnant :
input_tokenscache_creation_input_tokens (si vous utilisez la mise en cache des invites)cache_read_input_tokens (si vous utilisez la mise en cache des invites)Si le total dépasse 200 000 tokens, la requête entière a été facturée aux tarifs du contexte 1M.
Pour plus d'informations sur l'objet usage, consultez la documentation de réponse API.
Tool use requests are priced based on:
tools parameter)Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
tools parameter in API requests (tool names, descriptions, and schemas)tool_use content blocks in API requests and responsestool_result content blocks in API requestsWhen you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
Pour les prix actuels par modèle, reportez-vous à notre section tarification des modèles ci-dessus.
Pour plus d'informations sur la mise en œuvre et les meilleures pratiques de l'utilisation d'outils, consultez notre documentation sur l'utilisation d'outils.
The bash tool adds 245 input tokens to your API calls.
Additional tokens are consumed by:
Consultez la tarification de l'utilisation d'outils pour les détails tarifaires complets.
Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container.
Each organization receives 1,550 free hours of usage with the code execution tool per month. Additional usage beyond the first 1,550 hours is billed at $0.05 per hour, per container.
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.
In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
Consultez la tarification de l'utilisation d'outils pour les détails tarifaires complets.
Web search usage is charged in addition to token usage:
"usage": {
"input_tokens": 105,
"output_tokens": 6039,
"cache_read_input_tokens": 7123,
"cache_creation_input_tokens": 7345,
"server_tool_use": {
"web_search_requests": 1
}
}Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Web fetch usage has no additional charges beyond standard token costs:
"usage": {
"input_tokens": 25039,
"output_tokens": 931,
"cache_read_input_tokens": 0,
"cache_creation_input_tokens": 0,
"server_tool_use": {
"web_fetch_requests": 1
}
}The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.
To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
Additional token consumption:
If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Comprendre la tarification des applications d'agents est crucial lors de la création avec Claude. Ces exemples du monde réel peuvent vous aider à estimer les coûts pour différents modèles d'agents.
Lors de la création d'un agent d'assistance à la clientèle, voici comment les coûts pourraient se décomposer :
Exemple de calcul pour le traitement de 10 000 tickets d'assistance :
Pour une explication détaillée de ce calcul, consultez notre guide d'agent d'assistance à la clientèle.
Pour les architectures d'agents plus complexes avec plusieurs étapes :
Traitement des requêtes initiales
Récupération de la mémoire et du contexte
Planification et exécution des actions
Pour un guide complet sur les modèles de tarification des agents, consultez notre guide des cas d'utilisation d'agents.
Lors de la création d'agents avec Claude :
Pour les applications d'agents à haut volume, envisagez de contacter notre équipe de ventes d'entreprise pour des arrangements tarifaires personnalisés.
Les limites de débit varient selon le niveau d'utilisation et affectent le nombre de requêtes que vous pouvez effectuer :
Pour des informations détaillées sur les limites de débit, consultez notre documentation sur les limites de débit.
Pour des limites de débit plus élevées ou des arrangements tarifaires personnalisés, contactez notre équipe de ventes.
Des remises sur volume peuvent être disponibles pour les utilisateurs à haut volume. Celles-ci sont négociées au cas par cas.
Pour les clients d'entreprise ayant des besoins spécifiques :
Contactez notre équipe de ventes à [email protected] ou via la Console Claude pour discuter des options de tarification d'entreprise.
Comment l'utilisation des tokens est-elle calculée ?
Les tokens sont des morceaux de texte que les modèles traitent. En règle générale, 1 token représente environ 4 caractères ou 0,75 mots en anglais. Le nombre exact varie selon la langue et le type de contenu.
Y a-t-il des niveaux gratuits ou des essais ?
Les nouveaux utilisateurs reçoivent une petite quantité de crédits gratuits pour tester l'API. Contactez les ventes pour obtenir des informations sur les essais prolongés pour l'évaluation d'entreprise.
Comment les remises s'empilent-elles ?
Les remises de l'API Batch et de la mise en cache des invites peuvent être combinées. Par exemple, l'utilisation des deux fonctionnalités ensemble offre des économies de coûts importantes par rapport aux appels API standard.
Quels modes de paiement sont acceptés ?
Nous acceptons les principales cartes de crédit pour les comptes standard. Les clients d'entreprise peuvent organiser la facturation et d'autres modes de paiement.
Pour des questions supplémentaires sur la tarification, contactez [email protected].
| $7.50 / MTok |
| $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
| 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |