Loading...
  • Construire
  • Admin
  • Modèles & tarification
  • SDKs clients
  • Référence API
Search...
⌘K
Modèles
Aperçu des modèlesChoisir un modèleNouveautés dans Claude Opus 4.7Guide de migrationDépréciations de modèlesFiches de modèlesPrompts système
Tarification
Tarification
Log in
Tarification
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Modèles & tarification/Tarification

Tarification

Découvrez la structure tarifaire d'Anthropic pour les modèles et les fonctionnalités

Cette page fournit des informations détaillées sur la tarification des modèles et des fonctionnalités d'Anthropic. Tous les prix sont en USD.

Pour les informations tarifaires les plus récentes, veuillez consulter claude.com/pricing.

Tarification des modèles

Le tableau suivant montre la tarification de tous les modèles Claude selon les différents niveaux d'utilisation :

ModelBase Input Tokens5m Cache Writes1h Cache WritesCache Hits & RefreshesOutput Tokens
Claude Opus 4.7$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.6$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.5$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
Claude Opus 4.1$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Opus 4$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Sonnet 4.6$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4.5$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 3.7 (deprecated)$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Haiku 4.5$1 / MTok$1.25 / MTok$2 / MTok$0.10 / MTok$5 / MTok
Claude Haiku 3.5$0.80 / MTok$1 / MTok$1.6 / MTok$0.08 / MTok$4 / MTok
Claude Opus 3 (deprecated)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Haiku 3$0.25 / MTok$0.30 / MTok$0.50 / MTok$0.03 / MTok$1.25 / MTok

MTok = Millions de tokens. La colonne « Base Input Tokens » affiche la tarification standard des entrées, « Cache Writes » et « Cache Hits » sont spécifiques à la mise en cache des invites, et « Output Tokens » affiche la tarification des sorties. Consultez la section tarification de la mise en cache des invites ci-dessous pour une explication des colonnes de cache et des multiplicateurs de tarification.

Opus 4.7 utilise un nouveau tokenizer par rapport aux modèles précédents, contribuant à ses performances améliorées sur un large éventail de tâches. Ce nouveau tokenizer peut utiliser jusqu'à 35 % de tokens supplémentaires pour le même texte fixe.

Tarification des plateformes tierces

Les modèles Claude sont disponibles sur AWS Bedrock, Google Vertex AI, et Microsoft Foundry. Pour la tarification officielle, consultez :

  • Tarification AWS Bedrock
  • Tarification Google Vertex AI
  • Tarification Microsoft Foundry

Tarification des points de terminaison régionaux et multi-régionaux pour les modèles Claude 4.5 et versions ultérieures

À partir de Claude Sonnet 4.5 et Haiku 4.5 :

  • AWS Bedrock propose deux types de points de terminaison : les points de terminaison globaux (routage dynamique pour une disponibilité maximale) et les points de terminaison régionaux (routage de données garanti via des régions géographiques spécifiques).
  • Google Vertex AI propose trois types de points de terminaison : les points de terminaison globaux, les points de terminaison multi-régionaux (routage dynamique dans une zone géographique) et les points de terminaison régionaux.

Les points de terminaison régionaux et multi-régionaux incluent une prime de 10 % par rapport aux points de terminaison globaux. L'API Claude (1P) est globale par défaut ; pour les options de résidence des données 1P et la tarification, consultez la section Tarification de la résidence des données ci-dessous.

Portée : Cette structure tarifaire s'applique à Claude Sonnet 4.5, Haiku 4.5 et à tous les modèles futurs. Les modèles antérieurs (Claude Sonnet 4 (déprécié), Opus 4 (déprécié) et les versions antérieures) conservent leur tarification existante.

Pour les détails d'implémentation et les exemples de code :

  • Points de terminaison globaux vs régionaux AWS Bedrock
  • Points de terminaison globaux, multi-régionaux et régionaux Google Vertex AI

Tarification spécifique aux fonctionnalités

Mise en cache des invites

La mise en cache des invites réduit les coûts et la latence en réutilisant les portions précédemment traitées de votre invite dans les appels API. Au lieu de retraiter la même grande invite système, le même document ou le même historique de conversation à chaque demande, l'API lit à partir du cache à une fraction du prix d'entrée standard.

Il y a deux façons d'activer la mise en cache des invites :

  • Mise en cache automatique : Ajoutez un seul champ cache_control au niveau supérieur de votre demande. Le système gère automatiquement les points d'arrêt du cache à mesure que les conversations se développent. C'est le point de départ recommandé pour la plupart des cas d'utilisation.
  • Points d'arrêt de cache explicites : Placez cache_control directement sur les blocs de contenu individuels pour un contrôle granulaire sur exactement ce qui est mis en cache.

La mise en cache des invites utilise les multiplicateurs de tarification suivants par rapport aux taux de tokens d'entrée de base :

Opération de cacheMultiplicateurDurée
Écriture de cache de 5 minutes1,25x prix d'entrée de baseCache valide pendant 5 minutes
Écriture de cache d'1 heure2x prix d'entrée de baseCache valide pendant 1 heure
Lecture de cache (accès)0,1x prix d'entrée de baseMême durée que l'écriture précédente

Les tokens d'écriture de cache sont facturés lorsque le contenu est d'abord stocké. Les tokens de lecture de cache sont facturés lorsqu'une demande ultérieure récupère le contenu mis en cache. Un accès au cache coûte 10 % du prix d'entrée standard, ce qui signifie que la mise en cache est rentable après un seul accès au cache pour la durée de 5 minutes (écriture 1,25x), ou après deux accès au cache pour la durée d'1 heure (écriture 2x).

Ces multiplicateurs s'empilent avec d'autres modificateurs de tarification, y compris la remise de l'API Batch et la résidence des données.

Pour les détails d'implémentation, les modèles pris en charge et les exemples de code, consultez la documentation de mise en cache des invites.

Tarification de la résidence des données

Pour Claude Opus 4.7, Claude Opus 4.6 et les modèles plus récents, la spécification de l'inférence réservée aux États-Unis via le paramètre inference_geo entraîne un multiplicateur de 1,1x sur toutes les catégories de tarification des tokens, y compris les tokens d'entrée, les tokens de sortie, les écritures de cache et les lectures de cache. Le routage global (par défaut) utilise la tarification standard.

Cela s'applique uniquement à l'API Claude (1P). Les plateformes tierces ont leur propre tarification régionale. Consultez AWS Bedrock et Google Vertex AI pour plus de détails. Les modèles antérieurs conservent leur tarification existante indépendamment des paramètres inference_geo.

Pour plus d'informations, consultez la documentation de résidence des données.

Tarification du mode rapide

Le mode rapide (bêta : aperçu de recherche) pour Claude Opus 4.6 fournit une sortie considérablement plus rapide à une tarification premium (6x les tarifs standard). La tarification du mode rapide s'applique sur toute la fenêtre de contexte, y compris les demandes de plus de 200k tokens d'entrée. Actuellement pris en charge sur Opus 4.6 :

EntréeSortie
30 $ / MTok150 $ / MTok

La tarification du mode rapide s'empile avec d'autres modificateurs de tarification :

  • Les multiplicateurs de mise en cache des invites s'appliquent en plus de la tarification du mode rapide
  • Les multiplicateurs de résidence des données s'appliquent en plus de la tarification du mode rapide

Le mode rapide n'est pas disponible avec l'API Batch.

Pour plus d'informations, consultez la documentation du mode rapide.

Traitement par lots

L'API Batch permet le traitement asynchrone de grands volumes de demandes avec une remise de 50 % sur les tokens d'entrée et de sortie.

ModelBatch inputBatch output
Claude Opus 4.7$2.50 / MTok$12.50 / MTok
Claude Opus 4.6$2.50 / MTok$12.50 / MTok
Claude Opus 4.5$2.50 / MTok$12.50 / MTok
Claude Opus 4.1$7.50 / MTok$37.50 / MTok
Claude Opus 4$7.50 / MTok$37.50 / MTok
Claude Sonnet 4.6$1.50 / MTok$7.50 / MTok
Claude Sonnet 4.5$1.50 / MTok$7.50 / MTok
Claude Sonnet 4$1.50 / MTok$7.50 / MTok
Claude Sonnet 3.7 (deprecated)$1.50 / MTok$7.50 / MTok
Claude Haiku 4.5$0.50 / MTok$2.50 / MTok
Claude Haiku 3.5$0.40 / MTok$2 / MTok
Claude Opus 3 (deprecated)$7.50 / MTok$37.50 / MTok
Claude Haiku 3$0.125 / MTok$0.625 / MTok

Pour plus d'informations sur le traitement par lots, consultez la documentation du traitement par lots.

Tarification du contexte long

Claude Mythos Preview, Opus 4.7, Opus 4.6 et Sonnet 4.6 incluent la fenêtre de contexte complète de 1M tokens à la tarification standard. (Une demande de 900k tokens est facturée au même taux par token qu'une demande de 9k tokens.) Les remises de mise en cache des invites et de traitement par lots s'appliquent aux tarifs standard sur toute la fenêtre de contexte.

Tarification de l'utilisation des outils

Tool use requests are priced based on:

  1. The total number of input tokens sent to the model (including in the tools parameter)
  2. The number of output tokens generated
  3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

The additional tokens from tool use come from:

  • The tools parameter in API requests (tool names, descriptions, and schemas)
  • tool_use content blocks in API requests and responses
  • tool_result content blocks in API requests

When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

ModelTool choiceTool use system prompt token count
Claude Opus 4.7auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.6auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4.1auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.6auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 3.7 (deprecated)auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 3.5auto, none
any, tool
264 tokens
340 tokens
Claude Opus 3 (deprecated)auto, none
any, tool
530 tokens
281 tokens
Claude Sonnet 3auto, none
any, tool
159 tokens
235 tokens
Claude Haiku 3auto, none
any, tool
264 tokens
340 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request.

Pour les prix actuels par modèle, consultez la section tarification des modèles.

Pour plus d'informations sur l'implémentation et les meilleures pratiques de l'utilisation des outils, consultez la documentation de l'utilisation des outils.

Tarification des outils spécifiques

Outil Bash

The bash tool adds 245 input tokens to your API calls.

Additional tokens are consumed by:

  • Command outputs (stdout/stderr)
  • Error messages
  • Large file contents

Consultez la tarification de l'utilisation des outils pour les détails complets de la tarification.

Outil d'exécution de code

Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.

When used without these tools, code execution is billed by execution time, tracked separately from token usage:

  • Execution time has a minimum of 5 minutes
  • Each organization receives 1,550 free hours of usage per month
  • Additional usage beyond 1,550 hours is billed at $0.05 per hour, per container
  • If files are included in the request, execution time is billed even if the tool is not invoked, due to files being preloaded onto the container

Code execution usage is tracked in the response:

"usage": {
  "input_tokens": 105,
  "output_tokens": 239,
  "server_tool_use": {
    "code_execution_requests": 1
  }
}

Outil d'édition de texte

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.

In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

ToolAdditional input tokens
text_editor_20250429 (Claude 4.x)700 tokens
text_editor_20250124 (Claude Sonnet 3.7 (deprecated))700 tokens

Consultez la tarification de l'utilisation des outils pour les détails complets de la tarification.

Outil de recherche web

Web search usage is charged in addition to token usage:

"usage": {
  "input_tokens": 105,
  "output_tokens": 6039,
  "cache_read_input_tokens": 7123,
  "cache_creation_input_tokens": 7345,
  "server_tool_use": {
    "web_search_requests": 1
  }
}

Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.

Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

Outil de récupération web

Web fetch usage has no additional charges beyond standard token costs:

"usage": {
  "input_tokens": 25039,
  "output_tokens": 931,
  "cache_read_input_tokens": 0,
  "cache_creation_input_tokens": 0,
  "server_tool_use": {
    "web_fetch_requests": 1
  }
}

The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.

To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.

Example token usage for typical content:

  • Average web page (10 kB): ~2,500 tokens
  • Large documentation page (100 kB): ~25,000 tokens
  • Research paper PDF (500 kB): ~125,000 tokens

Outil d'utilisation informatique

Computer use follows the standard tool use pricing. When using the computer use tool:

System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

Computer use tool token usage:

ModelInput tokens per tool definition
Claude 4.x models735 tokens
Claude Sonnet 3.7 (deprecated)735 tokens

Additional token consumption:

  • Screenshot images (see Vision pricing)
  • Tool execution results returned to Claude

If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Tarification des agents gérés Claude

Les agents gérés Claude sont facturés selon deux dimensions : les tokens et le temps d'exécution de la session.

Tokens

Tous les tokens consommés par une session d'agents gérés Claude sont facturés aux tarifs indiqués dans la section Tarification des modèles ci-dessus. Les multiplicateurs de mise en cache des invites s'appliquent de manière identique. La recherche web déclenchée dans une session entraîne la tarification standard de 10 $ pour 1 000 recherches.

Les modificateurs suivants de l'API Messages ne s'appliquent pas aux sessions d'agents gérés Claude :

ModificateurRaison pour laquelle il ne s'applique pas
Remise de l'API BatchLes sessions sont avec état et interactives. Il n'y a pas de mode batch.
Prime du mode rapideLa vitesse d'inférence est gérée par le runtime.
Multiplicateur de résidence des donnéesinference_geo est un champ de demande de l'API Messages.
Prime du contexte longLa fenêtre de contexte est gérée par le runtime.
Tarification des plateformes tiercesLes agents gérés Claude sont disponibles uniquement via l'API Claude directement.

Temps d'exécution de la session

SKUTauxMesure
Temps d'exécution de la session0,08 $ par heure de sessionDurée du statut running

Le temps d'exécution est mesuré à la milliseconde et s'accumule uniquement lorsque le statut de la session est running. Le temps passé idle (en attente de votre prochain message ou d'une confirmation d'outil), rescheduling ou terminated ne compte pas vers le temps d'exécution.

Le temps d'exécution de la session remplace le modèle de facturation par heure de conteneur de l'exécution de code lors de l'utilisation des agents gérés Claude. Vous n'êtes pas facturé séparément pour les heures de conteneur en plus du temps d'exécution de la session.

Exemple détaillé

Une session de codage d'une heure utilisant Claude Opus 4.7 qui consomme 50 000 tokens d'entrée et 15 000 tokens de sortie :

Élément de ligneCalculCoût
Tokens d'entrée50 000 × 5 $ / 1 000 0000,25 $
Tokens de sortie15 000 × 25 $ / 1 000 0000,375 $
Temps d'exécution de la session1,0 heure × 0,08 $0,08 $
Total0,705 $

Si la mise en cache des invites est active et que 40 000 des tokens d'entrée sont des lectures de cache :

Élément de ligneCalculCoût
Tokens d'entrée non mis en cache10 000 × 5 $ / 1 000 0000,05 $
Tokens de lecture de cache40 000 × 5 $ × 0,1 / 1 000 0000,02 $
Tokens de sortie15 000 × 25 $ / 1 000 0000,375 $
Temps d'exécution de la session1,0 heure × 0,08 $0,08 $
Total0,525 $

Exemple de calcul pour traiter 10 000 tickets d'assistance :

  • Environ 3 700 tokens par conversation en moyenne
  • Utilisation de Claude Haiku 4.5 à 1 $/MTok d'entrée, 5 $/MTok de sortie
  • Coût total : environ 37,00 $ pour 10 000 tickets

Pour une explication détaillée de ce calcul, consultez le guide d'agent d'assistance client.

Considérations tarifaires supplémentaires

Stratégies d'optimisation des coûts

Lors de la création d'agents avec Claude :

  1. Utilisez les modèles appropriés : Choisissez Haiku pour les tâches simples, Sonnet pour le raisonnement complexe
  2. Implémentez la mise en cache des invites : Réduisez les coûts pour le contexte répété
  3. Opérations par lots : Utilisez l'API Batch pour les tâches non sensibles au temps
  4. Surveillez les modèles d'utilisation : Suivez la consommation de tokens pour identifier les opportunités d'optimisation

Pour les applications d'agents à haut volume, contactez l'équipe de ventes d'entreprise pour des arrangements tarifaires personnalisés.

Limites de débit

Les limites de débit varient selon le niveau d'utilisation et affectent le nombre de demandes que vous pouvez effectuer :

  • Niveau 1 : Utilisation au niveau d'entrée avec des limites de base
  • Niveau 2 : Limites augmentées pour les applications en croissance
  • Niveau 3 : Limites plus élevées pour les applications établies
  • Niveau 4 : Limites standard maximales
  • Entreprise : Limites personnalisées disponibles

Pour des informations détaillées sur les limites de débit, consultez la documentation des limites de débit.

Pour des limites de débit plus élevées ou des arrangements tarifaires personnalisés, contactez l'équipe de ventes.

Remises de volume

Des remises de volume peuvent être disponibles pour les utilisateurs à haut volume. Celles-ci sont négociées au cas par cas.

  • Les niveaux standard utilisent la tarification indiquée ci-dessus
  • Les clients d'entreprise peuvent contacter les ventes pour une tarification personnalisée
  • Des remises académiques et de recherche peuvent être disponibles

Tarification d'entreprise

Pour les clients d'entreprise ayant des besoins spécifiques :

  • Limites de débit personnalisées
  • Remises de volume
  • Support dédié
  • Conditions personnalisées

Contactez l'équipe de ventes à [email protected] ou via la Claude Console pour discuter des options de tarification d'entreprise.

Facturation et paiement

  • La facturation est basée sur l'utilisation mensuelle réelle
  • Tous les paiements sont en USD
  • Options de carte de crédit et de facturation disponibles
  • Suivi de l'utilisation disponible dans la Claude Console

Questions fréquemment posées

Comment l'utilisation des tokens est-elle calculée ?

Les tokens sont des morceaux de texte que les modèles traitent. En tant qu'estimation approximative, 1 token représente environ 4 caractères ou 0,75 mots en anglais. Le nombre exact varie selon la langue et le type de contenu.

Y a-t-il des niveaux gratuits ou des essais ?

Les nouveaux utilisateurs reçoivent une petite quantité de crédits gratuits pour tester l'API. Contactez les ventes pour des informations sur les essais prolongés pour l'évaluation d'entreprise.

Comment les remises s'empilent-elles ?

Les remises de l'API Batch et de la mise en cache des invites peuvent être combinées. Par exemple, l'utilisation des deux fonctionnalités ensemble offre des économies de coûts importantes par rapport aux appels API standard. Consultez la tarification de la mise en cache des invites pour voir comment les multiplicateurs interagissent.

Quels modes de paiement sont acceptés ?

Les principales cartes de crédit sont acceptées pour les comptes standard. Les clients d'entreprise peuvent organiser la facturation et d'autres modes de paiement.

Pour des questions supplémentaires sur la tarification, contactez [email protected].

Was this page helpful?

  • Tarification des modèles
  • Tarification des plateformes tierces
  • Tarification spécifique aux fonctionnalités
  • Mise en cache des invites
  • Tarification de la résidence des données
  • Tarification du mode rapide
  • Traitement par lots
  • Tarification du contexte long
  • Tarification de l'utilisation des outils
  • Tarification des outils spécifiques
  • Tarification des agents gérés Claude
  • Tokens
  • Temps d'exécution de la session
  • Exemple détaillé
  • Considérations tarifaires supplémentaires
  • Stratégies d'optimisation des coûts
  • Limites de débit
  • Remises de volume
  • Tarification d'entreprise
  • Facturation et paiement
  • Questions fréquemment posées