Cette page fournit des informations détaillées sur la tarification des modèles et des fonctionnalités d'Anthropic. Tous les prix sont en USD.
Pour obtenir les informations tarifaires les plus récentes, consultez claude.com/pricing.
Le tableau suivant présente la tarification de tous les modèles Claude :
| Modèle | Tokens d'entrée de base | Écritures en cache 5 min | Écritures en cache 1 h | Succès et actualisations du cache | Tokens de sortie |
|---|---|---|---|---|---|
| Claude Fable 5 | 10 $ / MTok | 12,50 $ / MTok | 20 $ / MTok | 1 $ / MTok | 50 $ / MTok |
| Claude Mythos 5 (disponibilité limitée) | 10 $ / MTok | 12,50 $ / MTok | 20 $ / MTok | 1 $ / MTok | 50 $ / MTok |
| Claude Opus 4.8 | 5 $ / MTok | 6,25 $ / MTok | 10 $ / MTok | 0,50 $ / MTok | 25 $ / MTok |
| Claude Opus 4.7 | 5 $ / MTok | 6,25 $ / MTok | 10 $ / MTok | 0,50 $ / MTok | 25 $ / MTok |
| Claude Opus 4.6 | 5 $ / MTok | 6,25 $ / MTok | 10 $ / MTok | 0,50 $ / MTok | 25 $ / MTok |
| Claude Opus 4.5 | 5 $ / MTok | 6,25 $ / MTok | 10 $ / MTok | 0,50 $ / MTok | 25 $ / MTok |
| Claude Opus 4.1 (déprécié) | 15 $ / MTok | 18,75 $ / MTok | 30 $ / MTok | 1,50 $ / MTok | 75 $ / MTok |
| Claude Opus 4 (déprécié) | 15 $ / MTok | 18,75 $ / MTok | 30 $ / MTok | 1,50 $ / MTok | 75 $ / MTok |
| Claude Sonnet 4.6 | 3 $ / MTok | 3,75 $ / MTok | 6 $ / MTok | 0,30 $ / MTok | 15 $ / MTok |
| Claude Sonnet 4.5 | 3 $ / MTok | 3,75 $ / MTok | 6 $ / MTok | 0,30 $ / MTok | 15 $ / MTok |
| Claude Sonnet 4 (déprécié) | 3 $ / MTok | 3,75 $ / MTok | 6 $ / MTok | 0,30 $ / MTok | 15 $ / MTok |
| Claude Haiku 4.5 | 1 $ / MTok | 1,25 $ / MTok | 2 $ / MTok | 0,10 $ / MTok | 5 $ / MTok |
| Claude Haiku 3.5 (retiré, sauf sur Bedrock et Vertex AI) | 0,80 $ / MTok | 1 $ / MTok | 1,60 $ / MTok | 0,08 $ / MTok | 4 $ / MTok |
MTok = Million de tokens. La colonne « Base Input Tokens » indique la tarification standard des tokens d'entrée, les colonnes « 5m Cache Writes », « 1h Cache Writes » et « Cache Hits & Refreshes » sont spécifiques à la mise en cache des prompts, et « Output Tokens » indique la tarification des tokens de sortie. Consultez la tarification de la mise en cache des prompts pour une explication des colonnes de cache et des multiplicateurs de tarification.
Opus 4.7 et les versions ultérieures utilisent un nouveau tokenizer par rapport aux modèles précédents, ce qui contribue à leurs performances améliorées sur un large éventail de tâches. Ce nouveau tokenizer peut utiliser jusqu'à 35 % de tokens supplémentaires pour le même texte fixe.
Pour la tarification de Claude Platform sur AWS, consultez Tarification de Claude Platform sur AWS.
Cette section couvre les plateformes cloud exploitées par des partenaires, où le fournisseur cloud vous facture directement. Pour les plateformes cloud exploitées par Anthropic et facturées via une marketplace, consultez Tarification de Claude Platform sur AWS et Claude dans Microsoft Foundry.
Les modèles Claude sont disponibles sur Amazon Bedrock et Vertex AI. Pour la tarification officielle, consultez :
Tarification des points de terminaison régionaux et multirégionaux pour les modèles Claude 4.5 et ultérieurs
À partir de Claude Sonnet 4.5, Haiku 4.5 et Opus 4.5 :
Les points de terminaison régionaux et multirégionaux incluent une majoration de 10 % par rapport aux points de terminaison globaux. L'API Claude (first-party) est globale par défaut ; pour les options de résidence des données first-party et leur tarification, consultez Tarification de la résidence des données.
Portée : Cette structure tarifaire s'applique à Claude Sonnet 4.5, Haiku 4.5, Opus 4.5 et à tous les modèles futurs. Les modèles antérieurs (Claude Sonnet 4 (obsolète), Opus 4 (obsolète) et les versions précédentes) conservent leur tarification existante.
Pour les détails d'implémentation et les exemples de code :
Claude Platform sur AWS facture via AWS Marketplace en utilisant des Claude Consumption Units (CCU). Anthropic évalue votre consommation de tokens en USD aux tarifs standard par modèle et par fonctionnalité, applique toute remise négociée, convertit le résultat en CCU au taux de 0,01 $ par CCU, et transmet la quantité de CCU à AWS Marketplace toutes les heures. Votre facture AWS affiche une seule ligne CCU.
| Concept | Détails |
|---|---|
| Unité de facturation | Claude Consumption Unit (CCU) |
| Prix du CCU | 0,01 $ par CCU (fixe ; les remises s'appliquent lors de la conversion tokens-CCU, pas au prix du CCU) |
| Conversion | Consommation de tokens évaluée en USD aux tarifs standard par modèle et par fonctionnalité (identiques à la tarification de l'API Claude), puis convertie en CCU au taux de 0,01 $ par CCU |
| Cadence de facturation | Mesure horaire vers AWS Marketplace ; factures mensuelles |
| Modèle de paiement | Paiement à terme échu uniquement (postpayé) ; pas de crédits prépayés |
| Remises | Appliquées sous forme de réduction du nombre de CCU mesurés |
| Taxes | Mesure hors taxes ; AWS Marketplace gère les taxes |
| Visibilité des coûts | Détail en temps réel dans la Claude Console (accessible via la console AWS) ; AWS Cost Explorer affiche les CCU agrégés |
Claude Consumption Units. Si le Client accède aux Services via certaines Plateformes Marketplace (par exemple, Claude Platform sur AWS), l'utilisation sera facturée en Claude Consumption Units (« CCU ») plutôt que par MTok. Un CCU est une unité de mesure utilisée uniquement pour la facturation via les Plateformes Marketplace. Cent (100) CCU représentent 1,00 $ USD de frais dus pour les Services, calculés aux prix applicables sur claude.com/pricing#api, après application de toute remise.
Pour Claude Opus 4.6, Claude Sonnet 4.6 et les modèles ultérieurs, l'utilisation de inference_geo: "us" applique un multiplicateur de tarification de 1,1x. inference_geo: "global" (par défaut) utilise la tarification standard. Consultez Résidence des données pour plus de détails.
Lorsque vous vous inscrivez sur la page du service Claude Platform on AWS de la console AWS, celle-ci recherche toute offre privée associée à votre compte et vous invite à l'accepter dans AWS Marketplace. Contactez votre représentant de compte Anthropic pour connaître les conditions des offres privées.
Si vous disposez d'une offre privée Amazon Bedrock existante, contactez votre représentant de compte Anthropic ou AWS avant de commencer à utiliser Claude Platform sur AWS afin de vous assurer que vos remises sont correctement appliquées. Les remises ne peuvent pas être appliquées rétroactivement à l'utilisation effectuée avant l'acceptation de votre offre privée.
La mise en cache des prompts réduit les coûts et la latence en réutilisant les portions de votre prompt déjà traitées lors d'appels API précédents. Au lieu de retraiter la même invite système volumineuse, le même document ou le même historique de conversation à chaque requête, l'API lit depuis le cache à une fraction du prix d'entrée standard.
Il existe deux façons d'activer la mise en cache des prompts :
cache_control au niveau supérieur de votre requête. Le système gère automatiquement les points de rupture du cache à mesure que les conversations s'allongent. C'est le point de départ recommandé pour la plupart des cas d'usage.cache_control directement sur des blocs de contenu individuels pour un contrôle précis de ce qui est mis en cache.La mise en cache des prompts utilise les multiplicateurs de tarification suivants par rapport aux tarifs de base des tokens d'entrée :
| Opération de cache | Multiplicateur | Durée |
|---|---|---|
| Écriture en cache de 5 minutes | 1,25x le prix d'entrée de base | Cache valide pendant 5 minutes |
| Écriture en cache de 1 heure | 2x le prix d'entrée de base | Cache valide pendant 1 heure |
| Lecture du cache (hit) | 0,1x le prix d'entrée de base | Même durée que l'écriture précédente |
Les tokens d'écriture en cache sont facturés lorsque le contenu est stocké pour la première fois. Les tokens de lecture du cache sont facturés lorsqu'une requête ultérieure récupère le contenu mis en cache. Un cache hit coûte 10 % du prix d'entrée standard, ce qui signifie que la mise en cache devient rentable après une seule lecture du cache pour la durée de 5 minutes (écriture à 1,25x), ou après deux lectures du cache pour la durée de 1 heure (écriture à 2x).
Ces multiplicateurs se cumulent avec d'autres modificateurs de tarification, notamment la remise de l'API Batch et la résidence des données.
Pour les détails d'implémentation, les modèles pris en charge et les exemples de code, consultez Mise en cache des prompts.
Pour Claude Opus 4.6, Claude Sonnet 4.6 et les modèles ultérieurs, spécifier une inférence limitée aux États-Unis via le paramètre inference_geo entraîne un multiplicateur de 1,1x sur toutes les catégories de tarification des tokens, y compris les tokens d'entrée, les tokens de sortie, les écritures en cache et les lectures du cache. Le routage global (par défaut) utilise la tarification standard.
Cela s'applique à l'API Claude (first-party) et à Claude Platform sur AWS. Les plateformes exploitées par des partenaires (Bedrock et Vertex AI) ont une tarification régionale indépendante. Consultez Bedrock et Vertex AI pour plus de détails. Les modèles antérieurs ne prennent pas en charge le paramètre inference_geo et utilisent toujours la tarification standard ; les requêtes incluant ce paramètre sur ces modèles renvoient une erreur 400.
Pour plus d'informations, consultez Résidence des données.
Le mode rapide, en aperçu de recherche, fournit une sortie nettement plus rapide pour Claude Opus 4.8, Claude Opus 4.7 et Claude Opus 4.6 à un tarif premium. La tarification du mode rapide s'applique sur l'ensemble de la fenêtre de contexte, y compris les requêtes dépassant 200k tokens d'entrée. Le mode rapide n'est pas disponible sur Claude Platform sur AWS.
| Modèle | Entrée | Sortie |
|---|---|---|
| Claude Opus 4.6 / Claude Opus 4.7 | 30 $ / MTok | 150 $ / MTok |
| Claude Opus 4.8 | 10 $ / MTok | 50 $ / MTok |
La tarification du mode rapide se cumule avec d'autres modificateurs de tarification :
Le mode rapide n'est pas disponible avec l'API Batch.
Pour plus d'informations, consultez Mode rapide.
L'API Batch permet le traitement asynchrone de grands volumes de requêtes avec une remise de 50 % sur les tokens d'entrée et de sortie.
| Modèle | Entrée par lot | Sortie par lot |
|---|---|---|
| Claude Fable 5 | 5 $ / MTok | 25 $ / MTok |
| Claude Mythos 5 (disponibilité limitée) | 5 $ / MTok | 25 $ / MTok |
| Claude Opus 4.8 | 2,50 $ / MTok | 12,50 $ / MTok |
| Claude Opus 4.7 | 2,50 $ / MTok | 12,50 $ / MTok |
| Claude Opus 4.6 | 2,50 $ / MTok | 12,50 $ / MTok |
| Claude Opus 4.5 | 2,50 $ / MTok | 12,50 $ / MTok |
| Claude Opus 4.1 (obsolète) | 7,50 $ / MTok | 37,50 $ / MTok |
| Claude Opus 4 (obsolète) | 7,50 $ / MTok | 37,50 $ / MTok |
| Claude Sonnet 4.6 | 1,50 $ / MTok | 7,50 $ / MTok |
| Claude Sonnet 4.5 | 1,50 $ / MTok | 7,50 $ / MTok |
| Claude Sonnet 4 (obsolète) | 1,50 $ / MTok | 7,50 $ / MTok |
| Claude Haiku 4.5 | 0,50 $ / MTok | 2,50 $ / MTok |
| Claude Haiku 3.5 (retiré, sauf sur Bedrock et Vertex AI) | 0,40 $ / MTok | 2 $ / MTok |
Pour plus d'informations sur le traitement par lots, consultez Traitement par lots.
Claude Fable 5, Claude Mythos 5, Claude Mythos Preview, Claude Opus 4.8, Opus 4.7, Opus 4.6 et Sonnet 4.6 incluent la fenêtre de contexte complète de 1M de tokens à la tarification standard. (Une requête de 900k tokens est facturée au même tarif par token qu'une requête de 9k tokens.) Les remises de mise en cache des prompts et de traitement par lots s'appliquent aux tarifs standard sur l'ensemble de la fenêtre de contexte.
Les requêtes d'utilisation d'outils sont facturées en fonction de :
tools)Les outils côté client sont facturés de la même manière que toute autre requête à l'API Claude, tandis que les outils côté serveur peuvent entraîner des frais supplémentaires en fonction de leur utilisation spécifique.
Les tokens supplémentaires liés à l'utilisation d'outils proviennent de :
tools dans les requêtes API (noms, descriptions et schémas des outils)tool_use dans les requêtes et réponses APItool_result dans les requêtes APILorsque vous utilisez tools, l'API inclut également automatiquement une invite système spéciale pour le modèle qui active l'utilisation d'outils. Le nombre de tokens d'utilisation d'outils requis pour chaque modèle est indiqué ci-dessous (à l'exclusion des tokens supplémentaires mentionnés ci-dessus). Notez que le tableau suppose qu'au moins 1 outil est fourni. Si aucun tools n'est fourni, alors un choix d'outil de none utilise 0 token d'invite système supplémentaire.
| Modèle | Choix d'outil | Nombre de tokens de l'invite système pour l'utilisation d'outils |
|---|---|---|
| Claude Opus 4.8 | auto, noneany, tool | 290 tokens 410 tokens |
| Claude Opus 4.7 | auto, noneany, tool | 675 tokens 804 tokens |
| Claude Opus 4.6 | auto, noneany, tool | 497 tokens 589 tokens |
| Claude Opus 4.5 | auto, noneany, tool | 496 tokens 588 tokens |
| Claude Opus 4.1 (déprécié) | auto, noneany, tool | 313 tokens 315 tokens |
| Claude Opus 4 (déprécié) | auto, noneany, tool | 313 tokens 315 tokens |
| Claude Sonnet 4.6 | auto, noneany, tool | 497 tokens 589 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 496 tokens 588 tokens |
| Claude Sonnet 4 (déprécié) | auto, noneany, tool | 313 tokens 315 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 496 tokens 588 tokens |
| Claude Haiku 3.5 (retiré, sauf sur Bedrock et Vertex AI) | auto, noneany, tool | 264 tokens 355 tokens |
Ces nombres de tokens sont ajoutés à vos tokens d'entrée et de sortie habituels pour calculer le coût total d'une requête.
Pour les prix actuels par modèle, consultez la section tarification des modèles.
Pour plus d'informations sur l'implémentation de l'utilisation d'outils et les bonnes pratiques, consultez Utilisation d'outils.
L'outil bash ajoute 245 tokens d'entrée à vos appels API.
Des tokens supplémentaires sont consommés par :
Consultez la tarification de l'utilisation d'outils pour les détails complets de tarification.
L'exécution de code est gratuite lorsqu'elle est utilisée avec la recherche web ou la récupération web. Lorsque web_search_20260209 ou web_fetch_20260209 est inclus dans votre requête API, aucun frais supplémentaire n'est facturé pour les appels à l'outil d'exécution de code, au-delà des coûts standard des tokens d'entrée et de sortie.
Lorsqu'elle est utilisée sans ces outils, l'exécution de code est facturée en fonction du temps d'exécution, comptabilisé séparément de l'utilisation des tokens :
L'utilisation de l'exécution de code est indiquée dans la réponse :
{
"usage": {
"input_tokens": 105,
"output_tokens": 239,
"server_tool_use": {
"code_execution_requests": 1
}
}
}L'outil d'édition de texte utilise la même structure tarifaire que les autres outils utilisés avec Claude. Il suit la tarification standard des tokens d'entrée et de sortie en fonction du modèle Claude que vous utilisez.
En plus des tokens de base, les tokens d'entrée supplémentaires suivants sont nécessaires pour l'outil d'édition de texte :
| Outil | Tokens d'entrée supplémentaires |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
Consultez la tarification de l'utilisation d'outils pour les détails complets de tarification.
L'utilisation de la recherche web est facturée en plus de l'utilisation des tokens :
{
"usage": {
"input_tokens": 105,
"output_tokens": 6039,
"cache_read_input_tokens": 7123,
"cache_creation_input_tokens": 7345,
"server_tool_use": {
"web_search_requests": 1
}
}
}La recherche web est disponible sur l'API Claude au tarif de 10 $ pour 1 000 recherches, auquel s'ajoutent les coûts standard des tokens pour le contenu généré par la recherche. Les résultats de recherche web récupérés tout au long d'une conversation sont comptabilisés comme des tokens d'entrée, que ce soit dans les itérations de recherche exécutées au cours d'un même tour ou dans les tours de conversation suivants.
Chaque recherche web compte comme une utilisation, quel que soit le nombre de résultats renvoyés. Si une erreur survient pendant la recherche web, celle-ci ne sera pas facturée.
L'utilisation de la récupération web n'entraîne aucuns frais supplémentaires au-delà des coûts standard en tokens :
{
"usage": {
"input_tokens": 25039,
"output_tokens": 931,
"cache_read_input_tokens": 0,
"cache_creation_input_tokens": 0,
"server_tool_use": {
"web_fetch_requests": 1
}
}
}L'outil de récupération web est disponible sur l'API Claude sans coût supplémentaire. Vous ne payez que les coûts standard en tokens pour le contenu récupéré qui devient partie intégrante du contexte de votre conversation.
Pour vous protéger contre la récupération involontaire de contenu volumineux qui consommerait un nombre excessif de tokens, utilisez le paramètre max_content_tokens afin de définir des limites appropriées en fonction de votre cas d'usage et de vos considérations budgétaires.
Exemple d'utilisation de tokens pour du contenu typique :
L'utilisation de l'ordinateur suit la tarification standard de l'utilisation d'outils. Lors de l'utilisation de l'outil d'utilisation de l'ordinateur :
Surcharge de l'invite système : la version bêta de l'utilisation de l'ordinateur ajoute 466 à 499 tokens à l'invite système
Consommation de tokens de l'outil d'utilisation de l'ordinateur :
| Modèle | Tokens d'entrée par définition d'outil |
|---|---|
| Modèles Claude 4.x | 735 tokens |
Consommation de tokens supplémentaire :
Si vous utilisez également les outils bash ou d'éditeur de texte en parallèle de l'utilisation de l'ordinateur, ces outils ont leurs propres coûts en tokens, comme documenté dans leurs pages respectives.
Claude Managed Agents est facturé selon deux dimensions : les tokens et la durée d'exécution de session.
Tous les tokens consommés par une session Claude Managed Agents sont facturés aux tarifs indiqués dans Tarification des modèles. Les multiplicateurs de mise en cache des prompts s'appliquent de manière identique. La recherche web déclenchée au sein d'une session entraîne le tarif standard de 10 $ pour 1 000 recherches. Sur Claude Platform sur AWS, les frais de tokens et de durée d'exécution de session sont convertis en Claude Consumption Units au taux standard.
Les modificateurs suivants de l'API Messages ne s'appliquent pas aux sessions Claude Managed Agents :
| Modificateur | Raison de la non-application |
|---|---|
| Remise de l'API Batch | Les sessions sont avec état et interactives. Il n'existe pas de mode batch. |
| Premium du mode rapide | La vitesse d'inférence est gérée par le runtime. |
| Multiplicateur de résidence des données | inference_geo est un champ de requête de l'API Messages. |
| Tarification des plateformes cloud | Non disponible sur les plateformes cloud exploitées par des partenaires. |
| SKU | Tarif | Mesure |
|---|---|---|
| Durée d'exécution de session | 0,08 $ par session-heure | Durée du statut running |
La durée d'exécution est mesurée à la milliseconde et ne s'accumule que lorsque le statut de la session est running. Le temps passé en statut idle (en attente de votre prochain message ou d'une confirmation d'outil), rescheduling ou terminated n'est pas comptabilisé dans la durée d'exécution.
La durée d'exécution de session remplace le modèle de facturation par heure-conteneur de l'exécution de code lors de l'utilisation de Claude Managed Agents. Vous n'êtes pas facturé séparément pour les heures-conteneur en plus de la durée d'exécution de session.
Une session de codage d'une heure utilisant Claude Opus 4.8 qui consomme 50 000 tokens d'entrée et 15 000 tokens de sortie :
| Ligne | Calcul | Coût |
|---|---|---|
| Tokens d'entrée | 50 000 × 5 $ / 1 000 000 | 0,25 $ |
| Tokens de sortie | 15 000 × 25 $ / 1 000 000 | 0,375 $ |
| Durée d'exécution de session | 1,0 heure × 0,08 $ | 0,08 $ |
| Total | 0,705 $ |
Si la mise en cache des prompts est active et que 40 000 des tokens d'entrée sont des lectures de cache :
| Ligne | Calcul | Coût |
|---|---|---|
| Tokens d'entrée non mis en cache | 10 000 × 5 $ / 1 000 000 | 0,05 $ |
| Tokens de lecture du cache | 40 000 × 5 $ × 0,1 / 1 000 000 | 0,02 $ |
| Tokens de sortie | 15 000 × 25 $ / 1 000 000 | 0,375 $ |
| Durée d'exécution de session | 1,0 heure × 0,08 $ | 0,08 $ |
| Total | 0,525 $ |
Exemple de calcul pour le traitement de 10 000 tickets de support :
Pour une explication détaillée de ce calcul, consultez le guide de l'agent de support client.
Lors de la création d'agents avec Claude :
Pour les applications d'agents à fort volume, contactez l'équipe commerciale entreprise pour des arrangements tarifaires personnalisés.
Les limites de débit varient selon le niveau d'utilisation et affectent le nombre de requêtes que vous pouvez effectuer :
Pour des informations détaillées sur les limites de débit, consultez Limites de débit.
Pour des limites de débit plus élevées ou des arrangements tarifaires personnalisés, contactez l'équipe commerciale.
Des remises sur volume peuvent être disponibles pour les utilisateurs à fort volume. Celles-ci sont négociées au cas par cas.
Pour les clients Enterprise ayant des besoins spécifiques :
Contactez l'équipe commerciale à l'adresse [email protected] ou via la Claude Console pour discuter des options de tarification Enterprise.
Comment l'utilisation des tokens est-elle calculée ?
Les tokens sont des fragments de texte que les modèles traitent. À titre d'estimation approximative, 1 token correspond à environ 4 caractères ou 0,75 mot en anglais. Le décompte exact varie selon la langue et le type de contenu.
Existe-t-il des niveaux gratuits ou des essais ?
Les nouveaux utilisateurs reçoivent une petite quantité de crédits gratuits pour tester l'API. Contactez l'équipe commerciale pour obtenir des informations sur les essais prolongés pour l'évaluation en entreprise.
Comment les remises se cumulent-elles ?
Les remises de l'API Batch et de la mise en cache des prompts peuvent être combinées. Par exemple, l'utilisation conjointe de ces deux fonctionnalités permet des économies de coûts significatives par rapport aux appels API standard. Consultez la tarification de la mise en cache des prompts pour comprendre comment les multiplicateurs interagissent.
Quels modes de paiement sont acceptés ?
Les principales cartes de crédit sont acceptées pour les comptes standard. Les clients Enterprise peuvent organiser une facturation et d'autres modes de paiement.
Pour toute question supplémentaire concernant la tarification, contactez [email protected].
Was this page helpful?