• Messages
  • Agents gérés
  • Administration

Search...
⌘K
Modèles
Aperçu des modèlesID de modèles et versionnageChoisir un modèlePrésentation de Claude Fable 5 et Claude Mythos 5Nouveautés de Claude Opus 4.8Mettre à niveau entre les versions de modèlesDépréciations de modèlesFiches de modèlesInvites systèmeTarification

Log in
Tarification
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Modèles et tarification/Modèles

Tarification

Découvrez la structure tarifaire d'Anthropic pour les modèles et les fonctionnalités

Cette page fournit des informations détaillées sur la tarification des modèles et des fonctionnalités d'Anthropic. Tous les prix sont en USD.

Pour obtenir les informations tarifaires les plus récentes, consultez claude.com/pricing.

Tarification des modèles

Le tableau suivant présente la tarification de tous les modèles Claude :

ModèleTokens d'entrée de baseÉcritures en cache 5 minÉcritures en cache 1 hSuccès et actualisations du cacheTokens de sortie
Claude Fable 510 $ / MTok12,50 $ / MTok20 $ / MTok1 $ / MTok50 $ / MTok
Claude Mythos 5 (disponibilité limitée)10 $ / MTok12,50 $ / MTok20 $ / MTok1 $ / MTok50 $ / MTok
Claude Opus 4.85 $ / MTok6,25 $ / MTok10 $ / MTok0,50 $ / MTok25 $ / MTok
Claude Opus 4.75 $ / MTok6,25 $ / MTok10 $ / MTok0,50 $ / MTok25 $ / MTok
Claude Opus 4.65 $ / MTok6,25 $ / MTok10 $ / MTok0,50 $ / MTok25 $ / MTok
Claude Opus 4.55 $ / MTok6,25 $ / MTok10 $ / MTok0,50 $ / MTok25 $ / MTok
Claude Opus 4.1 (déprécié)15 $ / MTok18,75 $ / MTok30 $ / MTok1,50 $ / MTok75 $ / MTok
Claude Opus 4 (déprécié)15 $ / MTok18,75 $ / MTok30 $ / MTok1,50 $ / MTok75 $ / MTok
Claude Sonnet 4.63 $ / MTok3,75 $ / MTok6 $ / MTok0,30 $ / MTok15 $ / MTok
Claude Sonnet 4.53 $ / MTok3,75 $ / MTok6 $ / MTok0,30 $ / MTok15 $ / MTok
Claude Sonnet 4 (déprécié)3 $ / MTok3,75 $ / MTok6 $ / MTok0,30 $ / MTok15 $ / MTok
Claude Haiku 4.51 $ / MTok1,25 $ / MTok2 $ / MTok0,10 $ / MTok5 $ / MTok
Claude Haiku 3.5 (retiré, sauf sur Bedrock et Vertex AI)0,80 $ / MTok1 $ / MTok1,60 $ / MTok0,08 $ / MTok4 $ / MTok


MTok = Million de tokens. La colonne « Base Input Tokens » indique la tarification standard des tokens d'entrée, les colonnes « 5m Cache Writes », « 1h Cache Writes » et « Cache Hits & Refreshes » sont spécifiques à la mise en cache des prompts, et « Output Tokens » indique la tarification des tokens de sortie. Consultez la tarification de la mise en cache des prompts pour une explication des colonnes de cache et des multiplicateurs de tarification.



Opus 4.7 et les versions ultérieures utilisent un nouveau tokenizer par rapport aux modèles précédents, ce qui contribue à leurs performances améliorées sur un large éventail de tâches. Ce nouveau tokenizer peut utiliser jusqu'à 35 % de tokens supplémentaires pour le même texte fixe.

Pour la tarification de Claude Platform sur AWS, consultez Tarification de Claude Platform sur AWS.

Tarification des plateformes cloud

Cette section couvre les plateformes cloud exploitées par des partenaires, où le fournisseur cloud vous facture directement. Pour les plateformes cloud exploitées par Anthropic et facturées via une marketplace, consultez Tarification de Claude Platform sur AWS et Claude dans Microsoft Foundry.

Les modèles Claude sont disponibles sur Amazon Bedrock et Vertex AI. Pour la tarification officielle, consultez :

  • Tarification Amazon Bedrock
  • Tarification Vertex AI


Tarification des points de terminaison régionaux et multirégionaux pour les modèles Claude 4.5 et ultérieurs

À partir de Claude Sonnet 4.5, Haiku 4.5 et Opus 4.5 :

  • Bedrock propose deux types de points de terminaison : les points de terminaison globaux (routage dynamique pour une disponibilité maximale) et les points de terminaison régionaux (routage des données garanti via des régions géographiques spécifiques).
  • Vertex AI propose trois types de points de terminaison : les points de terminaison globaux, les points de terminaison multirégionaux (routage dynamique au sein d'une zone géographique) et les points de terminaison régionaux.

Les points de terminaison régionaux et multirégionaux incluent une majoration de 10 % par rapport aux points de terminaison globaux. L'API Claude (first-party) est globale par défaut ; pour les options de résidence des données first-party et leur tarification, consultez Tarification de la résidence des données.

Portée : Cette structure tarifaire s'applique à Claude Sonnet 4.5, Haiku 4.5, Opus 4.5 et à tous les modèles futurs. Les modèles antérieurs (Claude Sonnet 4 (obsolète), Opus 4 (obsolète) et les versions précédentes) conservent leur tarification existante.

Pour les détails d'implémentation et les exemples de code :

  • Points de terminaison globaux vs régionaux Amazon Bedrock pour Opus 4.7, Haiku 4.5 et les modèles ultérieurs, ou l'intégration héritée pour tous les autres modèles sur Bedrock
  • Points de terminaison globaux, multirégionaux et régionaux Vertex AI

Tarification de Claude Platform sur AWS

Claude Platform sur AWS facture via AWS Marketplace en utilisant des Claude Consumption Units (CCU). Anthropic évalue votre consommation de tokens en USD aux tarifs standard par modèle et par fonctionnalité, applique toute remise négociée, convertit le résultat en CCU au taux de 0,01 $ par CCU, et transmet la quantité de CCU à AWS Marketplace toutes les heures. Votre facture AWS affiche une seule ligne CCU.

ConceptDétails
Unité de facturationClaude Consumption Unit (CCU)
Prix du CCU0,01 $ par CCU (fixe ; les remises s'appliquent lors de la conversion tokens-CCU, pas au prix du CCU)
ConversionConsommation de tokens évaluée en USD aux tarifs standard par modèle et par fonctionnalité (identiques à la tarification de l'API Claude), puis convertie en CCU au taux de 0,01 $ par CCU
Cadence de facturationMesure horaire vers AWS Marketplace ; factures mensuelles
Modèle de paiementPaiement à terme échu uniquement (postpayé) ; pas de crédits prépayés
RemisesAppliquées sous forme de réduction du nombre de CCU mesurés
TaxesMesure hors taxes ; AWS Marketplace gère les taxes
Visibilité des coûtsDétail en temps réel dans la Claude Console (accessible via la console AWS) ; AWS Cost Explorer affiche les CCU agrégés


Claude Consumption Units. Si le Client accède aux Services via certaines Plateformes Marketplace (par exemple, Claude Platform sur AWS), l'utilisation sera facturée en Claude Consumption Units (« CCU ») plutôt que par MTok. Un CCU est une unité de mesure utilisée uniquement pour la facturation via les Plateformes Marketplace. Cent (100) CCU représentent 1,00 $ USD de frais dus pour les Services, calculés aux prix applicables sur claude.com/pricing#api, après application de toute remise.

Géographie d'inférence

Pour Claude Opus 4.6, Claude Sonnet 4.6 et les modèles ultérieurs, l'utilisation de inference_geo: "us" applique un multiplicateur de tarification de 1,1x. inference_geo: "global" (par défaut) utilise la tarification standard. Consultez Résidence des données pour plus de détails.

Offres privées

Lorsque vous vous inscrivez sur la page du service Claude Platform on AWS de la console AWS, celle-ci recherche toute offre privée associée à votre compte et vous invite à l'accepter dans AWS Marketplace. Contactez votre représentant de compte Anthropic pour connaître les conditions des offres privées.



Si vous disposez d'une offre privée Amazon Bedrock existante, contactez votre représentant de compte Anthropic ou AWS avant de commencer à utiliser Claude Platform sur AWS afin de vous assurer que vos remises sont correctement appliquées. Les remises ne peuvent pas être appliquées rétroactivement à l'utilisation effectuée avant l'acceptation de votre offre privée.

Tarification spécifique aux fonctionnalités

Mise en cache des prompts

La mise en cache des prompts réduit les coûts et la latence en réutilisant les portions de votre prompt déjà traitées lors d'appels API précédents. Au lieu de retraiter la même invite système volumineuse, le même document ou le même historique de conversation à chaque requête, l'API lit depuis le cache à une fraction du prix d'entrée standard.

Il existe deux façons d'activer la mise en cache des prompts :

  • Mise en cache automatique : Ajoutez un seul champ cache_control au niveau supérieur de votre requête. Le système gère automatiquement les points de rupture du cache à mesure que les conversations s'allongent. C'est le point de départ recommandé pour la plupart des cas d'usage.
  • Points de rupture de cache explicites : Placez cache_control directement sur des blocs de contenu individuels pour un contrôle précis de ce qui est mis en cache.

La mise en cache des prompts utilise les multiplicateurs de tarification suivants par rapport aux tarifs de base des tokens d'entrée :

Opération de cacheMultiplicateurDurée
Écriture en cache de 5 minutes1,25x le prix d'entrée de baseCache valide pendant 5 minutes
Écriture en cache de 1 heure2x le prix d'entrée de baseCache valide pendant 1 heure
Lecture du cache (hit)0,1x le prix d'entrée de baseMême durée que l'écriture précédente

Les tokens d'écriture en cache sont facturés lorsque le contenu est stocké pour la première fois. Les tokens de lecture du cache sont facturés lorsqu'une requête ultérieure récupère le contenu mis en cache. Un cache hit coûte 10 % du prix d'entrée standard, ce qui signifie que la mise en cache devient rentable après une seule lecture du cache pour la durée de 5 minutes (écriture à 1,25x), ou après deux lectures du cache pour la durée de 1 heure (écriture à 2x).

Ces multiplicateurs se cumulent avec d'autres modificateurs de tarification, notamment la remise de l'API Batch et la résidence des données.

Pour les détails d'implémentation, les modèles pris en charge et les exemples de code, consultez Mise en cache des prompts.

Tarification de la résidence des données

Pour Claude Opus 4.6, Claude Sonnet 4.6 et les modèles ultérieurs, spécifier une inférence limitée aux États-Unis via le paramètre inference_geo entraîne un multiplicateur de 1,1x sur toutes les catégories de tarification des tokens, y compris les tokens d'entrée, les tokens de sortie, les écritures en cache et les lectures du cache. Le routage global (par défaut) utilise la tarification standard.

Cela s'applique à l'API Claude (first-party) et à Claude Platform sur AWS. Les plateformes exploitées par des partenaires (Bedrock et Vertex AI) ont une tarification régionale indépendante. Consultez Bedrock et Vertex AI pour plus de détails. Les modèles antérieurs ne prennent pas en charge le paramètre inference_geo et utilisent toujours la tarification standard ; les requêtes incluant ce paramètre sur ces modèles renvoient une erreur 400.

Pour plus d'informations, consultez Résidence des données.

Tarification du mode rapide

Le mode rapide, en aperçu de recherche, fournit une sortie nettement plus rapide pour Claude Opus 4.8, Claude Opus 4.7 et Claude Opus 4.6 à un tarif premium. La tarification du mode rapide s'applique sur l'ensemble de la fenêtre de contexte, y compris les requêtes dépassant 200k tokens d'entrée. Le mode rapide n'est pas disponible sur Claude Platform sur AWS.

ModèleEntréeSortie
Claude Opus 4.6 / Claude Opus 4.730 $ / MTok150 $ / MTok
Claude Opus 4.810 $ / MTok50 $ / MTok

La tarification du mode rapide se cumule avec d'autres modificateurs de tarification :

  • Les multiplicateurs de mise en cache des prompts s'appliquent en plus de la tarification du mode rapide
  • Les multiplicateurs de résidence des données s'appliquent en plus de la tarification du mode rapide

Le mode rapide n'est pas disponible avec l'API Batch.

Pour plus d'informations, consultez Mode rapide.

Traitement par lots

L'API Batch permet le traitement asynchrone de grands volumes de requêtes avec une remise de 50 % sur les tokens d'entrée et de sortie.

ModèleEntrée par lotSortie par lot
Claude Fable 55 $ / MTok25 $ / MTok
Claude Mythos 5 (disponibilité limitée)5 $ / MTok25 $ / MTok
Claude Opus 4.82,50 $ / MTok12,50 $ / MTok
Claude Opus 4.72,50 $ / MTok12,50 $ / MTok
Claude Opus 4.62,50 $ / MTok12,50 $ / MTok
Claude Opus 4.52,50 $ / MTok12,50 $ / MTok
Claude Opus 4.1 (obsolète)7,50 $ / MTok37,50 $ / MTok
Claude Opus 4 (obsolète)7,50 $ / MTok37,50 $ / MTok
Claude Sonnet 4.61,50 $ / MTok7,50 $ / MTok
Claude Sonnet 4.51,50 $ / MTok7,50 $ / MTok
Claude Sonnet 4 (obsolète)1,50 $ / MTok7,50 $ / MTok
Claude Haiku 4.50,50 $ / MTok2,50 $ / MTok
Claude Haiku 3.5 (retiré, sauf sur Bedrock et Vertex AI)0,40 $ / MTok2 $ / MTok

Pour plus d'informations sur le traitement par lots, consultez Traitement par lots.

Tarification du contexte long

Claude Fable 5, Claude Mythos 5, Claude Mythos Preview, Claude Opus 4.8, Opus 4.7, Opus 4.6 et Sonnet 4.6 incluent la fenêtre de contexte complète de 1M de tokens à la tarification standard. (Une requête de 900k tokens est facturée au même tarif par token qu'une requête de 9k tokens.) Les remises de mise en cache des prompts et de traitement par lots s'appliquent aux tarifs standard sur l'ensemble de la fenêtre de contexte.

Tarification de l'utilisation d'outils

Les requêtes d'utilisation d'outils sont facturées en fonction de :

  1. Le nombre total de tokens d'entrée envoyés au modèle (y compris dans le paramètre tools)
  2. Le nombre de tokens de sortie générés
  3. Pour les outils côté serveur, une tarification supplémentaire basée sur l'utilisation (par exemple, la recherche web est facturée par recherche effectuée)

Les outils côté client sont facturés de la même manière que toute autre requête à l'API Claude, tandis que les outils côté serveur peuvent entraîner des frais supplémentaires en fonction de leur utilisation spécifique.

Les tokens supplémentaires liés à l'utilisation d'outils proviennent de :

  • Le paramètre tools dans les requêtes API (noms, descriptions et schémas des outils)
  • Les blocs de contenu tool_use dans les requêtes et réponses API
  • Les blocs de contenu tool_result dans les requêtes API

Lorsque vous utilisez tools, l'API inclut également automatiquement une invite système spéciale pour le modèle qui active l'utilisation d'outils. Le nombre de tokens d'utilisation d'outils requis pour chaque modèle est indiqué ci-dessous (à l'exclusion des tokens supplémentaires mentionnés ci-dessus). Notez que le tableau suppose qu'au moins 1 outil est fourni. Si aucun tools n'est fourni, alors un choix d'outil de none utilise 0 token d'invite système supplémentaire.

ModèleChoix d'outilNombre de tokens de l'invite système pour l'utilisation d'outils
Claude Opus 4.8auto, none
any, tool
290 tokens
410 tokens
Claude Opus 4.7auto, none
any, tool
675 tokens
804 tokens
Claude Opus 4.6auto, none
any, tool
497 tokens
589 tokens
Claude Opus 4.5auto, none
any, tool
496 tokens
588 tokens
Claude Opus 4.1 (déprécié)auto, none
any, tool
313 tokens
315 tokens
Claude Opus 4 (déprécié)auto, none
any, tool
313 tokens
315 tokens
Claude Sonnet 4.6auto, none
any, tool
497 tokens
589 tokens
Claude Sonnet 4.5auto, none
any, tool
496 tokens
588 tokens
Claude Sonnet 4 (déprécié)auto, none
any, tool
313 tokens
315 tokens
Claude Haiku 4.5auto, none
any, tool
496 tokens
588 tokens
Claude Haiku 3.5 (retiré, sauf sur Bedrock et Vertex AI)auto, none
any, tool
264 tokens
355 tokens

Ces nombres de tokens sont ajoutés à vos tokens d'entrée et de sortie habituels pour calculer le coût total d'une requête.

Pour les prix actuels par modèle, consultez la section tarification des modèles.

Pour plus d'informations sur l'implémentation de l'utilisation d'outils et les bonnes pratiques, consultez Utilisation d'outils.

Tarification des outils spécifiques

Outil Bash

L'outil bash ajoute 245 tokens d'entrée à vos appels API.

Des tokens supplémentaires sont consommés par :

  • Les sorties de commande (stdout/stderr)
  • Les messages d'erreur
  • Les contenus de fichiers volumineux

Consultez la tarification de l'utilisation d'outils pour les détails complets de tarification.

Outil d'exécution de code

L'exécution de code est gratuite lorsqu'elle est utilisée avec la recherche web ou la récupération web. Lorsque web_search_20260209 ou web_fetch_20260209 est inclus dans votre requête API, aucun frais supplémentaire n'est facturé pour les appels à l'outil d'exécution de code, au-delà des coûts standard des tokens d'entrée et de sortie.

Lorsqu'elle est utilisée sans ces outils, l'exécution de code est facturée en fonction du temps d'exécution, comptabilisé séparément de l'utilisation des tokens :

  • Le temps d'exécution est facturé avec un minimum de 5 minutes
  • Chaque organisation bénéficie de 1 550 heures gratuites d'utilisation par mois
  • L'utilisation supplémentaire au-delà de 1 550 heures est facturée à 0,05 $ par heure, par conteneur
  • Si des fichiers sont inclus dans la requête, le temps d'exécution est facturé même si l'outil n'est pas invoqué, car les fichiers sont préchargés dans le conteneur

L'utilisation de l'exécution de code est indiquée dans la réponse :

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 239,
    "server_tool_use": {
      "code_execution_requests": 1
    }
  }
}

Outil d'édition de texte

L'outil d'édition de texte utilise la même structure tarifaire que les autres outils utilisés avec Claude. Il suit la tarification standard des tokens d'entrée et de sortie en fonction du modèle Claude que vous utilisez.

En plus des tokens de base, les tokens d'entrée supplémentaires suivants sont nécessaires pour l'outil d'édition de texte :

OutilTokens d'entrée supplémentaires
text_editor_20250429 (Claude 4.x)700 tokens

Consultez la tarification de l'utilisation d'outils pour les détails complets de tarification.

Outil de recherche web

L'utilisation de la recherche web est facturée en plus de l'utilisation des tokens :

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 6039,
    "cache_read_input_tokens": 7123,
    "cache_creation_input_tokens": 7345,
    "server_tool_use": {
      "web_search_requests": 1
    }
  }
}

La recherche web est disponible sur l'API Claude au tarif de 10 $ pour 1 000 recherches, auquel s'ajoutent les coûts standard des tokens pour le contenu généré par la recherche. Les résultats de recherche web récupérés tout au long d'une conversation sont comptabilisés comme des tokens d'entrée, que ce soit dans les itérations de recherche exécutées au cours d'un même tour ou dans les tours de conversation suivants.

Chaque recherche web compte comme une utilisation, quel que soit le nombre de résultats renvoyés. Si une erreur survient pendant la recherche web, celle-ci ne sera pas facturée.

Outil de récupération web

L'utilisation de la récupération web n'entraîne aucuns frais supplémentaires au-delà des coûts standard en tokens :

{
  "usage": {
    "input_tokens": 25039,
    "output_tokens": 931,
    "cache_read_input_tokens": 0,
    "cache_creation_input_tokens": 0,
    "server_tool_use": {
      "web_fetch_requests": 1
    }
  }
}

L'outil de récupération web est disponible sur l'API Claude sans coût supplémentaire. Vous ne payez que les coûts standard en tokens pour le contenu récupéré qui devient partie intégrante du contexte de votre conversation.

Pour vous protéger contre la récupération involontaire de contenu volumineux qui consommerait un nombre excessif de tokens, utilisez le paramètre max_content_tokens afin de définir des limites appropriées en fonction de votre cas d'usage et de vos considérations budgétaires.

Exemple d'utilisation de tokens pour du contenu typique :

  • Page web moyenne (10 ko) : ~2 500 tokens
  • Grande page de documentation (100 ko) : ~25 000 tokens
  • Article de recherche au format PDF (500 ko) : ~125 000 tokens

Outil d'utilisation d'ordinateur

L'utilisation de l'ordinateur suit la tarification standard de l'utilisation d'outils. Lors de l'utilisation de l'outil d'utilisation de l'ordinateur :

Surcharge de l'invite système : la version bêta de l'utilisation de l'ordinateur ajoute 466 à 499 tokens à l'invite système

Consommation de tokens de l'outil d'utilisation de l'ordinateur :

ModèleTokens d'entrée par définition d'outil
Modèles Claude 4.x735 tokens

Consommation de tokens supplémentaire :

  • Images de captures d'écran (voir la tarification Vision)
  • Résultats d'exécution d'outils renvoyés à Claude


Si vous utilisez également les outils bash ou d'éditeur de texte en parallèle de l'utilisation de l'ordinateur, ces outils ont leurs propres coûts en tokens, comme documenté dans leurs pages respectives.

Tarification de Claude Managed Agents

Claude Managed Agents est facturé selon deux dimensions : les tokens et la durée d'exécution de session.

Tokens

Tous les tokens consommés par une session Claude Managed Agents sont facturés aux tarifs indiqués dans Tarification des modèles. Les multiplicateurs de mise en cache des prompts s'appliquent de manière identique. La recherche web déclenchée au sein d'une session entraîne le tarif standard de 10 $ pour 1 000 recherches. Sur Claude Platform sur AWS, les frais de tokens et de durée d'exécution de session sont convertis en Claude Consumption Units au taux standard.

Les modificateurs suivants de l'API Messages ne s'appliquent pas aux sessions Claude Managed Agents :

ModificateurRaison de la non-application
Remise de l'API BatchLes sessions sont avec état et interactives. Il n'existe pas de mode batch.
Premium du mode rapideLa vitesse d'inférence est gérée par le runtime.
Multiplicateur de résidence des donnéesinference_geo est un champ de requête de l'API Messages.
Tarification des plateformes cloudNon disponible sur les plateformes cloud exploitées par des partenaires.

Durée d'exécution de session

SKUTarifMesure
Durée d'exécution de session0,08 $ par session-heureDurée du statut running

La durée d'exécution est mesurée à la milliseconde et ne s'accumule que lorsque le statut de la session est running. Le temps passé en statut idle (en attente de votre prochain message ou d'une confirmation d'outil), rescheduling ou terminated n'est pas comptabilisé dans la durée d'exécution.



La durée d'exécution de session remplace le modèle de facturation par heure-conteneur de l'exécution de code lors de l'utilisation de Claude Managed Agents. Vous n'êtes pas facturé séparément pour les heures-conteneur en plus de la durée d'exécution de session.

Exemple chiffré

Une session de codage d'une heure utilisant Claude Opus 4.8 qui consomme 50 000 tokens d'entrée et 15 000 tokens de sortie :

LigneCalculCoût
Tokens d'entrée50 000 × 5 $ / 1 000 0000,25 $
Tokens de sortie15 000 × 25 $ / 1 000 0000,375 $
Durée d'exécution de session1,0 heure × 0,08 $0,08 $
Total0,705 $

Si la mise en cache des prompts est active et que 40 000 des tokens d'entrée sont des lectures de cache :

LigneCalculCoût
Tokens d'entrée non mis en cache10 000 × 5 $ / 1 000 0000,05 $
Tokens de lecture du cache40 000 × 5 $ × 0,1 / 1 000 0000,02 $
Tokens de sortie15 000 × 25 $ / 1 000 0000,375 $
Durée d'exécution de session1,0 heure × 0,08 $0,08 $
Total0,525 $


Exemple de calcul pour le traitement de 10 000 tickets de support :

  • Moyenne d'environ 3 700 tokens par conversation
  • Utilisation de Claude Haiku 4.5 à 1 $/MTok en entrée, 5 $/MTok en sortie
  • Coût total : environ 37,00 $ pour 10 000 tickets

Pour une explication détaillée de ce calcul, consultez le guide de l'agent de support client.

Considérations tarifaires supplémentaires

Stratégies d'optimisation des coûts

Lors de la création d'agents avec Claude :

  1. Utilisez les modèles appropriés : Choisissez Haiku pour les tâches simples, Sonnet pour la plupart des charges de travail de production, et Opus pour les raisonnements les plus complexes
  2. Implémentez la mise en cache des prompts : Réduisez les coûts pour le contexte répété
  3. Regroupez les opérations : Utilisez l'API Batch pour les tâches non urgentes
  4. Surveillez les schémas d'utilisation : Suivez la consommation de tokens pour identifier les opportunités d'optimisation


Pour les applications d'agents à fort volume, contactez l'équipe commerciale entreprise pour des arrangements tarifaires personnalisés.

Limites de débit

Les limites de débit varient selon le niveau d'utilisation et affectent le nombre de requêtes que vous pouvez effectuer :

  • Niveau 1 : Utilisation de base avec des limites élémentaires
  • Niveau 2 : Limites augmentées pour les applications en croissance
  • Niveau 3 : Limites plus élevées pour les applications établies
  • Niveau 4 : Limites standard maximales
  • Enterprise : Limites personnalisées disponibles

Pour des informations détaillées sur les limites de débit, consultez Limites de débit.

Pour des limites de débit plus élevées ou des arrangements tarifaires personnalisés, contactez l'équipe commerciale.

Remises sur volume

Des remises sur volume peuvent être disponibles pour les utilisateurs à fort volume. Celles-ci sont négociées au cas par cas.

  • Les niveaux standard utilisent la tarification indiquée dans Tarification des modèles
  • Les clients Enterprise peuvent contacter l'équipe commerciale pour une tarification personnalisée
  • Des remises académiques et de recherche peuvent être disponibles

Tarification Enterprise

Pour les clients Enterprise ayant des besoins spécifiques :

  • Limites de débit personnalisées
  • Remises sur volume
  • Support dédié
  • Conditions personnalisées

Contactez l'équipe commerciale à l'adresse [email protected] ou via la Claude Console pour discuter des options de tarification Enterprise.

Facturation et paiement

  • La facturation est basée sur l'utilisation mensuelle réelle
  • Tous les paiements sont en USD
  • Options de carte de crédit et de facturation disponibles
  • Suivi de l'utilisation disponible dans la Claude Console

Questions fréquentes

Comment l'utilisation des tokens est-elle calculée ?

Les tokens sont des fragments de texte que les modèles traitent. À titre d'estimation approximative, 1 token correspond à environ 4 caractères ou 0,75 mot en anglais. Le décompte exact varie selon la langue et le type de contenu.

Existe-t-il des niveaux gratuits ou des essais ?

Les nouveaux utilisateurs reçoivent une petite quantité de crédits gratuits pour tester l'API. Contactez l'équipe commerciale pour obtenir des informations sur les essais prolongés pour l'évaluation en entreprise.

Comment les remises se cumulent-elles ?

Les remises de l'API Batch et de la mise en cache des prompts peuvent être combinées. Par exemple, l'utilisation conjointe de ces deux fonctionnalités permet des économies de coûts significatives par rapport aux appels API standard. Consultez la tarification de la mise en cache des prompts pour comprendre comment les multiplicateurs interagissent.

Quels modes de paiement sont acceptés ?

Les principales cartes de crédit sont acceptées pour les comptes standard. Les clients Enterprise peuvent organiser une facturation et d'autres modes de paiement.

Pour toute question supplémentaire concernant la tarification, contactez [email protected].

Was this page helpful?

  • Tarification des modèles
  • Tarification des plateformes cloud
  • Tarification de Claude Platform sur AWS
  • Géographie d'inférence
  • Offres privées
  • Tarification spécifique aux fonctionnalités
  • Mise en cache des prompts
  • Tarification de la résidence des données
  • Tarification du mode rapide
  • Traitement par lots
  • Tarification du contexte long
  • Tarification de l'utilisation d'outils
  • Tarification des outils spécifiques
  • Tarification de Claude Managed Agents
  • Tokens
  • Durée d'exécution de session
  • Exemple chiffré
  • Considérations tarifaires supplémentaires
  • Stratégies d'optimisation des coûts
  • Limites de débit
  • Remises sur volume
  • Tarification Enterprise
  • Facturation et paiement
  • Questions fréquentes