Loading...
    • Guide du développeur
    • Référence API
    • MCP
    • Ressources
    • Notes de version
    Search...
    ⌘K
    Premiers pas
    Introduction à ClaudeDémarrage rapide
    Modèles et tarification
    Aperçu des modèlesChoisir un modèleNouveautés dans Claude 4.6Guide de migrationDépréciation des modèlesTarification
    Créer avec Claude
    Aperçu des fonctionnalitésUtiliser l'API MessagesGérer les raisons d'arrêtMeilleures pratiques de prompting
    Gestion du contexte
    Fenêtres de contexteCompactionÉdition du contexte
    Capacités
    Mise en cache des promptsRéflexion étendueRéflexion adaptativeEffortStreaming de messagesTraitement par lotsCitationsSupport multilingueComptage des tokensEmbeddingsVisionSupport PDFAPI FilesRésultats de rechercheSorties structurées
    Outils
    AperçuComment implémenter l'utilisation d'outilsStreaming d'outils granulaireOutil BashOutil d'exécution de codeAppel d'outils programmatiqueOutil Computer useOutil Éditeur de texteOutil Web fetchOutil Web searchOutil MémoireOutil Tool search
    Compétences d'agent
    AperçuDémarrage rapideMeilleures pratiquesCompétences pour l'entrepriseUtiliser les compétences avec l'API
    SDK Agent
    AperçuDémarrage rapideSDK TypeScriptTypeScript V2 (aperçu)SDK PythonGuide de migration
    MCP dans l'API
    Connecteur MCPServeurs MCP distants
    Claude sur les plateformes tierces
    Amazon BedrockMicrosoft FoundryVertex AI
    Ingénierie des prompts
    AperçuGénérateur de promptsUtiliser les modèles de promptsAméliorateur de promptsÊtre clair et directUtiliser des exemples (prompting multi-coups)Laisser Claude réfléchir (CoT)Utiliser les balises XMLDonner un rôle à Claude (prompts système)Enchaîner les prompts complexesConseils pour le contexte longConseils pour la réflexion étendue
    Tester et évaluer
    Définir les critères de succèsDévelopper des cas de testUtiliser l'outil d'évaluationRéduire la latence
    Renforcer les garde-fous
    Réduire les hallucinationsAugmenter la cohérence des résultatsAtténuer les jailbreaksRefus en streamingRéduire les fuites de promptsGarder Claude dans le rôle
    Administration et surveillance
    Aperçu de l'API AdminRésidence des donnéesEspaces de travailAPI d'utilisation et de coûtsAPI Claude Code AnalyticsRétention zéro des données
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Modèles et tarification

    Tarification

    Découvrez la structure tarifaire d'Anthropic pour les modèles et les fonctionnalités

    Cette page fournit des informations tarifaires détaillées pour les modèles et les fonctionnalités d'Anthropic. Tous les prix sont en USD.

    Pour les informations tarifaires les plus récentes, veuillez visiter claude.com/pricing.

    Tarification des modèles

    Le tableau suivant montre la tarification de tous les modèles Claude selon les différents niveaux d'utilisation :

    ModelBase Input Tokens5m Cache Writes1h Cache WritesCache Hits & RefreshesOutput Tokens
    Claude Opus 4.6$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
    Claude Opus 4.5$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
    Claude Opus 4.1$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
    Claude Opus 4$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
    Claude Sonnet 4.5$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Sonnet 4$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Sonnet 3.7 (deprecated)$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Haiku 4.5$1 / MTok$1.25 / MTok$2 / MTok$0.10 / MTok$5 / MTok
    Claude Haiku 3.5$0.80 / MTok$1 / MTok$1.6 / MTok$0.08 / MTok$4 / MTok
    Claude Opus 3 (deprecated)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
    Claude Haiku 3$0.25 / MTok$0.30 / MTok$0.50 / MTok$0.03 / MTok$1.25 / MTok

    MTok = Millions de jetons. La colonne « Base Input Tokens » affiche la tarification d'entrée standard, « Cache Writes » et « Cache Hits » sont spécifiques à la mise en cache des invites, et « Output Tokens » affiche la tarification de sortie. La mise en cache des invites offre des durées de cache de 5 minutes (par défaut) et 1 heure pour optimiser les coûts selon les cas d'utilisation.

    Le tableau ci-dessus reflète les multiplicateurs de tarification suivants pour la mise en cache des invites :

    • Les jetons d'écriture de cache de 5 minutes sont 1,25 fois le prix des jetons d'entrée de base
    • Les jetons d'écriture de cache d'1 heure sont 2 fois le prix des jetons d'entrée de base
    • Les jetons de lecture de cache sont 0,1 fois le prix des jetons d'entrée de base

    Tarification des plateformes tierces

    Les modèles Claude sont disponibles sur AWS Bedrock, Google Vertex AI et Microsoft Foundry. Pour la tarification officielle, visitez :

    • Tarification AWS Bedrock
    • Tarification Google Vertex AI
    • Tarification Microsoft Foundry

    Tarification des points de terminaison régionaux pour les modèles Claude 4.5 et versions ultérieures

    À partir de Claude Sonnet 4.5 et Haiku 4.5, AWS Bedrock et Google Vertex AI offrent deux types de points de terminaison :

    • Points de terminaison mondiaux : Routage dynamique entre les régions pour une disponibilité maximale
    • Points de terminaison régionaux : Routage des données garanti dans des régions géographiques spécifiques

    Les points de terminaison régionaux incluent une prime de 10 % par rapport aux points de terminaison mondiaux. L'API Claude (1P) est mondiale par défaut et n'est pas affectée par ce changement. L'API Claude est mondiale uniquement (équivalente à l'offre de point de terminaison mondial et à la tarification d'autres fournisseurs).

    Portée : Cette structure tarifaire s'applique à Claude Sonnet 4.5, Haiku 4.5 et à tous les modèles futurs. Les modèles antérieurs (Claude Sonnet 4, Opus 4 et les versions antérieures) conservent leur tarification existante.

    Pour les détails de mise en œuvre et les exemples de code :

    • Points de terminaison mondiaux vs régionaux AWS Bedrock
    • Points de terminaison mondiaux vs régionaux Google Vertex AI

    Tarification spécifique aux fonctionnalités

    Tarification de la résidence des données

    Pour Claude Opus 4.6 et les modèles plus récents, la spécification de l'inférence réservée aux États-Unis via le paramètre inference_geo entraîne un multiplicateur de 1,1x sur toutes les catégories de tarification des jetons, y compris les jetons d'entrée, les jetons de sortie, les écritures de cache et les lectures de cache. Le routage mondial (par défaut) utilise la tarification standard.

    Cela s'applique uniquement à l'API Claude (1P). Les plateformes tierces ont leur propre tarification régionale — consultez AWS Bedrock, Google Vertex AI et Microsoft Foundry pour plus de détails. Les modèles antérieurs conservent leur tarification existante indépendamment des paramètres inference_geo.

    Pour plus d'informations, consultez notre documentation sur la résidence des données.

    Traitement par lots

    L'API Batch permet le traitement asynchrone de grands volumes de requêtes avec une réduction de 50 % sur les jetons d'entrée et de sortie.

    ModelBatch inputBatch output
    Claude Opus 4.6$2.50 / MTok$12.50 / MTok
    Claude Opus 4.5$2.50 / MTok$12.50 / MTok
    Claude Opus 4.1$7.50 / MTok$37.50 / MTok
    Claude Opus 4$7.50 / MTok$37.50 / MTok
    Claude Sonnet 4.5$1.50 / MTok$7.50 / MTok
    Claude Sonnet 4$1.50 / MTok$7.50 / MTok
    Claude Sonnet 3.7 (deprecated)$1.50 / MTok$7.50 / MTok
    Claude Haiku 4.5$0.50 / MTok$2.50 / MTok
    Claude Haiku 3.5$0.40 / MTok$2 / MTok
    Claude Opus 3 (deprecated)$7.50 / MTok$37.50 / MTok
    Claude Haiku 3$0.125 / MTok$0.625 / MTok

    Pour plus d'informations sur le traitement par lots, consultez notre documentation sur le traitement par lots.

    Tarification du contexte long

    Lors de l'utilisation de Claude Opus 4.6, Sonnet 4.5 ou Sonnet 4 avec la fenêtre de contexte de 1M jetons activée, les requêtes qui dépassent 200K jetons d'entrée sont automatiquement facturées aux tarifs de contexte long premium :

    La fenêtre de contexte de 1M jetons est actuellement en version bêta pour les organisations au niveau d'utilisation 4 et les organisations avec des limites de débit personnalisées. La fenêtre de contexte de 1M jetons n'est disponible que pour Claude Opus 4.6, Sonnet 4.5 et Sonnet 4.

    Modèle≤ 200K jetons d'entrée> 200K jetons d'entrée
    Claude Opus 4.6Entrée : 5 $ / MTokEntrée : 10 $ / MTok
    Sortie : 25 $ / MTokSortie : 37,50 $ / MTok
    Claude Sonnet 4.5 / 4Entrée : 3 $ / MTokEntrée : 6 $ / MTok
    Sortie : 15 $ / MTokSortie : 22,50 $ / MTok

    La tarification du contexte long s'empile avec d'autres modificateurs de tarification :

    • La réduction de 50 % de l'API Batch s'applique à la tarification du contexte long
    • Les multiplicateurs de mise en cache des invites s'appliquent en plus de la tarification du contexte long
    • Le multiplicateur de 1,1x de résidence des données s'applique en plus de la tarification du contexte long

    Même avec l'indicateur bêta activé, les requêtes avec moins de 200K jetons d'entrée sont facturées aux tarifs standard. Si votre requête dépasse 200K jetons d'entrée, tous les jetons entraînent une tarification premium.

    Le seuil de 200K est basé uniquement sur les jetons d'entrée (y compris les lectures/écritures de cache). Le nombre de jetons de sortie n'affecte pas la sélection du niveau de tarification, bien que les jetons de sortie soient facturés au taux plus élevé lorsque le seuil d'entrée est dépassé.

    Pour vérifier si votre requête API a été facturée aux tarifs de la fenêtre de contexte de 1M, examinez l'objet usage dans la réponse API :

    {
      "usage": {
        "input_tokens": 250000,
        "cache_creation_input_tokens": 0,
        "cache_read_input_tokens": 0,
        "output_tokens": 500
      }
    }

    Calculez le nombre total de jetons d'entrée en additionnant :

    • input_tokens
    • cache_creation_input_tokens (si vous utilisez la mise en cache des invites)
    • cache_read_input_tokens (si vous utilisez la mise en cache des invites)

    Si le total dépasse 200 000 jetons, la requête entière a été facturée aux tarifs de contexte de 1M.

    Pour plus d'informations sur l'objet usage, consultez la documentation de réponse API.

    Tarification de l'utilisation d'outils

    Tool use requests are priced based on:

    1. The total number of input tokens sent to the model (including in the tools parameter)
    2. The number of output tokens generated
    3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

    Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

    The additional tokens from tool use come from:

    • The tools parameter in API requests (tool names, descriptions, and schemas)
    • tool_use content blocks in API requests and responses
    • tool_result content blocks in API requests

    When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

    ModelTool choiceTool use system prompt token count
    Claude Opus 4.6auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Opus 4.5auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Opus 4.1auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Opus 4auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 4.5auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 4auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 3.7 (deprecated)auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Haiku 4.5auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Haiku 3.5auto, none
    any, tool
    264 tokens
    340 tokens
    Claude Opus 3 (deprecated)auto, none
    any, tool
    530 tokens
    281 tokens
    Claude Sonnet 3auto, none
    any, tool
    159 tokens
    235 tokens
    Claude Haiku 3auto, none
    any, tool
    264 tokens
    340 tokens

    These token counts are added to your normal input and output tokens to calculate the total cost of a request.

    Pour les prix actuels par modèle, reportez-vous à notre section tarification des modèles ci-dessus.

    Pour plus d'informations sur la mise en œuvre et les meilleures pratiques de l'utilisation d'outils, consultez notre documentation sur l'utilisation d'outils.

    Tarification d'outils spécifiques

    Outil Bash

    The bash tool adds 245 input tokens to your API calls.

    Additional tokens are consumed by:

    • Command outputs (stdout/stderr)
    • Error messages
    • Large file contents

    Consultez la tarification de l'utilisation d'outils pour les détails tarifaires complets.

    Outil d'exécution de code

    Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container.

    Each organization receives 1,550 free hours of usage with the code execution tool per month. Additional usage beyond the first 1,550 hours is billed at $0.05 per hour, per container.

    Outil d'éditeur de texte

    The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.

    In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

    ToolAdditional input tokens
    text_editor_20250429 (Claude 4.x)700 tokens
    text_editor_20250124 (Claude Sonnet 3.7 (deprecated))700 tokens

    Consultez la tarification de l'utilisation d'outils pour les détails tarifaires complets.

    Outil de recherche Web

    Web search usage is charged in addition to token usage:

    "usage": {
      "input_tokens": 105,
      "output_tokens": 6039,
      "cache_read_input_tokens": 7123,
      "cache_creation_input_tokens": 7345,
      "server_tool_use": {
        "web_search_requests": 1
      }
    }

    Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.

    Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

    Outil de récupération Web

    Web fetch usage has no additional charges beyond standard token costs:

    "usage": {
      "input_tokens": 25039,
      "output_tokens": 931,
      "cache_read_input_tokens": 0,
      "cache_creation_input_tokens": 0,
      "server_tool_use": {
        "web_fetch_requests": 1
      }
    }

    The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.

    To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.

    Example token usage for typical content:

    • Average web page (10KB): ~2,500 tokens
    • Large documentation page (100KB): ~25,000 tokens
    • Research paper PDF (500KB): ~125,000 tokens

    Outil d'utilisation informatique

    Computer use follows the standard tool use pricing. When using the computer use tool:

    System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

    Computer use tool token usage:

    ModelInput tokens per tool definition
    Claude 4.x models735 tokens
    Claude Sonnet 3.7 (deprecated)735 tokens

    Additional token consumption:

    • Screenshot images (see Vision pricing)
    • Tool execution results returned to Claude

    If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

    Exemples de tarification des cas d'utilisation des agents

    Comprendre la tarification des applications d'agents est crucial lors de la création avec Claude. Ces exemples du monde réel peuvent vous aider à estimer les coûts pour différents modèles d'agents.

    Exemple d'agent d'assistance client

    Lors de la création d'un agent d'assistance client, voici comment les coûts pourraient se décomposer :

    Exemple de calcul pour le traitement de 10 000 tickets d'assistance :

    • Environ 3 700 jetons par conversation
    • Utilisation de Claude Opus 4.6 à 5 $/MTok d'entrée, 25 $/MTok de sortie
    • Coût total : environ 37,00 $ pour 10 000 tickets

    Pour une présentation détaillée de ce calcul, consultez notre guide d'agent d'assistance client.

    Tarification générale du flux de travail des agents

    Pour les architectures d'agents plus complexes avec plusieurs étapes :

    1. Traitement des requêtes initiales

      • Entrée typique : 500-1 000 jetons
      • Coût de traitement : environ 0,003 $ par requête
    2. Récupération de la mémoire et du contexte

      • Contexte récupéré : 2 000-5 000 jetons
      • Coût par récupération : environ 0,015 $ par opération
    3. Planification et exécution des actions

      • Jetons de planification : 1 000-2 000
      • Retour d'exécution : 500-1 000
      • Coût combiné : environ 0,045 $ par action

    Pour un guide complet sur les modèles de tarification des agents, consultez notre guide des cas d'utilisation des agents.

    Stratégies d'optimisation des coûts

    Lors de la création d'agents avec Claude :

    1. Utilisez les modèles appropriés : Choisissez Haiku pour les tâches simples, Sonnet pour le raisonnement complexe
    2. Implémentez la mise en cache des invites : Réduisez les coûts pour le contexte répété
    3. Opérations par lots : Utilisez l'API Batch pour les tâches non sensibles au temps
    4. Surveillez les modèles d'utilisation : Suivez la consommation de jetons pour identifier les opportunités d'optimisation

    Pour les applications d'agents à haut volume, envisagez de contacter notre équipe de ventes d'entreprise pour des arrangements tarifaires personnalisés.

    Considérations tarifaires supplémentaires

    Limites de débit

    Les limites de débit varient selon le niveau d'utilisation et affectent le nombre de requêtes que vous pouvez effectuer :

    • Niveau 1 : Utilisation au niveau d'entrée avec des limites de base
    • Niveau 2 : Limites accrues pour les applications en croissance
    • Niveau 3 : Limites plus élevées pour les applications établies
    • Niveau 4 : Limites standard maximales
    • Entreprise : Limites personnalisées disponibles

    Pour des informations détaillées sur les limites de débit, consultez notre documentation sur les limites de débit.

    Pour des limites de débit plus élevées ou des arrangements tarifaires personnalisés, contactez notre équipe de ventes.

    Remises de volume

    Des remises de volume peuvent être disponibles pour les utilisateurs à haut volume. Celles-ci sont négociées au cas par cas.

    • Les niveaux standard utilisent la tarification indiquée ci-dessus
    • Les clients d'entreprise peuvent contacter les ventes pour une tarification personnalisée
    • Des remises académiques et de recherche peuvent être disponibles

    Tarification d'entreprise

    Pour les clients d'entreprise ayant des besoins spécifiques :

    • Limites de débit personnalisées
    • Remises de volume
    • Support dédié
    • Conditions personnalisées

    Contactez notre équipe de ventes à [email protected] ou via la Console Claude pour discuter des options de tarification d'entreprise.

    Facturation et paiement

    • La facturation est calculée mensuellement en fonction de l'utilisation réelle
    • Les paiements sont traités en USD
    • Options de carte de crédit et de facturation disponibles
    • Suivi de l'utilisation disponible dans la Console Claude

    Questions fréquemment posées

    Comment l'utilisation des jetons est-elle calculée ?

    Les jetons sont des morceaux de texte que les modèles traitent. En tant qu'estimation approximative, 1 jeton représente environ 4 caractères ou 0,75 mots en anglais. Le nombre exact varie selon la langue et le type de contenu.

    Y a-t-il des niveaux gratuits ou des essais ?

    Les nouveaux utilisateurs reçoivent une petite quantité de crédits gratuits pour tester l'API. Contactez les ventes pour obtenir des informations sur les essais prolongés pour l'évaluation d'entreprise.

    Comment les remises s'empilent-elles ?

    Les remises de l'API Batch et de la mise en cache des invites peuvent être combinées. Par exemple, l'utilisation des deux fonctionnalités ensemble offre des économies de coûts importantes par rapport aux appels API standard.

    Quels modes de paiement sont acceptés ?

    Nous acceptons les principales cartes de crédit pour les comptes standard. Les clients d'entreprise peuvent organiser la facturation et d'autres modes de paiement.

    Pour des questions supplémentaires sur la tarification, contactez [email protected].

    Was this page helpful?

    • Tarification des modèles
    • Tarification des plateformes tierces
    • Tarification spécifique aux fonctionnalités
    • Tarification de la résidence des données
    • Traitement par lots
    • Tarification du contexte long
    • Tarification de l'utilisation d'outils
    • Tarification d'outils spécifiques
    • Exemples de tarification des cas d'utilisation des agents
    • Exemple d'agent d'assistance client
    • Tarification générale du flux de travail des agents
    • Stratégies d'optimisation des coûts
    • Considérations tarifaires supplémentaires
    • Limites de débit
    • Remises de volume
    • Tarification d'entreprise
    • Facturation et paiement
    • Questions fréquemment posées