Loading...
    • Guide du développeur
    • Référence API
    • MCP
    • Ressources
    • Notes de version
    Search...
    ⌘K
    Premiers pas
    Introduction à ClaudeDémarrage rapide
    Modèles et tarification
    Aperçu des modèlesChoisir un modèleNouveautés dans Claude 4.6Guide de migrationDépréciation des modèlesTarification
    Créer avec Claude
    Aperçu des fonctionnalitésUtiliser l'API MessagesGérer les raisons d'arrêtMeilleures pratiques de prompting
    Gestion du contexte
    Fenêtres de contexteCompactionÉdition du contexte
    Capacités
    Mise en cache des promptsRéflexion étendueRéflexion adaptativeEffortStreaming de messagesTraitement par lotsCitationsSupport multilingueComptage des tokensEmbeddingsVisionSupport PDFAPI FilesRésultats de rechercheSorties structurées
    Outils
    AperçuComment implémenter l'utilisation d'outilsStreaming d'outils granulaireOutil BashOutil d'exécution de codeAppel d'outils programmatiqueOutil Computer useOutil Éditeur de texteOutil Web fetchOutil Web searchOutil MémoireOutil Tool search
    Compétences d'agent
    AperçuDémarrage rapideMeilleures pratiquesCompétences pour l'entrepriseUtiliser les compétences avec l'API
    SDK Agent
    AperçuDémarrage rapideSDK TypeScriptTypeScript V2 (aperçu)SDK PythonGuide de migration
    MCP dans l'API
    Connecteur MCPServeurs MCP distants
    Claude sur les plateformes tierces
    Amazon BedrockMicrosoft FoundryVertex AI
    Ingénierie des prompts
    AperçuGénérateur de promptsUtiliser les modèles de promptsAméliorateur de promptsÊtre clair et directUtiliser des exemples (prompting multi-coups)Laisser Claude réfléchir (CoT)Utiliser les balises XMLDonner un rôle à Claude (prompts système)Enchaîner les prompts complexesConseils pour le contexte longConseils pour la réflexion étendue
    Tester et évaluer
    Définir les critères de succèsDévelopper des cas de testUtiliser l'outil d'évaluationRéduire la latence
    Renforcer les garde-fous
    Réduire les hallucinationsAugmenter la cohérence des résultatsAtténuer les jailbreaksRefus en streamingRéduire les fuites de promptsGarder Claude dans le rôle
    Administration et surveillance
    Aperçu de l'API AdminRésidence des donnéesEspaces de travailAPI d'utilisation et de coûtsAPI Claude Code AnalyticsRétention zéro des données
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Administration et surveillance

    API d'utilisation et de coûts

    Accédez par programmation aux données d'utilisation et de coûts de l'API de votre organisation avec l'API Admin d'utilisation et de coûts.

    The Admin API is unavailable for individual accounts. To collaborate with teammates and add members, set up your organization in Console → Settings → Organization.

    L'API Admin d'utilisation et de coûts fournit un accès programmatique et granulaire aux données historiques d'utilisation et de coûts de l'API pour votre organisation. Ces données sont similaires aux informations disponibles dans les pages Utilisation et Coûts de la Claude Console.

    Cette API vous permet de mieux surveiller, analyser et optimiser vos implémentations Claude :

    • Suivi précis de l'utilisation : Obtenez des décomptes de tokens précis et des modèles d'utilisation au lieu de vous fier uniquement au décompte des tokens de réponse
    • Réconciliation des coûts : Faites correspondre les enregistrements internes avec la facturation Anthropic pour les équipes financières et comptables
    • Performance et amélioration des produits : Surveillez les performances des produits tout en mesurant si les modifications du système les ont améliorées, ou configurez des alertes
    • Optimisation des limites de débit et du niveau de priorité : Optimisez des fonctionnalités comme la mise en cache des invites ou des invites spécifiques pour tirer le meilleur parti de votre capacité allouée, ou achetez une capacité dédiée.
    • Analyse avancée : Effectuez une analyse de données plus approfondie que celle disponible dans la Console

    Clé API Admin requise

    Cette API fait partie de l'API Admin. Ces points de terminaison nécessitent une clé API Admin (commençant par sk-ant-admin...) qui diffère des clés API standard. Seuls les membres de l'organisation ayant le rôle d'administrateur peuvent provisionner les clés API Admin via la Claude Console.

    Solutions partenaires

    Les principales plateformes d'observabilité offrent des intégrations prêtes à l'emploi pour surveiller votre utilisation et vos coûts de l'API Claude, sans écrire de code personnalisé. Ces intégrations fournissent des tableaux de bord, des alertes et des analyses pour vous aider à gérer efficacement votre utilisation de l'API.

    CloudZero

    Plateforme d'intelligence cloud pour le suivi et la prévision des coûts

    Datadog

    Observabilité LLM avec traçage et surveillance automatiques

    Grafana Cloud

    Intégration sans agent pour une observabilité LLM facile avec des tableaux de bord et des alertes prêts à l'emploi

    Honeycomb

    Interrogation avancée et visualisation via OpenTelemetry

    Vantage

    Plateforme FinOps pour l'observabilité des coûts et de l'utilisation des LLM

    Démarrage rapide

    Obtenez l'utilisation quotidienne de votre organisation pour les 7 derniers jours :

    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2025-01-08T00:00:00Z&\
    ending_at=2025-01-15T00:00:00Z&\
    bucket_width=1d" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    Définissez un en-tête User-Agent pour les intégrations

    Si vous créez une intégration, définissez votre en-tête User-Agent pour nous aider à comprendre les modèles d'utilisation :

    User-Agent: YourApp/1.0.0 (https://yourapp.com)

    API d'utilisation

    Suivez la consommation de tokens dans votre organisation avec des ventilations détaillées par modèle, espace de travail et niveau de service avec le point de terminaison /v1/organizations/usage_report/messages.

    Concepts clés

    • Buckets temporels : Agrégez les données d'utilisation à intervalles fixes (1m, 1h ou 1d)
    • Suivi des tokens : Mesurez les tokens d'entrée non mis en cache, les tokens d'entrée mis en cache, la création de cache et les tokens de sortie
    • Filtrage et regroupement : Filtrez par clé API, espace de travail, modèle, niveau de service, fenêtre de contexte ou résidence des données, et regroupez les résultats par ces dimensions
    • Utilisation des outils serveur : Suivez l'utilisation des outils côté serveur comme la recherche web

    Pour les détails complets des paramètres et les schémas de réponse, consultez la référence de l'API d'utilisation.

    Exemples de base

    Utilisation quotidienne par modèle

    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2025-01-01T00:00:00Z&\
    ending_at=2025-01-08T00:00:00Z&\
    group_by[]=model&\
    bucket_width=1d" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    Utilisation horaire avec filtrage

    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2025-01-15T00:00:00Z&\
    ending_at=2025-01-15T23:59:59Z&\
    models[]=claude-opus-4-6&\
    service_tiers[]=batch&\
    context_window[]=0-200k&\
    bucket_width=1h" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    Filtrer l'utilisation par clés API et espaces de travail

    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2025-01-01T00:00:00Z&\
    ending_at=2025-01-08T00:00:00Z&\
    api_key_ids[]=apikey_01Rj2N8SVvo6BePZj99NhmiT&\
    api_key_ids[]=apikey_01ABC123DEF456GHI789JKL&\
    workspace_ids[]=wrkspc_01JwQvzr7rXLA5AGx3HKfFUJ&\
    workspace_ids[]=wrkspc_01XYZ789ABC123DEF456MNO&\
    bucket_width=1d" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    Pour récupérer les ID de clés API de votre organisation, utilisez le point de terminaison List API Keys.

    Pour récupérer les ID d'espaces de travail de votre organisation, utilisez le point de terminaison List Workspaces, ou trouvez les ID d'espaces de travail de votre organisation dans la Console Anthropic.

    Résidence des données

    Suivez vos contrôles de résidence des données en regroupant et en filtrant l'utilisation avec la dimension inference_geo. Ceci est utile pour vérifier le routage géographique dans votre organisation.

    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2026-02-01T00:00:00Z&\
    ending_at=2026-02-08T00:00:00Z&\
    group_by[]=inference_geo&\
    group_by[]=model&\
    bucket_width=1d" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    Vous pouvez également filtrer sur une géographie spécifique. Les valeurs valides sont global, us et not_available :

    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2026-02-01T00:00:00Z&\
    ending_at=2026-02-08T00:00:00Z&\
    inference_geos[]=us&\
    group_by[]=model&\
    bucket_width=1d" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    Les modèles publiés avant février 2026 (avant Claude Opus 4.6) ne supportent pas le paramètre de requête inference_geo, donc leurs rapports d'utilisation retournent "not_available" pour cette dimension. Vous pouvez utiliser not_available comme valeur de filtre dans inference_geos[] pour cibler ces modèles.

    Limites de granularité temporelle

    GranularitéLimite par défautLimite maximaleCas d'utilisation
    1m60 buckets1440 bucketsSurveillance en temps réel
    1h24 buckets168 bucketsModèles quotidiens
    1d7 buckets31 bucketsRapports hebdomadaires/mensuels

    API de coûts

    Récupérez les ventilations des coûts au niveau du service en USD avec le point de terminaison /v1/organizations/cost_report.

    Concepts clés

    • Devise : Tous les coûts en USD, rapportés sous forme de chaînes décimales en unités les plus basses (cents)
    • Types de coûts : Suivez les coûts d'utilisation des tokens, de recherche web et d'exécution de code
    • Regroupement : Regroupez les coûts par espace de travail ou description pour des ventilations détaillées. Lors du regroupement par description, les réponses incluent des champs analysés comme model et inference_geo
    • Buckets temporels : Granularité quotidienne uniquement (1d)

    Pour les détails complets des paramètres et les schémas de réponse, consultez la référence de l'API de coûts.

    Les coûts du niveau de priorité utilisent un modèle de facturation différent et ne sont pas inclus dans le point de terminaison de coûts. Suivez l'utilisation du niveau de priorité via le point de terminaison d'utilisation à la place.

    Exemple de base

    curl "https://api.anthropic.com/v1/organizations/cost_report?\
    starting_at=2025-01-01T00:00:00Z&\
    ending_at=2025-01-31T00:00:00Z&\
    group_by[]=workspace_id&\
    group_by[]=description" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    Pagination

    Les deux points de terminaison supportent la pagination pour les grands ensembles de données :

    1. Effectuez votre requête initiale
    2. Si has_more est true, utilisez la valeur next_page dans votre requête suivante
    3. Continuez jusqu'à ce que has_more soit false
    # Première requête
    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2025-01-01T00:00:00Z&\
    ending_at=2025-01-31T00:00:00Z&\
    limit=7" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"
    
    # La réponse inclut : "has_more": true, "next_page": "page_xyz..."
    
    # Requête suivante avec pagination
    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2025-01-01T00:00:00Z&\
    ending_at=2025-01-31T00:00:00Z&\
    limit=7&\
    page=page_xyz..." \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    Cas d'utilisation courants

    Explorez les implémentations détaillées dans Claude Cookbook :

    • Rapports d'utilisation quotidiens : Suivez les tendances de consommation de tokens
    • Attribution des coûts : Allouez les dépenses par espace de travail pour les rétrofacturations
    • Efficacité du cache : Mesurez et optimisez la mise en cache des invites
    • Surveillance du budget : Configurez des alertes pour les seuils de dépenses
    • Export CSV : Générez des rapports pour les équipes financières

    Questions fréquemment posées

    Quelle est la fraîcheur des données ?

    Les données d'utilisation et de coûts apparaissent généralement dans les 5 minutes suivant l'achèvement de la requête API, bien que les délais puissent occasionnellement être plus longs.

    Quelle est la fréquence d'interrogation recommandée ?

    L'API supporte l'interrogation une fois par minute pour une utilisation soutenue. Pour les rafales courtes (par exemple, le téléchargement de données paginées), une interrogation plus fréquente est acceptable. Mettez en cache les résultats pour les tableaux de bord qui nécessitent des mises à jour fréquentes.

    Comment suivre l'utilisation de l'exécution de code ?

    Les coûts d'exécution de code apparaissent dans le point de terminaison de coûts regroupés sous Code Execution Usage dans le champ description. L'exécution de code n'est pas incluse dans le point de terminaison d'utilisation.

    Comment suivre l'utilisation du niveau de priorité ?

    Filtrez ou regroupez par service_tier dans le point de terminaison d'utilisation et recherchez la valeur priority. Les coûts du niveau de priorité ne sont pas disponibles dans le point de terminaison de coûts.

    Que se passe-t-il avec l'utilisation de Workbench ?

    L'utilisation de l'API à partir de Workbench n'est pas associée à une clé API, donc api_key_id sera null même lors du regroupement par cette dimension.

    Comment l'espace de travail par défaut est-il représenté ?

    L'utilisation et les coûts attribués à l'espace de travail par défaut ont une valeur null pour workspace_id.

    Comment obtenir des ventilations de coûts par utilisateur pour Claude Code ?

    Utilisez l'API Claude Code Analytics, qui fournit les coûts estimés par utilisateur et les métriques de productivité sans les limitations de performance de la ventilation des coûts par de nombreuses clés API. Pour l'utilisation générale de l'API avec de nombreuses clés, utilisez l'API d'utilisation pour suivre la consommation de tokens comme proxy de coûts.

    Voir aussi

    Les API d'utilisation et de coûts peuvent être utilisées pour vous aider à offrir une meilleure expérience à vos utilisateurs, vous aider à gérer les coûts et préserver votre limite de débit. En savoir plus sur certaines de ces autres fonctionnalités :

    • Aperçu de l'API Admin
    • Référence de l'API Admin
    • Tarification
    • Mise en cache des invites - Optimisez les coûts avec la mise en cache
    • Traitement par lot - 50% de réduction sur les requêtes par lot
    • Limites de débit - Comprendre les niveaux d'utilisation
    • Résidence des données - Contrôlez la géographie de l'inférence

    Was this page helpful?

    • Solutions partenaires
    • Démarrage rapide
    • API d'utilisation
    • Concepts clés
    • Exemples de base
    • Limites de granularité temporelle
    • API de coûts
    • Concepts clés
    • Exemple de base
    • Pagination
    • Cas d'utilisation courants
    • Questions fréquemment posées
    • Quelle est la fraîcheur des données ?
    • Quelle est la fréquence d'interrogation recommandée ?
    • Comment suivre l'utilisation de l'exécution de code ?
    • Comment suivre l'utilisation du niveau de priorité ?
    • Que se passe-t-il avec l'utilisation de Workbench ?
    • Comment l'espace de travail par défaut est-il représenté ?
    • Comment obtenir des ventilations de coûts par utilisateur pour Claude Code ?
    • Voir aussi