Loading...
    • Construire
    • Admin
    • Modèles & tarification
    • SDKs clients
    • Référence API
    Search...
    ⌘K
    Premiers pas
    Introduction à ClaudeDémarrage rapide
    Construire avec Claude
    Aperçu des fonctionnalitésUtiliser l'API MessagesCompétence API ClaudeGérer les raisons d'arrêt
    Capacités du modèle
    Réflexion étendueRéflexion adaptativeEffortBudgets de tâches (bêta)Mode rapide (bêta : aperçu recherche)Sorties structuréesCitationsMessages en streamingTraitement par lotsRésultats de rechercheRefus en streamingSupport multilingueEmbeddings
    Outils
    AperçuFonctionnement des outilsTutoriel : Créer un agent utilisant des outilsDéfinir des outilsGérer les appels d'outilsUtilisation parallèle des outilsTool Runner (SDK)Utilisation stricte des outilsUtilisation des outils avec mise en cache des promptsOutils serveurDépannageOutil de recherche webOutil de récupération webOutil d'exécution de codeOutil conseillerOutil mémoireOutil BashOutil d'utilisation de l'ordinateurOutil éditeur de texte
    Infrastructure des outils
    Référence des outilsGérer le contexte des outilsCombinaisons d'outilsRecherche d'outilsAppel d'outils programmatiqueStreaming d'outils à grain fin
    Gestion du contexte
    Fenêtres de contexteCompactionÉdition du contexteMise en cache des promptsComptage de tokens
    Travailler avec des fichiers
    Files APISupport PDFImages et vision
    Compétences
    AperçuDémarrage rapideMeilleures pratiquesCompétences pour l'entrepriseCompétences dans l'API
    MCP
    Serveurs MCP distantsConnecteur MCP
    Ingénierie des prompts
    AperçuMeilleures pratiques de promptingOutils de prompting dans la Console
    Tester et évaluer
    Définir le succès et créer des évaluationsUtiliser l'outil d'évaluation dans la ConsoleRéduire la latence
    Renforcer les garde-fous
    Réduire les hallucinationsAugmenter la cohérence des sortiesAtténuer les jailbreaksRéduire les fuites de prompts
    Ressources
    Glossaire
    Notes de version
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Infrastructure des outils

    Gérer le contexte des outils

    Choisissez entre la recherche d'outils, l'appel d'outils programmatique, la mise en cache des invites et l'édition de contexte pour gérer la surcharge de contexte.

    Les définitions d'outils et les blocs tool_result accumulés consomment votre fenêtre de contexte. Les agents de longue durée avec de nombreux outils ou de nombreux tours peuvent épuiser le contexte disponible avant que la tâche soit terminée. Quatre approches abordent cela à différents points du pipeline.

    Les quatre approches

    Chaque approche cible une source différente de pression contextuelle. Choisissez celle qui correspond à l'endroit où vos jetons sont utilisés.

    ApprocheCe qu'elle réduitQuand elle convientEn savoir plus
    Recherche d'outilsDéfinitions d'outils chargées à l'avanceGrands ensembles d'outils (20+ outils) où la plupart des outils ne sont pas nécessaires à chaque tourOutil de recherche d'outils
    Appel d'outils programmatiqueAllers-retours tool_resultChaînes d'appels d'outils qui peuvent s'exécuter comme un seul scriptAppel d'outils programmatique
    Mise en cache des invitesCoût en jetons des définitions d'outils répétéesEnsembles d'outils stables sur de nombreuses requêtesUtilisation d'outils avec mise en cache des invites
    Édition de contexteAnciens blocs tool_result dans l'historiqueLongues conversations où les résultats antérieurs ne sont plus pertinentsÉdition de contexte

    Recherche d'outils

    La recherche d'outils garde les définitions d'outils en dehors de la fenêtre de contexte jusqu'à ce que Claude les demande. Au lieu d'envoyer 50 schémas d'outils à l'avance, vous envoyez un seul outil tool_search et laissez Claude découvrir le reste à la demande. Cela échange une petite quantité de latence (un tour supplémentaire pour rechercher un outil) contre une réduction importante de l'utilisation du contexte de base.

    Appel d'outils programmatique

    L'appel d'outils programmatique réduit une séquence d'appels d'outils à un seul bloc de code que Claude écrit et que le bac à sable d'exécution de code d'Anthropic exécute. Au lieu de cinq allers-retours de tool_use et tool_result, Claude émet un script qui appelle les cinq fonctions depuis le bac à sable. Les résultats intermédiaires n'entrent jamais dans l'historique de la conversation.

    Mise en cache des invites

    La mise en cache des invites ne réduit pas le nombre de jetons en contexte, mais elle réduit ce que vous payez pour eux lors des requêtes suivantes. Si vos définitions d'outils sont stables, mettez-les en cache une fois et réutilisez le préfixe mis en cache sur des milliers de requêtes. C'est le bon choix quand l'ensemble d'outils est grand mais fixe.

    Édition de contexte

    L'édition de contexte supprime les anciens blocs tool_result de l'historique de la conversation une fois qu'ils ont rempli leur fonction. Une longue boucle d'agent peut produire des centaines de résultats intermédiaires qui étaient utiles à l'époque mais qui sont maintenant du poids mort. L'édition de contexte vous permet de les réduire sans redémarrer la conversation.

    Combiner les approches

    Ces approches se composent. Un agent de longue durée pourrait utiliser la recherche d'outils pour garder l'ensemble d'outils léger, la mise en cache des invites pour amortir le coût des définitions restantes, et l'édition de contexte pour réduire les résultats obsolètes à mesure que la conversation se développe. Chacune résout une partie différente du problème, il n'y a donc aucun conflit à les utiliser ensemble.

    Un point de départ raisonnable pour un agent à haut volume :

    1. Activez la mise en cache des invites sur vos définitions d'outils dès le premier jour. Les écritures en cache comportent une majoration de 25 % par rapport aux tarifs d'entrée de base, ce qui se rembourse à la deuxième requête qui accède au cache.
    2. Ajoutez la recherche d'outils une fois que votre ensemble d'outils dépasse environ 20 outils ou que votre utilisation du contexte de base devient notable.
    3. Ajoutez l'édition de contexte une fois que les conversations individuelles commencent à s'exécuter assez longtemps pour que les résultats antérieurs deviennent non pertinents.
    4. Envisagez l'appel d'outils programmatique si vous remarquez des chaînes répétitives de petits appels d'outils qui pourraient s'exécuter comme un seul lot.

    Prochaines étapes

    Outil de recherche d'outils

    Charger les définitions d'outils à la demande au lieu de à l'avance.

    Appel d'outils programmatique

    Réduire les chaînes d'appels d'outils à un seul script exécutable.

    Utilisation d'outils avec mise en cache des invites

    Mettre en cache les définitions d'outils sur les requêtes pour réduire les coûts en jetons.

    Édition de contexte

    Réduire les résultats d'outils obsolètes des conversations de longue durée.

    Was this page helpful?

    • Les quatre approches
    • Recherche d'outils
    • Appel d'outils programmatique
    • Mise en cache des invites
    • Édition de contexte
    • Combiner les approches
    • Prochaines étapes