Loading...
  • Construire
  • Admin
  • Modèles & tarification
  • SDKs clients
  • Référence API
Search...
⌘K
Log in
Gérer le contexte des outils
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Construire/Infrastructure des outils

Gérer le contexte des outils

Choisissez entre la recherche d'outils, l'appel d'outils programmatique, la mise en cache des invites et l'édition de contexte pour gérer la surcharge de contexte.

Was this page helpful?

  • Les quatre approches
  • Recherche d'outils
  • Appel d'outils programmatique
  • Mise en cache des invites
  • Édition de contexte
  • Combiner les approches
  • Prochaines étapes

Les définitions d'outils et les blocs tool_result accumulés consomment votre fenêtre de contexte. Les agents de longue durée avec de nombreux outils ou de nombreux tours peuvent épuiser le contexte disponible avant que la tâche soit terminée. Quatre approches abordent cela à différents points du pipeline.

Les quatre approches

Chaque approche cible une source différente de pression contextuelle. Choisissez celle qui correspond à l'endroit où vos jetons sont utilisés.

ApprocheCe qu'elle réduitQuand elle convientEn savoir plus
Recherche d'outilsDéfinitions d'outils chargées à l'avanceGrands ensembles d'outils (20+ outils) où la plupart des outils ne sont pas nécessaires à chaque tourOutil de recherche d'outils
Appel d'outils programmatiqueAllers-retours tool_resultChaînes d'appels d'outils qui peuvent s'exécuter comme un seul scriptAppel d'outils programmatique
Mise en cache des invitesCoût en jetons des définitions d'outils répétéesEnsembles d'outils stables sur de nombreuses requêtesUtilisation d'outils avec mise en cache des invites
Édition de contexteAnciens blocs tool_result dans l'historiqueLongues conversations où les résultats antérieurs ne sont plus pertinentsÉdition de contexte

Recherche d'outils

La recherche d'outils garde les définitions d'outils en dehors de la fenêtre de contexte jusqu'à ce que Claude les demande. Au lieu d'envoyer 50 schémas d'outils à l'avance, vous envoyez un seul outil tool_search et laissez Claude découvrir le reste à la demande. Cela échange une petite quantité de latence (un tour supplémentaire pour rechercher un outil) contre une réduction importante de l'utilisation du contexte de base.

Appel d'outils programmatique

L'appel d'outils programmatique réduit une séquence d'appels d'outils à un seul bloc de code que Claude écrit et que le bac à sable d'exécution de code d'Anthropic exécute. Au lieu de cinq allers-retours de tool_use et tool_result, Claude émet un script qui appelle les cinq fonctions depuis le bac à sable. Les résultats intermédiaires n'entrent jamais dans l'historique de la conversation.

Mise en cache des invites

La mise en cache des invites ne réduit pas le nombre de jetons en contexte, mais elle réduit ce que vous payez pour eux lors des requêtes suivantes. Si vos définitions d'outils sont stables, mettez-les en cache une fois et réutilisez le préfixe mis en cache sur des milliers de requêtes. C'est le bon choix quand l'ensemble d'outils est grand mais fixe.

Édition de contexte

L'édition de contexte supprime les anciens blocs tool_result de l'historique de la conversation une fois qu'ils ont rempli leur fonction. Une longue boucle d'agent peut produire des centaines de résultats intermédiaires qui étaient utiles à l'époque mais qui sont maintenant du poids mort. L'édition de contexte vous permet de les réduire sans redémarrer la conversation.

Combiner les approches

Ces approches se composent. Un agent de longue durée pourrait utiliser la recherche d'outils pour garder l'ensemble d'outils léger, la mise en cache des invites pour amortir le coût des définitions restantes, et l'édition de contexte pour réduire les résultats obsolètes à mesure que la conversation se développe. Chacune résout une partie différente du problème, il n'y a donc aucun conflit à les utiliser ensemble.

Un point de départ raisonnable pour un agent à haut volume :

  1. Activez la mise en cache des invites sur vos définitions d'outils dès le premier jour. Les écritures en cache comportent une majoration de 25 % par rapport aux tarifs d'entrée de base, ce qui se rembourse à la deuxième requête qui accède au cache.
  2. Ajoutez la recherche d'outils une fois que votre ensemble d'outils dépasse environ 20 outils ou que votre utilisation du contexte de base devient notable.
  3. Ajoutez l'édition de contexte une fois que les conversations individuelles commencent à s'exécuter assez longtemps pour que les résultats antérieurs deviennent non pertinents.
  4. Envisagez l'appel d'outils programmatique si vous remarquez des chaînes répétitives de petits appels d'outils qui pourraient s'exécuter comme un seul lot.

Prochaines étapes

Outil de recherche d'outils

Charger les définitions d'outils à la demande au lieu de à l'avance.

Appel d'outils programmatique

Réduire les chaînes d'appels d'outils à un seul script exécutable.

Utilisation d'outils avec mise en cache des invites

Mettre en cache les définitions d'outils sur les requêtes pour réduire les coûts en jetons.

Édition de contexte

Réduire les résultats d'outils obsolètes des conversations de longue durée.