• Costruisci
  • Amministrazione
  • Modelli e prezzi
  • Client SDK
  • Riferimento API
Search...
⌘K
Log in
Gestisci il contesto degli strumenti
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Costruisci/Infrastruttura degli strumenti

Gestire il contesto degli strumenti

Scegli tra ricerca degli strumenti, chiamate programmatiche degli strumenti, caching dei prompt e modifica del contesto per gestire il sovraccarico del contesto.

Le definizioni degli strumenti e i blocchi tool_result accumulati consumano la tua finestra di contesto. Gli agenti a lunga esecuzione con molti strumenti o molti turni possono esaurire il contesto disponibile prima che l'attività sia completata. Quattro approcci affrontano questo problema in diversi punti della pipeline.

I quattro approcci

Ogni approccio affronta una diversa fonte di pressione sul contesto. Scegli quello che corrisponde a dove stanno andando i tuoi token.

ApproccioCosa riduceQuando si adattaScopri di più
Ricerca degli strumentiDefinizioni degli strumenti caricate in anticipoSet di strumenti grandi (20+ strumenti) dove la maggior parte degli strumenti non è necessaria ogni turnoStrumento di ricerca degli strumenti
Chiamate programmatiche degli strumentiRoundtrip tool_resultCatene di chiamate di strumenti che possono essere eseguite come un singolo scriptChiamate programmatiche degli strumenti
Caching dei promptCosto dei token delle definizioni degli strumenti ripetuteSet di strumenti stabili su molte richiesteUtilizzo degli strumenti con caching dei prompt
Modifica del contestoVecchi blocchi tool_result nella cronologiaConversazioni lunghe dove i risultati iniziali non sono più rilevantiModifica del contesto

Ricerca degli strumenti

La ricerca degli strumenti mantiene le definizioni degli strumenti fuori dalla finestra di contesto finché Claude non le richiede. Invece di inviare 50 schemi di strumenti in anticipo, invii un singolo strumento tool_search e lasci che Claude scopra il resto su richiesta. Questo scambia una piccola quantità di latenza (un turno extra per cercare uno strumento) per una grande riduzione nell'utilizzo del contesto di base.

Chiamate programmatiche degli strumenti

Le chiamate programmatiche degli strumenti collassano una sequenza di chiamate di strumenti in un singolo blocco di codice che Claude scrive e la sandbox di esecuzione del codice di Anthropic esegue. Invece di cinque roundtrip di tool_use e tool_result, Claude emette uno script che chiama tutte e cinque le funzioni dall'interno della sandbox. I risultati intermedi non entrano mai nella cronologia della conversazione.

Caching dei prompt

Il caching dei prompt non riduce il numero di token nel contesto, ma riduce quello che paghi per loro nelle richieste successive. Se le definizioni dei tuoi strumenti sono stabili, memorizzale nella cache una volta e riutilizza il prefisso memorizzato nella cache su migliaia di richieste. Questa è la scelta giusta quando il set di strumenti è grande ma fisso.

Modifica del contesto

La modifica del contesto rimuove i vecchi blocchi tool_result dalla cronologia della conversazione una volta che hanno assolto il loro scopo. Un lungo ciclo di agenti potrebbe produrre centinaia di risultati intermedi che erano utili al momento ma ora sono peso morto. La modifica del contesto ti permette di potarli senza riavviare la conversazione.

Combinare gli approcci

Questi approcci si compongono. Un agente a lunga esecuzione potrebbe utilizzare la ricerca degli strumenti per mantenere il set di strumenti snello, il caching dei prompt per ammortizzare il costo delle definizioni rimanenti e la modifica del contesto per potare i risultati obsoleti man mano che la conversazione cresce. Ognuno risolve una parte diversa del problema, quindi non c'è conflitto nell'usarli insieme.

Un punto di partenza ragionevole per un agente ad alto volume:

  1. Abilita il caching dei prompt sulle definizioni dei tuoi strumenti dal primo giorno. Le scritture della cache comportano un markup del 25% rispetto ai prezzi di input di base, che si ripaga alla seconda richiesta che colpisce la cache.
  2. Aggiungi la ricerca degli strumenti una volta che il tuo set di strumenti cresce oltre circa 20 strumenti o il tuo utilizzo del contesto di base diventa evidente.
  3. Aggiungi la modifica del contesto una volta che le conversazioni individuali iniziano a durare abbastanza a lungo che i risultati iniziali diventano irrilevanti.
  4. Considera le chiamate programmatiche degli strumenti se noti catene ripetitive di piccole chiamate di strumenti che potrebbero essere eseguite come un singolo batch.

Passaggi successivi

Strumento di ricerca degli strumenti

Carica le definizioni degli strumenti su richiesta invece che in anticipo.

Chiamate programmatiche degli strumenti

Collassa le catene di chiamate di strumenti in un singolo script eseguibile.

Utilizzo degli strumenti con caching dei prompt

Memorizza nella cache le definizioni degli strumenti su più richieste per ridurre i costi dei token.

Modifica del contesto

Pota i risultati degli strumenti obsoleti dalle conversazioni a lunga esecuzione.

Was this page helpful?

  • I quattro approcci
  • Ricerca degli strumenti
  • Chiamate programmatiche degli strumenti
  • Caching dei prompt
  • Modifica del contesto
  • Combinare gli approcci
  • Passaggi successivi