Loading...
    • Costruisci
    • Amministrazione
    • Modelli e prezzi
    • Client SDK
    • Riferimento API
    Search...
    ⌘K
    Primi passi
    Introduzione a ClaudeAvvio rapido
    Costruire con Claude
    Panoramica delle funzionalitàUtilizzo delle Messages APIClaude API skillGestione dei motivi di stop
    Capacità del modello
    Ragionamento estesoRagionamento adattivoImpegnoBudget attività (beta)Modalità rapida (beta: anteprima di ricerca)Output strutturatiCitazioniMessaggi in streamingElaborazione batchRisultati di ricercaRifiuti in streamingSupporto multilingueEmbeddings
    Strumenti
    PanoramicaCome funziona l'uso degli strumentiTutorial: Costruisci un agente che usa strumentiDefinisci strumentiGestisci le chiamate agli strumentiUso parallelo degli strumentiTool Runner (SDK)Uso rigoroso degli strumentiUso degli strumenti con prompt cachingStrumenti serverRisoluzione dei problemiStrumento di ricerca webStrumento di recupero webStrumento di esecuzione codiceStrumento advisorStrumento di memoriaStrumento BashStrumento di utilizzo del computerStrumento editor di testo
    Infrastruttura degli strumenti
    Riferimento strumentiGestisci il contesto degli strumentiCombinazioni di strumentiRicerca strumentiChiamata programmatica agli strumentiStreaming granulare degli strumenti
    Gestione del contesto
    Finestre di contestoCompattazioneModifica del contestoPrompt cachingConteggio token
    Lavorare con i file
    Files APISupporto PDFImmagini e visione
    Skill
    PanoramicaAvvio rapidoBest practiceSkill per le impreseSkill nell'API
    MCP
    Server MCP remotiMCP connector
    Prompt engineering
    PanoramicaBest practice per il promptingStrumenti di prompting in Console
    Testa e valuta
    Definisci il successo e costruisci valutazioniUtilizzo dello strumento di valutazione in ConsoleRiduzione della latenza
    Rafforzare i guardrail
    Ridurre le allucinazioniAumentare la coerenza dell'outputMitigare i jailbreakRidurre la perdita di prompt
    Risorse
    Glossario
    Note di rilascio
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Infrastruttura degli strumenti

    Gestire il contesto degli strumenti

    Scegli tra ricerca degli strumenti, chiamate programmatiche degli strumenti, caching dei prompt e modifica del contesto per gestire il sovraccarico del contesto.

    Le definizioni degli strumenti e i blocchi tool_result accumulati consumano la tua finestra di contesto. Gli agenti a lunga esecuzione con molti strumenti o molti turni possono esaurire il contesto disponibile prima che l'attività sia completata. Quattro approcci affrontano questo problema in diversi punti della pipeline.

    I quattro approcci

    Ogni approccio affronta una diversa fonte di pressione sul contesto. Scegli quello che corrisponde a dove stanno andando i tuoi token.

    ApproccioCosa riduceQuando si adattaScopri di più
    Ricerca degli strumentiDefinizioni degli strumenti caricate in anticipoSet di strumenti grandi (20+ strumenti) dove la maggior parte degli strumenti non è necessaria ogni turnoStrumento di ricerca degli strumenti
    Chiamate programmatiche degli strumentiRoundtrip tool_resultCatene di chiamate di strumenti che possono essere eseguite come un singolo scriptChiamate programmatiche degli strumenti
    Caching dei promptCosto dei token delle definizioni degli strumenti ripetuteSet di strumenti stabili su molte richiesteUtilizzo degli strumenti con caching dei prompt
    Modifica del contestoVecchi blocchi tool_result nella cronologiaConversazioni lunghe dove i risultati iniziali non sono più rilevantiModifica del contesto

    Ricerca degli strumenti

    La ricerca degli strumenti mantiene le definizioni degli strumenti fuori dalla finestra di contesto finché Claude non le richiede. Invece di inviare 50 schemi di strumenti in anticipo, invii un singolo strumento tool_search e lasci che Claude scopra il resto su richiesta. Questo scambia una piccola quantità di latenza (un turno extra per cercare uno strumento) per una grande riduzione nell'utilizzo del contesto di base.

    Chiamate programmatiche degli strumenti

    Le chiamate programmatiche degli strumenti collassano una sequenza di chiamate di strumenti in un singolo blocco di codice che Claude scrive e la sandbox di esecuzione del codice di Anthropic esegue. Invece di cinque roundtrip di tool_use e tool_result, Claude emette uno script che chiama tutte e cinque le funzioni dall'interno della sandbox. I risultati intermedi non entrano mai nella cronologia della conversazione.

    Caching dei prompt

    Il caching dei prompt non riduce il numero di token nel contesto, ma riduce quello che paghi per loro nelle richieste successive. Se le definizioni dei tuoi strumenti sono stabili, memorizzale nella cache una volta e riutilizza il prefisso memorizzato nella cache su migliaia di richieste. Questa è la scelta giusta quando il set di strumenti è grande ma fisso.

    Modifica del contesto

    La modifica del contesto rimuove i vecchi blocchi tool_result dalla cronologia della conversazione una volta che hanno assolto il loro scopo. Un lungo ciclo di agenti potrebbe produrre centinaia di risultati intermedi che erano utili al momento ma ora sono peso morto. La modifica del contesto ti permette di potarli senza riavviare la conversazione.

    Combinare gli approcci

    Questi approcci si compongono. Un agente a lunga esecuzione potrebbe utilizzare la ricerca degli strumenti per mantenere il set di strumenti snello, il caching dei prompt per ammortizzare il costo delle definizioni rimanenti e la modifica del contesto per potare i risultati obsoleti man mano che la conversazione cresce. Ognuno risolve una parte diversa del problema, quindi non c'è conflitto nell'usarli insieme.

    Un punto di partenza ragionevole per un agente ad alto volume:

    1. Abilita il caching dei prompt sulle definizioni dei tuoi strumenti dal primo giorno. Le scritture della cache comportano un markup del 25% rispetto ai prezzi di input di base, che si ripaga alla seconda richiesta che colpisce la cache.
    2. Aggiungi la ricerca degli strumenti una volta che il tuo set di strumenti cresce oltre circa 20 strumenti o il tuo utilizzo del contesto di base diventa evidente.
    3. Aggiungi la modifica del contesto una volta che le conversazioni individuali iniziano a durare abbastanza a lungo che i risultati iniziali diventano irrilevanti.
    4. Considera le chiamate programmatiche degli strumenti se noti catene ripetitive di piccole chiamate di strumenti che potrebbero essere eseguite come un singolo batch.

    Passaggi successivi

    Strumento di ricerca degli strumenti

    Carica le definizioni degli strumenti su richiesta invece che in anticipo.

    Chiamate programmatiche degli strumenti

    Collassa le catene di chiamate di strumenti in un singolo script eseguibile.

    Utilizzo degli strumenti con caching dei prompt

    Memorizza nella cache le definizioni degli strumenti su più richieste per ridurre i costi dei token.

    Modifica del contesto

    Pota i risultati degli strumenti obsoleti dalle conversazioni a lunga esecuzione.

    Was this page helpful?

    • I quattro approcci
    • Ricerca degli strumenti
    • Chiamate programmatiche degli strumenti
    • Caching dei prompt
    • Modifica del contesto
    • Combinare gli approcci
    • Passaggi successivi