Loading...
  • Costruisci
  • Amministrazione
  • Modelli e prezzi
  • Client SDK
  • Riferimento API
Search...
⌘K
Log in
Uso degli strumenti con prompt caching
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Costruisci/Strumenti

Utilizzo di strumenti con caching dei prompt

Memorizza nella cache le definizioni degli strumenti tra i turni e comprendi cosa invalida la tua cache.

Questa pagina copre il caching dei prompt per le definizioni degli strumenti: dove posizionare i breakpoint cache_control, come defer_loading preserva la tua cache e cosa la invalida. Per il caching generale dei prompt, vedi Caching dei prompt.

cache_control sulle definizioni degli strumenti

Posiziona cache_control: {"type": "ephemeral"} sull'ultimo strumento nel tuo array tools. Questo memorizza nella cache l'intero prefisso delle definizioni degli strumenti, dal primo strumento attraverso il breakpoint contrassegnato:

{
  "tools": [
    {
      "name": "get_weather",
      "description": "Get the current weather in a given location",
      "input_schema": {
        "type": "object",
        "properties": {
          "location": { "type": "string" }
        },
        "required": ["location"]
      }
    },
    {
      "name": "get_time",
      "description": "Get the current time in a given time zone",
      "input_schema": {
        "type": "object",
        "properties": {
          "timezone": { "type": "string" }
        },
        "required": ["timezone"]
      },
      "cache_control": { "type": "ephemeral" }
    }
  ]
}

Per mcp_toolset, il breakpoint cache_control si posiziona sull'ultimo strumento nel set. Non controlli l'ordine degli strumenti all'interno di un toolset MCP, quindi posiziona il breakpoint sulla voce mcp_toolset stessa e l'API lo applica allo strumento finale espanso.

defer_loading e preservazione della cache

Gli strumenti differiti non sono inclusi nel prefisso del prompt di sistema. Quando il modello scopre uno strumento differito attraverso tool search, la definizione viene aggiunta inline come blocco tool_reference nella cronologia della conversazione. Il prefisso rimane intatto, quindi il caching dei prompt è preservato.

Questo significa che l'aggiunta dinamica di strumenti attraverso tool search non interrompe la tua cache. Puoi iniziare una conversazione con un piccolo set di strumenti sempre caricati (memorizzati nella cache), lasciare che il modello scopra strumenti aggiuntivi secondo necessità e mantenere lo stesso cache hit in ogni turno.

defer_loading agisce anche indipendentemente dalla costruzione della grammatica per la modalità ristretta. La grammatica si costruisce dal set completo di strumenti indipendentemente da quali strumenti sono differiti, quindi il caching dei prompt e il caching della grammatica sono entrambi preservati quando gli strumenti si caricano dinamicamente.

Cosa invalida la tua cache

La cache segue una gerarchia di prefissi (tools → system → messages), quindi una modifica a un livello invalida quel livello e tutto ciò che viene dopo:

ModificaInvalida
Modifica delle definizioni degli strumentiIntera cache (tools, system, messages)
Attivazione/disattivazione della ricerca web o citazioniCache di system e messages
Modifica di tool_choiceCache di messages
Modifica di disable_parallel_tool_useCache di messages
Attivazione/disattivazione della presenza di immaginiCache di messages
Modifica dei parametri di thinkingCache di messages

Se hai bisogno di variare tool_choice a metà conversazione, considera di posizionare breakpoint della cache prima del punto di variazione.

Tabella di interazione per strumento

StrumentoConsiderazioni di caching
Ricerca webL'abilitazione o la disabilitazione invalida le cache di system e messages
Web fetchL'abilitazione o la disabilitazione invalida le cache di system e messages
Esecuzione di codiceLo stato del container è indipendente dalla cache dei prompt
Tool searchGli strumenti scoperti si caricano come blocchi tool_reference, preservando la cache del prefisso
Utilizzo del computerLa presenza dello screenshot influisce sulla cache di messages
Editor di testoStrumento client standard, nessuna interazione di caching speciale
BashStrumento client standard, nessuna interazione di caching speciale
MemoriaStrumento client standard, nessuna interazione di caching speciale

Passaggi successivi

Caching dei prompt

Scopri il modello completo di caching dei prompt, inclusi TTL e prezzi.

Tool search

Carica gli strumenti su richiesta senza interrompere la tua cache.

Riferimento degli strumenti

Sfoglia tutti gli strumenti disponibili e i loro parametri.

Was this page helpful?

  • cache_control sulle definizioni degli strumenti
  • defer_loading e preservazione della cache
  • Cosa invalida la tua cache
  • Tabella di interazione per strumento
  • Passaggi successivi