Programmatic tool calling consente a Claude di scrivere codice che chiama i tuoi strumenti in modo programmatico all'interno di un contenitore di esecuzione del codice, piuttosto che richiedere round trip attraverso il modello per ogni invocazione dello strumento. Questo riduce la latenza per i flussi di lavoro multi-strumento e diminuisce il consumo di token consentendo a Claude di filtrare o elaborare i dati prima che raggiungano la finestra di contesto del modello. Su benchmark di ricerca agentiva come BrowseComp e DeepSearchQA, che testano la ricerca web multi-step e il recupero di informazioni complesse, l'aggiunta di programmatic tool calling in cima agli strumenti di ricerca di base è stato il fattore chiave che ha completamente sbloccato le prestazioni dell'agente.
La differenza si compone rapidamente nei flussi di lavoro reali. Considera il controllo della conformità del budget su 20 dipendenti: l'approccio tradizionale richiede 20 round trip separati del modello, tirando migliaia di voci di spesa nel contesto lungo il percorso. Con programmatic tool calling, un singolo script esegue tutti e 20 i lookup, filtra i risultati e restituisce solo i dipendenti che hanno superato i loro limiti, riducendo ciò che Claude deve ragionare da centinaia di kilobyte a poche righe.
Per uno sguardo più approfondito ai costi di inferenza e contesto che programmatic tool calling affronta, vedi Advanced tool use.
Questa funzione richiede che lo strumento di esecuzione del codice sia abilitato.
This feature is not eligible for Zero Data Retention (ZDR). Data is retained according to the feature's standard retention policy.
Programmatic tool calling richiede code_execution_20260120, che è supportato sui seguenti modelli:
| Modello |
|---|
Claude Opus 4.7 (claude-opus-4-7) |
Claude Opus 4.6 (claude-opus-4-6) |
Claude Sonnet 4.6 (claude-sonnet-4-6) |
Claude Opus 4.5 (claude-opus-4-5-20251101) |
Claude Sonnet 4.5 (claude-sonnet-4-5-20250929) |
Per la matrice completa delle versioni dello strumento di esecuzione del codice, vedi la tabella di compatibilità del modello dello strumento di esecuzione del codice. Programmatic tool calling è disponibile tramite l'API Claude e Microsoft Foundry.
Ecco un semplice esempio in cui Claude interroga programmaticamente un database più volte e aggrega i risultati:
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=4096,
messages=[
{
"role": "user",
"content": "Query sales data for the West, East, and Central regions, then tell me which region had the highest revenue",
}
],
tools=[
{"type": "code_execution_20260120", "name": "code_execution"},
{
"name": "query_database",
"description": "Execute a SQL query against the sales database. Returns a list of rows as JSON objects.",
"input_schema": {
"type": "object",
"properties": {
"sql": {"type": "string", "description": "SQL query to execute"}
},
"required": ["sql"],
},
"allowed_callers": ["code_execution_20260120"],
},
],
)
print(response)Quando configuri uno strumento per essere richiamabile dall'esecuzione del codice e Claude decide di utilizzare quello strumento:
tool_useQuesto approccio è particolarmente utile per:
Gli strumenti personalizzati vengono convertiti in funzioni Python asincrone per supportare le chiamate di strumenti parallele. Quando Claude scrive codice che chiama i tuoi strumenti, utilizza await (ad es., result = await query_database("<sql>")) e include automaticamente la funzione wrapper asincrona appropriata.
Il wrapper asincrono è omesso dagli esempi di codice in questa documentazione per chiarezza.
allowed_callersIl campo allowed_callers specifica quali contesti possono invocare uno strumento:
{
"name": "query_database",
"description": "Execute a SQL query against the database",
"input_schema": {
// ...
},
"allowed_callers": ["code_execution_20260120"]
}Valori possibili:
["direct"] - Solo Claude può chiamare questo strumento direttamente (predefinito se omesso)["code_execution_20260120"] - Richiamabile solo dall'interno dell'esecuzione del codice["direct", "code_execution_20260120"] - Richiamabile sia direttamente che dall'esecuzione del codiceScegli ["direct"] o ["code_execution_20260120"] per ogni strumento piuttosto che abilitare entrambi, poiché ciò fornisce una guida più chiara a Claude su come utilizzare al meglio lo strumento.
caller nelle risposteOgni blocco di utilizzo dello strumento include un campo caller che indica come è stato invocato:
Invocazione diretta (utilizzo tradizionale dello strumento):
{
"type": "tool_use",
"id": "toolu_abc123",
"name": "query_database",
"input": { "sql": "<sql>" },
"caller": { "type": "direct" }
}Invocazione programmatica:
{
"type": "tool_use",
"id": "toolu_xyz789",
"name": "query_database",
"input": { "sql": "<sql>" },
"caller": {
"type": "code_execution_20260120",
"tool_id": "srvtoolu_abc123"
}
}Il tool_id fa riferimento allo strumento di esecuzione del codice che ha effettuato la chiamata programmatica.
Programmatic tool calling utilizza gli stessi contenitori dell'esecuzione del codice:
containerQuando uno strumento viene chiamato programmaticamente e il contenitore è in attesa del risultato dello strumento, devi rispondere prima che il contenitore scada. Monitora il campo expires_at. Se il contenitore scade, Claude potrebbe trattare la chiamata dello strumento come scaduta e riprovare.
Ecco come funziona un flusso di programmatic tool calling completo:
Invia una richiesta con esecuzione del codice e uno strumento che consente la chiamata programmatica. Per abilitare la chiamata programmatica, aggiungi il campo allowed_callers alla definizione dello strumento.
Fornisci descrizioni dettagliate del formato di output dello strumento nella descrizione dello strumento. Se specifichi che lo strumento restituisce JSON, Claude tenta di deserializzare ed elaborare il risultato nel codice. Più dettagli fornisci sullo schema di output, meglio Claude può gestire la risposta programmaticamente.
La forma della richiesta è identica all'esempio Avvio rapido: includi code_execution nell'elenco dei tuoi strumenti, aggiungi allowed_callers: ["code_execution_20260120"] a qualsiasi strumento che desideri che Claude invochi dal codice e invia il tuo messaggio utente.
Claude scrive codice che chiama il tuo strumento. L'API si interrompe e restituisce:
{
"role": "assistant",
"content": [
{
"type": "text",
"text": "I'll query the purchase history and analyze the results."
},
{
"type": "server_tool_use",
"id": "srvtoolu_abc123",
"name": "code_execution",
"input": {
"code": "results = await query_database('<sql>')\ntop_customers = sorted(results, key=lambda x: x['revenue'], reverse=True)[:5]\nprint(f'Top 5 customers: {top_customers}')"
}
},
{
"type": "tool_use",
"id": "toolu_def456",
"name": "query_database",
"input": { "sql": "<sql>" },
"caller": {
"type": "code_execution_20260120",
"tool_id": "srvtoolu_abc123"
}
}
],
"container": {
"id": "container_xyz789",
"expires_at": "2025-01-15T14:30:00Z"
},
"stop_reason": "tool_use"
}Includi la cronologia completa della conversazione più il risultato dello strumento:
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=4096,
container="container_xyz789", # Reuse the container
messages=[
{
"role": "user",
"content": "Query customer purchase history from the last quarter and identify our top 5 customers by revenue",
},
{
"role": "assistant",
"content": [
{
"type": "text",
"text": "I'll query the purchase history and analyze the results.",
},
{
"type": "server_tool_use",
"id": "srvtoolu_abc123",
"name": "code_execution",
"input": {"code": "..."},
},
{
"type": "tool_use",
"id": "toolu_def456",
"name": "query_database",
"input": {"sql": "<sql>"},
"caller": {
"type": "code_execution_20260120",
"tool_id": "srvtoolu_abc123",
},
},
],
},
{
"role": "user",
"content": [
{
"type": "tool_result",
"tool_use_id": "toolu_def456",
"content": '[{"customer_id": "C1", "revenue": 45000}, {"customer_id": "C2", "revenue": 38000}, ...]',
}
],
},
],
tools=[...],
)
print(response)L'esecuzione del codice continua ed elabora i risultati. Se sono necessarie ulteriori chiamate dello strumento, ripeti il Passaggio 3 fino a quando tutte le chiamate dello strumento non sono soddisfatte.
Una volta completata l'esecuzione del codice, Claude fornisce la risposta finale:
{
"content": [
{
"type": "code_execution_tool_result",
"tool_use_id": "srvtoolu_abc123",
"content": {
"type": "code_execution_result",
"stdout": "Top 5 customers by revenue:\n1. Customer C1: $45,000\n2. Customer C2: $38,000\n3. Customer C5: $32,000\n4. Customer C8: $28,500\n5. Customer C3: $24,000",
"stderr": "",
"return_code": 0,
"content": []
}
},
{
"type": "text",
"text": "I've analyzed the purchase history from last quarter. Your top 5 customers generated $167,500 in total revenue, with Customer C1 leading at $45,000."
}
],
"stop_reason": "end_turn"
}Claude può scrivere codice che elabora più elementi in modo efficiente:
async def _claude_code():
regions = ["West", "East", "Central", "North", "South"]
results = {}
for region in regions:
data = await query_database(f"<sql for {region}>")
results[region] = sum(row["revenue"] for row in data)
# Process results programmatically
top_region = max(results.items(), key=lambda x: x[1])
print(f"Top region: {top_region[0]} with ${top_region[1]:,} in revenue")
Questo modello:
Claude può interrompere l'elaborazione non appena vengono soddisfatti i criteri di successo:
async def _claude_code():
endpoints = ["us-east", "eu-west", "apac"]
for endpoint in endpoints:
status = await check_health(endpoint)
if status == "healthy":
print(f"Found healthy endpoint: {endpoint}")
break # Stop early, don't check remaining
async def _claude_code():
file_info = await get_file_info(path)
if file_info["size"] < 10000:
content = await read_full_file(path)
else:
content = await read_file_summary(path)
print(content)
async def _claude_code():
logs = await fetch_logs(server_id)
errors = [log for log in logs if "ERROR" in log]
print(f"Found {len(errors)} errors")
for error in errors[-10:]: # Only return last 10 errors
print(error)
Quando l'esecuzione del codice chiama uno strumento:
{
"type": "tool_use",
"id": "toolu_abc123",
"name": "query_database",
"input": { "sql": "<sql>" },
"caller": {
"type": "code_execution_20260120",
"tool_id": "srvtoolu_xyz789"
}
}Il risultato dello strumento viene passato al codice in esecuzione:
{
"role": "user",
"content": [
{
"type": "tool_result",
"tool_use_id": "toolu_abc123",
"content": "[{\"customer_id\": \"C1\", \"revenue\": 45000, \"orders\": 23}, {\"customer_id\": \"C2\", \"revenue\": 38000, \"orders\": 18}, ...]"
}
]
}Quando tutte le chiamate dello strumento sono soddisfatte e il codice si completa:
{
"type": "code_execution_tool_result",
"tool_use_id": "srvtoolu_xyz789",
"content": {
"type": "code_execution_result",
"stdout": "Analysis complete. Top 5 customers identified from 847 total records.",
"stderr": "",
"return_code": 0,
"content": []
}
}| Errore | Descrizione | Soluzione |
|---|---|---|
invalid_tool_input | L'input dello strumento non corrisponde allo schema | Convalida l'input_schema dello strumento |
tool_not_allowed | Lo strumento non consente il tipo di chiamante richiesto | Verifica che allowed_callers includa i contesti corretti |
missing_beta_header | Intestazione beta richiesta non fornita (solo Bedrock e Vertex AI; la chiamata dello strumento programmatica è GA sull'API Claude di prima parte) | Aggiungi gli intestazioni beta richiesti alla tua richiesta |
Se lo strumento impiega troppo tempo per rispondere, l'esecuzione del codice riceve un TimeoutError. Claude lo vede in stderr e in genere riprova:
{
"type": "code_execution_tool_result",
"tool_use_id": "srvtoolu_abc123",
"content": {
"type": "code_execution_result",
"stdout": "",
"stderr": "TimeoutError: Calling tool ['query_database'] timed out.",
"return_code": 0,
"content": []
}
}Per prevenire i timeout:
expires_at nelle risposteSe lo strumento restituisce un errore:
{
"type": "tool_result",
"tool_use_id": "toolu_abc123",
"content": "Error: Query timeout - table lock exceeded 30 seconds"
}Il codice di Claude riceve questo errore e può gestirlo in modo appropriato.
strict: true non sono supportati con la chiamata programmaticatool_choicedisable_parallel_tool_use: true non è supportato con la chiamata programmaticaI seguenti strumenti attualmente non possono essere chiamati a livello di programmazione, ma il supporto potrebbe essere aggiunto nelle versioni future:
Quando rispondi alle chiamate dello strumento programmatico, ci sono requisiti di formattazione rigorosi:
Risposte solo con risultato dello strumento: Se ci sono chiamate dello strumento programmatico in sospeso in attesa di risultati, il tuo messaggio di risposta deve contenere solo blocchi tool_result. Non puoi includere alcun contenuto di testo, nemmeno dopo i risultati dello strumento.
Non valido - Non puoi includere testo quando rispondi alle chiamate dello strumento programmatico:
{
"role": "user",
"content": [
{
"type": "tool_result",
"tool_use_id": "toolu_01",
"content": "[{\"customer_id\": \"C1\", \"revenue\": 45000}]"
},
{ "type": "text", "text": "What should I do next?" }
]
}Valido - Solo risultati dello strumento quando rispondi alle chiamate dello strumento programmatico:
{
"role": "user",
"content": [
{
"type": "tool_result",
"tool_use_id": "toolu_01",
"content": "[{\"customer_id\": \"C1\", \"revenue\": 45000}]"
}
]
}Questa restrizione si applica solo quando rispondi alle chiamate dello strumento programmatico (esecuzione del codice). Per le normali chiamate dello strumento lato client, puoi includere contenuto di testo dopo i risultati dello strumento.
Le chiamate dello strumento programmatico sono soggette agli stessi limiti di velocità delle normali chiamate dello strumento. Ogni chiamata dello strumento dall'esecuzione del codice conta come una separata invocazione.
Quando implementi strumenti definiti dall'utente che verranno chiamati a livello di programmazione:
La chiamata dello strumento programmatico può ridurre significativamente il consumo di token:
Ad esempio, chiamare 10 strumenti direttamente utilizza ~10 volte i token di chiamarli a livello di programmazione e restituire un riepilogo.
La chiamata dello strumento programmatico utilizza gli stessi prezzi dell'esecuzione del codice. Vedi i prezzi di esecuzione del codice per i dettagli.
Conteggio dei token per le chiamate dello strumento programmatico: I risultati dello strumento dalle invocazioni programmatiche non contano verso l'utilizzo dei token di input/output. Solo il risultato finale dell'esecuzione del codice e la risposta di Claude contano.
Buoni casi d'uso:
Casi d'uso meno ideali:
Errore "Tool not allowed"
"allowed_callers": ["code_execution_20260120"]Scadenza del contenitore
expires_at nelle risposteRisultato dello strumento non analizzato correttamente
caller per confermare l'invocazione programmaticaL'addestramento di Claude include un'ampia esposizione al codice, il che lo rende efficace nel ragionare attraverso e concatenare le chiamate di funzione. Quando gli strumenti vengono presentati come funzioni richiamabili all'interno di un ambiente di esecuzione del codice, Claude può sfruttare questa forza per:
Questo approccio abilita flussi di lavoro che sarebbero impraticabili con l'uso dello strumento tradizionale (come l'elaborazione di file oltre 1M token) consentendo a Claude di lavorare con i dati a livello di programmazione piuttosto che caricare tutto nella finestra di contesto della conversazione.
La chiamata dello strumento programmatico è un modello generalizzabile che può essere implementato al di fuori dell'esecuzione del codice gestito di Anthropic. Ecco una panoramica degli approcci:
Fornisci a Claude uno strumento di esecuzione del codice e descrivi quali funzioni sono disponibili in quell'ambiente. Quando Claude richiama lo strumento con il codice, la tua applicazione lo esegue localmente dove quelle funzioni sono definite.
Vantaggi:
Svantaggi:
Usa quando: La tua applicazione può eseguire in modo sicuro codice arbitrario, desideri una soluzione semplice e l'offerta gestita di Anthropic non si adatta alle tue esigenze.
Lo stesso approccio dal punto di vista di Claude, ma il codice viene eseguito in un contenitore in sandbox con restrizioni di sicurezza (ad es. nessun egresso di rete). Se i tuoi strumenti richiedono risorse esterne, avrai bisogno di un protocollo per eseguire le chiamate dello strumento al di fuori della sandbox.
Vantaggi:
Svantaggi:
Usa quando: La sicurezza è critica e la soluzione gestita di Anthropic non si adatta alle tue esigenze.
La chiamata dello strumento programmatico di Anthropic è una versione gestita dell'esecuzione in sandbox con un ambiente Python opinato ottimizzato per Claude. Anthropic gestisce la gestione dei contenitori, l'esecuzione del codice e la comunicazione sicura dell'invocazione dello strumento.
Vantaggi:
Considera di utilizzare la soluzione gestita di Anthropic se stai utilizzando l'API Claude.
La chiamata dello strumento programmatico è costruita sull'infrastruttura di esecuzione del codice e utilizza gli stessi contenitori sandbox. I dati del contenitore, inclusi gli artefatti di esecuzione e gli output, vengono conservati per un massimo di 30 giorni.
Per l'idoneità ZDR in tutte le funzioni, vedi Conservazione dell'API e dei dati.
Scopri la capacità di esecuzione del codice sottostante che alimenta la chiamata dello strumento programmatico.
Comprendi i fondamenti dell'uso dello strumento con Claude.
Guida passo dopo passo per definire gli strumenti.
Was this page helpful?