Il parametro effort ti consente di controllare quanto Claude sia disposto a spendere token quando risponde alle richieste. Questo ti dà la possibilità di bilanciare tra la completezza della risposta e l'efficienza dei token, il tutto con un singolo modello.
Il parametro effort è attualmente in beta ed è supportato solo da Claude Opus 4.5.
Devi includere l'intestazione beta effort-2025-11-24 quando utilizzi questa funzione.
Per impostazione predefinita, Claude utilizza il massimo sforzo, spendendo quanti token necessari per il miglior risultato possibile. Abbassando il livello di effort, puoi istruire Claude a essere più conservatore nell'utilizzo dei token, ottimizzando per velocità e costo accettando una riduzione di capacità.
Impostare effort a "high" produce esattamente lo stesso comportamento di omettere completamente il parametro effort.
Il parametro effort influisce su tutti i token nella risposta, inclusi:
Questo approccio ha due vantaggi principali:
| Livello | Descrizione | Caso d'uso tipico |
|---|---|---|
high | Massima capacità. Claude utilizza quanti token necessari per il miglior risultato possibile. Equivalente a non impostare il parametro. | Ragionamento complesso, problemi di codifica difficili, compiti agentici |
medium | Approccio equilibrato con risparmi di token moderati. | Compiti agentici che richiedono un equilibrio tra velocità, costo e prestazioni |
low | Più efficiente. Risparmi significativi di token con una riduzione di capacità. | Compiti più semplici che necessitano della migliore velocità e dei costi più bassi, come i subagenzi |
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)Quando si utilizzano strumenti, il parametro effort influisce sia sulle spiegazioni intorno alle chiamate di strumenti che sulle chiamate di strumenti stesse. I livelli di effort inferiori tendono a:
I livelli di effort superiori possono:
Il parametro effort funziona insieme al budget di token di pensiero quando il pensiero esteso è abilitato. Questi due controlli servono scopi diversi:
Il parametro effort può essere utilizzato con o senza il pensiero esteso abilitato. Quando entrambi sono configurati:
Per le migliori prestazioni su compiti di ragionamento complesso, usa high effort (il valore predefinito) con un budget di token di pensiero elevato. Questo consente a Claude di pensare a fondo e fornire risposte complete.