Il parametro effort ti consente di controllare quanto Claude sia disposto a spendere token quando risponde alle richieste. Questo ti dà la possibilità di bilanciare tra completezza della risposta ed efficienza dei token, il tutto con un singolo modello.
Il parametro effort è attualmente in beta ed è supportato solo da Claude Opus 4.5.
Devi includere l'intestazione beta effort-2025-11-24 quando utilizzi questa funzione.
Per impostazione predefinita, Claude utilizza il massimo sforzo, spendendo quanti token necessari per fornire risposte approfondite. Abbassando il livello di effort, puoi istruire Claude a essere più conservatore nell'utilizzo dei token, trattando i token come una risorsa più costosa.
Impostare effort a "high" produce esattamente lo stesso comportamento di omettere completamente il parametro effort.
Il parametro effort influisce su tutti i token nella risposta, inclusi:
| Livello | Descrizione | Caso d'uso tipico |
|---|---|---|
high | Massima completezza—Claude utilizza quanti token necessari. Equivalente a non impostare il parametro. | Analisi complessa, spiegazioni dettagliate, contenuti educativi |
medium | Approccio equilibrato con risparmi di token moderati. | La maggior parte dei casi di produzione, applicazioni consapevoli dei costi |
low | Risposte più efficienti in termini di token. | Automazione ad alto volume, query semplici, quando le risposte vengono elaborate programmaticamente |
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)Il parametro effort controlla principalmente la verbosità dell'output e la profondità della spiegazione, non la correttezza della risposta. Claude esegue un ragionamento interno simile indipendentemente dal livello di effort, ma regola quanto di quel ragionamento appare nell'output.
Quando si utilizzano strumenti, il parametro effort influisce sia sulle spiegazioni intorno alle chiamate di strumenti che sulle chiamate di strumenti stesse. I livelli di effort inferiore tendono a:
I livelli di effort superiore possono:
Il parametro effort funziona insieme al budget di token di pensiero quando il pensiero esteso è abilitato. Questi due controlli servono scopi diversi:
Il parametro effort può essere utilizzato con o senza il pensiero esteso abilitato. Quando entrambi sono configurati:
Per le migliori prestazioni su compiti di ragionamento complesso, utilizza alto effort (l'impostazione predefinita) con un budget di token di pensiero elevato. Questo consente a Claude di pensare a fondo e fornire risposte complete.
Inizia con medium: Per la maggior parte delle applicazioni, medium effort fornisce un buon equilibrio tra qualità ed efficienza.
Usa low per l'automazione: Quando le risposte vengono consumate dal codice piuttosto che da umani, low effort può ridurre significativamente i costi senza influire sulla correttezza.
Testa il tuo caso d'uso: L'impatto dei livelli di effort varia in base al tipo di compito. Valuta le prestazioni sui tuoi casi d'uso specifici prima di distribuire.
Monitora la qualità: Mentre la correttezza è generalmente preservata tra i livelli di effort, la qualità della spiegazione varia. Assicurati che il livello che scegli soddisfi le esigenze dei tuoi utenti.
Considera effort dinamico: Regola l'effort in base alla complessità del compito o alla preferenza dell'utente. Le query semplici possono giustificare low effort mentre l'analisi complessa beneficia di alto effort.