Il parametro effort ti consente di controllare quanto Claude è disposto a spendere token quando risponde alle richieste. Questo ti dà la possibilità di bilanciare tra completezza della risposta ed efficienza dei token, il tutto con un singolo modello. Il parametro effort è generalmente disponibile su tutti i modelli supportati senza richiedere un header beta.
Il parametro effort è supportato da Claude Opus 4.6 e Claude Opus 4.5.
Per Claude Opus 4.6, effort sostituisce budget_tokens come modo consigliato per controllare la profondità del pensiero. Combina effort con adaptive thinking (thinking: {type: "adaptive"}) per la migliore esperienza. Mentre budget_tokens è ancora accettato su Opus 4.6, è deprecato e verrà rimosso in una futura versione del modello. A high (predefinito) e max effort, Claude quasi sempre penserà. A livelli di effort inferiori, potrebbe saltare il pensiero per problemi più semplici.
Per impostazione predefinita, Claude utilizza high effort—spendendo quanti token necessari per risultati eccellenti. Puoi aumentare il livello di effort a max per la massima capacità assoluta, oppure abbassarlo per essere più conservatore con l'utilizzo dei token, ottimizzando per velocità e costo accettando una riduzione della capacità.
Impostare effort a "high" produce esattamente lo stesso comportamento di omettere completamente il parametro effort.
Il parametro effort influisce su tutti i token nella risposta, inclusi:
Questo approccio ha due vantaggi principali:
| Livello | Descrizione | Caso d'uso tipico |
|---|---|---|
max | Capacità massima assoluta senza vincoli sulla spesa di token. Solo Opus 4.6 — le richieste che utilizzano max su altri modelli restituiranno un errore. | Attività che richiedono il ragionamento più profondo possibile e l'analisi più completa |
high | Alta capacità. Equivalente a non impostare il parametro. | Ragionamento complesso, problemi di codifica difficili, attività agentiche |
medium | Approccio equilibrato con risparmi di token moderati. | Attività agentiche che richiedono un equilibrio tra velocità, costo e prestazioni |
low | Più efficiente. Risparmi di token significativi con una riduzione della capacità. | Attività più semplici che necessitano della migliore velocità e dei costi più bassi, come i subagenti |
Effort è un segnale comportamentale, non un budget di token rigoroso. A livelli di effort inferiori, Claude penserà comunque su problemi sufficientemente difficili — penserà semplicemente meno di quanto farebbe a livelli di effort superiori per lo stesso problema.
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)max su altri modelli restituiranno un errore.Quando si utilizzano strumenti, il parametro effort influisce sia sulle spiegazioni intorno alle chiamate di strumenti che sulle chiamate di strumenti stesse. I livelli di effort inferiori tendono a:
I livelli di effort superiori possono:
Il parametro effort funziona insieme al pensiero esteso. Il suo comportamento dipende dal modello:
thinking: {type: "adaptive"}), dove effort è il controllo consigliato per la profondità del pensiero. Mentre budget_tokens è ancora accettato su Opus 4.6, è deprecato e verrà rimosso in una futura versione. A high e max effort, Claude quasi sempre pensa profondamente. A livelli inferiori, potrebbe saltare il pensiero per problemi più semplici.thinking: {type: "enabled", budget_tokens: N}), dove effort funziona insieme al budget dei token di pensiero. Imposta il livello di effort per il tuo compito, quindi imposta il budget dei token di pensiero in base alla complessità del compito.Il parametro effort può essere utilizzato con o senza il pensiero esteso abilitato. Quando utilizzato senza pensiero, controlla comunque la spesa totale di token per risposte di testo e chiamate di strumenti.
Was this page helpful?