Was this page helpful?
This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
Il parametro effort ti consente di controllare quanto Claude è disposto a spendere token quando risponde alle richieste. Questo ti dà la possibilità di bilanciare tra la completezza della risposta e l'efficienza dei token, il tutto con un singolo modello. Il parametro effort è generalmente disponibile su tutti i modelli supportati senza richiedere un header beta.
Il parametro effort è supportato da Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6, e Claude Opus 4.5.
Per Claude Opus 4.6 e Sonnet 4.6, effort sostituisce budget_tokens come modo consigliato per controllare la profondità del pensiero. Combina effort con adaptive thinking (thinking: {type: "adaptive"}) per la migliore esperienza. Mentre budget_tokens è ancora accettato su Opus 4.6 e Sonnet 4.6, è deprecato e sarà rimosso in una futura versione del modello. A high (predefinito) e max effort, Claude quasi sempre penserà. A livelli di effort inferiori, potrebbe saltare il pensiero per problemi più semplici.
Per impostazione predefinita, Claude utilizza high effort, spendendo quanti token necessari per risultati eccellenti. Puoi aumentare il livello di effort a max per la massima capacità assoluta, oppure abbassarlo per essere più conservatore con l'utilizzo dei token, ottimizzando per velocità e costo accettando una riduzione nella capacità.
Impostare effort a "high" produce esattamente lo stesso comportamento di omettere completamente il parametro effort.
Il parametro effort influisce su tutti i token nella risposta, inclusi:
Questo approccio ha due vantaggi principali:
| Livello | Descrizione | Caso d'uso tipico |
|---|---|---|
max | Capacità massima assoluta senza vincoli sulla spesa di token. Disponibile su Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, e Claude Sonnet 4.6. | Attività che richiedono il ragionamento più profondo possibile e l'analisi più completa |
xhigh | Capacità estesa per lavori a lungo termine. Disponibile su Claude Opus 4.7. | Attività di codifica e agentic a lungo termine (oltre 30 minuti) con budget di token in milioni |
high | Capacità elevata. Equivalente a non impostare il parametro. | Ragionamento complesso, problemi di codifica difficili, attività agentic |
medium | Approccio equilibrato con risparmi di token moderati. | Attività agentic che richiedono un equilibrio tra velocità, costo e prestazioni |
low | Più efficiente. Risparmi di token significativi con una riduzione di capacità. |
Effort è un segnale comportamentale, non un budget di token rigoroso. A livelli di effort inferiori, Claude penserà comunque su problemi sufficientemente difficili, ma penserà meno di quanto farebbe a livelli di effort superiori per lo stesso problema.
Sonnet 4.6 ha come impostazione predefinita high effort. Imposta esplicitamente effort quando usi Sonnet 4.6 per evitare latenza inaspettata:
Inizia con xhigh per casi d'uso di codifica e agentic, e usa high come minimo per la maggior parte dei carichi di lavoro sensibili all'intelligenza. Scendi a medium per carichi di lavoro sensibili ai costi, oppure sali a max solo quando i tuoi eval mostrano spazio di manovra misurabile a xhigh.
L'impostazione predefinita dell'API è high. Per usare xhigh, imposta effort esplicitamente; il valore che passi sostituisce l'impostazione predefinita.
| Effort | Guida per Claude Opus 4.7 |
|---|---|
low | Efficiente, ma migliore per attività brevi e circoscritte. Abbina low con checklist esplicite se la tua attività ha più sezioni. |
medium | La sostituzione per il flusso di lavoro medio dove vuoi buoni risultati riducendo i costi. |
high | Casi d'uso avanzati che ancora necessitano di un equilibrio tra intelligenza e consumo di token. Questo è spesso il punto dolce che bilancia qualità ed efficienza dei token. |
xhigh | Il punto di partenza consigliato per il lavoro di codifica e agentic, e per attività esplorative come chiamate di strumenti ripetute, ricerca web dettagliata e ricerca di knowledge base. Aspettati un utilizzo di token significativamente più elevato rispetto a high. |
max | Riservato per problemi veramente di frontiera. Sulla maggior parte dei carichi di lavoro max aggiunge costi significativi per guadagni di qualità relativamente piccoli, e su alcuni compiti di output strutturato o meno sensibili all'intelligenza può portare a un eccesso di pensiero. |
Claude Opus 4.7 rispetta anche i livelli di effort più rigorosamente rispetto a Claude Opus 4.6, specialmente a low e medium. A livelli di effort inferiori, il modello circoscrive il suo lavoro a ciò che è stato chiesto piuttosto che andare oltre. Se osservi ragionamento superficiale su problemi complessi con Claude Opus 4.7, aumenta effort piuttosto che cercare di aggirarlo con il prompt. Se devi mantenere effort basso per la latenza, aggiungi una guida mirata come "Questo compito comporta ragionamento multi-step. Pensa attentamente prima di rispondere."
Quando esegui Claude Opus 4.7 a xhigh o max effort, imposta un grande max_tokens in modo che il modello abbia spazio per pensare e agire tra subagent e chiamate di strumenti. Iniziare con 64k token e sintonizzarsi da lì è un'impostazione predefinita ragionevole.
Quando usi strumenti, il parametro effort influisce sia sulle spiegazioni intorno alle chiamate di strumenti che sulle chiamate di strumenti stesse. I livelli di effort inferiori tendono a:
I livelli di effort superiori possono:
Il parametro effort funziona insieme al pensiero esteso. Il suo comportamento dipende dal modello:
thinking richiesta). thinking: {type: "disabled"} è rifiutato. Effort controlla la profondità del pensiero allo stesso modo di Opus 4.7 e Opus 4.6.thinking: {type: "adaptive"}), dove effort è il controllo consigliato per la profondità del pensiero. Il pensiero esteso manuale (thinking: {type: "enabled", budget_tokens: N}) non è più supportato su Opus 4.7; usa invece adaptive thinking con effort. A high, xhigh, e max effort, Claude quasi sempre pensa profondamente. A livelli inferiori, potrebbe saltare il pensiero per problemi più semplici.thinking: {type: "adaptive"}), dove effort è il controllo consigliato per la profondità del pensiero. Mentre budget_tokens è ancora accettato su Opus 4.6, è deprecato e sarà rimosso in una futura versione. A high e effort, Claude quasi sempre pensa profondamente. A livelli inferiori, potrebbe saltare il pensiero per problemi più semplici.Il parametro effort può essere utilizzato con o senza il pensiero esteso abilitato. Quando utilizzato senza pensiero, controlla comunque la spesa totale di token per risposte di testo e chiamate di strumenti.
high, ma il punto di partenza giusto dipende dal tuo modello e dal carico di lavoro.| Attività più semplici che necessitano della migliore velocità e dei costi più bassi, come i subagent |
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=4096,
messages=[
{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures",
}
],
output_config={"effort": "medium"},
)
print(response.content[0].text)maxthinking: {type: "enabled", budget_tokens: N}) è ancora funzionale ma deprecato.thinking: {type: "enabled", budget_tokens: N}), dove effort funziona insieme al budget di token di pensiero. Imposta il livello di effort per il tuo compito, quindi imposta il budget di token di pensiero in base alla complessità del compito.