This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
Il parametro effort ti consente di controllare quanto Claude è disposto a spendere token quando risponde alle richieste. Questo ti dà la possibilità di bilanciare tra la completezza della risposta e l'efficienza dei token, il tutto con un singolo modello. Il parametro effort è generalmente disponibile su tutti i modelli supportati senza richiedere un header beta.
Il parametro effort è supportato da Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6 e Claude Opus 4.5.
Per Claude Opus 4.6 e Sonnet 4.6, effort sostituisce budget_tokens come modo consigliato per controllare la profondità del thinking. Combina effort con adaptive thinking (thinking: {type: "adaptive"}) per la migliore esperienza. Mentre budget_tokens è ancora accettato su Opus 4.6 e Sonnet 4.6, è deprecato e verrà rimosso in una futura versione del modello. A high (predefinito) e max effort, Claude quasi sempre pensa. A livelli di effort inferiori, potrebbe saltare il thinking per problemi più semplici.
Per impostazione predefinita, Claude utilizza high effort, spendendo quanti token necessari per risultati eccellenti. Puoi aumentare il livello di effort a max per la massima capacità assoluta, oppure abbassarlo per essere più conservatore con l'utilizzo dei token, ottimizzando per velocità e costo accettando una riduzione della capacità.
Impostare effort a "high" produce esattamente lo stesso comportamento di omettere completamente il parametro effort.
Il parametro effort influisce su tutti i token nella risposta, inclusi:
Questo approccio ha due vantaggi principali:
| Livello | Descrizione | Caso d'uso tipico |
|---|---|---|
max | Capacità massima assoluta senza vincoli sulla spesa di token. Disponibile su Claude Mythos Preview, Claude Opus 4.6 e Claude Sonnet 4.6. | Attività che richiedono il ragionamento più profondo possibile e l'analisi più completa |
high | Alta capacità. Equivalente a non impostare il parametro. | Ragionamento complesso, problemi di codifica difficili, attività agentiche |
medium | Approccio equilibrato con risparmi di token moderati. | Attività agentiche che richiedono un equilibrio tra velocità, costo e prestazioni |
low | Più efficiente. Risparmi di token significativi con una riduzione della capacità. | Attività più semplici che necessitano della migliore velocità e dei costi più bassi, come i subagent |
Effort è un segnale comportamentale, non un budget di token rigoroso. A livelli di effort inferiori, Claude continuerà comunque a pensare su problemi sufficientemente difficili, ma penserà meno di quanto farebbe a livelli di effort superiori per lo stesso problema.
Sonnet 4.6 ha come impostazione predefinita high effort. Imposta esplicitamente effort quando utilizzi Sonnet 4.6 per evitare latenza inaspettata:
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-6",
"max_tokens": 4096,
"messages": [{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
"output_config": {
"effort": "medium"
}
}'Quando utilizzi strumenti, il parametro effort influisce sia sulle spiegazioni intorno alle chiamate di strumenti che sulle chiamate di strumenti stesse. I livelli di effort inferiori tendono a:
I livelli di effort superiori possono:
Il parametro effort funziona insieme a extended thinking. Il suo comportamento dipende dal modello:
thinking richiesta). thinking: {type: "disabled"} è rifiutato. Effort controlla la profondità del thinking allo stesso modo di Opus 4.6.thinking: {type: "adaptive"}), dove effort è il controllo consigliato per la profondità del thinking. Mentre budget_tokens è ancora accettato su Opus 4.6, è deprecato e verrà rimosso in una futura versione. A high e max effort, Claude quasi sempre pensa profondamente. A livelli inferiori, potrebbe saltare il thinking per problemi più semplici.thinking: {type: "enabled", budget_tokens: N}) è ancora funzionale ma deprecato.thinking: {type: "enabled", budget_tokens: N}), dove effort funziona insieme al budget di token di thinking. Imposta il livello di effort per la tua attività, quindi imposta il budget di token di thinking in base alla complessità dell'attività.Il parametro effort può essere utilizzato con o senza extended thinking abilitato. Quando utilizzato senza thinking, controlla comunque la spesa totale di token per risposte di testo e chiamate di strumenti.
high, ma il punto di partenza giusto dipende dal tuo modello e dal carico di lavoro.Was this page helpful?