Effort
Il parametro effort ti consente di controllare quanto Claude sia disposto a spendere token quando risponde alle richieste. Questo ti dà la possibilità di bilanciare tra completezza della risposta ed efficienza dei token, il tutto con un singolo modello.
Il parametro effort è attualmente in beta ed è supportato solo da Claude Opus 4.5.
Devi includere l'intestazione beta effort-2025-11-24 quando utilizzi questa funzione.
Come funziona effort
Per impostazione predefinita, Claude utilizza il massimo sforzo, spendendo quanti token necessari per fornire risposte approfondite. Abbassando il livello di effort, puoi istruire Claude a essere più conservatore nell'utilizzo dei token, trattando i token come una risorsa più costosa.
Impostare effort a "high" produce esattamente lo stesso comportamento di omettere completamente il parametro effort.
Il parametro effort influisce su tutti i token nella risposta, inclusi:
- Risposte di testo e spiegazioni
- Chiamate di strumenti e argomenti di funzioni
- Pensiero esteso (quando abilitato)
Livelli di effort
| Livello | Descrizione | Caso d'uso tipico |
|---|---|---|
high | Massima completezza—Claude utilizza quanti token necessari. Equivalente a non impostare il parametro. | Analisi complessa, spiegazioni dettagliate, contenuti educativi |
medium | Approccio equilibrato con risparmi di token moderati. | La maggior parte dei casi di produzione, applicazioni consapevoli dei costi |
low | Risposte più efficienti in termini di token. | Automazione ad alto volume, query semplici, quando le risposte vengono elaborate programmaticamente |
Utilizzo di base
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)Comportamento per livello di effort
Il parametro effort controlla principalmente la verbosità dell'output e la profondità della spiegazione, non la correttezza della risposta. Claude esegue un ragionamento interno simile indipendentemente dal livello di effort, ma regola quanto di quel ragionamento appare nell'output.
Risposte con basso effort
- Risposta dichiarata direttamente con spiegazione minima
- Risposte concise ed efficienti (1-2 frasi di contesto)
- Formule mostrate ma non derivate
- Presuppone che il lettore possa verificare la risposta
- Conferme laconiche per l'uso di strumenti ("Fatto.", "Risolto.")
Risposte con effort medio
- Breve contesto prima della risposta
- Giustificazione concisa con passaggi intermedi chiave
- Può includere un esempio elaborato
- Ancora focalizzato sull'efficienza
Risposte con alto effort
- Strutturate con intestazioni di sezione
- Configurazione del problema e definizioni di variabili
- Processo di soluzione passo dopo passo
- Verifica e controlli di sanità mentale
- Formattazione markdown ricca
Casi d'uso
Quando usare basso effort
- Ottimizzazione della velocità: Conteggi di token inferiori significano tempi di risposta più veloci, vantaggiosi per applicazioni sensibili alla latenza
- Pipeline automatizzate: Quando le risposte vengono elaborate dal codice piuttosto che lette da umani
- Applicazioni ad alto volume: Riduci i costi su query routine e semplici
- Utenti esperti: Quando gli utenti non hanno bisogno di spiegazioni dettagliate
- Conferme rapide: Risposte semplici sì/no o di stato
Quando usare effort medio
- API di produzione: Equilibrio tra chiarezza ed efficienza dei costi
- Applicazioni rivolte agli utenti: Contesto sufficiente senza verbosità eccessiva
- Distribuzioni consapevoli dei costi: Risparmi significativi con impatto minimo sulla qualità
Quando usare alto effort (o nessun parametro effort)
- Analisi complessa: Quando la completezza è critica
- Contenuti educativi: Quando gli utenti hanno bisogno di comprendere il ragionamento
- Documentazione: Quando le risposte servono come materiale di riferimento
- Debug: Quando spiegazioni dettagliate aiutano a identificare i problemi
Effort con l'uso di strumenti
Quando si utilizzano strumenti, il parametro effort influisce sia sulle spiegazioni intorno alle chiamate di strumenti che sulle chiamate di strumenti stesse. I livelli di effort inferiore tendono a:
- Combinare più operazioni in meno chiamate di strumenti
- Procedere direttamente all'azione senza preambolo
- Utilizzare messaggi di conferma laconici dopo il completamento
I livelli di effort superiore possono:
- Spiegare il piano prima di intraprendere un'azione
- Fornire riepiloghi dettagliati dei cambiamenti
- Includere commenti di codice più completi
Effort con pensiero esteso
Il parametro effort funziona insieme al budget di token di pensiero quando il pensiero esteso è abilitato. Questi due controlli servono scopi diversi:
- Parametro effort: Controlla come Claude spende tutti i token—inclusi i token di pensiero, le risposte di testo e le chiamate di strumenti
- Budget di token di pensiero: Imposta un limite massimo sui token di pensiero specificamente
Il parametro effort può essere utilizzato con o senza il pensiero esteso abilitato. Quando entrambi sono configurati:
- Per prima cosa determina il livello di effort appropriato per il tuo compito
- Quindi imposta il budget di token di pensiero in base alla complessità del compito
Per le migliori prestazioni su compiti di ragionamento complesso, utilizza alto effort (l'impostazione predefinita) con un budget di token di pensiero elevato. Questo consente a Claude di pensare a fondo e fornire risposte complete.
Migliori pratiche
-
Inizia con medium: Per la maggior parte delle applicazioni, medium effort fornisce un buon equilibrio tra qualità ed efficienza.
-
Usa low per l'automazione: Quando le risposte vengono consumate dal codice piuttosto che da umani, low effort può ridurre significativamente i costi senza influire sulla correttezza.
-
Testa il tuo caso d'uso: L'impatto dei livelli di effort varia in base al tipo di compito. Valuta le prestazioni sui tuoi casi d'uso specifici prima di distribuire.
-
Monitora la qualità: Mentre la correttezza è generalmente preservata tra i livelli di effort, la qualità della spiegazione varia. Assicurati che il livello che scegli soddisfi le esigenze dei tuoi utenti.
-
Considera effort dinamico: Regola l'effort in base alla complessità del compito o alla preferenza dell'utente. Le query semplici possono giustificare low effort mentre l'analisi complessa beneficia di alto effort.