Loading...
    • Costruisci
    • Admin
    • Modelli e prezzi
    • Client SDK
    • Riferimento API
    Search...
    ⌘K
    Primi passi
    Introduzione a ClaudeAvvio rapido
    Costruire con Claude
    Panoramica delle funzionalitàUtilizzo delle Messages APIGestione dei motivi di arresto
    Capacità del modello
    Ragionamento estesoRagionamento adattivoImpegnoModalità rapida (beta: anteprima di ricerca)Output strutturatiCitazioniMessaggi in streamingElaborazione batchRisultati di ricercaRifiuti in streamingSupporto multilingueEmbeddings
    Strumenti
    PanoramicaCome funziona l'uso degli strumentiStrumento di ricerca webStrumento di recupero webStrumento di esecuzione del codiceStrumento di memoriaStrumento BashStrumento di utilizzo del computerStrumento editor di testo
    Infrastruttura degli strumenti
    Ricerca strumentiChiamata programmatica degli strumentiStreaming granulare degli strumenti
    Gestione del contesto
    Finestre di contestoCompattazioneModifica del contestoCaching dei promptConteggio dei token
    Lavorare con i file
    Files APISupporto PDFImmagini e visione
    Skills
    PanoramicaAvvio rapidoBest practiceSkills per l'impresaSkills nell'API
    MCP
    Server MCP remotiConnettore MCP
    Prompt engineering
    PanoramicaBest practice per i promptStrumenti di prompting in Console
    Testa e valuta
    Definisci il successo e crea valutazioniUtilizzo dello strumento di valutazione in ConsoleRiduzione della latenza
    Rafforzare i guardrail
    Ridurre le allucinazioniAumentare la coerenza dell'outputMitigare i jailbreakRidurre la perdita di prompt
    Risorse
    Glossario
    Note di rilascio
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Capacità del modello

    Effort

    Controlla quanti token Claude utilizza quando risponde con il parametro effort, bilanciando tra la completezza della risposta e l'efficienza dei token.

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    Il parametro effort ti consente di controllare quanto Claude è disposto a spendere token quando risponde alle richieste. Questo ti dà la possibilità di bilanciare tra la completezza della risposta e l'efficienza dei token, il tutto con un singolo modello. Il parametro effort è generalmente disponibile su tutti i modelli supportati senza richiedere un header beta.

    Il parametro effort è supportato da Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6 e Claude Opus 4.5.

    Per Claude Opus 4.6 e Sonnet 4.6, effort sostituisce budget_tokens come modo consigliato per controllare la profondità del thinking. Combina effort con adaptive thinking (thinking: {type: "adaptive"}) per la migliore esperienza. Mentre budget_tokens è ancora accettato su Opus 4.6 e Sonnet 4.6, è deprecato e verrà rimosso in una futura versione del modello. A high (predefinito) e max effort, Claude quasi sempre pensa. A livelli di effort inferiori, potrebbe saltare il thinking per problemi più semplici.

    Come funziona effort

    Per impostazione predefinita, Claude utilizza high effort, spendendo quanti token necessari per risultati eccellenti. Puoi aumentare il livello di effort a max per la massima capacità assoluta, oppure abbassarlo per essere più conservatore con l'utilizzo dei token, ottimizzando per velocità e costo accettando una riduzione della capacità.

    Impostare effort a "high" produce esattamente lo stesso comportamento di omettere completamente il parametro effort.

    Il parametro effort influisce su tutti i token nella risposta, inclusi:

    • Risposte di testo e spiegazioni
    • Chiamate di strumenti e argomenti di funzioni
    • Extended thinking (quando abilitato)

    Questo approccio ha due vantaggi principali:

    1. Non richiede che il thinking sia abilitato per utilizzarlo.
    2. Può influire su tutta la spesa di token incluse le chiamate di strumenti. Ad esempio, uno sforzo inferiore significherebbe che Claude effettua meno chiamate di strumenti. Questo dà un grado molto maggiore di controllo sull'efficienza.

    Livelli di effort

    LivelloDescrizioneCaso d'uso tipico
    maxCapacità massima assoluta senza vincoli sulla spesa di token. Disponibile su Claude Mythos Preview, Claude Opus 4.6 e Claude Sonnet 4.6.Attività che richiedono il ragionamento più profondo possibile e l'analisi più completa
    highAlta capacità. Equivalente a non impostare il parametro.Ragionamento complesso, problemi di codifica difficili, attività agentiche
    mediumApproccio equilibrato con risparmi di token moderati.Attività agentiche che richiedono un equilibrio tra velocità, costo e prestazioni
    lowPiù efficiente. Risparmi di token significativi con una riduzione della capacità.Attività più semplici che necessitano della migliore velocità e dei costi più bassi, come i subagent

    Effort è un segnale comportamentale, non un budget di token rigoroso. A livelli di effort inferiori, Claude continuerà comunque a pensare su problemi sufficientemente difficili, ma penserà meno di quanto farebbe a livelli di effort superiori per lo stesso problema.

    Livelli di effort consigliati per Sonnet 4.6

    Sonnet 4.6 ha come impostazione predefinita high effort. Imposta esplicitamente effort quando utilizzi Sonnet 4.6 per evitare latenza inaspettata:

    • Medium effort (predefinito consigliato): Miglior equilibrio tra velocità, costo e prestazioni per la maggior parte delle applicazioni. Adatto per codifica agentiche, flussi di lavoro ricchi di strumenti e generazione di codice.
    • Low effort: Per carichi di lavoro ad alto volume o sensibili alla latenza. Adatto per chat e casi d'uso non di codifica dove è prioritaria una risposta più veloce.
    • High effort: Per attività che richiedono la massima intelligenza da Sonnet 4.6.
    • Max effort: Per attività che richiedono la capacità assoluta più alta senza vincoli sulla spesa di token.

    Utilizzo di base

    curl https://api.anthropic.com/v1/messages \
        --header "x-api-key: $ANTHROPIC_API_KEY" \
        --header "anthropic-version: 2023-06-01" \
        --header "content-type: application/json" \
        --data '{
            "model": "claude-opus-4-6",
            "max_tokens": 4096,
            "messages": [{
                "role": "user",
                "content": "Analyze the trade-offs between microservices and monolithic architectures"
            }],
            "output_config": {
                "effort": "medium"
            }
        }'

    Quando regolare il parametro effort

    • Usa max effort quando hai bisogno della capacità assoluta più alta senza vincoli: il ragionamento più completo e l'analisi più profonda. Disponibile su Claude Mythos Preview, Claude Opus 4.6 e Claude Sonnet 4.6.
    • Usa high effort (il predefinito) quando hai bisogno del miglior lavoro di Claude: ragionamento complesso, analisi sfumata, problemi di codifica difficili, o qualsiasi attività dove la qualità è la priorità principale.
    • Usa medium effort come opzione equilibrata quando vuoi prestazioni solide senza la piena spesa di token di high effort.
    • Usa low effort quando stai ottimizzando per velocità (perché Claude risponde con meno token) o costo. Ad esempio, semplici attività di classificazione, ricerche rapide, o casi d'uso ad alto volume dove miglioramenti marginali della qualità non giustificano latenza aggiuntiva o spesa.

    Effort con l'uso di strumenti

    Quando utilizzi strumenti, il parametro effort influisce sia sulle spiegazioni intorno alle chiamate di strumenti che sulle chiamate di strumenti stesse. I livelli di effort inferiori tendono a:

    • Combinare più operazioni in meno chiamate di strumenti
    • Effettuare meno chiamate di strumenti
    • Procedere direttamente all'azione senza preambolo
    • Utilizzare messaggi di conferma concisi dopo il completamento

    I livelli di effort superiori possono:

    • Effettuare più chiamate di strumenti
    • Spiegare il piano prima di intraprendere un'azione
    • Fornire riepiloghi dettagliati dei cambiamenti
    • Includere commenti di codice più completi

    Effort con extended thinking

    Il parametro effort funziona insieme a extended thinking. Il suo comportamento dipende dal modello:

    • Claude Mythos Preview utilizza adaptive thinking per impostazione predefinita (nessuna configurazione thinking richiesta). thinking: {type: "disabled"} è rifiutato. Effort controlla la profondità del thinking allo stesso modo di Opus 4.6.
    • Claude Opus 4.6 utilizza adaptive thinking (thinking: {type: "adaptive"}), dove effort è il controllo consigliato per la profondità del thinking. Mentre budget_tokens è ancora accettato su Opus 4.6, è deprecato e verrà rimosso in una futura versione. A high e max effort, Claude quasi sempre pensa profondamente. A livelli inferiori, potrebbe saltare il thinking per problemi più semplici.
    • Claude Sonnet 4.6 utilizza adaptive thinking (dove effort controlla la profondità del thinking). Il thinking manuale con modalità interleaved (thinking: {type: "enabled", budget_tokens: N}) è ancora funzionale ma deprecato.
    • Claude Opus 4.5 e altri modelli Claude 4 utilizzano il thinking manuale (thinking: {type: "enabled", budget_tokens: N}), dove effort funziona insieme al budget di token di thinking. Imposta il livello di effort per la tua attività, quindi imposta il budget di token di thinking in base alla complessità dell'attività.

    Il parametro effort può essere utilizzato con o senza extended thinking abilitato. Quando utilizzato senza thinking, controlla comunque la spesa totale di token per risposte di testo e chiamate di strumenti.

    Best practice

    1. Imposta effort esplicitamente: L'API ha come impostazione predefinita high, ma il punto di partenza giusto dipende dal tuo modello e dal carico di lavoro.
    2. Usa low per attività sensibili alla velocità o semplici: Quando la latenza è importante o le attività sono semplici, low effort può ridurre significativamente i tempi di risposta e i costi.
    3. Testa il tuo caso d'uso: L'impatto dei livelli di effort varia in base al tipo di attività. Valuta le prestazioni sui tuoi casi d'uso specifici prima di distribuire.
    4. Considera effort dinamico: Regola effort in base alla complessità dell'attività. Le query semplici potrebbero giustificare low effort mentre la codifica agentiche e il ragionamento complesso beneficiano di high effort.

    Was this page helpful?

    • Come funziona effort
    • Livelli di effort
    • Livelli di effort consigliati per Sonnet 4.6
    • Utilizzo di base
    • Quando regolare il parametro effort
    • Effort con l'uso di strumenti
    • Effort con extended thinking
    • Best practice