Loading...
    • Crea
    • Admin
    • Modelli e prezzi
    • SDK client
    • Riferimento API
    Search...
    ⌘K
    Primi passi
    Introduzione a ClaudeGuida rapida
    Creare con Claude
    Panoramica delle funzioniUtilizzo dell'API MessagesCompetenza Claude APIGestione dei motivi di arresto
    Capacità del modello
    Extended thinkingAdaptive thinkingEffortBudget attività (beta)Modalità veloce (beta: anteprima ricerca)Output strutturatiCitazioniStreaming MessagesElaborazione batchRisultati di ricercaStreaming rifiutiSupporto multilingueEmbeddings
    Strumenti
    PanoramicaCome funziona l'uso degli strumentiStrumento di ricerca webStrumento di recupero webStrumento di esecuzione codiceStrumento AdvisorStrumento MemoryStrumento BashStrumento Computer useStrumento editor di testo
    Infrastruttura degli strumenti
    Riferimento strumentiRicerca strumentiChiamata programmatica degli strumentiStreaming granulare degli strumenti
    Gestione del contesto
    Finestre di contestoCompattazioneModifica del contestoPrompt cachingConteggio token
    Utilizzo dei file
    API FilesSupporto PDFImmagini e visione
    Competenze
    PanoramicaGuida rapidaBest practiceCompetenze per l'aziendaCompetenze nell'API
    MCP
    Server MCP remotiConnettore MCP
    Prompt engineering
    PanoramicaBest practice per il promptStrumenti di prompt in Console
    Test e valutazione
    Definire il successo e creare valutazioniUtilizzo dello strumento di valutazione in ConsoleRiduzione della latenza
    Rafforzare le protezioni
    Ridurre le allucinazioniAumentare la coerenza dell'outputMitigare i jailbreakRidurre la perdita di prompt
    Risorse
    Glossario
    Note sulla versione
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Capacità del modello

    Effort

    Controlla quanti token Claude utilizza quando risponde con il parametro effort, bilanciando tra la completezza della risposta e l'efficienza dei token.

    Was this page helpful?

    • Come funziona effort
    • Livelli di effort
    • Livelli di effort consigliati per Sonnet 4.6
    • Livelli di effort consigliati per Claude Opus 4.7
    • Utilizzo di base
    • Quando regolare il parametro effort
    • Effort con l'uso di strumenti
    • Effort con il pensiero esteso
    • Best practice

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    Il parametro effort ti consente di controllare quanto Claude è disposto a spendere token quando risponde alle richieste. Questo ti dà la possibilità di bilanciare tra la completezza della risposta e l'efficienza dei token, il tutto con un singolo modello. Il parametro effort è generalmente disponibile su tutti i modelli supportati senza richiedere un header beta.

    Il parametro effort è supportato da Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6, e Claude Opus 4.5.

    Per Claude Opus 4.6 e Sonnet 4.6, effort sostituisce budget_tokens come modo consigliato per controllare la profondità del pensiero. Combina effort con adaptive thinking (thinking: {type: "adaptive"}) per la migliore esperienza. Mentre budget_tokens è ancora accettato su Opus 4.6 e Sonnet 4.6, è deprecato e sarà rimosso in una futura versione del modello. A high (predefinito) e max effort, Claude quasi sempre penserà. A livelli di effort inferiori, potrebbe saltare il pensiero per problemi più semplici.

    Come funziona effort

    Per impostazione predefinita, Claude utilizza high effort, spendendo quanti token necessari per risultati eccellenti. Puoi aumentare il livello di effort a max per la massima capacità assoluta, oppure abbassarlo per essere più conservatore con l'utilizzo dei token, ottimizzando per velocità e costo accettando una riduzione nella capacità.

    Impostare effort a "high" produce esattamente lo stesso comportamento di omettere completamente il parametro effort.

    Il parametro effort influisce su tutti i token nella risposta, inclusi:

    • Risposte di testo e spiegazioni
    • Chiamate di strumenti e argomenti di funzioni
    • Pensiero esteso (quando abilitato)

    Questo approccio ha due vantaggi principali:

    1. Non richiede che il pensiero sia abilitato per utilizzarlo.
    2. Può influire su tutta la spesa di token incluse le chiamate di strumenti. Ad esempio, uno sforzo inferiore significherebbe che Claude effettua meno chiamate di strumenti. Questo dà un grado molto maggiore di controllo sull'efficienza.

    Livelli di effort

    LivelloDescrizioneCaso d'uso tipico
    maxCapacità massima assoluta senza vincoli sulla spesa di token. Disponibile su Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, e Claude Sonnet 4.6.Attività che richiedono il ragionamento più profondo possibile e l'analisi più completa
    xhighCapacità estesa per lavori a lungo termine. Disponibile su Claude Opus 4.7.Attività di codifica e agentic a lungo termine (oltre 30 minuti) con budget di token in milioni
    highCapacità elevata. Equivalente a non impostare il parametro.Ragionamento complesso, problemi di codifica difficili, attività agentic
    mediumApproccio equilibrato con risparmi di token moderati.Attività agentic che richiedono un equilibrio tra velocità, costo e prestazioni
    lowPiù efficiente. Risparmi di token significativi con una riduzione di capacità.

    Effort è un segnale comportamentale, non un budget di token rigoroso. A livelli di effort inferiori, Claude penserà comunque su problemi sufficientemente difficili, ma penserà meno di quanto farebbe a livelli di effort superiori per lo stesso problema.

    Livelli di effort consigliati per Sonnet 4.6

    Sonnet 4.6 ha come impostazione predefinita high effort. Imposta esplicitamente effort quando usi Sonnet 4.6 per evitare latenza inaspettata:

    • Medium effort (predefinito consigliato): Miglior equilibrio di velocità, costo e prestazioni per la maggior parte delle applicazioni. Adatto per codifica agentic, flussi di lavoro ricchi di strumenti e generazione di codice.
    • Low effort: Per carichi di lavoro ad alto volume o sensibili alla latenza. Adatto per chat e casi d'uso non di codifica dove è prioritario un turnaround più veloce.
    • High effort: Per attività che richiedono l'intelligenza massima da Sonnet 4.6.
    • Max effort: Per attività che richiedono la capacità assoluta più elevata senza vincoli sulla spesa di token.

    Livelli di effort consigliati per Claude Opus 4.7

    Inizia con xhigh per casi d'uso di codifica e agentic, e usa high come minimo per la maggior parte dei carichi di lavoro sensibili all'intelligenza. Scendi a medium per carichi di lavoro sensibili ai costi, oppure sali a max solo quando i tuoi eval mostrano spazio di manovra misurabile a xhigh.

    L'impostazione predefinita dell'API è high. Per usare xhigh, imposta effort esplicitamente; il valore che passi sostituisce l'impostazione predefinita.

    EffortGuida per Claude Opus 4.7
    lowEfficiente, ma migliore per attività brevi e circoscritte. Abbina low con checklist esplicite se la tua attività ha più sezioni.
    mediumLa sostituzione per il flusso di lavoro medio dove vuoi buoni risultati riducendo i costi.
    highCasi d'uso avanzati che ancora necessitano di un equilibrio tra intelligenza e consumo di token. Questo è spesso il punto dolce che bilancia qualità ed efficienza dei token.
    xhighIl punto di partenza consigliato per il lavoro di codifica e agentic, e per attività esplorative come chiamate di strumenti ripetute, ricerca web dettagliata e ricerca di knowledge base. Aspettati un utilizzo di token significativamente più elevato rispetto a high.
    maxRiservato per problemi veramente di frontiera. Sulla maggior parte dei carichi di lavoro max aggiunge costi significativi per guadagni di qualità relativamente piccoli, e su alcuni compiti di output strutturato o meno sensibili all'intelligenza può portare a un eccesso di pensiero.

    Claude Opus 4.7 rispetta anche i livelli di effort più rigorosamente rispetto a Claude Opus 4.6, specialmente a low e medium. A livelli di effort inferiori, il modello circoscrive il suo lavoro a ciò che è stato chiesto piuttosto che andare oltre. Se osservi ragionamento superficiale su problemi complessi con Claude Opus 4.7, aumenta effort piuttosto che cercare di aggirarlo con il prompt. Se devi mantenere effort basso per la latenza, aggiungi una guida mirata come "Questo compito comporta ragionamento multi-step. Pensa attentamente prima di rispondere."

    Quando esegui Claude Opus 4.7 a xhigh o max effort, imposta un grande max_tokens in modo che il modello abbia spazio per pensare e agire tra subagent e chiamate di strumenti. Iniziare con 64k token e sintonizzarsi da lì è un'impostazione predefinita ragionevole.

    Utilizzo di base

    Quando regolare il parametro effort

    • Usa max effort quando hai bisogno della capacità assoluta più elevata senza vincoli: il ragionamento più completo e l'analisi più profonda. Disponibile su Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, e Claude Sonnet 4.6.
    • Usa xhigh effort per lavoro di codifica avanzato e agentic complesso che richiede esplorazione estesa, come chiamate di strumenti ripetute e ricerca dettagliata. Disponibile su Claude Opus 4.7.
    • Usa high effort (l'impostazione predefinita) quando hai bisogno del miglior lavoro di Claude: ragionamento complesso, analisi sfumata, problemi di codifica difficili, o qualsiasi attività dove la qualità è la priorità principale.
    • Usa medium effort come opzione equilibrata quando vuoi prestazioni solide senza la piena spesa di token di high effort.
    • Usa low effort quando stai ottimizzando per velocità (perché Claude risponde con meno token) o costo. Ad esempio, semplici compiti di classificazione, ricerche rapide, o casi d'uso ad alto volume dove miglioramenti marginali di qualità non giustificano latenza aggiuntiva o spesa.

    Effort con l'uso di strumenti

    Quando usi strumenti, il parametro effort influisce sia sulle spiegazioni intorno alle chiamate di strumenti che sulle chiamate di strumenti stesse. I livelli di effort inferiori tendono a:

    • Combinare più operazioni in meno chiamate di strumenti
    • Effettuare meno chiamate di strumenti
    • Procedere direttamente all'azione senza preambolo
    • Usare messaggi di conferma terse dopo il completamento

    I livelli di effort superiori possono:

    • Effettuare più chiamate di strumenti
    • Spiegare il piano prima di intraprendere un'azione
    • Fornire riepiloghi dettagliati dei cambiamenti
    • Includere commenti di codice più completi

    Effort con il pensiero esteso

    Il parametro effort funziona insieme al pensiero esteso. Il suo comportamento dipende dal modello:

    • Claude Mythos Preview utilizza adaptive thinking per impostazione predefinita (nessuna configurazione thinking richiesta). thinking: {type: "disabled"} è rifiutato. Effort controlla la profondità del pensiero allo stesso modo di Opus 4.7 e Opus 4.6.
    • Claude Opus 4.7 utilizza adaptive thinking (thinking: {type: "adaptive"}), dove effort è il controllo consigliato per la profondità del pensiero. Il pensiero esteso manuale (thinking: {type: "enabled", budget_tokens: N}) non è più supportato su Opus 4.7; usa invece adaptive thinking con effort. A high, xhigh, e max effort, Claude quasi sempre pensa profondamente. A livelli inferiori, potrebbe saltare il pensiero per problemi più semplici.
    • Claude Opus 4.6 utilizza adaptive thinking (thinking: {type: "adaptive"}), dove effort è il controllo consigliato per la profondità del pensiero. Mentre budget_tokens è ancora accettato su Opus 4.6, è deprecato e sarà rimosso in una futura versione. A high e effort, Claude quasi sempre pensa profondamente. A livelli inferiori, potrebbe saltare il pensiero per problemi più semplici.

    Il parametro effort può essere utilizzato con o senza il pensiero esteso abilitato. Quando utilizzato senza pensiero, controlla comunque la spesa totale di token per risposte di testo e chiamate di strumenti.

    Best practice

    1. Imposta effort esplicitamente: L'API ha come impostazione predefinita high, ma il punto di partenza giusto dipende dal tuo modello e dal carico di lavoro.
    2. Usa low per attività sensibili alla velocità o semplici: Quando la latenza è importante o i compiti sono semplici, low effort può ridurre significativamente i tempi di risposta e i costi.
    3. Testa il tuo caso d'uso: L'impatto dei livelli di effort varia in base al tipo di attività. Valuta le prestazioni sui tuoi casi d'uso specifici prima di distribuire.
    4. Considera effort dinamico: Regola effort in base alla complessità del compito. Le query semplici potrebbero giustificare low effort mentre la codifica agentic e il ragionamento complesso beneficiano di high effort.
    Attività più semplici che necessitano della migliore velocità e dei costi più bassi, come i subagent
    client = anthropic.Anthropic()
    
    response = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=4096,
        messages=[
            {
                "role": "user",
                "content": "Analyze the trade-offs between microservices and monolithic architectures",
            }
        ],
        output_config={"effort": "medium"},
    )
    
    print(response.content[0].text)
    max
  1. Claude Sonnet 4.6 utilizza adaptive thinking (dove effort controlla la profondità del pensiero). Il pensiero manuale con modalità interleaved (thinking: {type: "enabled", budget_tokens: N}) è ancora funzionale ma deprecato.
  2. Claude Opus 4.5 e altri modelli Claude 4 utilizzano il pensiero manuale (thinking: {type: "enabled", budget_tokens: N}), dove effort funziona insieme al budget di token di pensiero. Imposta il livello di effort per il tuo compito, quindi imposta il budget di token di pensiero in base alla complessità del compito.