Loading...
    • Guida per sviluppatori
    • Riferimento API
    • MCP
    • Risorse
    • Note sulla versione
    Search...
    ⌘K
    Primi passi
    Introduzione a ClaudeAvvio rapido
    Modelli e prezzi
    Panoramica dei modelliScelta di un modelloNovità in Claude 4.6Guida alla migrazioneDeprecazioni dei modelliPrezzi
    Crea con Claude
    Panoramica delle funzioniUtilizzo dell'API MessagesGestione dei motivi di arrestoBest practice per i prompt
    Capacità del modello
    Extended thinkingAdaptive thinkingEffortFast mode (anteprima di ricerca)Output strutturatiCitazioniStreaming dei messaggiElaborazione batchSupporto PDFRisultati di ricercaSupporto multilingueEmbeddingsVision
    Strumenti
    PanoramicaCome implementare l'uso degli strumentiStrumento di ricerca webStrumento di recupero webStrumento di esecuzione del codiceStrumento di memoriaStrumento BashStrumento Computer useStrumento editor di testo
    Infrastruttura degli strumenti
    Ricerca strumentiChiamata programmatica degli strumentiStreaming granulare degli strumenti
    Gestione del contesto
    Finestre di contestoCompattazioneModifica del contestoPrompt cachingConteggio dei token
    File e risorse
    API Files
    Agent Skills
    PanoramicaAvvio rapidoBest practiceSkills per l'aziendaUtilizzo di Skills con l'API
    Agent SDK
    PanoramicaAvvio rapidoTypeScript SDKTypeScript V2 (anteprima)Python SDKGuida alla migrazione
    MCP nell'API
    Connettore MCPServer MCP remoti
    Claude su piattaforme di terze parti
    Amazon BedrockMicrosoft FoundryVertex AI
    Prompt engineering
    PanoramicaGeneratore di promptUsa modelli di promptMiglioratore di promptSii chiaro e direttoUsa esempi (multishot prompting)Lascia che Claude pensi (CoT)Usa tag XMLDai a Claude un ruolo (prompt di sistema)Concatena prompt complessiSuggerimenti per il contesto lungoSuggerimenti per extended thinking
    Test e valutazione
    Definisci criteri di successoSviluppa casi di testUtilizzo dello strumento di valutazioneRiduzione della latenza
    Rafforza i guardrail
    Riduci le allucinazioniAumenta la coerenza dell'outputMitiga i jailbreakStreaming dei rifiutiRiduci la perdita di promptMantieni Claude nel personaggio
    Amministrazione e monitoraggio
    Panoramica dell'API AdminResidenza dei datiWorkspaceAPI di utilizzo e costiAPI Claude Code AnalyticsZero Data Retention
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Capacità del modello

    Effort

    Controlla quanti token Claude utilizza quando risponde con il parametro effort, bilanciando tra completezza della risposta ed efficienza dei token.

    Il parametro effort ti consente di controllare quanto Claude è disposto a spendere token quando risponde alle richieste. Questo ti dà la possibilità di bilanciare tra completezza della risposta ed efficienza dei token, il tutto con un singolo modello. Il parametro effort è generalmente disponibile su tutti i modelli supportati senza richiedere un header beta.

    Il parametro effort è supportato da Claude Opus 4.6 e Claude Opus 4.5.

    Per Claude Opus 4.6, effort sostituisce budget_tokens come modo consigliato per controllare la profondità del pensiero. Combina effort con adaptive thinking (thinking: {type: "adaptive"}) per la migliore esperienza. Mentre budget_tokens è ancora accettato su Opus 4.6, è deprecato e verrà rimosso in una futura versione del modello. A high (predefinito) e max effort, Claude quasi sempre penserà. A livelli di effort inferiori, potrebbe saltare il pensiero per problemi più semplici.

    Come funziona effort

    Per impostazione predefinita, Claude utilizza high effort—spendendo quanti token necessari per risultati eccellenti. Puoi aumentare il livello di effort a max per la massima capacità assoluta, oppure abbassarlo per essere più conservatore con l'utilizzo dei token, ottimizzando per velocità e costo accettando una riduzione della capacità.

    Impostare effort a "high" produce esattamente lo stesso comportamento di omettere completamente il parametro effort.

    Il parametro effort influisce su tutti i token nella risposta, inclusi:

    • Risposte di testo e spiegazioni
    • Chiamate di strumenti e argomenti di funzioni
    • Pensiero esteso (quando abilitato)

    Questo approccio ha due vantaggi principali:

    1. Non richiede che il pensiero sia abilitato per utilizzarlo.
    2. Può influire su tutta la spesa di token incluse le chiamate di strumenti. Ad esempio, uno sforzo inferiore significherebbe che Claude effettua meno chiamate di strumenti. Questo dà un grado molto maggiore di controllo sull'efficienza.

    Livelli di effort

    LivelloDescrizioneCaso d'uso tipico
    maxCapacità massima assoluta senza vincoli sulla spesa di token. Solo Opus 4.6 — le richieste che utilizzano max su altri modelli restituiranno un errore.Attività che richiedono il ragionamento più profondo possibile e l'analisi più completa
    highAlta capacità. Equivalente a non impostare il parametro.Ragionamento complesso, problemi di codifica difficili, attività agentiche
    mediumApproccio equilibrato con risparmi di token moderati.Attività agentiche che richiedono un equilibrio tra velocità, costo e prestazioni
    lowPiù efficiente. Risparmi di token significativi con una riduzione della capacità.Attività più semplici che necessitano della migliore velocità e dei costi più bassi, come i subagenti

    Effort è un segnale comportamentale, non un budget di token rigoroso. A livelli di effort inferiori, Claude penserà comunque su problemi sufficientemente difficili — penserà semplicemente meno di quanto farebbe a livelli di effort superiori per lo stesso problema.

    Utilizzo di base

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    Quando dovrei regolare il parametro effort?

    • Usa max effort quando hai bisogno della massima capacità assoluta senza vincoli—il ragionamento più completo e l'analisi più profonda. Disponibile solo su Opus 4.6; le richieste che utilizzano max su altri modelli restituiranno un errore.
    • Usa high effort (il predefinito) quando hai bisogno del miglior lavoro di Claude—ragionamento complesso, analisi sfumata, problemi di codifica difficili, o qualsiasi attività dove la qualità è la priorità principale.
    • Usa medium effort come opzione equilibrata quando vuoi prestazioni solide senza la spesa completa di token di high effort.
    • Usa low effort quando stai ottimizzando per velocità (perché Claude risponde con meno token) o costo—ad esempio, semplici attività di classificazione, ricerche rapide, o casi d'uso ad alto volume dove miglioramenti marginali della qualità non giustificano latenza aggiuntiva o spesa.

    Effort con l'uso di strumenti

    Quando si utilizzano strumenti, il parametro effort influisce sia sulle spiegazioni intorno alle chiamate di strumenti che sulle chiamate di strumenti stesse. I livelli di effort inferiori tendono a:

    • Combinare più operazioni in meno chiamate di strumenti
    • Effettuare meno chiamate di strumenti
    • Procedere direttamente all'azione senza preambolo
    • Utilizzare messaggi di conferma concisi dopo il completamento

    I livelli di effort superiori possono:

    • Effettuare più chiamate di strumenti
    • Spiegare il piano prima di intraprendere un'azione
    • Fornire riepiloghi dettagliati dei cambiamenti
    • Includere commenti di codice più completi

    Effort con il pensiero esteso

    Il parametro effort funziona insieme al pensiero esteso. Il suo comportamento dipende dal modello:

    • Claude Opus 4.6 utilizza adaptive thinking (thinking: {type: "adaptive"}), dove effort è il controllo consigliato per la profondità del pensiero. Mentre budget_tokens è ancora accettato su Opus 4.6, è deprecato e verrà rimosso in una futura versione. A high e max effort, Claude quasi sempre pensa profondamente. A livelli inferiori, potrebbe saltare il pensiero per problemi più semplici.
    • Claude Opus 4.5 utilizza il pensiero manuale (thinking: {type: "enabled", budget_tokens: N}), dove effort funziona insieme al budget dei token di pensiero. Imposta il livello di effort per il tuo compito, quindi imposta il budget dei token di pensiero in base alla complessità del compito.

    Il parametro effort può essere utilizzato con o senza il pensiero esteso abilitato. Quando utilizzato senza pensiero, controlla comunque la spesa totale di token per risposte di testo e chiamate di strumenti.

    Best practice

    1. Inizia con high: Utilizza livelli di effort inferiori per bilanciare le prestazioni con l'efficienza dei token.
    2. Usa low per attività sensibili alla velocità o semplici: Quando la latenza è importante o i compiti sono semplici, low effort può ridurre significativamente i tempi di risposta e i costi.
    3. Testa il tuo caso d'uso: L'impatto dei livelli di effort varia in base al tipo di attività. Valuta le prestazioni sui tuoi casi d'uso specifici prima di distribuire.
    4. Considera effort dinamico: Regola effort in base alla complessità del compito. Le query semplici potrebbero giustificare low effort mentre la codifica agentiche e il ragionamento complesso beneficiano di high effort.

    Was this page helpful?

    • Come funziona effort
    • Livelli di effort
    • Utilizzo di base
    • Quando dovrei regolare il parametro effort?
    • Effort con l'uso di strumenti
    • Effort con il pensiero esteso
    • Best practice