Loading...
    0
    • Guida per sviluppatori
    • Riferimento API
    • MCP
    • Risorse
    • Note di rilascio
    Search...
    ⌘K
    Primi passi
    Introduzione a ClaudeAvvio rapido
    Modelli e prezzi
    Panoramica dei modelliScelta di un modelloNovità in Claude 4.5Migrazione a Claude 4.5Deprecazioni dei modelliPrezzi
    Costruisci con Claude
    Panoramica delle funzionalitàUtilizzo dell'API MessagesFinestre di contestoBest practice per i prompt
    Capacità
    Prompt cachingModifica del contestoExtended thinkingSforzoStreaming di messaggiElaborazione batchCitazioniSupporto multilingueConteggio dei tokenEmbeddingsVisioneSupporto PDFAPI FilesRisultati di ricercaOutput strutturatiComponente aggiuntivo Google Sheets
    Strumenti
    PanoramicaCome implementare l'uso degli strumentiUso efficiente dei token con gli strumentiStreaming granulare degli strumentiStrumento BashStrumento di esecuzione del codiceChiamata programmatica degli strumentiStrumento Computer useStrumento Editor di testoStrumento Web fetchStrumento Web searchStrumento MemoryStrumento Tool search
    Agent Skills
    PanoramicaAvvio rapidoBest practiceUtilizzo di Skills con l'API
    Agent SDK
    PanoramicaTypeScript SDKPython SDKGuida alla migrazione
    Guide
    Streaming InputGestione dei permessiGestione delle sessioniOutput strutturati nell'SDKHosting dell'Agent SDKModifica dei prompt di sistemaMCP nell'SDKStrumenti personalizzatiSubagent nell'SDKSlash Commands nell'SDKAgent Skills nell'SDKTracciamento dei costi e dell'utilizzoElenchi di attivitàPlugin nell'SDK
    MCP nell'API
    Connettore MCPServer MCP remoti
    Claude su piattaforme di terze parti
    Amazon BedrockMicrosoft FoundryVertex AI
    Prompt engineering
    PanoramicaGeneratore di promptUsa modelli di promptMiglioratore di promptSii chiaro e direttoUsa esempi (multishot prompting)Lascia che Claude pensi (CoT)Usa tag XMLDai a Claude un ruolo (prompt di sistema)Precompila la risposta di ClaudeConcatena prompt complessiSuggerimenti per il contesto lungoSuggerimenti per extended thinking
    Test e valutazione
    Definisci i criteri di successoSviluppa casi di testUtilizzo dello strumento di valutazioneRiduzione della latenza
    Rafforza i guardrail
    Riduci le allucinazioniAumenta la coerenza dell'outputMitiga i jailbreakStreaming dei rifiutiRiduci la perdita di promptMantieni Claude nel personaggio
    Amministrazione e monitoraggio
    Panoramica dell'Admin APIAPI di utilizzo e costiAPI Claude Code Analytics
    Console
    Capacità

    Effort

    Controlla quanti token Claude utilizza quando risponde con il parametro effort, bilanciando tra completezza della risposta ed efficienza dei token.

    Il parametro effort ti consente di controllare quanto Claude sia disposto a spendere token quando risponde alle richieste. Questo ti dà la possibilità di bilanciare tra completezza della risposta ed efficienza dei token, il tutto con un singolo modello.

    Il parametro effort è attualmente in beta ed è supportato solo da Claude Opus 4.5.

    Devi includere l'intestazione beta effort-2025-11-24 quando utilizzi questa funzione.

    Come funziona effort

    Per impostazione predefinita, Claude utilizza il massimo sforzo, spendendo quanti token necessari per fornire risposte approfondite. Abbassando il livello di effort, puoi istruire Claude a essere più conservatore nell'utilizzo dei token, trattando i token come una risorsa più costosa.

    Impostare effort a "high" produce esattamente lo stesso comportamento di omettere completamente il parametro effort.

    Il parametro effort influisce su tutti i token nella risposta, inclusi:

    • Risposte di testo e spiegazioni
    • Chiamate di strumenti e argomenti di funzioni
    • Pensiero esteso (quando abilitato)

    Livelli di effort

    LivelloDescrizioneCaso d'uso tipico
    highMassima completezza—Claude utilizza quanti token necessari. Equivalente a non impostare il parametro.Analisi complessa, spiegazioni dettagliate, contenuti educativi
    mediumApproccio equilibrato con risparmi di token moderati.La maggior parte dei casi di produzione, applicazioni consapevoli dei costi
    lowRisposte più efficienti in termini di token.Automazione ad alto volume, query semplici, quando le risposte vengono elaborate programmaticamente

    Utilizzo di base

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.beta.messages.create(
        model="claude-opus-4-5-20251101",
        betas=["effort-2025-11-24"],
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    Comportamento per livello di effort

    Il parametro effort controlla principalmente la verbosità dell'output e la profondità della spiegazione, non la correttezza della risposta. Claude esegue un ragionamento interno simile indipendentemente dal livello di effort, ma regola quanto di quel ragionamento appare nell'output.

    Risposte con basso effort

    • Risposta dichiarata direttamente con spiegazione minima
    • Risposte concise ed efficienti (1-2 frasi di contesto)
    • Formule mostrate ma non derivate
    • Presuppone che il lettore possa verificare la risposta
    • Conferme laconiche per l'uso di strumenti ("Fatto.", "Risolto.")

    Risposte con effort medio

    • Breve contesto prima della risposta
    • Giustificazione concisa con passaggi intermedi chiave
    • Può includere un esempio elaborato
    • Ancora focalizzato sull'efficienza

    Risposte con alto effort

    • Strutturate con intestazioni di sezione
    • Configurazione del problema e definizioni di variabili
    • Processo di soluzione passo dopo passo
    • Verifica e controlli di sanità mentale
    • Formattazione markdown ricca

    Casi d'uso

    Quando usare basso effort

    • Ottimizzazione della velocità: Conteggi di token inferiori significano tempi di risposta più veloci, vantaggiosi per applicazioni sensibili alla latenza
    • Pipeline automatizzate: Quando le risposte vengono elaborate dal codice piuttosto che lette da umani
    • Applicazioni ad alto volume: Riduci i costi su query routine e semplici
    • Utenti esperti: Quando gli utenti non hanno bisogno di spiegazioni dettagliate
    • Conferme rapide: Risposte semplici sì/no o di stato

    Quando usare effort medio

    • API di produzione: Equilibrio tra chiarezza ed efficienza dei costi
    • Applicazioni rivolte agli utenti: Contesto sufficiente senza verbosità eccessiva
    • Distribuzioni consapevoli dei costi: Risparmi significativi con impatto minimo sulla qualità

    Quando usare alto effort (o nessun parametro effort)

    • Analisi complessa: Quando la completezza è critica
    • Contenuti educativi: Quando gli utenti hanno bisogno di comprendere il ragionamento
    • Documentazione: Quando le risposte servono come materiale di riferimento
    • Debug: Quando spiegazioni dettagliate aiutano a identificare i problemi

    Effort con l'uso di strumenti

    Quando si utilizzano strumenti, il parametro effort influisce sia sulle spiegazioni intorno alle chiamate di strumenti che sulle chiamate di strumenti stesse. I livelli di effort inferiore tendono a:

    • Combinare più operazioni in meno chiamate di strumenti
    • Procedere direttamente all'azione senza preambolo
    • Utilizzare messaggi di conferma laconici dopo il completamento

    I livelli di effort superiore possono:

    • Spiegare il piano prima di intraprendere un'azione
    • Fornire riepiloghi dettagliati dei cambiamenti
    • Includere commenti di codice più completi

    Effort con pensiero esteso

    Il parametro effort funziona insieme al budget di token di pensiero quando il pensiero esteso è abilitato. Questi due controlli servono scopi diversi:

    • Parametro effort: Controlla come Claude spende tutti i token—inclusi i token di pensiero, le risposte di testo e le chiamate di strumenti
    • Budget di token di pensiero: Imposta un limite massimo sui token di pensiero specificamente

    Il parametro effort può essere utilizzato con o senza il pensiero esteso abilitato. Quando entrambi sono configurati:

    1. Per prima cosa determina il livello di effort appropriato per il tuo compito
    2. Quindi imposta il budget di token di pensiero in base alla complessità del compito

    Per le migliori prestazioni su compiti di ragionamento complesso, utilizza alto effort (l'impostazione predefinita) con un budget di token di pensiero elevato. Questo consente a Claude di pensare a fondo e fornire risposte complete.

    Migliori pratiche

    1. Inizia con medium: Per la maggior parte delle applicazioni, medium effort fornisce un buon equilibrio tra qualità ed efficienza.

    2. Usa low per l'automazione: Quando le risposte vengono consumate dal codice piuttosto che da umani, low effort può ridurre significativamente i costi senza influire sulla correttezza.

    3. Testa il tuo caso d'uso: L'impatto dei livelli di effort varia in base al tipo di compito. Valuta le prestazioni sui tuoi casi d'uso specifici prima di distribuire.

    4. Monitora la qualità: Mentre la correttezza è generalmente preservata tra i livelli di effort, la qualità della spiegazione varia. Assicurati che il livello che scegli soddisfi le esigenze dei tuoi utenti.

    5. Considera effort dinamico: Regola l'effort in base alla complessità del compito o alla preferenza dell'utente. Le query semplici possono giustificare low effort mentre l'analisi complessa beneficia di alto effort.

    • Come funziona effort
    • Livelli di effort
    • Utilizzo di base
    • Comportamento per livello di effort
    • Risposte con basso effort
    • Risposte con effort medio
    • Risposte con alto effort
    • Casi d'uso
    • Quando usare basso effort
    • Quando usare effort medio
    • Quando usare alto effort (o nessun parametro effort)
    • Effort con l'uso di strumenti
    • Effort con pensiero esteso
    • Migliori pratiche

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy