Questo è il riferimento unico per il prompt engineering con i modelli più recenti di Claude, inclusi Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 e Claude Haiku 4.5. Copre tecniche fondamentali, controllo dell'output, uso degli strumenti, thinking e sistemi agentici. Passa alla sezione che corrisponde alla tua situazione.
Per una panoramica delle capacità del modello, vedi la panoramica dei modelli. Per i dettagli su cosa c'è di nuovo in Claude Opus 4.7, vedi Cosa c'è di nuovo in Claude Opus 4.7. Per le indicazioni sulla migrazione, vedi la Guida alla migrazione.
Claude Opus 4.7 è il nostro modello più capace generalmente disponibile, con particolari punti di forza nel lavoro agentitico a lungo termine, nel knowledge work, nella visione e nei compiti di memoria. Funziona bene fin da subito sui prompt esistenti di Claude Opus 4.6. I pattern di seguito coprono i comportamenti che più spesso richiedono tuning.
Per i cambiamenti dei parametri API durante la migrazione da Claude Opus 4.6 (livelli di sforzo, budget dei compiti, configurazione del thinking, rimozione dei parametri di campionamento e tokenizzazione), vedi la guida alla migrazione.
Claude Opus 4.7 calibra la lunghezza della risposta in base a quanto complesso giudica il compito, piuttosto che impostare una verbosità fissa. Questo di solito significa risposte più brevi su ricerche semplici e molto più lunghe su analisi aperte.
Se il tuo prodotto dipende da uno stile o una verbosità specifici dell'output, potrebbe essere necessario sintonizzare i tuoi prompt. Ad esempio, per diminuire la verbosità, potresti aggiungere:
Fornisci risposte concise e focalizzate. Salta il contesto non essenziale e mantieni gli esempi minimi.Se vedi esempi specifici di tipi di verbosità (cioè over-explaining), puoi aggiungere istruzioni aggiuntive nel tuo prompt per prevenirli. Gli esempi positivi che mostrano come Claude può comunicare con il livello appropriato di concisione tendono ad essere più efficaci degli esempi negativi o delle istruzioni che dicono al modello cosa non fare.
Il parametro effort ti permette di sintonizzare l'intelligenza di Claude rispetto al consumo di token, scambiando capacità per velocità più rapida e costi inferiori. Inizia con il nuovo livello di sforzo xhigh per i casi d'uso di coding e agentici, e usa un minimo di high effort per la maggior parte dei casi d'uso sensibili all'intelligenza. Sperimenta con altri livelli di sforzo per sintonizzare ulteriormente l'utilizzo dei token e l'intelligenza:
max: Lo sforzo massimo può fornire guadagni di prestazioni in alcuni casi d'uso, ma potrebbe mostrare rendimenti decrescenti dall'aumento dell'utilizzo dei token. Questa impostazione può anche a volte essere soggetta a overthinking. Consigliamo di testare lo sforzo massimo per compiti che richiedono molta intelligenza.xhigh (nuovo): Lo sforzo extra alto è la migliore impostazione per la maggior parte dei casi d'uso di coding e agentici.high: Questa impostazione bilancia l'utilizzo dei token e l'intelligenza. Per la maggior parte dei casi d'uso sensibili all'intelligenza, consigliamo un minimo di high effort.medium: Buono per i casi d'uso sensibili ai costi che hanno bisogno di ridurre l'utilizzo dei token mentre scambiano intelligenza.low: Riservato per compiti brevi e scoped e carichi di lavoro sensibili alla latenza che non sono sensibili all'intelligenza.Cambiando significativamente da Claude Opus 4.6, Claude Opus 4.7 rispetta i livelli di sforzo rigorosamente, specialmente alle estremità basse. A low e medium, il modello limita il suo lavoro a quello che è stato chiesto piuttosto che andare oltre. Questo è buono per la latenza e il costo, ma su compiti moderatamente complessi in esecuzione a low effort c'è un certo rischio di under-thinking.
Se osservi ragionamento superficiale su problemi complessi, aumenta lo sforzo a high o xhigh piuttosto che fare prompting intorno ad esso. Se hai bisogno di mantenere lo sforzo a low per la latenza, aggiungi una guida mirata:
Questo compito comporta ragionamento multi-step. Pensa attentamente al problema prima di rispondere.Ci aspettiamo che lo sforzo sia più importante per questo modello che per qualsiasi Opus precedente, e consigliamo di sperimentare attivamente con esso quando esegui l'upgrade.
Il comportamento di attivazione per il thinking adattivo è steerable. Se trovi che il modello pensa più spesso di quanto vorresti — il che può accadere con system prompt grandi o complessi — aggiungi una guida per steerarlo. Come sempre, misura l'effetto di qualsiasi cambiamento di prompting sulle prestazioni. Esempio:
Il thinking aggiunge latenza e dovrebbe essere usato solo quando migliorerà significativamente la qualità della risposta — tipicamente per problemi che richiedono ragionamento multi-step. In caso di dubbio, rispondi direttamente.Conversamente, se stai eseguendo carichi di lavoro difficili a medium e vedi under-thinking, la prima leva è aumentare lo sforzo. Se hai bisogno di un controllo più fine, chiedi direttamente.
Se stai eseguendo Claude Opus 4.7 a max o xhigh effort, imposta un grande budget di token di output massimo in modo che il modello abbia spazio per pensare e agire attraverso i suoi subagent e le chiamate agli strumenti. Consigliamo di iniziare con 64k token e sintonizzare da lì.
Claude Opus 4.7 ha una tendenza a usare gli strumenti meno spesso di Claude Opus 4.6 e a usare il ragionamento di più. Questo produce risultati migliori nella maggior parte dei casi. Tuttavia, aumentare l'impostazione dello sforzo è una leva utile per aumentare il livello di utilizzo degli strumenti, specialmente nel knowledge work. Le impostazioni di sforzo high o xhigh mostrano sostanzialmente più utilizzo degli strumenti nella ricerca agentitica e nel coding. Per scenari in cui vuoi più utilizzo degli strumenti, puoi anche regolare il tuo prompt per istruire esplicitamente il modello su quando e come usare correttamente i suoi strumenti. Ad esempio, se trovi che il modello non sta usando i tuoi strumenti di ricerca web, descrivi chiaramente il perché e come dovrebbe.
Claude Opus 4.7 fornisce aggiornamenti più regolari e di qualità superiore all'utente durante lunghe tracce agentiche. Se hai aggiunto scaffolding per forzare messaggi di stato intermedi ("Dopo ogni 3 chiamate agli strumenti, riassumi il progresso"), prova a rimuoverlo. Se trovi che la lunghezza o il contenuto degli aggiornamenti rivolti all'utente di Claude Opus 4.7 non sono ben calibrati al tuo caso d'uso, descrivi esplicitamente come dovrebbero apparire questi aggiornamenti nel prompt e fornisci esempi.
Claude Opus 4.7 interpreta i prompt in modo più letterale ed esplicito di Claude Opus 4.6, in particolare ai livelli di sforzo inferiori. Non generalizzerà silenziosamente un'istruzione da un elemento a un altro, e non dedurrà richieste che non hai fatto. Il lato positivo di questo letteralismo è la precisione e meno thrash, e generalmente funziona meglio per i casi d'uso API con prompt accuratamente sintonizzati, estrazione strutturata e pipeline dove vuoi un comportamento prevedibile. Se hai bisogno che Claude applichi un'istruzione ampiamente, dichiara lo scope esplicitamente (ad esempio, "Applica questa formattazione a ogni sezione, non solo alla prima").
Come con qualsiasi nuovo modello, lo stile della prosa sulla scrittura di forma lunga potrebbe cambiare. Claude Opus 4.7 è più diretto e opinato, con meno phrasing validation-forward e meno emoji dello stile più caldo di Claude Opus 4.6. Se il tuo prodotto si basa su una voce specifica, rivaluta i prompt di stile rispetto alla nuova baseline.
Ad esempio, se la voce del tuo prodotto è più calda o conversazionale, aggiungi:
Usa un tono caldo e collaborativo. Riconosci il framing dell'utente prima di rispondere.Claude Opus 4.7 tende a generare meno subagent per impostazione predefinita. Tuttavia, questo comportamento è steerable attraverso il prompting; dai a Claude Opus 4.7 una guida esplicita su quando i subagent sono desiderabili. Un esempio giocattolo per un caso d'uso di coding:
Non generare un subagent per il lavoro che puoi completare direttamente in una singola risposta (ad es. refactoring di una funzione che puoi già vedere).
Genera più subagent nello stesso turno quando fai fan-out su elementi o leggi più file.Claude Opus 4.7 ha istinti di design più forti di Claude Opus 4.6, con uno stile house predefinito coerente: sfondi caldi crema/bianco sporco (~#F4F1EA), tipo display serif (Georgia, Fraunces, Playfair), accenti di parole in corsivo e un accento terracotta/ambra. Questo legge bene per brief editoriali, ospitalità e portfolio, ma sembrerà fuori posto per dashboard, dev tool, fintech, healthcare o app enterprise — e appare sia in slide deck che in UI web.
Questo predefinito è persistente. Le istruzioni generiche ("non usare crema," "rendilo pulito e minimalista") tendono a spostare il modello a una diversa tavolozza fissa piuttosto che produrre varietà. Due approcci funzionano in modo affidabile:
1. Specifica un'alternativa concreta. Il modello segue le specifiche esplicite con precisione:
Progetta una landing page desktop per un marchio di integratori chiamato AEFRM.
La direzione visiva dovrebbe provenire da un'atmosfera monocromatica fredda usando toni grigio-argento pallido che si approfondiscono gradualmente in grigio-blu e quasi nero, simile a una superficie metallica nebbiosa.
La pagina dovrebbe sentirsi nitida e controllata, con un forte senso di struttura e moderazione.
Usa questo sistema tonale su tutta la pagina invece di introdurre colori di accento luminosi.
Usa l'immagine caricata nel design hero in bianco e nero.
Il layout dovrebbe essere costruito con sezioni orizzontali chiare e un contenitore centrato con larghezza massima. Usa un raggio d'angolo di 4px in modo coerente su card, pulsanti, input e frame multimediali. I margini dovrebbero sentirsi generosi, con abbastanza spazio vuoto intorno a ogni sezione in modo che la pagina respiri.
La tipografia dovrebbe usare un sans-serif quadrato e angolare con spaziatura tra le lettere più ampia del solito, specialmente nei titoli e nella navigazione, in modo che il testo sembri più ingegnerizzato e meno compresso. Il testo del titolo può essere grande e maiuscolo, mentre la copia di supporto rimane breve e scarsa. I sottotesti dovrebbero essere scritti con Alumni Sans SC in 4-6px come piccoli testi negli angoli in basso al centro come quello.
Per la struttura, inizia con una sezione hero contenente una dichiarazione di prodotto forte, un breve paragrafo di supporto e un frame di placeholder di prodotto pulito o packshot. Sotto, aggiungi una griglia di vantaggi con tre o quattro blocchi, quindi una sezione di formulazione o ingredienti, e infine una cta.
I pulsanti dovrebbero essere piatti e precisi, con sottili cambiamenti al passaggio del mouse usando transition: all 160ms ease out dove la luminosità e il contrasto del bordo cambiano leggermente piuttosto che usare movimento drammatico.
La tavolozza dei colori dovrebbe rimanere entro questo intervallo:
#E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.2. Fai proporre al modello le opzioni prima di costruire. Questo rompe il predefinito e dà agli utenti il controllo. Se in precedenza ti affidavi a temperature per la varietà di design, usa questo approccio — produce direzioni significativamente diverse tra le esecuzioni. Esempio di prompt:
Prima di costruire, proponi 4 direzioni visive distinte adattate a questo brief (ognuna come: bg hex / accent hex / typeface — razionale di una riga). Chiedi all'utente di sceglierne una, quindi implementa solo quella direzione.Inoltre, Claude Opus 4.7 richiede meno prompting di design frontend rispetto ai modelli precedenti per evitare pattern generici che gli utenti chiamano l'estetica "AI slop". Con i modelli precedenti, consigliavamo uno snippet di prompt più lungo nella nostra skill di frontend-design. Tuttavia, Claude Opus 4.7 genera frontend distintivi e creativi con una guida di prompting più minimalista. Questo snippet di prompt funziona bene con i consigli di prompting sopra per la varietà:
<frontend_aesthetics>
NON usare estetiche generiche generate da AI come famiglie di font overused (Inter, Roboto, Arial, font di sistema), schemi di colore cliché (in particolare gradienti viola su sfondi bianchi o scuri), layout prevedibili e pattern di componenti, e design cookie-cutter che manca di carattere specifico del contesto. Usa font unici, colori e temi coesi e animazioni per effetti e micro-interazioni.
</frontend_aesthetics>L'utilizzo dei token e il comportamento di Claude Opus 4.7 possono differire tra agenti di coding autonomi e asincroni con un singolo turno utente e agenti di coding interattivi e sincroni con più turni utente. Specificamente, tende a usare più token in impostazioni interattive, principalmente perché ragiona di più dopo i turni utente. Questo può migliorare la coerenza a lungo termine, il seguimento delle istruzioni e le capacità di coding in lunghe sessioni di coding interattive, ma viene anche con più utilizzo dei token. Per massimizzare sia le prestazioni che l'efficienza dei token nei prodotti di coding, consigliamo di usare xhigh o high effort, aggiungere funzioni autonome come una modalità auto, e ridurre il numero di interazioni umane richieste dai tuoi utenti.
Naturalmente, quando si limita il numero di interazioni umane richieste, è importante specificare il compito, l'intento e i vincoli rilevanti in anticipo nel primo turno umano. Fornire descrizioni di compiti ben specificate, chiare e accurate in anticipo può aiutare a massimizzare l'autonomia e l'intelligenza mentre si minimizza l'utilizzo extra dei token dopo i turni utente. Troviamo che perché Claude Opus 4.7 è più autonomo rispetto ai modelli precedenti, questo pattern di utilizzo aiuta a massimizzare le prestazioni. Al contrario, i prompt ambigui o sotto-specificati trasmessi progressivamente su più turni utente tendono a ridurre relativamente l'efficienza dei token e talvolta le prestazioni.
Claude Opus 4.7 è significativamente migliore nel trovare bug rispetto ai modelli precedenti, e ha sia un recall che una precisione più alti nei nostri eval — 11pp di recall migliore in uno dei nostri eval di ricerca di bug più difficili basati su PR Anthropic reali. Tuttavia, se il tuo harness di revisione del codice è stato sintonizzato per un modello precedente, potresti inizialmente vedere un recall inferiore. Questo è probabilmente un effetto dell'harness, non una regressione di capacità. Quando un prompt di revisione dice cose come "segnala solo problemi ad alta gravità," "sii conservatore," o "non fare nitpicking," Claude Opus 4.7 potrebbe seguire quell'istruzione più fedelmente di quanto i modelli precedenti facessero — potrebbe investigare il codice altrettanto a fondo, identificare i bug, e poi non segnalare i risultati che giudica essere al di sotto della tua barra dichiarata. Questo può apparire come il modello che fa la stessa profondità di investigazione ma converte meno investigazioni in risultati segnalati, specialmente su bug di gravità inferiore. La precisione tipicamente aumenta, ma il recall misurato può diminuire anche se la capacità di ricerca di bug sottostante del modello è migliorata.
Alcuni linguaggi di prompt consigliati:
Segnala ogni problema che trovi, inclusi quelli di cui sei incerto o consideri di bassa gravità. Non filtrare per importanza o confidenza in questa fase - un passo di verifica separato farà quello. Il tuo obiettivo qui è la copertura: è meglio far emergere un risultato che successivamente viene filtrato piuttosto che silenziosamente far cadere un bug reale. Per ogni risultato, includi il tuo livello di confidenza e una gravità stimata in modo che un filtro downstream possa classificarli.Questo prompt può essere usato senza avere un secondo passo effettivo, ma spostare il filtraggio della confidenza fuori dal passo di ricerca spesso aiuta. Se il tuo harness ha una verifica separata, deduplicazione o fase di ranking, digli esplicitamente che il suo lavoro nella fase di ricerca è la copertura piuttosto che il filtraggio.
Se vuoi davvero che il modello si auto-filtri in un singolo passaggio, sii concreto su dove è la barra piuttosto che usare termini qualitativi come "importante" — ad esempio, "segnala qualsiasi bug che potrebbe causare comportamento scorretto, un fallimento di test o un risultato fuorviante; ometti solo nit come preferenze di stile puro o naming."
Consigliamo di iterare sui prompt rispetto a un sottoinsieme dei tuoi eval o casi di test per convalidare i guadagni di recall o F1 score.
La capacità di computer use funziona su risoluzioni, fino a una nuova risoluzione massima di 2576px / 3.75MP. Nel nostro testing di computer use, troviamo che inviare immagini a 1080p fornisce un buon equilibrio di prestazioni e costo.
Per carichi di lavoro particolarmente sensibili ai costi, consigliamo 720p o 1366×768 come opzioni a costo inferiore con prestazioni forti. Consigliamo di condurre il tuo testing per trovare le impostazioni ideali per il tuo caso d'uso; sperimentare con le impostazioni di sforzo può anche aiutare a sintonizzare il comportamento del modello.
Claude risponde bene a istruzioni chiare ed esplicite. Essere specifico sul tuo output desiderato può aiutare a migliorare i risultati. Se vuoi un comportamento "above and beyond", richiedilo esplicitamente piuttosto che affidarti al modello per dedurlo da prompt vaghi.
Pensa a Claude come a un brillante ma nuovo dipendente che manca di contesto sulle tue norme e flussi di lavoro. Più precisamente spieghi cosa vuoi, migliore sarà il risultato.
Regola d'oro: Mostra il tuo prompt a un collega con contesto minimo sul compito e chiedigli di seguirlo. Se sarebbero confusi, Claude lo sarà anche.
Fornire contesto o motivazione dietro le tue istruzioni, come spiegare a Claude perché tale comportamento è importante, può aiutare Claude a comprendere meglio i tuoi obiettivi e fornire risposte più mirate.
Claude è abbastanza intelligente da generalizzare dalla spiegazione.
Gli esempi sono uno dei modi più affidabili per steerare il formato dell'output, il tono e la struttura di Claude. Alcuni esempi ben realizzati (noti come prompting few-shot o multishot) possono migliorare drammaticamente l'accuratezza e la coerenza.
Quando aggiungi esempi, rendili:
<example> (più esempi in tag <examples>) in modo che Claude possa distinguerli dalle istruzioni.I tag XML aiutano Claude a analizzare prompt complessi in modo non ambiguo, specialmente quando il tuo prompt mescola istruzioni, contesto, esempi e input variabili. Avvolgere ogni tipo di contenuto nel suo tag (ad es. <instructions>, <context>, <input>) riduce le interpretazioni errate.
Migliori pratiche:
<documents>, ognuno dentro <document index="n">).Impostare un ruolo nel system prompt focalizza il comportamento e il tono di Claude per il tuo caso d'uso. Anche una singola frase fa la differenza:
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
system="You are a helpful coding assistant specializing in Python.",
messages=[
{"role": "user", "content": "How do I sort a list of dictionaries by key?"}
],
)
print(message.content)Quando lavori con documenti grandi o input ricchi di dati (20k+ token), struttura il tuo prompt con attenzione per ottenere i migliori risultati:
Metti i dati di forma lunga in cima: Posiziona i tuoi documenti lunghi e input vicino alla cima del tuo prompt, sopra la tua query, istruzioni ed esempi. Questo può migliorare significativamente le prestazioni su tutti i modelli.
Struttura il contenuto del documento e i metadati con tag XML: Quando usi più documenti, avvolgi ogni documento in tag <document> con sottotag <document_content> e <source> (e altri metadati) per chiarezza.
Fondi le risposte con citazioni: Per compiti con documenti lunghi, chiedi a Claude di citare le parti rilevanti dei documenti prima di eseguire il suo compito. Questo aiuta Claude a tagliare il rumore del resto del contenuto del documento.
Se vorresti che Claude si identifichi correttamente nella tua applicazione o usi stringhe API specifiche:
L'assistente è Claude, creato da Anthropic. Il modello attuale è Claude Opus 4.7.Per app alimentate da LLM che hanno bisogno di specificare stringhe di modello:
Quando è necessario un LLM, per favore usa come predefinito Claude Opus 4.7 a meno che l'utente non richieda diversamente. La stringa di modello esatta per Claude Opus 4.7 è claude-opus-4-7.I modelli più recenti di Claude hanno uno stile di comunicazione più conciso e naturale rispetto ai modelli precedenti:
Questo significa che Claude potrebbe saltare riassunti verbali dopo le chiamate agli strumenti, saltando direttamente all'azione successiva. Se preferisci più visibilità nel suo ragionamento:
Dopo aver completato un compito che comporta l'uso di strumenti, fornisci un rapido riassunto del lavoro che hai svolto.Ci sono alcuni modi particolarmente efficaci per steerare la formattazione dell'output:
Digli a Claude cosa fare invece di cosa non fare
Usa indicatori di formato XML
Abbina lo stile del tuo prompt all'output desiderato
Lo stile di formattazione usato nel tuo prompt potrebbe influenzare lo stile di risposta di Claude. Se stai ancora riscontrando problemi di steerability con la formattazione dell'output, prova ad abbinare lo stile del tuo prompt il più possibile allo stile di output desiderato. Ad esempio, rimuovere markdown dal tuo prompt può ridurre il volume di markdown nell'output.
Usa prompt dettagliati per preferenze di formattazione specifiche
Per un maggiore controllo sull'uso di markdown e formattazione, fornisci una guida esplicita:
<avoid_excessive_markdown_and_bullet_points>
Quando scrivi rapporti, documenti, spiegazioni tecniche, analisi o qualsiasi contenuto di forma lunga, scrivi in prosa chiara e scorrevole usando paragrafi e frasi complete. Usa interruzioni di paragrafo standard per l'organizzazione e riserva markdown principalmente per `inline code`, blocchi di codice (```...```), e semplici titoli (###, e ###). Evita di usare **bold** e *italics*.
NON usare elenchi ordinati (1. ...) o elenchi non ordinati (*) a meno che : a) stai presentando elementi veramente discreti dove un formato di elenco è la migliore opzione, o b) l'utente esplicitamente richiede un elenco o una classifica
Invece di elencare elementi con punti elenco o numeri, incorporali naturalmente nelle frasi. Questa guida si applica specialmente alla scrittura tecnica. Usare prosa invece di formattazione eccessiva migliorerà la soddisfazione dell'utente. NON produrre mai una serie di punti elenco eccessivamente brevi.
Il tuo obiettivo è testo leggibile e scorrevole che guida il lettore naturalmente attraverso le idee piuttosto che frammentare le informazioni in punti isolati.
</avoid_excessive_markdown_and_bullet_points>Claude Opus 4.6 usa come predefinito LaTeX per espressioni matematiche, equazioni e spiegazioni tecniche. Se preferisci testo semplice, aggiungi le seguenti istruzioni al tuo prompt:
Formatta la tua risposta in testo semplice solo. Non usare LaTeX, MathJax o qualsiasi notazione di markup come \( \), $, o \frac{}{}. Scrivi tutte le espressioni matematiche usando caratteri di testo standard (ad es., "/" per la divisione, "*" per la moltiplicazione, e "^" per gli esponenti).I modelli più recenti di Claude eccellono nella creazione di presentazioni, animazioni e documenti visivi con impressionante creatività e forte seguimento delle istruzioni. I modelli producono output lucido e utilizzabile al primo tentativo nella maggior parte dei casi.
Per i migliori risultati con la creazione di documenti:
Crea una presentazione professionale su [topic]. Includi elementi di design riflessivi, gerarchia visiva e animazioni coinvolgenti dove appropriato.A partire dai modelli Claude 4.6 e Claude Mythos Preview, le risposte pre-riempite nell'ultimo turno dell'assistente non sono più supportate. Su Mythos Preview, le richieste con messaggi dell'assistente pre-riempiti restituiscono un errore 400. L'intelligenza del modello e il seguimento delle istruzioni sono avanzati in modo tale che la maggior parte dei casi d'uso del prefill non lo richiedono più. I modelli esistenti continueranno a supportare i prefill, e aggiungere messaggi dell'assistente altrove nella conversazione non è interessato.
Ecco scenari di prefill comuni e come migrare da essi:
I modelli più recenti di Claude sono addestrati per il seguimento preciso delle istruzioni e beneficiano di una direzione esplicita per usare strumenti specifici. Se dici "puoi suggerire alcuni cambiamenti," Claude a volte fornirà suggerimenti piuttosto che implementarli, anche se fare cambiamenti potrebbe essere quello che intendevi.
Perché Claude agisca, sii più esplicito:
Per rendere Claude più proattivo nel prendere azioni per impostazione predefinita, puoi aggiungere questo al tuo system prompt:
<default_to_action>
Per impostazione predefinita, implementa i cambiamenti piuttosto che solo suggerirli. Se l'intento dell'utente non è chiaro, deduci l'azione probabile più utile e procedi, usando strumenti per scoprire qualsiasi dettaglio mancante invece di indovinare. Prova a dedurre l'intento dell'utente su se una chiamata agli strumenti (ad es. modifica o lettura di file) è intesa o no, e agisci di conseguenza.
</default_to_action>D'altra parte, se vuoi che il modello sia più esitante per impostazione predefinita, meno propenso a saltare direttamente nelle implementazioni, e agisca solo se richiesto, puoi steerare questo comportamento con un prompt come il seguente:
<do_not_act_before_instructions>
Non saltare nell'implementazione o cambiare file a meno che non sia chiaramente istruito di fare cambiamenti. Quando l'intento dell'utente è ambiguo, usa come predefinito fornire informazioni, fare ricerca e fornire raccomandazioni piuttosto che agire. Procedi con edit, modifiche o implementazioni solo quando l'utente esplicitamente le richiede.
</do_not_act_before_instructions>Claude Opus 4.5 e Claude Opus 4.6 sono anche più responsivi al system prompt rispetto ai modelli precedenti. Se i tuoi prompt sono stati progettati per ridurre l'undertriggering su strumenti o skill, questi modelli potrebbero ora overtrigger. La soluzione è ridurre qualsiasi linguaggio aggressivo. Dove avresti potuto dire "CRITICAL: Devi usare questo strumento quando...", puoi usare prompting più normale come "Usa questo strumento quando...".
I modelli più recenti di Claude eccellono nell'esecuzione parallela dei tool. Questi modelli:
Questo comportamento è facilmente controllabile. Sebbene il modello abbia un alto tasso di successo nell'esecuzione parallela dei tool senza prompt, puoi aumentarlo a ~100% o regolare il livello di aggressività:
<use_parallel_tool_calls>
Se intendi chiamare più tool e non ci sono dipendenze tra le chiamate ai tool, effettua tutte le chiamate ai tool indipendenti in parallelo. Dai priorità alle chiamate ai tool simultanee ogni volta che le azioni possono essere eseguite in parallelo piuttosto che sequenzialmente. Ad esempio, quando leggi 3 file, esegui 3 chiamate ai tool in parallelo per leggere tutti e 3 i file nel contesto contemporaneamente. Massimizza l'uso delle chiamate ai tool parallele dove possibile per aumentare la velocità e l'efficienza. Tuttavia, se alcune chiamate ai tool dipendono da chiamate precedenti per informare valori dipendenti come i parametri, NON chiamare questi tool in parallelo e invece chiamarli sequenzialmente. Non usare mai segnaposti o indovinare parametri mancanti nelle chiamate ai tool.
</use_parallel_tool_calls>Esegui le operazioni sequenzialmente con brevi pause tra ogni passaggio per garantire la stabilità.Claude Opus 4.6 esegue significativamente più esplorazione iniziale rispetto ai modelli precedenti, specialmente con impostazioni effort più elevate. Questo lavoro iniziale spesso aiuta a ottimizzare i risultati finali, ma il modello può raccogliere un contesto esteso o perseguire più filoni di ricerca senza essere sollecitato. Se i tuoi prompt precedentemente incoraggiavano il modello a essere più accurato, dovresti regolare quella guida per Claude Opus 4.6:
effort.In alcuni casi, Claude Opus 4.6 può pensare estesamente, il che può gonfiare i token di pensiero e rallentare le risposte. Se questo comportamento è indesiderato, puoi aggiungere istruzioni esplicite per vincolare il suo ragionamento, oppure puoi abbassare l'impostazione effort per ridurre il pensiero complessivo e l'utilizzo dei token.
Quando stai decidendo come affrontare un problema, scegli un approccio e impegnati su di esso. Evita di riconsiderare le decisioni a meno che non incontri nuove informazioni che contraddicono direttamente il tuo ragionamento. Se stai soppesando due approcci, scegline uno e portalo avanti. Puoi sempre correggere il corso in seguito se l'approccio scelto fallisce.Se hai bisogno di un limite massimo assoluto sui costi di pensiero, il pensiero esteso con un limite budget_tokens è ancora funzionale su Opus 4.6 e Sonnet 4.6 ma è deprecato. Preferisci abbassare l'impostazione effort o usare max_tokens come limite assoluto con adaptive thinking.
I modelli più recenti di Claude offrono capacità di pensiero che possono essere particolarmente utili per attività che coinvolgono la riflessione dopo l'uso dei tool o il ragionamento multi-step complesso. Puoi guidare il suo pensiero iniziale o interleaved per risultati migliori.
Claude Opus 4.6 e Claude Sonnet 4.6 utilizzano adaptive thinking (thinking: {type: "adaptive"}), dove Claude decide dinamicamente quando e quanto pensare. Claude calibra il suo pensiero in base a due fattori: il parametro effort e la complessità della query. Uno sforzo più elevato provoca più pensiero, e query più complesse fanno lo stesso. Su query più semplici che non richiedono pensiero, il modello risponde direttamente. Nelle valutazioni interne, il pensiero adattivo guida in modo affidabile prestazioni migliori rispetto al pensiero esteso. Considera il passaggio al pensiero adattivo per ottenere le risposte più intelligenti.
Usa il pensiero adattivo per carichi di lavoro che richiedono comportamento agentico come l'uso di tool multi-step, attività di codifica complesse e loop di agenti a lungo termine. I modelli più vecchi utilizzano la modalità di pensiero manuale con budget_tokens.
Puoi guidare il comportamento di pensiero di Claude:
Dopo aver ricevuto i risultati dei tool, rifletti attentamente sulla loro qualità e determina i passaggi successivi ottimali prima di procedere. Usa il tuo pensiero per pianificare e iterare in base a queste nuove informazioni, quindi intraprendi la migliore azione successiva.Il comportamento di attivazione per il pensiero adattivo è promptabile. Se trovi che il modello pensa più spesso di quanto desideri, il che può accadere con prompt di sistema grandi o complessi, aggiungi una guida per indirizzarlo:
Il pensiero esteso aggiunge latenza e dovrebbe essere utilizzato solo quando migliorerà significativamente la qualità della risposta - tipicamente per problemi che richiedono ragionamento multi-step. Quando hai dubbi, rispondi direttamente.Se stai migrando da extended thinking con budget_tokens, sostituisci la tua configurazione di pensiero e sposta il controllo del budget su effort:
Prima (pensiero esteso, modelli più vecchi):
client.messages.create(
model="claude-sonnet-4-5-20250929",
max_tokens=64000,
thinking={"type": "enabled", "budget_tokens": 32000},
messages=[{"role": "user", "content": "..."}],
)Dopo (pensiero adattivo):
client.messages.create(
model="claude-opus-4-7",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "high"}, # or "max", "xhigh", "medium", "low"
messages=[{"role": "user", "content": "..."}],
)Se non stai utilizzando il pensiero esteso, non sono necessarie modifiche. Il pensiero è disattivato per impostazione predefinita quando ometti il parametro thinking.
<thinking> all'interno dei tuoi esempi few-shot per mostrare a Claude il modello di ragionamento. Generalizzerà quello stile ai suoi stessi blocchi di pensiero esteso.<thinking> e <answer> per separare chiaramente il ragionamento dall'output finale.Per ulteriori informazioni sulle capacità di pensiero, vedi Extended thinking e Adaptive thinking.
I modelli più recenti di Claude eccellono nei compiti di ragionamento a lungo termine con eccezionali capacità di tracciamento dello stato. Claude mantiene l'orientamento durante sessioni estese concentrandosi sul progresso incrementale, facendo progressi costanti su poche cose alla volta piuttosto che tentare tutto contemporaneamente. Questa capacità emerge specialmente su più finestre di contesto o iterazioni di attività, dove Claude può lavorare su un compito complesso, salvare lo stato e continuare con una finestra di contesto fresca.
I modelli Claude 4.6 e Claude 4.5 presentano context awareness, consentendo al modello di tracciare la sua finestra di contesto rimanente (cioè "budget di token") durante una conversazione. Questo consente a Claude di eseguire attività e gestire il contesto più efficacemente comprendendo quanto spazio ha per lavorare.
Gestione dei limiti di contesto:
Se stai utilizzando Claude in un harness di agente che compatta il contesto o consente il salvataggio del contesto in file esterni (come in Claude Code), considera di aggiungere queste informazioni al tuo prompt in modo che Claude possa comportarsi di conseguenza. Altrimenti, Claude potrebbe a volte tentare naturalmente di concludere il lavoro mentre si avvicina al limite di contesto. Di seguito è riportato un prompt di esempio:
La tua finestra di contesto verrà compattata automaticamente mentre si avvicina al suo limite, consentendoti di continuare a lavorare indefinitamente da dove hai lasciato. Pertanto, non interrompere i compiti in anticipo a causa di preoccupazioni relative al budget di token. Man mano che ti avvicini al limite del tuo budget di token, salva il tuo progresso e stato attuali nella memoria prima che la finestra di contesto si aggiorni. Sii sempre il più persistente e autonomo possibile e completa i compiti completamente, anche se la fine del tuo budget si sta avvicinando. Non interrompere artificialmente alcun compito in anticipo indipendentemente dal contesto rimanente.Lo memory tool si abbina naturalmente alla consapevolezza del contesto per transizioni di contesto senza soluzione di continuità.
Per attività che si estendono su più finestre di contesto:
Usa un prompt diverso per la primissima finestra di contesto: Usa la prima finestra di contesto per impostare un framework (scrivi test, crea script di configurazione), quindi usa le future finestre di contesto per iterare su una lista di cose da fare.
Fai scrivere al modello i test in un formato strutturato: Chiedi a Claude di creare test prima di iniziare il lavoro e tieni traccia di essi in un formato strutturato (ad es. tests.json). Questo porta a una migliore capacità a lungo termine di iterare. Ricorda a Claude l'importanza dei test: "È inaccettabile rimuovere o modificare i test perché ciò potrebbe portare a funzionalità mancanti o buggy."
Configura strumenti di qualità della vita: Incoraggia Claude a creare script di configurazione (ad es. init.sh) per avviare gracefully i server, eseguire suite di test e linter. Questo previene il lavoro ripetuto quando si continua da una finestra di contesto fresca.
Iniziare da zero vs compattazione: Quando una finestra di contesto viene cancellata, considera di iniziare con una finestra di contesto completamente nuova piuttosto che utilizzare la compattazione. I modelli più recenti di Claude sono estremamente efficaci nel scoprire lo stato dal filesystem locale. In alcuni casi, potresti voler sfruttare questo rispetto alla compattazione. Sii prescrittivo su come dovrebbe iniziare:
Fornisci strumenti di verifica: Man mano che la lunghezza dei compiti autonomi cresce, Claude ha bisogno di verificare la correttezza senza feedback umano continuo. Strumenti come il server Playwright MCP o le capacità di utilizzo del computer per testare le UI sono utili.
Incoraggia l'utilizzo completo del contesto: Richiedi a Claude di completare efficientemente i componenti prima di passare:
Questo è un compito molto lungo, quindi potrebbe essere vantaggioso pianificare il tuo lavoro chiaramente. È incoraggiato spendere l'intero contesto di output sul compito - assicurati solo di non esaurire il contesto con lavoro significativo non committato. Continua a lavorare sistematicamente fino a quando non hai completato questo compito.Senza guida, Claude Opus 4.6 potrebbe intraprendere azioni difficili da invertire o che influenzano sistemi condivisi, come l'eliminazione di file, force-push o la pubblicazione su servizi esterni. Se desideri che Claude Opus 4.6 confermi prima di intraprendere azioni potenzialmente rischiose, aggiungi una guida al tuo prompt:
Considera la reversibilità e il potenziale impatto delle tue azioni. Sei incoraggiato a intraprendere azioni locali e reversibili come la modifica di file o l'esecuzione di test, ma per azioni difficili da invertire, che influenzano sistemi condivisi o potrebbero essere distruttive, chiedi all'utente prima di procedere.
Esempi di azioni che richiedono conferma:
- Operazioni distruttive: eliminazione di file o rami, eliminazione di tabelle di database, rm -rf
- Operazioni difficili da invertire: git push --force, git reset --hard, modifica di commit pubblicati
- Operazioni visibili ad altri: push di codice, commenti su PR/issue, invio di messaggi, modifica dell'infrastruttura condivisa
Quando incontri ostacoli, non usare azioni distruttive come scorciatoia. Ad esempio, non bypassare i controlli di sicurezza (ad es. --no-verify) o scartare file sconosciuti che potrebbero essere lavoro in corso.I modelli più recenti di Claude dimostrano eccezionali capacità di ricerca agentica e possono trovare e sintetizzare informazioni da più fonti in modo efficace. Per risultati di ricerca ottimali:
Fornisci criteri di successo chiari: Definisci cosa costituisce una risposta di successo alla tua domanda di ricerca
Incoraggia la verifica delle fonti: Chiedi a Claude di verificare le informazioni su più fonti
Per compiti di ricerca complessi, usa un approccio strutturato:
Cerca queste informazioni in modo strutturato. Man mano che raccogli dati, sviluppa diverse ipotesi concorrenti. Traccia i tuoi livelli di confidenza nelle note di progresso per migliorare la calibrazione. Critica regolarmente il tuo approccio e pianifica. Aggiorna un file di albero di ipotesi o note di ricerca per persistere le informazioni e fornire trasparenza. Suddividi questo compito di ricerca complesso sistematicamente.Questo approccio strutturato consente a Claude di trovare e sintetizzare praticamente qualsiasi informazione e criticare iterativamente i suoi risultati, indipendentemente dalle dimensioni del corpus.
I modelli più recenti di Claude dimostrano capacità di orchestrazione di subagenti nativi significativamente migliorate. Questi modelli possono riconoscere quando i compiti trarrebbero beneficio dalla delega del lavoro a subagenti specializzati e farlo proattivamente senza richiedere istruzioni esplicite.
Per sfruttare questo comportamento:
Se stai vedendo un uso eccessivo di subagenti, aggiungi una guida esplicita su quando i subagenti sono e non sono garantiti:
Usa i subagenti quando i compiti possono essere eseguiti in parallelo, richiedono contesto isolato o coinvolgono flussi di lavoro indipendenti che non hanno bisogno di condividere lo stato. Per compiti semplici, operazioni sequenziali, modifiche a file singoli o compiti in cui devi mantenere il contesto tra i passaggi, lavora direttamente piuttosto che delegare.Con il pensiero adattivo e l'orchestrazione dei subagenti, Claude gestisce la maggior parte del ragionamento multi-step internamente. Il concatenamento esplicito dei prompt (suddividere un compito in chiamate API sequenziali) è ancora utile quando devi ispezionare output intermedi o applicare una struttura di pipeline specifica.
Il modello di concatenamento più comune è auto-correzione: genera una bozza → fai rivedere a Claude rispetto ai criteri → fai affinare a Claude in base alla revisione. Ogni passaggio è una chiamata API separata in modo da poter registrare, valutare o ramificare in qualsiasi punto.
I modelli più recenti di Claude possono a volte creare nuovi file per scopi di test e iterazione, in particolare quando si lavora con il codice. Questo approccio consente a Claude di utilizzare file, specialmente script python, come un "blocco note temporaneo" prima di salvare l'output finale. L'utilizzo di file temporanei può migliorare i risultati particolarmente per i casi di utilizzo della codifica agentica.
Se preferisci minimizzare la creazione netta di nuovi file, puoi istruire Claude a ripulire dopo se stesso:
Se crei file temporanei nuovi, script o file helper per l'iterazione, pulisci questi file rimuovendoli alla fine del compito.Claude Opus 4.5 e Claude Opus 4.6 hanno una tendenza a over-engineering creando file extra, aggiungendo astrazioni non necessarie o costruendo flessibilità che non era stata richiesta. Se stai vedendo questo comportamento indesiderato, aggiungi una guida specifica per mantenere le soluzioni minime.
Ad esempio:
Evita l'over-engineering. Fai solo i cambiamenti che sono direttamente richiesti o chiaramente necessari. Mantieni le soluzioni semplici e focalizzate:
- Ambito: Non aggiungere funzionalità, refactorizzare il codice o fare "miglioramenti" oltre a ciò che è stato chiesto. Una correzione di bug non ha bisogno di codice circostante pulito. Una funzionalità semplice non ha bisogno di configurabilità extra.
- Documentazione: Non aggiungere docstring, commenti o annotazioni di tipo al codice che non hai modificato. Aggiungi commenti solo dove la logica non è auto-evidente.
- Codifica difensiva: Non aggiungere gestione degli errori, fallback o validazione per scenari che non possono accadere. Fidati del codice interno e delle garanzie del framework. Valida solo ai confini del sistema (input dell'utente, API esterne).
- Astrazioni: Non creare helper, utility o astrazioni per operazioni una tantum. Non progettare per requisiti futuri ipotetici. La giusta quantità di complessità è il minimo necessario per il compito attuale.Claude a volte può concentrarsi troppo sul passaggio dei test a scapito di soluzioni più generali, o può usare workaround come script helper per il refactoring complesso invece di usare strumenti standard direttamente. Per prevenire questo comportamento e garantire soluzioni robuste e generalizzabili:
Per favore scrivi una soluzione di alta qualità e di uso generale utilizzando gli strumenti standard disponibili. Non creare script helper o workaround per completare il compito più efficientemente. Implementa una soluzione che funzioni correttamente per tutti gli input validi, non solo i casi di test. Non codificare valori o creare soluzioni che funzionano solo per input di test specifici. Invece, implementa la logica effettiva che risolve il problema in generale.
Concentrati sulla comprensione dei requisiti del problema e sull'implementazione dell'algoritmo corretto. I test sono lì per verificare la correttezza, non per definire la soluzione. Fornisci un'implementazione principiata che segue le migliori pratiche e i principi di progettazione del software.
Se il compito è irragionevole o non fattibile, o se uno qualsiasi dei test è errato, per favore informami piuttosto che aggirare il problema. La soluzione dovrebbe essere robusta, mantenibile ed estensibile.I modelli più recenti di Claude sono meno inclini alle allucinazioni e forniscono risposte più accurate, fondate e intelligenti basate sul codice. Per incoraggiare ulteriormente questo comportamento e minimizzare le allucinazioni:
<investigate_before_answering>
Non speculare mai su codice che non hai aperto. Se l'utente fa riferimento a un file specifico, DEVI leggere il file prima di rispondere. Assicurati di investigare e leggere i file rilevanti PRIMA di rispondere a domande sulla base di codice. Non fare mai affermazioni sul codice prima di investigare a meno che tu non sia sicuro della risposta corretta - fornisci risposte fondate e prive di allucinazioni.
</investigate_before_answering>Claude Opus 4.5 e Claude Opus 4.6 hanno capacità di visione migliorate rispetto ai modelli Claude precedenti. Funzionano meglio nei compiti di elaborazione delle immagini e estrazione dei dati, in particolare quando ci sono più immagini presenti nel contesto. Questi miglioramenti si estendono all'utilizzo del computer, dove i modelli possono interpretare più affidabilmente gli screenshot e gli elementi dell'interfaccia utente. Puoi anche usare questi modelli per analizzare video suddividendoli in fotogrammi.
Una tecnica che si è dimostrata efficace per aumentare ulteriormente le prestazioni è fornire a Claude uno strumento di ritaglio o una skill. I test hanno mostrato un miglioramento coerente nelle valutazioni delle immagini quando Claude è in grado di "zoomare" su regioni rilevanti di un'immagine. Anthropic ha creato un cookbook per lo strumento di ritaglio.
Claude Opus 4.5 e Claude Opus 4.6 eccellono nella costruzione di applicazioni web complesse e reali con un forte design del frontend. Tuttavia, senza guida, i modelli possono impostare come predefiniti modelli generici che creano quello che gli utenti chiamano l'estetica "AI slop". Per creare frontend distintivi e creativi che sorprendono e deliziano:
Per una guida dettagliata sul miglioramento del design del frontend, vedi il post del blog su improving frontend design through skills.
Ecco uno snippet di prompt di sistema che puoi usare per incoraggiare un migliore design del frontend:
<frontend_aesthetics>
Tendi a convergere verso output generici e "on distribution". Nel design del frontend, questo crea quello che gli utenti chiamano l'estetica "AI slop". Evita questo: crea frontend creativi e distintivi che sorprendono e deliziano.
Concentrati su:
- Tipografia: Scegli font che sono belli, unici e interessanti. Evita font generici come Arial e Inter; opta invece per scelte distintive che elevino l'estetica del frontend.
- Colore e tema: Impegnati su un'estetica coerente. Usa variabili CSS per la coerenza. I colori dominanti con accenti nitidi superano le palette timide e uniformemente distribuite. Attingi da temi IDE e estetiche culturali per l'ispirazione.
- Movimento: Usa le animazioni per effetti e micro-interazioni. Dai priorità alle soluzioni solo CSS per HTML. Usa la libreria Motion per React quando disponibile. Concentrati su momenti ad alto impatto: un caricamento di pagina ben orchestrato con rivela sfalsate (animation-delay) crea più delizia rispetto a micro-interazioni sparse.
- Sfondi: Crea atmosfera e profondità piuttosto che impostare come predefiniti colori solidi. Stratifica i gradienti CSS, usa modelli geometrici o aggiungi effetti contestuali che corrispondono all'estetica complessiva.
Evita estetiche generiche generate da AI:
- Famiglie di font overused (Inter, Roboto, Arial, font di sistema)
- Schemi di colore cliché (in particolare gradienti viola su sfondi bianchi)
- Layout e modelli di componenti prevedibili
- Design cookie-cutter che manca di carattere specifico del contesto
Interpreta creativamente e fai scelte inaspettate che si sentono genuinamente progettate per il contesto. Varia tra temi chiari e scuri, font diversi, estetiche diverse. Tendi comunque a convergere su scelte comuni (Space Grotesk, ad esempio) tra le generazioni. Evita questo: è critico che tu pensi fuori dagli schemi!
</frontend_aesthetics>Puoi anche fare riferimento alla definizione completa della skill.
Quando migri ai modelli Claude 4.6 da generazioni precedenti:
Sii specifico sul comportamento desiderato: Considera di descrivere esattamente cosa vorresti vedere nell'output.
Inquadra le tue istruzioni con modificatori: Aggiungere modificatori che incoraggiano Claude ad aumentare la qualità e il dettaglio del suo output può aiutare a modellare meglio le prestazioni di Claude. Ad esempio, invece di "Crea un dashboard di analitiche", usa "Crea un dashboard di analitiche. Includi il maggior numero possibile di funzionalità e interazioni rilevanti. Vai oltre le basi per creare un'implementazione completamente funzionante."
Richiedi funzionalità specifiche esplicitamente: Le animazioni e gli elementi interattivi dovrebbero essere richiesti esplicitamente quando desiderati.
Aggiorna la configurazione del pensiero: I modelli Claude 4.6 utilizzano adaptive thinking (thinking: {type: "adaptive"}) invece del pensiero manuale con budget_tokens. Usa il parametro effort per controllare la profondità del pensiero.
Migra dalle risposte prefillate: Le risposte prefillate nell'ultimo turno dell'assistente sono deprecate a partire dai modelli Claude 4.6. Vedi Migrating away from prefilled responses per una guida dettagliata sulle alternative.
Sintonizza il prompting anti-pigrizia: Se i tuoi prompt precedentemente incoraggiavano il modello a essere più accurato o usare i tool più aggressivamente, riduci quella guida. I modelli Claude 4.6 sono significativamente più proattivi e possono eccessivamente attivare le istruzioni che erano necessarie per i modelli precedenti.
Per i passaggi di migrazione dettagliati, vedi la Migration guide.
Claude Sonnet 4.6 ha come impostazione predefinita un livello di effort di high, in contrasto con Claude Sonnet 4.5 che non aveva alcun parametro effort. Considera di regolare il parametro effort mentre migri da Claude Sonnet 4.5 a Claude Sonnet 4.6. Se non esplicitamente impostato, potresti sperimentare una latenza più elevata con il livello di effort predefinito.
Impostazioni di effort consigliate:
Quando usare Opus 4.7 invece: Per i problemi più difficili e a lungo termine (migrazioni di codice su larga scala, ricerca profonda, lavoro autonomo esteso), Opus 4.7 rimane la scelta giusta. Sonnet 4.6 è ottimizzato per carichi di lavoro in cui il rapido turnaround e l'efficienza dei costi sono più importanti.
Se non stai utilizzando il pensiero esteso su Claude Sonnet 4.5, puoi continuare senza di esso su Claude Sonnet 4.6. Dovresti esplicitamente impostare effort al livello appropriato per il tuo caso d'uso. A low effort con il pensiero disattivato, puoi aspettarti prestazioni simili o migliori rispetto a Claude Sonnet 4.5 senza pensiero esteso.
client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "disabled"},
output_config={"effort": "low"},
messages=[{"role": "user", "content": "..."}],
)Se stai utilizzando il pensiero esteso con budget_tokens su Claude Sonnet 4.5, è ancora funzionale su Claude Sonnet 4.6 ma è deprecato. Migra a adaptive thinking con il parametro effort.
Il pensiero adattivo è particolarmente adatto ai seguenti modelli di carico di lavoro:
high effort. Se la latenza o l'utilizzo dei token è una preoccupazione, riduci a medium.Quando utilizzi il pensiero adattivo, valuta medium e high effort sui tuoi compiti. Il livello giusto dipende dal compromesso del tuo carico di lavoro tra qualità, latenza e utilizzo dei token.
client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "high"},
messages=[{"role": "user", "content": "..."}],
)Se devi mantenere budget_tokens temporaneamente durante la migrazione, un budget intorno a 16k token fornisce spazio per problemi più difficili senza rischio di utilizzo di token incontrollato. Questa configurazione è deprecata e verrà rimossa in una futura versione del modello.
Per i casi di utilizzo della codifica (codifica agentica, flussi di lavoro pesanti di tool, generazione di codice), inizia con medium effort:
client.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "..."}],
)Per i casi di utilizzo di chat e non-codifica (chat, generazione di contenuti, ricerca, classificazione), inizia con low effort:
client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
messages=[{"role": "user", "content": "..."}],
)Was this page helpful?