Migliori pratiche di prompting

Best practice per il prompting

Questo è il riferimento unico per il prompt engineering con i modelli più recenti di Claude, inclusi Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 e Claude Haiku 4.5. Copre tecniche fondamentali, controllo dell'output, uso degli strumenti, thinking e sistemi agentici. Passa alla sezione che corrisponde alla tua situazione.

Per una panoramica delle capacità del modello, vedi la panoramica dei modelli. Per i dettagli su cosa c'è di nuovo in Claude Opus 4.7, vedi Cosa c'è di nuovo in Claude Opus 4.7. Per le indicazioni sulla migrazione, vedi la Guida alla migrazione.

Prompting Claude Opus 4.7

Claude Opus 4.7 è il nostro modello più capace generalmente disponibile, con particolari punti di forza nel lavoro agentitico a lungo termine, nel knowledge work, nella visione e nei compiti di memoria. Funziona bene fin da subito sui prompt esistenti di Claude Opus 4.6. I pattern di seguito coprono i comportamenti che più spesso richiedono tuning.

Per i cambiamenti dei parametri API durante la migrazione da Claude Opus 4.6 (livelli di sforzo, budget dei compiti, configurazione del thinking, rimozione dei parametri di campionamento e tokenizzazione), vedi la guida alla migrazione.

Lunghezza della risposta e verbosità

Claude Opus 4.7 calibra la lunghezza della risposta in base a quanto complesso giudica il compito, piuttosto che impostare una verbosità fissa. Questo di solito significa risposte più brevi su ricerche semplici e molto più lunghe su analisi aperte.

Se il tuo prodotto dipende da uno stile o una verbosità specifici dell'output, potrebbe essere necessario sintonizzare i tuoi prompt. Ad esempio, per diminuire la verbosità, potresti aggiungere:

Fornisci risposte concise e focalizzate. Salta il contesto non essenziale e mantieni gli esempi minimi.

Se vedi esempi specifici di tipi di verbosità (cioè over-explaining), puoi aggiungere istruzioni aggiuntive nel tuo prompt per prevenirli. Gli esempi positivi che mostrano come Claude può comunicare con il livello appropriato di concisione tendono ad essere più efficaci degli esempi negativi o delle istruzioni che dicono al modello cosa non fare.

Calibrare lo sforzo e la profondità del thinking

Il parametro effort ti permette di sintonizzare l'intelligenza di Claude rispetto al consumo di token, scambiando capacità per velocità più rapida e costi inferiori. Inizia con il nuovo livello di sforzo xhigh per i casi d'uso di coding e agentici, e usa un minimo di high effort per la maggior parte dei casi d'uso sensibili all'intelligenza. Sperimenta con altri livelli di sforzo per sintonizzare ulteriormente l'utilizzo dei token e l'intelligenza:

max: Lo sforzo massimo può fornire guadagni di prestazioni in alcuni casi d'uso, ma potrebbe mostrare rendimenti decrescenti dall'aumento dell'utilizzo dei token. Questa impostazione può anche a volte essere soggetta a overthinking. Consigliamo di testare lo sforzo massimo per compiti che richiedono molta intelligenza.
xhigh (nuovo): Lo sforzo extra alto è la migliore impostazione per la maggior parte dei casi d'uso di coding e agentici.
high: Questa impostazione bilancia l'utilizzo dei token e l'intelligenza. Per la maggior parte dei casi d'uso sensibili all'intelligenza, consigliamo un minimo di high effort.
medium: Buono per i casi d'uso sensibili ai costi che hanno bisogno di ridurre l'utilizzo dei token mentre scambiano intelligenza.
low: Riservato per compiti brevi e scoped e carichi di lavoro sensibili alla latenza che non sono sensibili all'intelligenza.

Cambiando significativamente da Claude Opus 4.6, Claude Opus 4.7 rispetta i livelli di sforzo rigorosamente, specialmente alle estremità basse. A low e medium, il modello limita il suo lavoro a quello che è stato chiesto piuttosto che andare oltre. Questo è buono per la latenza e il costo, ma su compiti moderatamente complessi in esecuzione a low effort c'è un certo rischio di under-thinking.

Se osservi ragionamento superficiale su problemi complessi, aumenta lo sforzo a high o xhigh piuttosto che fare prompting intorno ad esso. Se hai bisogno di mantenere lo sforzo a low per la latenza, aggiungi una guida mirata:

Questo compito comporta ragionamento multi-step. Pensa attentamente al problema prima di rispondere.

Ci aspettiamo che lo sforzo sia più importante per questo modello che per qualsiasi Opus precedente, e consigliamo di sperimentare attivamente con esso quando esegui l'upgrade.

Il comportamento di attivazione per il thinking adattivo è steerable. Se trovi che il modello pensa più spesso di quanto vorresti — il che può accadere con system prompt grandi o complessi — aggiungi una guida per steerarlo. Come sempre, misura l'effetto di qualsiasi cambiamento di prompting sulle prestazioni. Esempio:

Il thinking aggiunge latenza e dovrebbe essere usato solo quando migliorerà significativamente la qualità della risposta — tipicamente per problemi che richiedono ragionamento multi-step. In caso di dubbio, rispondi direttamente.

Conversamente, se stai eseguendo carichi di lavoro difficili a medium e vedi under-thinking, la prima leva è aumentare lo sforzo. Se hai bisogno di un controllo più fine, chiedi direttamente.

Se stai eseguendo Claude Opus 4.7 a max o xhigh effort, imposta un grande budget di token di output massimo in modo che il modello abbia spazio per pensare e agire attraverso i suoi subagent e le chiamate agli strumenti. Consigliamo di iniziare con 64k token e sintonizzare da lì.

Attivazione dell'uso degli strumenti

Claude Opus 4.7 ha una tendenza a usare gli strumenti meno spesso di Claude Opus 4.6 e a usare il ragionamento di più. Questo produce risultati migliori nella maggior parte dei casi. Tuttavia, aumentare l'impostazione dello sforzo è una leva utile per aumentare il livello di utilizzo degli strumenti, specialmente nel knowledge work. Le impostazioni di sforzo high o xhigh mostrano sostanzialmente più utilizzo degli strumenti nella ricerca agentitica e nel coding. Per scenari in cui vuoi più utilizzo degli strumenti, puoi anche regolare il tuo prompt per istruire esplicitamente il modello su quando e come usare correttamente i suoi strumenti. Ad esempio, se trovi che il modello non sta usando i tuoi strumenti di ricerca web, descrivi chiaramente il perché e come dovrebbe.

Aggiornamenti di progresso rivolti all'utente

Claude Opus 4.7 fornisce aggiornamenti più regolari e di qualità superiore all'utente durante lunghe tracce agentiche. Se hai aggiunto scaffolding per forzare messaggi di stato intermedi ("Dopo ogni 3 chiamate agli strumenti, riassumi il progresso"), prova a rimuoverlo. Se trovi che la lunghezza o il contenuto degli aggiornamenti rivolti all'utente di Claude Opus 4.7 non sono ben calibrati al tuo caso d'uso, descrivi esplicitamente come dovrebbero apparire questi aggiornamenti nel prompt e fornisci esempi.

Seguimento di istruzioni più letterale

Claude Opus 4.7 interpreta i prompt in modo più letterale ed esplicito di Claude Opus 4.6, in particolare ai livelli di sforzo inferiori. Non generalizzerà silenziosamente un'istruzione da un elemento a un altro, e non dedurrà richieste che non hai fatto. Il lato positivo di questo letteralismo è la precisione e meno thrash, e generalmente funziona meglio per i casi d'uso API con prompt accuratamente sintonizzati, estrazione strutturata e pipeline dove vuoi un comportamento prevedibile. Se hai bisogno che Claude applichi un'istruzione ampiamente, dichiara lo scope esplicitamente (ad esempio, "Applica questa formattazione a ogni sezione, non solo alla prima").

Tono e stile di scrittura

Come con qualsiasi nuovo modello, lo stile della prosa sulla scrittura di forma lunga potrebbe cambiare. Claude Opus 4.7 è più diretto e opinato, con meno phrasing validation-forward e meno emoji dello stile più caldo di Claude Opus 4.6. Se il tuo prodotto si basa su una voce specifica, rivaluta i prompt di stile rispetto alla nuova baseline.

Ad esempio, se la voce del tuo prodotto è più calda o conversazionale, aggiungi:

Usa un tono caldo e collaborativo. Riconosci il framing dell'utente prima di rispondere.

Controllare lo spawning dei subagent

Claude Opus 4.7 tende a generare meno subagent per impostazione predefinita. Tuttavia, questo comportamento è steerable attraverso il prompting; dai a Claude Opus 4.7 una guida esplicita su quando i subagent sono desiderabili. Un esempio giocattolo per un caso d'uso di coding:

Non generare un subagent per il lavoro che puoi completare direttamente in una singola risposta (ad es. refactoring di una funzione che puoi già vedere).

Genera più subagent nello stesso turno quando fai fan-out su elementi o leggi più file.

Impostazioni predefinite di design e frontend

Claude Opus 4.7 ha istinti di design più forti di Claude Opus 4.6, con uno stile house predefinito coerente: sfondi caldi crema/bianco sporco (~#F4F1EA), tipo display serif (Georgia, Fraunces, Playfair), accenti di parole in corsivo e un accento terracotta/ambra. Questo legge bene per brief editoriali, ospitalità e portfolio, ma sembrerà fuori posto per dashboard, dev tool, fintech, healthcare o app enterprise — e appare sia in slide deck che in UI web.

Questo predefinito è persistente. Le istruzioni generiche ("non usare crema," "rendilo pulito e minimalista") tendono a spostare il modello a una diversa tavolozza fissa piuttosto che produrre varietà. Due approcci funzionano in modo affidabile:

1. Specifica un'alternativa concreta. Il modello segue le specifiche esplicite con precisione:

Progetta una landing page desktop per un marchio di integratori chiamato AEFRM.

La direzione visiva dovrebbe provenire da un'atmosfera monocromatica fredda usando toni grigio-argento pallido che si approfondiscono gradualmente in grigio-blu e quasi nero, simile a una superficie metallica nebbiosa.

La pagina dovrebbe sentirsi nitida e controllata, con un forte senso di struttura e moderazione.

Usa questo sistema tonale su tutta la pagina invece di introdurre colori di accento luminosi.

Usa l'immagine caricata nel design hero in bianco e nero.

Il layout dovrebbe essere costruito con sezioni orizzontali chiare e un contenitore centrato con larghezza massima. Usa un raggio d'angolo di 4px in modo coerente su card, pulsanti, input e frame multimediali. I margini dovrebbero sentirsi generosi, con abbastanza spazio vuoto intorno a ogni sezione in modo che la pagina respiri.

La tipografia dovrebbe usare un sans-serif quadrato e angolare con spaziatura tra le lettere più ampia del solito, specialmente nei titoli e nella navigazione, in modo che il testo sembri più ingegnerizzato e meno compresso. Il testo del titolo può essere grande e maiuscolo, mentre la copia di supporto rimane breve e scarsa. I sottotesti dovrebbero essere scritti con Alumni Sans SC in 4-6px come piccoli testi negli angoli in basso al centro come quello.

Per la struttura, inizia con una sezione hero contenente una dichiarazione di prodotto forte, un breve paragrafo di supporto e un frame di placeholder di prodotto pulito o packshot. Sotto, aggiungi una griglia di vantaggi con tre o quattro blocchi, quindi una sezione di formulazione o ingredienti, e infine una cta.

I pulsanti dovrebbero essere piatti e precisi, con sottili cambiamenti al passaggio del mouse usando transition: all 160ms ease out dove la luminosità e il contrasto del bordo cambiano leggermente piuttosto che usare movimento drammatico.

La tavolozza dei colori dovrebbe rimanere entro questo intervallo:
#E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.

2. Fai proporre al modello le opzioni prima di costruire. Questo rompe il predefinito e dà agli utenti il controllo. Se in precedenza ti affidavi a temperature per la varietà di design, usa questo approccio — produce direzioni significativamente diverse tra le esecuzioni. Esempio di prompt:

Prima di costruire, proponi 4 direzioni visive distinte adattate a questo brief (ognuna come: bg hex / accent hex / typeface — razionale di una riga). Chiedi all'utente di sceglierne una, quindi implementa solo quella direzione.

Inoltre, Claude Opus 4.7 richiede meno prompting di design frontend rispetto ai modelli precedenti per evitare pattern generici che gli utenti chiamano l'estetica "AI slop". Con i modelli precedenti, consigliavamo uno snippet di prompt più lungo nella nostra skill di frontend-design. Tuttavia, Claude Opus 4.7 genera frontend distintivi e creativi con una guida di prompting più minimalista. Questo snippet di prompt funziona bene con i consigli di prompting sopra per la varietà:

<frontend_aesthetics>
NON usare estetiche generiche generate da AI come famiglie di font overused (Inter, Roboto, Arial, font di sistema), schemi di colore cliché (in particolare gradienti viola su sfondi bianchi o scuri), layout prevedibili e pattern di componenti, e design cookie-cutter che manca di carattere specifico del contesto. Usa font unici, colori e temi coesi e animazioni per effetti e micro-interazioni.
</frontend_aesthetics>

Prodotti di coding interattivi

L'utilizzo dei token e il comportamento di Claude Opus 4.7 possono differire tra agenti di coding autonomi e asincroni con un singolo turno utente e agenti di coding interattivi e sincroni con più turni utente. Specificamente, tende a usare più token in impostazioni interattive, principalmente perché ragiona di più dopo i turni utente. Questo può migliorare la coerenza a lungo termine, il seguimento delle istruzioni e le capacità di coding in lunghe sessioni di coding interattive, ma viene anche con più utilizzo dei token. Per massimizzare sia le prestazioni che l'efficienza dei token nei prodotti di coding, consigliamo di usare xhigh o high effort, aggiungere funzioni autonome come una modalità auto, e ridurre il numero di interazioni umane richieste dai tuoi utenti.

Naturalmente, quando si limita il numero di interazioni umane richieste, è importante specificare il compito, l'intento e i vincoli rilevanti in anticipo nel primo turno umano. Fornire descrizioni di compiti ben specificate, chiare e accurate in anticipo può aiutare a massimizzare l'autonomia e l'intelligenza mentre si minimizza l'utilizzo extra dei token dopo i turni utente. Troviamo che perché Claude Opus 4.7 è più autonomo rispetto ai modelli precedenti, questo pattern di utilizzo aiuta a massimizzare le prestazioni. Al contrario, i prompt ambigui o sotto-specificati trasmessi progressivamente su più turni utente tendono a ridurre relativamente l'efficienza dei token e talvolta le prestazioni.

Harness di revisione del codice

Claude Opus 4.7 è significativamente migliore nel trovare bug rispetto ai modelli precedenti, e ha sia un recall che una precisione più alti nei nostri eval — 11pp di recall migliore in uno dei nostri eval di ricerca di bug più difficili basati su PR Anthropic reali. Tuttavia, se il tuo harness di revisione del codice è stato sintonizzato per un modello precedente, potresti inizialmente vedere un recall inferiore. Questo è probabilmente un effetto dell'harness, non una regressione di capacità. Quando un prompt di revisione dice cose come "segnala solo problemi ad alta gravità," "sii conservatore," o "non fare nitpicking," Claude Opus 4.7 potrebbe seguire quell'istruzione più fedelmente di quanto i modelli precedenti facessero — potrebbe investigare il codice altrettanto a fondo, identificare i bug, e poi non segnalare i risultati che giudica essere al di sotto della tua barra dichiarata. Questo può apparire come il modello che fa la stessa profondità di investigazione ma converte meno investigazioni in risultati segnalati, specialmente su bug di gravità inferiore. La precisione tipicamente aumenta, ma il recall misurato può diminuire anche se la capacità di ricerca di bug sottostante del modello è migliorata.

Alcuni linguaggi di prompt consigliati:

Segnala ogni problema che trovi, inclusi quelli di cui sei incerto o consideri di bassa gravità. Non filtrare per importanza o confidenza in questa fase - un passo di verifica separato farà quello. Il tuo obiettivo qui è la copertura: è meglio far emergere un risultato che successivamente viene filtrato piuttosto che silenziosamente far cadere un bug reale. Per ogni risultato, includi il tuo livello di confidenza e una gravità stimata in modo che un filtro downstream possa classificarli.

Questo prompt può essere usato senza avere un secondo passo effettivo, ma spostare il filtraggio della confidenza fuori dal passo di ricerca spesso aiuta. Se il tuo harness ha una verifica separata, deduplicazione o fase di ranking, digli esplicitamente che il suo lavoro nella fase di ricerca è la copertura piuttosto che il filtraggio.

Se vuoi davvero che il modello si auto-filtri in un singolo passaggio, sii concreto su dove è la barra piuttosto che usare termini qualitativi come "importante" — ad esempio, "segnala qualsiasi bug che potrebbe causare comportamento scorretto, un fallimento di test o un risultato fuorviante; ometti solo nit come preferenze di stile puro o naming."

Consigliamo di iterare sui prompt rispetto a un sottoinsieme dei tuoi eval o casi di test per convalidare i guadagni di recall o F1 score.

Uso del computer

La capacità di computer use funziona su risoluzioni, fino a una nuova risoluzione massima di 2576px / 3.75MP. Nel nostro testing di computer use, troviamo che inviare immagini a 1080p fornisce un buon equilibrio di prestazioni e costo.

Per carichi di lavoro particolarmente sensibili ai costi, consigliamo 720p o 1366×768 come opzioni a costo inferiore con prestazioni forti. Consigliamo di condurre il tuo testing per trovare le impostazioni ideali per il tuo caso d'uso; sperimentare con le impostazioni di sforzo può anche aiutare a sintonizzare il comportamento del modello.

Principi generali

Sii chiaro e diretto

Claude risponde bene a istruzioni chiare ed esplicite. Essere specifico sul tuo output desiderato può aiutare a migliorare i risultati. Se vuoi un comportamento "above and beyond", richiedilo esplicitamente piuttosto che affidarti al modello per dedurlo da prompt vaghi.

Pensa a Claude come a un brillante ma nuovo dipendente che manca di contesto sulle tue norme e flussi di lavoro. Più precisamente spieghi cosa vuoi, migliore sarà il risultato.

Regola d'oro: Mostra il tuo prompt a un collega con contesto minimo sul compito e chiedigli di seguirlo. Se sarebbero confusi, Claude lo sarà anche.

Sii specifico sul formato e i vincoli dell'output desiderato.
Fornisci istruzioni come passaggi sequenziali usando elenchi numerati o punti elenco quando l'ordine o la completezza dei passaggi è importante.

Aggiungi contesto per migliorare le prestazioni

Fornire contesto o motivazione dietro le tue istruzioni, come spiegare a Claude perché tale comportamento è importante, può aiutare Claude a comprendere meglio i tuoi obiettivi e fornire risposte più mirate.

Claude è abbastanza intelligente da generalizzare dalla spiegazione.

Usa gli esempi in modo efficace

Gli esempi sono uno dei modi più affidabili per steerare il formato dell'output, il tono e la struttura di Claude. Alcuni esempi ben realizzati (noti come prompting few-shot o multishot) possono migliorare drammaticamente l'accuratezza e la coerenza.

Quando aggiungi esempi, rendili:

Rilevanti: Specchia il tuo caso d'uso effettivo da vicino.
Diversi: Copri i casi limite e varia abbastanza che Claude non raccolga pattern non intenzionali.
Strutturati: Avvolgi gli esempi in tag <example> (più esempi in tag <examples>) in modo che Claude possa distinguerli dalle istruzioni.

Includi 3–5 esempi per i migliori risultati. Puoi anche chiedere a Claude di valutare i tuoi esempi per rilevanza e diversità, o di generarne altri aggiuntivi in base al tuo set iniziale.

Struttura i prompt con tag XML

I tag XML aiutano Claude a analizzare prompt complessi in modo non ambiguo, specialmente quando il tuo prompt mescola istruzioni, contesto, esempi e input variabili. Avvolgere ogni tipo di contenuto nel suo tag (ad es. <instructions>, <context>, <input>) riduce le interpretazioni errate.

Migliori pratiche:

Usa nomi di tag coerenti e descrittivi nei tuoi prompt.
Annida i tag quando il contenuto ha una gerarchia naturale (documenti dentro <documents>, ognuno dentro <document index="n">).

Dai a Claude un ruolo

Impostare un ruolo nel system prompt focalizza il comportamento e il tono di Claude per il tuo caso d'uso. Anche una singola frase fa la differenza:

Python

import anthropic

client = anthropic.Anthropic()

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    system="You are a helpful coding assistant specializing in Python.",
    messages=[
        {"role": "user", "content": "How do I sort a list of dictionaries by key?"}
    ],
)
print(message.content)

Prompting con contesto lungo

Quando lavori con documenti grandi o input ricchi di dati (20k+ token), struttura il tuo prompt con attenzione per ottenere i migliori risultati:

Metti i dati di forma lunga in cima: Posiziona i tuoi documenti lunghi e input vicino alla cima del tuo prompt, sopra la tua query, istruzioni ed esempi. Questo può migliorare significativamente le prestazioni su tutti i modelli.

Le query alla fine possono migliorare la qualità della risposta fino al 30% nei test, specialmente con input complessi e multi-documento.
Struttura il contenuto del documento e i metadati con tag XML: Quando usi più documenti, avvolgi ogni documento in tag <document> con sottotag <document_content> e <source> (e altri metadati) per chiarezza.

Autoconoscenza del modello

Se vorresti che Claude si identifichi correttamente nella tua applicazione o usi stringhe API specifiche:

Prompt di esempio per l'identità del modello

L'assistente è Claude, creato da Anthropic. Il modello attuale è Claude Opus 4.7.

Per app alimentate da LLM che hanno bisogno di specificare stringhe di modello:

Prompt di esempio per la stringa del modello

Quando è necessario un LLM, per favore usa come predefinito Claude Opus 4.7 a meno che l'utente non richieda diversamente. La stringa di modello esatta per Claude Opus 4.7 è claude-opus-4-7.

Output e formattazione

Stile di comunicazione e verbosità

I modelli più recenti di Claude hanno uno stile di comunicazione più conciso e naturale rispetto ai modelli precedenti:

Più diretto e radicato: Fornisce rapporti di progresso basati su fatti piuttosto che aggiornamenti auto-celebrativi
Più conversazionale: Leggermente più fluido e colloquiale, meno simile a una macchina
Meno verboso: Potrebbe saltare riassunti dettagliati per efficienza a meno che non sia richiesto diversamente

Questo significa che Claude potrebbe saltare riassunti verbali dopo le chiamate agli strumenti, saltando direttamente all'azione successiva. Se preferisci più visibilità nel suo ragionamento:

Prompt di esempio

Dopo aver completato un compito che comporta l'uso di strumenti, fornisci un rapido riassunto del lavoro che hai svolto.

Controlla il formato delle risposte

Ci sono alcuni modi particolarmente efficaci per steerare la formattazione dell'output:

Digli a Claude cosa fare invece di cosa non fare
- Invece di: "Non usare markdown nella tua risposta"
- Prova: "La tua risposta dovrebbe essere composta da paragrafi di prosa che scorrono dolcemente."
Usa indicatori di formato XML
- Prova: "Scrivi le sezioni di prosa della tua risposta in tag <smoothly_flowing_prose_paragraphs>."
Abbina lo stile del tuo prompt all'output desiderato

Lo stile di formattazione usato nel tuo prompt potrebbe influenzare lo stile di risposta di Claude. Se stai ancora riscontrando problemi di steerability con la formattazione dell'output, prova ad abbinare lo stile del tuo prompt il più possibile allo stile di output desiderato. Ad esempio, rimuovere markdown dal tuo prompt può ridurre il volume di markdown nell'output.
Usa prompt dettagliati per preferenze di formattazione specifiche

Prompt di esempio per minimizzare markdown

<avoid_excessive_markdown_and_bullet_points>
Quando scrivi rapporti, documenti, spiegazioni tecniche, analisi o qualsiasi contenuto di forma lunga, scrivi in prosa chiara e scorrevole usando paragrafi e frasi complete. Usa interruzioni di paragrafo standard per l'organizzazione e riserva markdown principalmente per `inline code`, blocchi di codice (```...```), e semplici titoli (###, e ###). Evita di usare **bold** e *italics*.

NON usare elenchi ordinati (1. ...) o elenchi non ordinati (*) a meno che : a) stai presentando elementi veramente discreti dove un formato di elenco è la migliore opzione, o b) l'utente esplicitamente richiede un elenco o una classifica

Invece di elencare elementi con punti elenco o numeri, incorporali naturalmente nelle frasi. Questa guida si applica specialmente alla scrittura tecnica. Usare prosa invece di formattazione eccessiva migliorerà la soddisfazione dell'utente. NON produrre mai una serie di punti elenco eccessivamente brevi.

Il tuo obiettivo è testo leggibile e scorrevole che guida il lettore naturalmente attraverso le idee piuttosto che frammentare le informazioni in punti isolati.
</avoid_excessive_markdown_and_bullet_points>

Output LaTeX

Claude Opus 4.6 usa come predefinito LaTeX per espressioni matematiche, equazioni e spiegazioni tecniche. Se preferisci testo semplice, aggiungi le seguenti istruzioni al tuo prompt:

Prompt di esempio

Formatta la tua risposta in testo semplice solo. Non usare LaTeX, MathJax o qualsiasi notazione di markup come \( \), $, o \frac{}{}. Scrivi tutte le espressioni matematiche usando caratteri di testo standard (ad es., "/" per la divisione, "*" per la moltiplicazione, e "^" per gli esponenti).

Creazione di documenti

I modelli più recenti di Claude eccellono nella creazione di presentazioni, animazioni e documenti visivi con impressionante creatività e forte seguimento delle istruzioni. I modelli producono output lucido e utilizzabile al primo tentativo nella maggior parte dei casi.

Per i migliori risultati con la creazione di documenti:

Prompt di esempio

Crea una presentazione professionale su [topic]. Includi elementi di design riflessivi, gerarchia visiva e animazioni coinvolgenti dove appropriato.

Migrazione da risposte pre-riempite

A partire dai modelli Claude 4.6 e Claude Mythos Preview, le risposte pre-riempite nell'ultimo turno dell'assistente non sono più supportate. Su Mythos Preview, le richieste con messaggi dell'assistente pre-riempiti restituiscono un errore 400. L'intelligenza del modello e il seguimento delle istruzioni sono avanzati in modo tale che la maggior parte dei casi d'uso del prefill non lo richiedono più. I modelli esistenti continueranno a supportare i prefill, e aggiungere messaggi dell'assistente altrove nella conversazione non è interessato.

Ecco scenari di prefill comuni e come migrare da essi:

Uso degli strumenti

Utilizzo degli strumenti

I modelli più recenti di Claude sono addestrati per il seguimento preciso delle istruzioni e beneficiano di una direzione esplicita per usare strumenti specifici. Se dici "puoi suggerire alcuni cambiamenti," Claude a volte fornirà suggerimenti piuttosto che implementarli, anche se fare cambiamenti potrebbe essere quello che intendevi.

Perché Claude agisca, sii più esplicito:

Per rendere Claude più proattivo nel prendere azioni per impostazione predefinita, puoi aggiungere questo al tuo system prompt:

Prompt di esempio per azione proattiva

<default_to_action>
Per impostazione predefinita, implementa i cambiamenti piuttosto che solo suggerirli. Se l'intento dell'utente non è chiaro, deduci l'azione probabile più utile e procedi, usando strumenti per scoprire qualsiasi dettaglio mancante invece di indovinare. Prova a dedurre l'intento dell'utente su se una chiamata agli strumenti (ad es. modifica o lettura di file) è intesa o no, e agisci di conseguenza.
</default_to_action>

D'altra parte, se vuoi che il modello sia più esitante per impostazione predefinita, meno propenso a saltare direttamente nelle implementazioni, e agisca solo se richiesto, puoi steerare questo comportamento con un prompt come il seguente:

Prompt di esempio per azione conservatrice

<do_not_act_before_instructions>
Non saltare nell'implementazione o cambiare file a meno che non sia chiaramente istruito di fare cambiamenti. Quando l'intento dell'utente è ambiguo, usa come predefinito fornire informazioni, fare ricerca e fornire raccomandazioni piuttosto che agire. Procedi con edit, modifiche o implementazioni solo quando l'utente esplicitamente le richiede.
</do_not_act_before_instructions>

Claude Opus 4.5 e Claude Opus 4.6 sono anche più responsivi al system prompt rispetto ai modelli precedenti. Se i tuoi prompt sono stati progettati per ridurre l'undertriggering su strumenti o skill, questi modelli potrebbero ora overtrigger. La soluzione è ridurre qualsiasi linguaggio aggressivo. Dove avresti potuto dire "CRITICAL: Devi usare questo strumento quando...", puoi usare prompting più normale come "Usa questo strumento quando...".

Ottimizza le chiamate parallele ai tool

I modelli più recenti di Claude eccellono nell'esecuzione parallela dei tool. Questi modelli:

Eseguono più ricerche speculative durante la ricerca
Leggono più file contemporaneamente per costruire il contesto più velocemente
Eseguono comandi bash in parallelo (che possono anche creare un collo di bottiglia nelle prestazioni del sistema)

Questo comportamento è facilmente controllabile. Sebbene il modello abbia un alto tasso di successo nell'esecuzione parallela dei tool senza prompt, puoi aumentarlo a ~100% o regolare il livello di aggressività:

Prompt di esempio per la massima efficienza parallela

<use_parallel_tool_calls>
Se intendi chiamare più tool e non ci sono dipendenze tra le chiamate ai tool, effettua tutte le chiamate ai tool indipendenti in parallelo. Dai priorità alle chiamate ai tool simultanee ogni volta che le azioni possono essere eseguite in parallelo piuttosto che sequenzialmente. Ad esempio, quando leggi 3 file, esegui 3 chiamate ai tool in parallelo per leggere tutti e 3 i file nel contesto contemporaneamente. Massimizza l'uso delle chiamate ai tool parallele dove possibile per aumentare la velocità e l'efficienza. Tuttavia, se alcune chiamate ai tool dipendono da chiamate precedenti per informare valori dipendenti come i parametri, NON chiamare questi tool in parallelo e invece chiamarli sequenzialmente. Non usare mai segnaposti o indovinare parametri mancanti nelle chiamate ai tool.
</use_parallel_tool_calls>

Prompt di esempio per ridurre l'esecuzione parallela

Esegui le operazioni sequenzialmente con brevi pause tra ogni passaggio per garantire la stabilità.

Pensiero e ragionamento

Eccesso di riflessione e eccessiva accuratezza

Claude Opus 4.6 esegue significativamente più esplorazione iniziale rispetto ai modelli precedenti, specialmente con impostazioni effort più elevate. Questo lavoro iniziale spesso aiuta a ottimizzare i risultati finali, ma il modello può raccogliere un contesto esteso o perseguire più filoni di ricerca senza essere sollecitato. Se i tuoi prompt precedentemente incoraggiavano il modello a essere più accurato, dovresti regolare quella guida per Claude Opus 4.6:

Sostituisci i valori predefiniti generici con istruzioni più mirate. Invece di "Usa per impostazione predefinita [tool]," aggiungi una guida come "Usa [tool] quando migliorerebbe la tua comprensione del problema."
Rimuovi il sovra-prompting. I tool che non si attivavano sufficientemente nei modelli precedenti probabilmente si attiveranno appropriatamente ora. Istruzioni come "Se hai dubbi, usa [tool]" causeranno un'eccessiva attivazione.
Usa effort come fallback. Se Claude continua ad essere eccessivamente aggressivo, usa un'impostazione inferiore per effort.

In alcuni casi, Claude Opus 4.6 può pensare estesamente, il che può gonfiare i token di pensiero e rallentare le risposte. Se questo comportamento è indesiderato, puoi aggiungere istruzioni esplicite per vincolare il suo ragionamento, oppure puoi abbassare l'impostazione effort per ridurre il pensiero complessivo e l'utilizzo dei token.

Prompt di esempio

Quando stai decidendo come affrontare un problema, scegli un approccio e impegnati su di esso. Evita di riconsiderare le decisioni a meno che non incontri nuove informazioni che contraddicono direttamente il tuo ragionamento. Se stai soppesando due approcci, scegline uno e portalo avanti. Puoi sempre correggere il corso in seguito se l'approccio scelto fallisce.

Se hai bisogno di un limite massimo assoluto sui costi di pensiero, il pensiero esteso con un limite budget_tokens è ancora funzionale su Opus 4.6 e Sonnet 4.6 ma è deprecato. Preferisci abbassare l'impostazione effort o usare max_tokens come limite assoluto con adaptive thinking.

Sfrutta le capacità di pensiero e pensiero interleaved

I modelli più recenti di Claude offrono capacità di pensiero che possono essere particolarmente utili per attività che coinvolgono la riflessione dopo l'uso dei tool o il ragionamento multi-step complesso. Puoi guidare il suo pensiero iniziale o interleaved per risultati migliori.

Claude Opus 4.6 e Claude Sonnet 4.6 utilizzano adaptive thinking (thinking: {type: "adaptive"}), dove Claude decide dinamicamente quando e quanto pensare. Claude calibra il suo pensiero in base a due fattori: il parametro effort e la complessità della query. Uno sforzo più elevato provoca più pensiero, e query più complesse fanno lo stesso. Su query più semplici che non richiedono pensiero, il modello risponde direttamente. Nelle valutazioni interne, il pensiero adattivo guida in modo affidabile prestazioni migliori rispetto al pensiero esteso. Considera il passaggio al pensiero adattivo per ottenere le risposte più intelligenti.

Usa il pensiero adattivo per carichi di lavoro che richiedono comportamento agentico come l'uso di tool multi-step, attività di codifica complesse e loop di agenti a lungo termine. I modelli più vecchi utilizzano la modalità di pensiero manuale con budget_tokens.

Puoi guidare il comportamento di pensiero di Claude:

Prompt di esempio

Dopo aver ricevuto i risultati dei tool, rifletti attentamente sulla loro qualità e determina i passaggi successivi ottimali prima di procedere. Usa il tuo pensiero per pianificare e iterare in base a queste nuove informazioni, quindi intraprendi la migliore azione successiva.

Il comportamento di attivazione per il pensiero adattivo è promptabile. Se trovi che il modello pensa più spesso di quanto desideri, il che può accadere con prompt di sistema grandi o complessi, aggiungi una guida per indirizzarlo:

Prompt di esempio

Il pensiero esteso aggiunge latenza e dovrebbe essere utilizzato solo quando migliorerà significativamente la qualità della risposta - tipicamente per problemi che richiedono ragionamento multi-step. Quando hai dubbi, rispondi direttamente.

Se stai migrando da extended thinking con budget_tokens, sostituisci la tua configurazione di pensiero e sposta il controllo del budget su effort:

Prima (pensiero esteso, modelli più vecchi):

Python

client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=64000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    messages=[{"role": "user", "content": "..."}],
)

Dopo (pensiero adattivo):

Python

client.messages.create(
    model="claude-opus-4-7",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},  # or "max", "xhigh", "medium", "low"
    messages=[{"role": "user", "content": "..."}],
)

Se non stai utilizzando il pensiero esteso, non sono necessarie modifiche. Il pensiero è disattivato per impostazione predefinita quando ometti il parametro thinking.

Preferisci istruzioni generali rispetto ai passaggi prescrittivi. Un prompt come "pensa attentamente" spesso produce un ragionamento migliore rispetto a un piano passo-passo scritto a mano. Il ragionamento di Claude frequentemente supera ciò che un umano prescriverebbe.
Gli esempi multishot funzionano con il pensiero. Usa i tag <thinking> all'interno dei tuoi esempi few-shot per mostrare a Claude il modello di ragionamento. Generalizzerà quello stile ai suoi stessi blocchi di pensiero esteso.
CoT manuale come fallback. Quando il pensiero è disattivato, puoi comunque incoraggiare il ragionamento passo-passo chiedendo a Claude di pensare al problema. Usa tag strutturati come <thinking> e <answer> per separare chiaramente il ragionamento dall'output finale.
Chiedi a Claude di auto-verificarsi. Aggiungi qualcosa come "Prima di finire, verifica la tua risposta rispetto a [criteri di test]." Questo cattura gli errori in modo affidabile, specialmente per la codifica e la matematica.

Quando il pensiero esteso è disattivato, Claude Opus 4.5 è particolarmente sensibile alla parola "think" e alle sue varianti. Considera di usare alternative come "consider," "evaluate," o "reason through" in quei casi.

Per ulteriori informazioni sulle capacità di pensiero, vedi Extended thinking e Adaptive thinking.

Sistemi agentic

Ragionamento a lungo termine e tracciamento dello stato

I modelli più recenti di Claude eccellono nei compiti di ragionamento a lungo termine con eccezionali capacità di tracciamento dello stato. Claude mantiene l'orientamento durante sessioni estese concentrandosi sul progresso incrementale, facendo progressi costanti su poche cose alla volta piuttosto che tentare tutto contemporaneamente. Questa capacità emerge specialmente su più finestre di contesto o iterazioni di attività, dove Claude può lavorare su un compito complesso, salvare lo stato e continuare con una finestra di contesto fresca.

Consapevolezza del contesto e flussi di lavoro multi-finestra

I modelli Claude 4.6 e Claude 4.5 presentano context awareness, consentendo al modello di tracciare la sua finestra di contesto rimanente (cioè "budget di token") durante una conversazione. Questo consente a Claude di eseguire attività e gestire il contesto più efficacemente comprendendo quanto spazio ha per lavorare.

Gestione dei limiti di contesto:

Se stai utilizzando Claude in un harness di agente che compatta il contesto o consente il salvataggio del contesto in file esterni (come in Claude Code), considera di aggiungere queste informazioni al tuo prompt in modo che Claude possa comportarsi di conseguenza. Altrimenti, Claude potrebbe a volte tentare naturalmente di concludere il lavoro mentre si avvicina al limite di contesto. Di seguito è riportato un prompt di esempio:

Prompt di esempio

La tua finestra di contesto verrà compattata automaticamente mentre si avvicina al suo limite, consentendoti di continuare a lavorare indefinitamente da dove hai lasciato. Pertanto, non interrompere i compiti in anticipo a causa di preoccupazioni relative al budget di token. Man mano che ti avvicini al limite del tuo budget di token, salva il tuo progresso e stato attuali nella memoria prima che la finestra di contesto si aggiorni. Sii sempre il più persistente e autonomo possibile e completa i compiti completamente, anche se la fine del tuo budget si sta avvicinando. Non interrompere artificialmente alcun compito in anticipo indipendentemente dal contesto rimanente.

Lo memory tool si abbina naturalmente alla consapevolezza del contesto per transizioni di contesto senza soluzione di continuità.

Flussi di lavoro multi-finestra di contesto

Per attività che si estendono su più finestre di contesto:

Usa un prompt diverso per la primissima finestra di contesto: Usa la prima finestra di contesto per impostare un framework (scrivi test, crea script di configurazione), quindi usa le future finestre di contesto per iterare su una lista di cose da fare.
Fai scrivere al modello i test in un formato strutturato: Chiedi a Claude di creare test prima di iniziare il lavoro e tieni traccia di essi in un formato strutturato (ad es. tests.json). Questo porta a una migliore capacità a lungo termine di iterare. Ricorda a Claude l'importanza dei test: "È inaccettabile rimuovere o modificare i test perché ciò potrebbe portare a funzionalità mancanti o buggy."
Configura strumenti di qualità della vita: Incoraggia Claude a creare script di configurazione (ad es. init.sh) per avviare gracefully i server, eseguire suite di test e linter. Questo previene il lavoro ripetuto quando si continua da una finestra di contesto fresca.
Iniziare da zero vs compattazione: Quando una finestra di contesto viene cancellata, considera di iniziare con una finestra di contesto completamente nuova piuttosto che utilizzare la compattazione. I modelli più recenti di Claude sono estremamente efficaci nel scoprire lo stato dal filesystem locale. In alcuni casi, potresti voler sfruttare questo rispetto alla compattazione. Sii prescrittivo su come dovrebbe iniziare:

Prompt di esempio

Questo è un compito molto lungo, quindi potrebbe essere vantaggioso pianificare il tuo lavoro chiaramente. È incoraggiato spendere l'intero contesto di output sul compito - assicurati solo di non esaurire il contesto con lavoro significativo non committato. Continua a lavorare sistematicamente fino a quando non hai completato questo compito.

Migliori pratiche di gestione dello stato

Usa formati strutturati per i dati di stato: Quando traccia informazioni strutturate (come risultati di test o stato dei compiti), usa JSON o altri formati strutturati per aiutare Claude a comprendere i requisiti dello schema
Usa testo non strutturato per le note di progresso: Le note di progresso in forma libera funzionano bene per tracciare il progresso generale e il contesto
Usa git per il tracciamento dello stato: Git fornisce un log di ciò che è stato fatto e checkpoint che possono essere ripristinati. I modelli più recenti di Claude funzionano particolarmente bene nell'utilizzo di git per tracciare lo stato su più sessioni.
Sottolinea il progresso incrementale: Chiedi esplicitamente a Claude di tenere traccia del suo progresso e di concentrarsi sul lavoro incrementale

Bilanciamento tra autonomia e sicurezza

Senza guida, Claude Opus 4.6 potrebbe intraprendere azioni difficili da invertire o che influenzano sistemi condivisi, come l'eliminazione di file, force-push o la pubblicazione su servizi esterni. Se desideri che Claude Opus 4.6 confermi prima di intraprendere azioni potenzialmente rischiose, aggiungi una guida al tuo prompt:

Prompt di esempio

Considera la reversibilità e il potenziale impatto delle tue azioni. Sei incoraggiato a intraprendere azioni locali e reversibili come la modifica di file o l'esecuzione di test, ma per azioni difficili da invertire, che influenzano sistemi condivisi o potrebbero essere distruttive, chiedi all'utente prima di procedere.

Esempi di azioni che richiedono conferma:
- Operazioni distruttive: eliminazione di file o rami, eliminazione di tabelle di database, rm -rf
- Operazioni difficili da invertire: git push --force, git reset --hard, modifica di commit pubblicati
- Operazioni visibili ad altri: push di codice, commenti su PR/issue, invio di messaggi, modifica dell'infrastruttura condivisa

Quando incontri ostacoli, non usare azioni distruttive come scorciatoia. Ad esempio, non bypassare i controlli di sicurezza (ad es. --no-verify) o scartare file sconosciuti che potrebbero essere lavoro in corso.

Ricerca e raccolta di informazioni

I modelli più recenti di Claude dimostrano eccezionali capacità di ricerca agentica e possono trovare e sintetizzare informazioni da più fonti in modo efficace. Per risultati di ricerca ottimali:

Fornisci criteri di successo chiari: Definisci cosa costituisce una risposta di successo alla tua domanda di ricerca
Incoraggia la verifica delle fonti: Chiedi a Claude di verificare le informazioni su più fonti
Per compiti di ricerca complessi, usa un approccio strutturato:

Prompt di esempio per ricerca complessa

Cerca queste informazioni in modo strutturato. Man mano che raccogli dati, sviluppa diverse ipotesi concorrenti. Traccia i tuoi livelli di confidenza nelle note di progresso per migliorare la calibrazione. Critica regolarmente il tuo approccio e pianifica. Aggiorna un file di albero di ipotesi o note di ricerca per persistere le informazioni e fornire trasparenza. Suddividi questo compito di ricerca complesso sistematicamente.

Questo approccio strutturato consente a Claude di trovare e sintetizzare praticamente qualsiasi informazione e criticare iterativamente i suoi risultati, indipendentemente dalle dimensioni del corpus.

Orchestrazione di subagenti

I modelli più recenti di Claude dimostrano capacità di orchestrazione di subagenti nativi significativamente migliorate. Questi modelli possono riconoscere quando i compiti trarrebbero beneficio dalla delega del lavoro a subagenti specializzati e farlo proattivamente senza richiedere istruzioni esplicite.

Per sfruttare questo comportamento:

Assicurati che i tool dei subagenti siano ben definiti: Disponi di tool dei subagenti disponibili e descritti nelle definizioni dei tool
Lascia che Claude orchestri naturalmente: Claude delegherà appropriatamente senza istruzioni esplicite
Guarda l'uso eccessivo: Claude Opus 4.6 ha una forte predilezione per i subagenti e potrebbe generarli in situazioni in cui un approccio più semplice e diretto sarebbe sufficiente. Ad esempio, il modello potrebbe generare subagenti per l'esplorazione del codice quando una chiamata grep diretta è più veloce e sufficiente.

Se stai vedendo un uso eccessivo di subagenti, aggiungi una guida esplicita su quando i subagenti sono e non sono garantiti:

Prompt di esempio per l'utilizzo di subagenti

Usa i subagenti quando i compiti possono essere eseguiti in parallelo, richiedono contesto isolato o coinvolgono flussi di lavoro indipendenti che non hanno bisogno di condividere lo stato. Per compiti semplici, operazioni sequenziali, modifiche a file singoli o compiti in cui devi mantenere il contesto tra i passaggi, lavora direttamente piuttosto che delegare.

Concatena prompt complessi

Con il pensiero adattivo e l'orchestrazione dei subagenti, Claude gestisce la maggior parte del ragionamento multi-step internamente. Il concatenamento esplicito dei prompt (suddividere un compito in chiamate API sequenziali) è ancora utile quando devi ispezionare output intermedi o applicare una struttura di pipeline specifica.

Il modello di concatenamento più comune è auto-correzione: genera una bozza → fai rivedere a Claude rispetto ai criteri → fai affinare a Claude in base alla revisione. Ogni passaggio è una chiamata API separata in modo da poter registrare, valutare o ramificare in qualsiasi punto.

Riduci la creazione di file nella codifica agentica

I modelli più recenti di Claude possono a volte creare nuovi file per scopi di test e iterazione, in particolare quando si lavora con il codice. Questo approccio consente a Claude di utilizzare file, specialmente script python, come un "blocco note temporaneo" prima di salvare l'output finale. L'utilizzo di file temporanei può migliorare i risultati particolarmente per i casi di utilizzo della codifica agentica.

Se preferisci minimizzare la creazione netta di nuovi file, puoi istruire Claude a ripulire dopo se stesso:

Prompt di esempio

Se crei file temporanei nuovi, script o file helper per l'iterazione, pulisci questi file rimuovendoli alla fine del compito.

Eccessivo entusiasmo

Claude Opus 4.5 e Claude Opus 4.6 hanno una tendenza a over-engineering creando file extra, aggiungendo astrazioni non necessarie o costruendo flessibilità che non era stata richiesta. Se stai vedendo questo comportamento indesiderato, aggiungi una guida specifica per mantenere le soluzioni minime.

Ad esempio:

Prompt di esempio per minimizzare l'over-engineering

Evita l'over-engineering. Fai solo i cambiamenti che sono direttamente richiesti o chiaramente necessari. Mantieni le soluzioni semplici e focalizzate:

- Ambito: Non aggiungere funzionalità, refactorizzare il codice o fare "miglioramenti" oltre a ciò che è stato chiesto. Una correzione di bug non ha bisogno di codice circostante pulito. Una funzionalità semplice non ha bisogno di configurabilità extra.

- Documentazione: Non aggiungere docstring, commenti o annotazioni di tipo al codice che non hai modificato. Aggiungi commenti solo dove la logica non è auto-evidente.

- Codifica difensiva: Non aggiungere gestione degli errori, fallback o validazione per scenari che non possono accadere. Fidati del codice interno e delle garanzie del framework. Valida solo ai confini del sistema (input dell'utente, API esterne).

- Astrazioni: Non creare helper, utility o astrazioni per operazioni una tantum. Non progettare per requisiti futuri ipotetici. La giusta quantità di complessità è il minimo necessario per il compito attuale.

Evita di concentrarsi sul passaggio dei test e sulla codifica fissa

Claude a volte può concentrarsi troppo sul passaggio dei test a scapito di soluzioni più generali, o può usare workaround come script helper per il refactoring complesso invece di usare strumenti standard direttamente. Per prevenire questo comportamento e garantire soluzioni robuste e generalizzabili:

Prompt di esempio

Per favore scrivi una soluzione di alta qualità e di uso generale utilizzando gli strumenti standard disponibili. Non creare script helper o workaround per completare il compito più efficientemente. Implementa una soluzione che funzioni correttamente per tutti gli input validi, non solo i casi di test. Non codificare valori o creare soluzioni che funzionano solo per input di test specifici. Invece, implementa la logica effettiva che risolve il problema in generale.

Concentrati sulla comprensione dei requisiti del problema e sull'implementazione dell'algoritmo corretto. I test sono lì per verificare la correttezza, non per definire la soluzione. Fornisci un'implementazione principiata che segue le migliori pratiche e i principi di progettazione del software.

Se il compito è irragionevole o non fattibile, o se uno qualsiasi dei test è errato, per favore informami piuttosto che aggirare il problema. La soluzione dovrebbe essere robusta, mantenibile ed estensibile.

Minimizzazione delle allucinazioni nella codifica agentica

I modelli più recenti di Claude sono meno inclini alle allucinazioni e forniscono risposte più accurate, fondate e intelligenti basate sul codice. Per incoraggiare ulteriormente questo comportamento e minimizzare le allucinazioni:

Prompt di esempio

<investigate_before_answering>
Non speculare mai su codice che non hai aperto. Se l'utente fa riferimento a un file specifico, DEVI leggere il file prima di rispondere. Assicurati di investigare e leggere i file rilevanti PRIMA di rispondere a domande sulla base di codice. Non fare mai affermazioni sul codice prima di investigare a meno che tu non sia sicuro della risposta corretta - fornisci risposte fondate e prive di allucinazioni.
</investigate_before_answering>

Suggerimenti specifici per le capacità

Capacità di visione migliorate

Claude Opus 4.5 e Claude Opus 4.6 hanno capacità di visione migliorate rispetto ai modelli Claude precedenti. Funzionano meglio nei compiti di elaborazione delle immagini e estrazione dei dati, in particolare quando ci sono più immagini presenti nel contesto. Questi miglioramenti si estendono all'utilizzo del computer, dove i modelli possono interpretare più affidabilmente gli screenshot e gli elementi dell'interfaccia utente. Puoi anche usare questi modelli per analizzare video suddividendoli in fotogrammi.

Una tecnica che si è dimostrata efficace per aumentare ulteriormente le prestazioni è fornire a Claude uno strumento di ritaglio o una skill. I test hanno mostrato un miglioramento coerente nelle valutazioni delle immagini quando Claude è in grado di "zoomare" su regioni rilevanti di un'immagine. Anthropic ha creato un cookbook per lo strumento di ritaglio.

Progettazione del frontend

Claude Opus 4.5 e Claude Opus 4.6 eccellono nella costruzione di applicazioni web complesse e reali con un forte design del frontend. Tuttavia, senza guida, i modelli possono impostare come predefiniti modelli generici che creano quello che gli utenti chiamano l'estetica "AI slop". Per creare frontend distintivi e creativi che sorprendono e deliziano:

Per una guida dettagliata sul miglioramento del design del frontend, vedi il post del blog su improving frontend design through skills.

Ecco uno snippet di prompt di sistema che puoi usare per incoraggiare un migliore design del frontend:

Prompt di esempio per l'estetica del frontend

<frontend_aesthetics>
Tendi a convergere verso output generici e "on distribution". Nel design del frontend, questo crea quello che gli utenti chiamano l'estetica "AI slop". Evita questo: crea frontend creativi e distintivi che sorprendono e deliziano.

Concentrati su:
- Tipografia: Scegli font che sono belli, unici e interessanti. Evita font generici come Arial e Inter; opta invece per scelte distintive che elevino l'estetica del frontend.
- Colore e tema: Impegnati su un'estetica coerente. Usa variabili CSS per la coerenza. I colori dominanti con accenti nitidi superano le palette timide e uniformemente distribuite. Attingi da temi IDE e estetiche culturali per l'ispirazione.
- Movimento: Usa le animazioni per effetti e micro-interazioni. Dai priorità alle soluzioni solo CSS per HTML. Usa la libreria Motion per React quando disponibile. Concentrati su momenti ad alto impatto: un caricamento di pagina ben orchestrato con rivela sfalsate (animation-delay) crea più delizia rispetto a micro-interazioni sparse.
- Sfondi: Crea atmosfera e profondità piuttosto che impostare come predefiniti colori solidi. Stratifica i gradienti CSS, usa modelli geometrici o aggiungi effetti contestuali che corrispondono all'estetica complessiva.

Evita estetiche generiche generate da AI:
- Famiglie di font overused (Inter, Roboto, Arial, font di sistema)
- Schemi di colore cliché (in particolare gradienti viola su sfondi bianchi)
- Layout e modelli di componenti prevedibili
- Design cookie-cutter che manca di carattere specifico del contesto

Interpreta creativamente e fai scelte inaspettate che si sentono genuinamente progettate per il contesto. Varia tra temi chiari e scuri, font diversi, estetiche diverse. Tendi comunque a convergere su scelte comuni (Space Grotesk, ad esempio) tra le generazioni. Evita questo: è critico che tu pensi fuori dagli schemi!
</frontend_aesthetics>

Puoi anche fare riferimento alla definizione completa della skill.

Considerazioni sulla migrazione

Quando migri ai modelli Claude 4.6 da generazioni precedenti:

Sii specifico sul comportamento desiderato: Considera di descrivere esattamente cosa vorresti vedere nell'output.
Inquadra le tue istruzioni con modificatori: Aggiungere modificatori che incoraggiano Claude ad aumentare la qualità e il dettaglio del suo output può aiutare a modellare meglio le prestazioni di Claude. Ad esempio, invece di "Crea un dashboard di analitiche", usa "Crea un dashboard di analitiche. Includi il maggior numero possibile di funzionalità e interazioni rilevanti. Vai oltre le basi per creare un'implementazione completamente funzionante."
Richiedi funzionalità specifiche esplicitamente: Le animazioni e gli elementi interattivi dovrebbero essere richiesti esplicitamente quando desiderati.
Aggiorna la configurazione del pensiero: I modelli Claude 4.6 utilizzano adaptive thinking (thinking: {type: "adaptive"}) invece del pensiero manuale con budget_tokens. Usa il parametro effort per controllare la profondità del pensiero.
Migra dalle risposte prefillate: Le risposte prefillate nell'ultimo turno dell'assistente sono deprecate a partire dai modelli Claude 4.6. Vedi per una guida dettagliata sulle alternative.

Per i passaggi di migrazione dettagliati, vedi la Migration guide.

Migrazione da Claude Sonnet 4.5 a Claude Sonnet 4.6

Claude Sonnet 4.6 ha come impostazione predefinita un livello di effort di high, in contrasto con Claude Sonnet 4.5 che non aveva alcun parametro effort. Considera di regolare il parametro effort mentre migri da Claude Sonnet 4.5 a Claude Sonnet 4.6. Se non esplicitamente impostato, potresti sperimentare una latenza più elevata con il livello di effort predefinito.

Impostazioni di effort consigliate:

Medium per la maggior parte delle applicazioni
Low per carichi di lavoro ad alto volume o sensibili alla latenza
Imposta un grande budget di token di output massimo (64k token consigliati) a effort medio o alto per dare al modello spazio per pensare e agire

Quando usare Opus 4.7 invece: Per i problemi più difficili e a lungo termine (migrazioni di codice su larga scala, ricerca profonda, lavoro autonomo esteso), Opus 4.7 rimane la scelta giusta. Sonnet 4.6 è ottimizzato per carichi di lavoro in cui il rapido turnaround e l'efficienza dei costi sono più importanti.

Se non stai utilizzando il pensiero esteso

Se non stai utilizzando il pensiero esteso su Claude Sonnet 4.5, puoi continuare senza di esso su Claude Sonnet 4.6. Dovresti esplicitamente impostare effort al livello appropriato per il tuo caso d'uso. A low effort con il pensiero disattivato, puoi aspettarti prestazioni simili o migliori rispetto a Claude Sonnet 4.5 senza pensiero esteso.

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "disabled"},
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "..."}],
)

Se stai utilizzando il pensiero esteso

Se stai utilizzando il pensiero esteso con budget_tokens su Claude Sonnet 4.5, è ancora funzionale su Claude Sonnet 4.6 ma è deprecato. Migra a adaptive thinking con il parametro effort.

Migrazione al pensiero adattivo

Il pensiero adattivo è particolarmente adatto ai seguenti modelli di carico di lavoro:

Agenti autonomi multi-step: agenti di codifica che trasformano i requisiti in software funzionante, pipeline di analisi dei dati e ricerca di bug dove il modello viene eseguito indipendentemente su molti passaggi. Il pensiero adattivo consente al modello di calibrare il suo ragionamento per passaggio, rimanendo in pista su traiettorie più lunghe. Per questi carichi di lavoro, inizia a high effort. Se la latenza o l'utilizzo dei token è una preoccupazione, riduci a medium.
Agenti di utilizzo del computer: Claude Sonnet 4.6 ha raggiunto la migliore accuratezza in classe sulle valutazioni di utilizzo del computer utilizzando la modalità adattiva.
Carichi di lavoro bimodali: un mix di compiti facili e difficili dove l'adattivo salta il pensiero su query semplici e ragiona profondamente su quelle complesse.

Quando utilizzi il pensiero adattivo, valuta medium e high effort sui tuoi compiti. Il livello giusto dipende dal compromesso del tuo carico di lavoro tra qualità, latenza e utilizzo dei token.

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},
    messages=[{"role": "user", "content": "..."}],
)

Mantenimento di budget_tokens durante la migrazione

Se devi mantenere budget_tokens temporaneamente durante la migrazione, un budget intorno a 16k token fornisce spazio per problemi più difficili senza rischio di utilizzo di token incontrollato. Questa configurazione è deprecata e verrà rimossa in una futura versione del modello.

Per i casi di utilizzo della codifica (codifica agentica, flussi di lavoro pesanti di tool, generazione di codice), inizia con medium effort:

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "..."}],
)

Per i casi di utilizzo di chat e non-codifica (chat, generazione di contenuti, ricerca, classificazione), inizia con low effort:

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "..."}],
)

Prompting Claude Opus 4.7

Lunghezza della risposta e verbosità

Calibrare lo sforzo e la profondità del thinking

Attivazione dell'uso degli strumenti

Aggiornamenti di progresso rivolti all'utente

Seguimento di istruzioni più letterale

Tono e stile di scrittura

Controllare lo spawning dei subagent

Impostazioni predefinite di design e frontend

Prodotti di coding interattivi

Harness di revisione del codice

Uso del computer

Principi generali

Sii chiaro e diretto

Esempio: Creazione di un dashboard di analitiche

Aggiungi contesto per migliorare le prestazioni

Esempio: Preferenze di formattazione

Usa gli esempi in modo efficace

Struttura i prompt con tag XML

Dai a Claude un ruolo

Prompting con contesto lungo

Esempio di struttura multi-documento

Autoconoscenza del modello

Output e formattazione

Stile di comunicazione e verbosità

Controlla il formato delle risposte

Output LaTeX

Creazione di documenti

Migrazione da risposte pre-riempite

Controllare la formattazione dell'output

Eliminare i preamboli

Evitare rifiuti cattivi

Continuazioni

Idratazione del contesto e coerenza del ruolo

Uso degli strumenti

Utilizzo degli strumenti

Esempio: Istruzioni esplicite

Ottimizza le chiamate parallele ai tool

Pensiero e ragionamento

Eccesso di riflessione e eccessiva accuratezza

Sfrutta le capacità di pensiero e pensiero interleaved

Sistemi agentic

Ragionamento a lungo termine e tracciamento dello stato

Consapevolezza del contesto e flussi di lavoro multi-finestra

Flussi di lavoro multi-finestra di contesto

Migliori pratiche di gestione dello stato

Esempio: Tracciamento dello stato

Bilanciamento tra autonomia e sicurezza

Ricerca e raccolta di informazioni

Orchestrazione di subagenti

Concatena prompt complessi

Riduci la creazione di file nella codifica agentica

Eccessivo entusiasmo

Evita di concentrarsi sul passaggio dei test e sulla codifica fissa

Minimizzazione delle allucinazioni nella codifica agentica

Suggerimenti specifici per le capacità

Capacità di visione migliorate

Progettazione del frontend

Considerazioni sulla migrazione

Migrazione da Claude Sonnet 4.5 a Claude Sonnet 4.6

Se non stai utilizzando il pensiero esteso

Se stai utilizzando il pensiero esteso

Migrazione al pensiero adattivo

Mantenimento di budget_tokens durante la migrazione

Esempio di estrazione di citazioni