Was this page helpful?
Questa guida copre la migrazione del codice Messages API. Se utilizzi Claude Managed Agents, non sono richiesti cambiamenti oltre all'aggiornamento del nome del modello.
Claude Opus 4.7 è il nostro modello disponibile in generale più capace fino ad oggi. È altamente autonomo e funziona eccezionalmente bene su lavori agentici a lungo termine, lavori di conoscenza, compiti di visione e compiti di memoria. Claude Opus 4.7 dovrebbe avere forti prestazioni out-of-the-box su prompt e eval esistenti di Claude Opus 4.6 allo stesso prezzo di $5 / $25 per MTok, ma ci sono alcuni cambiamenti comportamentali e API che vale la pena conoscere mentre esegui la migrazione. Supporta lo stesso set di funzionalità di Claude Opus 4.6, inclusa la finestra di contesto di 1M token ai prezzi API standard senza premio per contesto lungo, 128k token di output massimi, adaptive thinking, prompt caching, batch processing, Files API, supporto PDF, visione e l'intero set di strumenti lato server e lato client (bash, esecuzione del codice, computer use, editor di testo, ricerca web, web fetch, connettore MCP, memoria).
Automatizza questa migrazione con la competenza Claude API. In Claude Code, esegui /claude-api migrate per invocare la competenza Claude API inclusa:
/claude-api migrate this project to claude-opus-4-7La competenza applica lo scambio di ID modello, i cambiamenti di parametri che interrompono, la sostituzione del prefill e la calibrazione dello sforzo descritti di seguito nel tuo codebase, quindi produce un elenco di controllo di elementi da verificare manualmente. Ti chiede di confermare l'ambito della migrazione (l'intera directory di lavoro, una sottodirectory o un elenco di file specifico) prima di modificare qualsiasi file.
# Migrazione Opus
model = "claude-opus-4-6" # Prima
model = "claude-opus-4-7" # DopoExtended thinking rimosso: thinking: {type: "enabled", budget_tokens: N} non è più supportato su Claude Opus 4.7 o modelli successivi e restituisce un errore 400. Passa a adaptive thinking (thinking: {type: "adaptive"}) e usa il parametro effort per controllare la profondità del thinking. Adaptive thinking è disattivato per impostazione predefinita su Claude Opus 4.7: le richieste senza il campo thinking vengono eseguite senza thinking, corrispondendo al comportamento di Opus 4.6. Imposta thinking: {type: "adaptive"} esplicitamente per abilitarlo.
Prima (Claude Opus 4.6):
client.messages.create(
model="claude-opus-4-6",
max_tokens=64000,
thinking={"type": "enabled", "budget_tokens": 32000},
messages=[{"role": "user", "content": "..."}],
)Il parametro effort ti consente di regolare l'intelligenza di Claude rispetto alla spesa di token, scambiando la capacità per velocità più veloce e costi inferiori. Inizia con il nuovo livello di sforzo xhigh per i casi di utilizzo di codifica e agentici, e usa un minimo di sforzo high per la maggior parte dei casi di utilizzo sensibili all'intelligenza. Sperimenta con altri livelli di sforzo per regolare ulteriormente l'utilizzo dei token e l'intelligenza:
max: Lo sforzo massimo può fornire guadagni di prestazioni in alcuni casi di utilizzo, ma può mostrare rendimenti decrescenti dall'aumento dell'utilizzo dei token. Questa impostazione può anche a volte essere soggetta al pensiero eccessivo. Consigliamo di testare lo sforzo massimo per compiti che richiedono molta intelligenza.xhigh (nuovo): Lo sforzo extra alto è la migliore impostazione per la maggior parte dei casi di utilizzo di codifica e agentici.high: Questa impostazione bilancia l'utilizzo dei token e l'intelligenza. Per la maggior parte dei casi di utilizzo sensibili all'intelligenza, consigliamo un minimo di sforzo high.medium: Buono per i casi di utilizzo sensibili ai costi che devono ridurre l'utilizzo dei token mentre scambiano l'intelligenza.low: Riservato per compiti brevi e limitati e carichi di lavoro sensibili alla latenza che non sono sensibili all'intelligenza.Ci aspettiamo che lo sforzo sia più importante per questo modello che per qualsiasi Opus precedente, e consigliamo di sperimentare attivamente quando esegui l'upgrade.
Claude Opus 4.7 ha diverse differenze comportamentali da Claude Opus 4.6 che non sono cambiamenti API che interrompono ma possono richiedere aggiornamenti di prompt o rimozione di scaffolding.
La lunghezza della risposta varia in base al caso di utilizzo: Claude Opus 4.7 calibra la lunghezza della risposta in base a quanto complesso giudica il compito, piuttosto che impostare per impostazione predefinita una verbosità fissa. Questo di solito significa risposte più brevi su ricerche semplici e molto più lunghe su analisi aperte. Se il tuo prodotto dipende da un certo stile o verbosità dell'output, potrebbe essere necessario regolare i tuoi prompt. Ad esempio, per diminuire la verbosità, potresti aggiungere: "Fornisci risposte concise e mirate. Salta il contesto non essenziale e mantieni gli esempi minimi." Se vedi esempi specifici di tipi di verbosità (cioè spiegazioni eccessive), puoi aggiungere istruzioni aggiuntive nel tuo prompt per prevenirle. Gli esempi positivi che mostrano come Claude può comunicare con il livello appropriato di concisione tendono ad essere più efficaci degli esempi negativi o delle istruzioni che dicono al modello cosa non fare.
Seguire le istruzioni più letterale: Claude Opus 4.7 interpreta i prompt in modo più letterale ed esplicito rispetto a Claude Opus 4.6, in particolare a livelli di sforzo inferiori. Non generalizzerà silenziosamente un'istruzione da un elemento a un altro, e non dedurrà richieste che non hai fatto. Il lato positivo di questo letteralismo è la precisione e meno confusione. Generalmente funziona meglio per i casi di utilizzo API con prompt accuratamente sintonizzati, estrazione strutturata e pipeline in cui desideri un comportamento prevedibile. Una revisione del prompt e dell'harness può essere particolarmente utile per la migrazione a Claude Opus 4.7.
Tono più diretto: Come con qualsiasi nuovo modello, lo stile della prosa nella scrittura di forma lunga può cambiare. Claude Opus 4.7 è più diretto e opinabile, con meno frasi orientate alla convalida e meno emoji rispetto allo stile più caldo di Claude Opus 4.6. Se il tuo prodotto si basa su una voce specifica, rivaluta i prompt di stile rispetto alla nuova linea di base.
Questi non sono obbligatori ma miglioreranno la tua esperienza:
Rivaluta max_tokens: Poiché lo stesso testo produce un conteggio di token più elevato su Claude Opus 4.7, suggeriamo di aggiornare i tuoi parametri max_tokens per fornire spazio aggiuntivo, inclusi i trigger di compattazione. Gli interventi di prompting, task_budget e effort possono aiutare a controllare i costi e garantire un utilizzo appropriato dei token.
Controlla le aspettative di conteggio dei token: Qualsiasi percorso di codice che stima i token lato client o presuppone un rapporto fisso token-carattere dovrebbe essere ri-testato rispetto a Claude Opus 4.7. Usa l'endpoint di conteggio dei token per verificare.
Adotta task budgets (beta): Claude Opus 4.7 introduce i budget dei compiti. Questi budget ti permettono di informare Claude quanti token ha per un ciclo agentici completo, incluso thinking, chiamate di strumento, risultati di strumento e output finale. Il modello vede un conto alla rovescia in esecuzione e lo utilizza per dare priorità al lavoro e terminare il compito con grazia man mano che il budget viene consumato. Per usare, imposta l'header beta task-budgets-2026-03-13 e aggiungi quanto segue alla tua configurazione di output:
claude-opus-4-6 a claude-opus-4-7 (o aggiorna gli alias).temperature, top_p e top_k dai payload delle richieste.thinking: {type: "enabled", budget_tokens: N} con thinking: {type: "adaptive"} più il parametro effort.Se stai migrando da Claude Opus 4.5, Opus 4.1 o un modello precedente direttamente a Claude Opus 4.7, applica tutti i cambiamenti di Opus 4.7 sopra più i cambiamenti cumulativi in questa sezione che hanno avuto effetto tra Opus 4.5 e Opus 4.7. Se stai migrando da Opus 4.6, hai solo bisogno della sezione Opus 4.7 sopra.
# Migrazione Opus
model = "claude-opus-4-5" # Prima
model = "claude-opus-4-7" # DopoRimozione del prefill è coperta nei cambiamenti che interrompono di Opus 4.7 sopra.
Quotazione del parametro dello strumento: Claude Opus 4.6 e i modelli successivi possono produrre un'escaping JSON leggermente diversa nelle stringhe negli argomenti della chiamata dello strumento (ad es., gestione diversa degli escape Unicode o dell'escape della barra inclinata). Se analizzi lo input della chiamata dello strumento come una stringa grezza piuttosto che utilizzare un parser JSON, verifica la tua logica di parsing. I parser JSON standard (come json.loads() o JSON.parse()) gestiscono automaticamente queste differenze.
Questi cambiamenti migliorano la tua esperienza su Opus 4.7. Gli elementi contrassegnati (obbligatorio su Opus 4.7) erano raccomandazioni facoltative quando Opus 4.6 è stato lanciato ma ora sono obbligatori; il resto rimane consigliato.
Migra a adaptive thinking (obbligatorio su Opus 4.7): thinking: {type: "enabled", budget_tokens: N} restituisce un errore 400 su Claude Opus 4.7. Passa a thinking: {type: "adaptive"} e usa il parametro effort per controllare la profondità del thinking. Vedi Adaptive thinking.
Se stai migrando da Opus 4.1, Sonnet 4 (deprecato) o modelli precedenti direttamente a Claude Opus 4.7, applica i cambiamenti di Claude Opus 4.7 in cima a questa guida e i cambiamenti cumulativi sopra più i cambiamenti aggiuntivi in questa sezione.
# Da Opus 4.1
model = "claude-opus-4-1-20250805" # Prima
model = "claude-opus-4-7" # Dopo
# Da Sonnet 4
model = "claude-sonnet-4-20250514" # Prima
model = "claude-opus-4-7" # Dopo
# Da Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Prima
model = "claude-opus-4-7" # DopoRimuovi i parametri di campionamento
Questo è un cambiamento che interrompe quando si esegue la migrazione da modelli Claude 3.x.
A partire da Claude Opus 4.7, impostare temperature, top_p o top_k su qualsiasi valore non predefinito restituirà un errore 400. Il percorso di migrazione più sicuro è omettere completamente questi parametri dalle richieste e utilizzare il prompting per guidare il comportamento del modello. Se stavi usando temperature = 0 per il determinismo, nota che non ha mai garantito output identici.
# Prima - Questo darà errore nei modelli Claude 4+
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # I parametri di campionamento non predefiniti restituiscono 400 su Opus 4.7
# ...
)
# Dopo
response = client.messages.create(
model="claude-opus-4-7",
# ...
)token-efficient-tools-2025-02-19 e output-128k-2025-02-19. Tutti i modelli Claude 4+ hanno l'utilizzo dello strumento efficiente in termini di token integrato e questi header non hanno alcun effetto.claude-opus-4-7output_config.format invecethinking: {type: "enabled", budget_tokens: N} con thinking: {type: "adaptive"} più il parametro effort (restituisce 400 su Opus 4.7)effort-2025-11-24 (effort è ora GA)Claude Sonnet 4.6 combina forte intelligenza con prestazioni veloci, con capacità di ricerca agentiche migliorate e esecuzione del codice gratuita quando utilizzato con ricerca web o web fetch. È ideale per compiti di codifica, analisi e contenuto quotidiani.
Per una panoramica completa delle capacità, vedi la panoramica dei modelli.
Il prezzo di Sonnet 4.6 è $3 per milione di token di input, $15 per milione di token di output. Vedi Claude pricing per i dettagli.
Aggiorna il nome del tuo modello:
# Da Sonnet 4.5
model = "claude-sonnet-4-5" # Prima
model = "claude-sonnet-4-6" # Dopo
# Da Sonnet 4
model = "claude-sonnet-4-20250514" # Prima
model = "claude-sonnet-4-6" # DopoIl prefilling dei messaggi dell'assistente non è più supportato
Questo è un cambiamento di rilievo durante la migrazione da Sonnet 4.5 o versioni precedenti.
Il prefilling dei messaggi dell'assistente restituisce un errore 400 su Sonnet 4.6. Utilizza output strutturati, istruzioni nel prompt di sistema, o output_config.format invece.
Casi d'uso comuni di prefill e migrazioni:
Controllo della formattazione dell'output (forzare output JSON/YAML): Utilizza output strutturati o strumenti con campi enum per attività di classificazione.
Eliminazione dei preamboli (rimozione di frasi come "Ecco..."): Aggiungi istruzioni dirette nel prompt di sistema: "Rispondi direttamente senza preambolo. Non iniziare con frasi come 'Ecco...', 'Basato su...', ecc."
Evitare rifiuti scorretti: Claude è molto più bravo nei rifiuti appropriati ora. Un prompt chiaro nel messaggio dell'utente senza prefill dovrebbe essere sufficiente.
Aggiorna i parametri di campionamento
Questo è un cambiamento di rilievo durante la migrazione da modelli Claude 3.x.
Utilizza solo temperature O top_p, non entrambi.
Aggiorna le versioni degli strumenti
Questo è un cambiamento di rilievo durante la migrazione da modelli Claude 3.x.
Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.
Gestisci il motivo di arresto refusal
Aggiorna la tua applicazione per gestire i motivi di arresto refusal.
fine-grained-tool-streaming-2025-05-14: Lo streaming degli strumenti a grana fine è ora GA su Sonnet 4.6 e non richiede più un header beta.output_format a output_config.format: Il parametro output_format è deprecato. Utilizza output_config.format invece.Considera la migrazione da Sonnet 4.5 a Sonnet 4.6, che offre maggiore intelligenza allo stesso prezzo.
Sonnet 4.6 ha come impostazione predefinita un livello di sforzo di high, in contrasto con Sonnet 4.5 che non aveva parametro di sforzo. Considera l'aggiustamento del parametro di sforzo durante la migrazione da Sonnet 4.5 a Sonnet 4.6. Se non impostato esplicitamente, potresti riscontrare una latenza più elevata con il livello di sforzo predefinito.
Se non stai utilizzando il pensiero esteso su Sonnet 4.5, puoi continuare senza di esso su Sonnet 4.6. Dovresti impostare esplicitamente lo sforzo al livello appropriato per il tuo caso d'uso. Con sforzo low e il pensiero disabilitato, puoi aspettarti prestazioni simili o migliori rispetto a Sonnet 4.5 senza pensiero esteso.
Se stai utilizzando il pensiero esteso con budget_tokens su Sonnet 4.5, è ancora funzionale su Sonnet 4.6 ma è deprecato. Migra al pensiero adattivo con il parametro di sforzo.
Il pensiero adattivo è la sostituzione consigliata per budget_tokens su Sonnet 4.6. È particolarmente adatto ai seguenti modelli di carico di lavoro:
high. Se la latenza o l'utilizzo dei token è una preoccupazione, riduci a medium.Quando utilizzi il pensiero adattivo, valuta lo sforzo medium e high sui tuoi compiti. Il livello giusto dipende dal compromesso del tuo carico di lavoro tra qualità, latenza e utilizzo dei token.
Se noti comportamenti incoerenti o regressioni di qualità con il pensiero adattivo, prova ad abbassare l'impostazione effort o utilizza max_tokens come limite rigido prima. Il pensiero esteso con budget_tokens è ancora funzionale su Sonnet 4.6 ma è deprecato e non è più consigliato.
Se hai bisogno di mantenere budget_tokens temporaneamente durante la migrazione, un budget intorno a 16k token fornisce spazio per problemi più difficili senza rischio di utilizzo incontrollato dei token. Questa configurazione è deprecata e verrà rimossa in una futura versione del modello.
Per la codifica agentiva, il design frontend, i flussi di lavoro ricchi di strumenti e i flussi di lavoro aziendali complessi, inizia con sforzo medium. Se trovi che la latenza è troppo alta, considera di ridurre lo sforzo a low. Se hai bisogno di maggiore intelligenza, considera di aumentare lo sforzo a high o migrare a Opus 4.7.
Per chat, generazione di contenuti, ricerca, classificazione e altri compiti non di codifica, inizia con sforzo low con pensiero esteso. Se hai bisogno di più profondità, aumenta lo sforzo a medium.
claude-sonnet-4-6output_config.format invecetext_editor_20250728, code_execution_20250825); le versioni legacy non sono supportate (se migri da 3.x)undo_edit (se applicabile)temperature O top_p, non entrambi (se migri da 3.x)Claude Sonnet 4.5 combina forte intelligenza con prestazioni veloci, rendendolo ideale per attività di codifica, analisi e contenuti quotidiane.
Per una panoramica completa delle capacità, consulta la panoramica dei modelli.
Il prezzo di Sonnet 4.5 è $3 per milione di token di input, $15 per milione di token di output. Consulta Prezzi di Claude per i dettagli.
Aggiorna il nome del tuo modello:
# Da Sonnet 4
model = "claude-sonnet-4-20250514" # Prima
model = "claude-sonnet-4-5-20250929" # Dopo
# Da Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Prima
model = "claude-sonnet-4-5-20250929" # DopoQuesti cambiamenti di rilievo si applicano durante la migrazione da modelli Claude 3.x Sonnet.
Aggiorna i parametri di campionamento
Questo è un cambiamento di rilievo durante la migrazione da modelli Claude 3.x.
Utilizza solo temperature O top_p, non entrambi.
Aggiorna le versioni degli strumenti
Questo è un cambiamento di rilievo durante la migrazione da modelli Claude 3.x.
Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.
Gestisci il motivo di arresto refusal
Aggiorna la tua applicazione per gestire i motivi di arresto refusal.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825); le versioni legacy non sono supportate (se migri da 3.x)undo_edit (se applicabile)temperature O top_p, non entrambi (se migri da 3.x)refusal nella tua applicazioneClaude Haiku 4.5 è il modello Haiku più veloce e intelligente con prestazioni quasi di frontiera, offrendo qualità del modello premium per applicazioni interattive e elaborazione ad alto volume.
Per una panoramica completa delle capacità, consulta la panoramica dei modelli.
Il prezzo di Haiku 4.5 è $1 per milione di token di input, $5 per milione di token di output. Consulta Prezzi di Claude per i dettagli.
Aggiorna il nome del tuo modello:
# Da Haiku 3.5
model = "claude-3-5-haiku-20241022" # Prima
model = "claude-haiku-4-5-20251001" # Dopo
# Da Haiku 3
model = "claude-3-haiku-20240307" # Prima
model = "claude-haiku-4-5-20251001" # DopoRivedi i nuovi limiti di velocità: Haiku 4.5 ha limiti di velocità separati da Haiku 3.5 e Haiku 3. Consulta la documentazione dei limiti di velocità per i dettagli.
Per miglioramenti significativi delle prestazioni su attività di codifica e ragionamento, considera l'abilitazione del pensiero esteso con thinking: {type: "enabled", budget_tokens: N}.
Il pensiero esteso influisce sull'efficienza della cache dei prompt.
Il pensiero esteso è deprecato nei modelli Claude 4.6 o più recenti. Se utilizzi modelli più recenti, utilizza il pensiero adattivo invece.
Esplora le nuove capacità: Consulta la panoramica dei modelli per i dettagli sulla consapevolezza del contesto, capacità di output aumentata (64k token), intelligenza più elevata e velocità migliorata.
Questi cambiamenti di rilievo si applicano durante la migrazione da modelli Claude 3.x Haiku.
Aggiorna i parametri di campionamento
Questo è un cambiamento di rilievo durante la migrazione da modelli Claude 3.x.
Utilizza solo temperature O top_p, non entrambi.
Aggiorna le versioni degli strumenti
Questo è un cambiamento di rilievo durante la migrazione da modelli Claude 3.x.
Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.
Gestisci il motivo di arresto refusal
Aggiorna la tua applicazione per gestire i motivi di arresto refusal.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825); le versioni legacy non sono supportateundo_edit (se applicabile)temperature O top_p, non entrambirefusal nella tua applicazioneDopo (Claude Opus 4.7):
client.messages.create(
model="claude-opus-4-7",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "high"}, # o "max", "xhigh", "medium", "low"
messages=[{"role": "user", "content": "..."}],
)Adaptive thinking è controllabile attraverso il prompting. Per una guida su come regolare quando il modello pensa troppo o troppo poco, vedi Calibrating effort and thinking depth.
Parametri di campionamento rimossi: Impostare temperature, top_p o top_k su qualsiasi valore non predefinito su Claude Opus 4.7 restituisce un errore 400. Il percorso di migrazione più sicuro è omettere completamente questi parametri dai payload delle richieste. Il prompting è il modo consigliato per guidare il comportamento del modello su Claude Opus 4.7. Se stavi usando temperature = 0 per il determinismo, nota che non ha mai garantito output identici su modelli precedenti.
Contenuto del thinking omesso per impostazione predefinita: I blocchi di thinking continuano ad apparire nel flusso di risposta su Claude Opus 4.7, ma il loro campo thinking è vuoto a meno che tu non esplicitamente acconsenta. Questo è un cambiamento silenzioso da Claude Opus 4.6, dove l'impostazione predefinita era restituire il testo del thinking riassunto. Per ripristinare il contenuto del thinking riassunto su Claude Opus 4.7, imposta thinking.display su "summarized":
thinking = {
"type": "adaptive",
"display": "summarized",
}L'impostazione predefinita è "omitted" su Claude Opus 4.7. Se il tuo prodotto trasmette il ragionamento agli utenti, la nuova impostazione predefinita appare come una lunga pausa prima dell'inizio dell'output; imposta display: "summarized" per ripristinare il progresso visibile durante il thinking. Vedi Extended thinking per i dettagli.
Conteggio dei token aggiornato: Claude Opus 4.7 utilizza un nuovo tokenizer, contribuendo alle sue prestazioni migliorate su un'ampia gamma di compiti. Questo nuovo tokenizer può utilizzare approssimativamente da 1x a 1,35x più token durante l'elaborazione del testo rispetto ai modelli precedenti (fino a ~35% in più, variando in base al contenuto), e /v1/messages/count_tokens restituirà un numero diverso di token per Claude Opus 4.7 rispetto a Claude Opus 4.6. L'efficienza dei token di Claude Opus 4.7 può variare in base alla forma del carico di lavoro. Gli interventi di prompting, task_budget e effort possono aiutare a controllare i costi e garantire un utilizzo appropriato dei token. Tieni presente che questi controlli possono compromettere l'intelligenza del modello. Suggeriamo di aggiornare i tuoi parametri max_tokens per fornire spazio aggiuntivo, inclusi i trigger di compattazione. Claude Opus 4.7 fornisce una finestra di contesto di 1M ai prezzi API standard senza premio per contesto lungo.
Rimozione del prefill (trasportata da Opus 4.6): Il prefill dei messaggi dell'assistente restituisce un errore 400 su Claude Opus 4.7. Usa structured outputs, istruzioni di prompt di sistema o output_config.format invece.
Aggiornamenti di progresso integrati nelle tracce agentiche: Claude Opus 4.7 fornisce aggiornamenti più regolari e di qualità superiore all'utente durante lunghe tracce agentiche. Se hai aggiunto scaffolding per forzare messaggi di stato intermedi ("Dopo ogni 3 chiamate di strumento, riassumi il progresso"), prova a rimuoverlo. Se scopri che la lunghezza o il contenuto degli aggiornamenti rivolti all'utente di Claude Opus 4.7 non sono ben calibrati al tuo caso di utilizzo, descrivi esplicitamente come dovrebbero apparire questi aggiornamenti nel prompt e fornisci esempi.
Meno subagenzi generati per impostazione predefinita: Claude Opus 4.7 tende a generare meno subagenzi per impostazione predefinita. Tuttavia, questo comportamento è controllabile attraverso il prompting; fornisci a Claude Opus 4.7 una guida esplicita su quando i subagenzi sono desiderabili.
Calibrazione dello sforzo più rigorosa: Cambiando significativamente da Claude Opus 4.6, Claude Opus 4.7 rispetta i livelli di sforzo rigorosamente, specialmente all'estremità inferiore. A low e medium, il modello limita il suo lavoro a quello che è stato chiesto piuttosto che andare oltre. Questo è buono per la latenza e il costo, ma su compiti moderatamente complessi in esecuzione a sforzo low c'è un certo rischio di pensiero insufficiente. Se osservi ragionamento superficiale su problemi complessi, aumenta lo sforzo a high o xhigh piuttosto che aggirarlo con il prompting. Se devi mantenere lo sforzo a low per la latenza, aggiungi una guida mirata: "Questo compito comporta un ragionamento multi-step. Pensa attentamente al problema prima di rispondere." Vedi Recommended effort levels for Claude Opus 4.7.
Meno chiamate di strumento per impostazione predefinita: Claude Opus 4.7 ha una tendenza a usare gli strumenti meno spesso rispetto a Claude Opus 4.6 e a usare il ragionamento di più. Questo produce risultati migliori nella maggior parte dei casi. Tuttavia, aumentare l'impostazione dello sforzo è una leva utile per aumentare il livello di utilizzo dello strumento, specialmente nel lavoro di conoscenza. Le impostazioni di sforzo high o xhigh mostrano sostanzialmente più utilizzo di strumenti nella ricerca agentici e nella codifica. Per scenari in cui desideri più utilizzo di strumenti, puoi anche regolare il tuo prompt per istruire esplicitamente il modello su quando e come utilizzare correttamente i suoi strumenti.
Salvaguardie di sicurezza informatica in tempo reale: Aggiunte di recente in Claude Opus 4.7, le richieste che coinvolgono argomenti proibiti o ad alto rischio possono portare a rifiuti. Per il lavoro di sicurezza legittimo come test di penetrazione, ricerca di vulnerabilità o red-teaming, candidati al Cyber Verification Program per richiedere restrizioni ridotte. Vedi Safeguards, warnings, and appeals per il background.
Supporto per immagini ad alta risoluzione: Claude Opus 4.7 è il primo modello Claude con supporto per immagini ad alta risoluzione, con una risoluzione massima dell'immagine di 2576 pixel sul bordo lungo (da 1568 pixel su modelli precedenti). Questo sblocca guadagni su carichi di lavoro pesanti di visione ed è particolarmente prezioso per computer use, comprensione degli screenshot e analisi dei documenti. Il supporto ad alta risoluzione è automatico e non richiede alcun header beta o opt-in lato client. Le immagini a risoluzione completa possono utilizzare fino a circa 3x più token di immagine rispetto ai modelli precedenti (fino a 4.784 token per immagine, rispetto al limite precedente di circa 1.600 token per immagine), quindi ri-budget max_tokens e aspettative di costo per carichi di lavoro pesanti di immagini, o ricampiona prima di inviare se non hai bisogno della fedeltà aggiuntiva. Le coordinate di puntamento e riquadro restituite dal modello sono 1
output_config = {
"effort": "high",
"task_budget": {"type": "tokens", "total": 128000},
}Potrebbe essere necessario sperimentare con diversi budget di compiti per il tuo caso di utilizzo. Se al modello viene assegnato un budget di compiti troppo restrittivo per un determinato compito, potrebbe completare il compito meno completamente, facendo riferimento al suo budget come vincolo. Per compiti agentici aperti in cui la qualità è più importante della velocità, non impostare un budget di compiti; riservare i budget di compiti per carichi di lavoro in cui hai bisogno che il modello limiti il suo lavoro a un'indennità di token. Il valore minimo per un budget di compiti è 20k token.
Questo non è un limite rigido; è un suggerimento di cui il modello è consapevole. Questo è distinto da max_tokens, che è un limite rigido per richiesta sui token generati (max_tokens non viene passato al modello, e il modello non ne è consapevole), mentre task_budget è un limite consigliato su tutto il ciclo agentici. Usa task_budget quando desideri che il modello si auto-moderato, e max_tokens come limite rigido per richiesta per limitare l'utilizzo.
Imposta un grande max_tokens a sforzo max o xhigh: Se stai eseguendo Claude Opus 4.7 a sforzo max o xhigh, imposta un grande budget di token di output massimi in modo che il modello abbia spazio per pensare e agire nei suoi subagenzi e nelle chiamate di strumento. Consigliamo di iniziare con 64k token e regolare da lì.
Ricampiona le immagini se l'alta risoluzione non è necessaria: Claude Opus 4.7 supporta immagini fino a 2576px / 3,75MP. Le immagini ad alta risoluzione utilizzano più token. Se la fedeltà aggiuntiva dell'immagine non è necessaria, ricampiona le immagini prima di inviarle a Claude per evitare aumenti nell'utilizzo dei token. Vedi Images and vision.
max_tokensxhigh o max, aumenta max_tokens ad almeno 64k come punto di partenza.response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 32000},
betas=["interleaved-thinking-2025-05-14"],
messages=[...],
)Nota che la migrazione si sposta anche da client.beta.messages.create a client.messages.create. Adaptive thinking e effort sono funzionalità GA e non richiedono lo spazio dei nomi SDK beta o alcun header beta.
Rimuovi l'header beta dello sforzo: Il parametro effort è ora GA. Rimuovi betas=["effort-2025-11-24"] dalle tue richieste.
Rimuovi l'header beta dello streaming dello strumento a grana fine: Lo streaming dello strumento a grana fine è ora GA. Rimuovi betas=["fine-grained-tool-streaming-2025-05-14"] dalle tue richieste.
Rimuovi l'header beta del thinking interleaved: Adaptive thinking abilita automaticamente il thinking interleaved su Claude Opus 4.7, Opus 4.6 e Sonnet 4.6. Rimuovi betas=["interleaved-thinking-2025-05-14"] dalle tue richieste. L'header è ancora funzionale su Sonnet 4.6 con extended thinking manuale, ma la modalità manuale è deprecata.
Migra a output_config.format: Se usi structured outputs, aggiorna output_format={...} a output_config={"format": {...}}. Il vecchio parametro rimane funzionale ma è deprecato e verrà rimosso in una futura versione del modello.
Aggiorna le versioni degli strumenti
Questo è un cambiamento che interrompe quando si esegue la migrazione da modelli Claude 3.x.
Aggiorna alle versioni più recenti degli strumenti. Rimuovi qualsiasi codice che utilizza il comando undo_edit.
# Prima
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# Dopo
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 e str_replace_based_edit_tool. Vedi Text editor tool documentation per i dettagli.code_execution_20250825. Vedi Code execution tool documentation per le istruzioni di migrazione.Gestisci il motivo di arresto refusal
Aggiorna la tua applicazione per gestire i motivi di arresto refusal:
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Gestisci il rifiuto in modo appropriato
passGestisci il motivo di arresto model_context_window_exceeded
I modelli Claude 4.5+ restituiscono un motivo di arresto model_context_window_exceeded quando la generazione si ferma a causa del raggiungimento del limite della finestra di contesto, piuttosto che il limite max_tokens richiesto. Aggiorna la tua applicazione per gestire questo nuovo motivo di arresto:
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Gestisci il limite della finestra di contesto in modo appropriato
passVerifica la gestione del parametro dello strumento (newline finali)
I modelli Claude 4.5+ preservano le newline finali nei parametri di stringa della chiamata dello strumento che erano precedentemente eliminate. Se i tuoi strumenti si basano su corrispondenze di stringhe esatte rispetto ai parametri della chiamata dello strumento, verifica che la tua logica gestisca correttamente le newline finali.
Aggiorna i tuoi prompt per i cambiamenti comportamentali
I modelli Claude 4+ hanno uno stile di comunicazione più conciso e diretto e richiedono una direzione esplicita. Rivedi le best practices di prompting per una guida all'ottimizzazione.
fine-grained-tool-streaming-2025-05-14interleaved-thinking-2025-05-14 (adaptive thinking abilita il thinking interleaved automaticamente)output_format a output_config.format (se applicabile)temperature, top_p e top_k (i valori non predefiniti restituiscono 400 su Opus 4.7)text_editor_20250728, code_execution_20250825)refusalmodel_context_window_exceededtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Continuazioni (riprendere risposte interrotte): Sposta la continuazione nel messaggio dell'utente: "La tua risposta precedente è stata interrotta e si è conclusa con [previous_response]. Continua da dove ti eri fermato."
Idratazione del contesto / coerenza del ruolo (aggiornamento del contesto in conversazioni lunghe): Inietta i promemoria dell'assistente prefilled precedenti nel turno dell'utente invece.
L'escape JSON dei parametri dello strumento potrebbe differire
Questo è un cambiamento di rilievo durante la migrazione da Sonnet 4.5 o versioni precedenti.
L'escape delle stringhe JSON nei parametri dello strumento potrebbe differire dai modelli precedenti. I parser JSON standard gestiscono questo automaticamente, ma l'analisi personalizzata basata su stringhe potrebbe richiedere aggiornamenti.
Aggiorna i tuoi prompt per i cambiamenti comportamentali
I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le best practice di prompting per indicazioni di ottimizzazione.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
output_config={"effort": "low"},
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)refusal nella tua applicazionefine-grained-tool-streaming-2025-05-14 (ora GA)output_format a output_config.formatthinking: {type: "enabled", budget_tokens: N} a thinking: {type: "adaptive"} con il parametro di sforzo (budget_tokens è deprecato e verrà rimosso in una futura versione)Aggiorna i tuoi prompt per i cambiamenti comportamentali
I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le best practice di prompting per indicazioni di ottimizzazione.
Aggiorna i tuoi prompt per i cambiamenti comportamentali
I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le best practice di prompting per indicazioni di ottimizzazione.