Claude Opus 4.6 è un sostituto quasi drop-in per Claude 4.5, con alcuni cambiamenti di rottura di cui essere consapevoli. Per un elenco completo delle nuove funzionalità, vedi Novità in Claude 4.6.
# Migrazione Opus
model = "claude-opus-4-5" # Prima
model = "claude-opus-4-6" # DopoRimozione del prefill: Il prefill dei messaggi dell'assistente restituisce un errore 400 sui modelli Claude 4.6. Usa output strutturati, istruzioni del prompt di sistema, o output_config.format invece.
Quotazione dei parametri dello strumento: I modelli Claude 4.6 possono produrre un escaping JSON leggermente diverso nelle stringhe degli argomenti delle chiamate di strumento (ad es., gestione diversa degli escape Unicode o dell'escaping della barra). Se analizzi l'input della chiamata di strumento come una stringa grezza piuttosto che utilizzare un parser JSON, verifica la tua logica di parsing. I parser JSON standard (come json.loads() o JSON.parse()) gestiscono automaticamente queste differenze.
Queste non sono obbligatorie ma miglioreranno la tua esperienza:
Migra al pensiero adattivo: thinking: {type: "enabled", budget_tokens: N} è deprecato sui modelli Claude 4.6 e verrà rimosso in una futura versione del modello. Passa a thinking: {type: "adaptive"} e usa il parametro effort per controllare la profondità del pensiero. Vedi Pensiero adattivo.
response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 32000},
betas=["interleaved-thinking-2025-05-14"],
messages=[...],
)Nota che la migrazione passa anche da client.beta.messages.create a client.messages.create. Il pensiero adattivo e l'effort sono funzionalità GA e non richiedono lo spazio dei nomi beta SDK o alcun header beta.
Rimuovi l'header beta effort: Il parametro effort è ora GA. Rimuovi betas=["effort-2025-11-24"] dalle tue richieste.
Rimuovi l'header beta del fine-grained tool streaming: Il fine-grained tool streaming è ora GA. Rimuovi betas=["fine-grained-tool-streaming-2025-05-14"] dalle tue richieste.
Rimuovi l'header beta del pensiero interleaved (solo Opus 4.6): Il pensiero adattivo abilita automaticamente il pensiero interleaved su Opus 4.6. Rimuovi betas=["interleaved-thinking-2025-05-14"] dalle tue richieste Opus 4.6. Nota: Sonnet 4.6 continua a supportare questo header beta con il pensiero esteso manuale.
Migra a output_config.format: Se usi output strutturati, aggiorna output_format={...} a output_config={"format": {...}}. Il vecchio parametro rimane funzionale ma è deprecato e verrà rimosso in una futura versione del modello.
Se stai migrando da Opus 4.1, Sonnet 4, o modelli precedenti direttamente a Claude 4.6, applica i cambiamenti di rottura di Claude 4.6 sopra più i cambiamenti aggiuntivi in questa sezione.
# Da Opus 4.1
model = "claude-opus-4-1-20250805" # Prima
model = "claude-opus-4-6" # Dopo
# Da Sonnet 4
model = "claude-sonnet-4-20250514" # Prima
model = "claude-opus-4-6" # Dopo
# Da Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Prima
model = "claude-opus-4-6" # DopoAggiorna i parametri di campionamento
Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.
Usa solo temperature O top_p, non entrambi:
# Prima - Questo darà errore nei modelli Claude 4+
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # Non puoi usare entrambi
# ...
)
# Dopo
response = client.messages.create(
model="claude-opus-4-6",
temperature=0.7, # Usa temperature O top_p, non entrambi
# ...
)Aggiorna le versioni degli strumenti
Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.
Aggiorna alle versioni più recenti degli strumenti. Rimuovi qualsiasi codice che utilizza il comando undo_edit.
# Prima
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# Dopo
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 e str_replace_based_edit_tool. Vedi Documentazione dello strumento editor di testo per i dettagli.code_execution_20250825. Vedi Documentazione dello strumento di esecuzione del codice per le istruzioni di migrazione.Gestisci il motivo di arresto refusal
Aggiorna la tua applicazione per gestire i motivi di arresto refusal:
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Gestisci il rifiuto in modo appropriato
passGestisci il motivo di arresto model_context_window_exceeded
I modelli Claude 4.5+ restituiscono un motivo di arresto model_context_window_exceeded quando la generazione si interrompe a causa del raggiungimento del limite della finestra di contesto, piuttosto che il limite max_tokens richiesto. Aggiorna la tua applicazione per gestire questo nuovo motivo di arresto:
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Gestisci il limite della finestra di contesto in modo appropriato
passVerifica la gestione dei parametri dello strumento (newline finali)
I modelli Claude 4.5+ preservano le newline finali nei parametri di stringa delle chiamate di strumento che erano precedentemente rimosse. Se i tuoi strumenti si basano sulla corrispondenza esatta delle stringhe rispetto ai parametri delle chiamate di strumento, verifica che la tua logica gestisca correttamente le newline finali.
Aggiorna i tuoi prompt per i cambiamenti comportamentali
I modelli Claude 4+ hanno uno stile di comunicazione più conciso e diretto e richiedono indicazioni esplicite. Rivedi le migliori pratiche di prompt engineering per una guida all'ottimizzazione.
token-efficient-tools-2025-02-19 e output-128k-2025-02-19. Tutti i modelli Claude 4+ hanno l'uso degli strumenti efficiente in termini di token integrato e questi header non hanno alcun effetto.claude-opus-4-6output_config.format invecethinking: {type: "enabled", budget_tokens: N} a thinking: {type: "adaptive"} con il parametro effort (budget_tokens è deprecato e verrà rimosso in una futura versione)effort-2025-11-24 (effort è ora GA)fine-grained-tool-streaming-2025-05-14interleaved-thinking-2025-05-14 (solo Opus 4.6; Sonnet 4.6 lo supporta ancora)output_format a output_config.format (se applicabile)temperature O top_ptext_editor_20250728, code_execution_20250825)refusalmodel_context_window_exceededtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Claude Sonnet 4.6 combina forte intelligenza con prestazioni veloci, con capacità di ricerca agentiche migliorate e esecuzione del codice gratuita quando utilizzato con ricerca web o web fetch. È ideale per compiti di codifica, analisi e contenuti quotidiani.
Per una panoramica completa delle capacità, vedi la panoramica dei modelli.
Il prezzo di Sonnet 4.6 è $3 per milione di token di input, $15 per milione di token di output. Vedi Prezzo di Claude per i dettagli.
Aggiorna il nome del tuo modello:
# Da Sonnet 4.5
model = "claude-sonnet-4-5" # Prima
model = "claude-sonnet-4-6" # Dopo
# Da Sonnet 4
model = "claude-sonnet-4-20250514" # Prima
model = "claude-sonnet-4-6" # DopoIl prefill dei messaggi dell'assistente non è più supportato
Questo è un cambiamento di rottura quando si migra da Sonnet 4.5 o precedente.
Il prefill dei messaggi dell'assistente restituisce un errore 400 su Sonnet 4.6. Usa output strutturati, istruzioni del prompt di sistema, o output_config.format invece.
Casi d'uso comuni di prefill e migrazioni:
Controllo della formattazione dell'output (forzare l'output JSON/YAML): Usa output strutturati o strumenti con campi enum per compiti di classificazione.
Eliminazione dei preamboli (rimozione di frasi "Ecco..."): Aggiungi istruzioni dirette nel prompt di sistema: "Rispondi direttamente senza preambolo. Non iniziare con frasi come 'Ecco...', 'Basato su...', ecc."
Evitare cattivi rifiuti: Claude è molto migliore nei rifiuti appropriati ora. Un prompt chiaro nel messaggio dell'utente senza prefill dovrebbe essere sufficiente.
Continuazioni (ripresa di risposte interrotte): Sposta la continuazione al messaggio dell'utente: "La tua risposta precedente è stata interrotta e è terminata con [previous_response]. Continua da dove eri rimasto."
Idratazione del contesto / coerenza del ruolo (aggiornamento del contesto in conversazioni lunghe): Inietta ciò che erano precedentemente promemoria dell'assistente prefilled nel turno dell'utente invece.
L'escaping JSON dei parametri dello strumento potrebbe differire
Questo è un cambiamento di rottura quando si migra da Sonnet 4.5 o precedente.
L'escaping delle stringhe JSON nei parametri dello strumento potrebbe differire dai modelli precedenti. I parser JSON standard lo gestiscono automaticamente, ma il parsing personalizzato basato su stringhe potrebbe richiedere aggiornamenti.
Aggiorna i parametri di campionamento
Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.
Usa solo temperature O top_p, non entrambi.
Aggiorna le versioni degli strumenti
Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.
Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.
Gestisci il motivo di arresto refusal
Aggiorna la tua applicazione per gestire i motivi di arresto refusal.
Aggiorna i tuoi prompt per i cambiamenti comportamentali
I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le migliori pratiche di prompt engineering per una guida all'ottimizzazione.
fine-grained-tool-streaming-2025-05-14 — Il fine-grained tool streaming è ora GA su Sonnet 4.6 e non richiede più un header beta.output_format a output_config.format — Il parametro output_format è deprecato. Usa output_config.format invece.Ti incoraggiamo fortemente a migrare da Sonnet 4.5 a Sonnet 4.6, che offre più intelligenza allo stesso prezzo.
Sonnet 4.6 ha un livello di effort predefinito di high, in contrasto con Sonnet 4.5 che non aveva parametro effort. Ti consigliamo di regolare il parametro effort mentre migri da Sonnet 4.5 a Sonnet 4.6. Se non impostato esplicitamente, potresti sperimentare una latenza più elevata con il livello di effort predefinito.
Se non stai usando il pensiero esteso su Sonnet 4.5, puoi continuare senza di esso su Sonnet 4.6. Dovresti impostare esplicitamente l'effort al livello appropriato per il tuo caso d'uso. Con effort low e il pensiero disabilitato, puoi aspettarti prestazioni simili o migliori rispetto a Sonnet 4.5 senza pensiero esteso.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
output_config={"effort": "low"},
messages=[{"role": "user", "content": "Your prompt here"}],
)Se stai usando il pensiero esteso su Sonnet 4.5, continua ad essere supportato su Sonnet 4.6 senza modifiche necessarie alla tua configurazione di pensiero. Ti consigliamo di mantenere un budget di pensiero intorno a 16k token. In pratica, la maggior parte dei compiti non ne usa così tanto, ma fornisce spazio di manovra per problemi più difficili senza il rischio di un utilizzo di token incontrollato.
Per la codifica agentiva, il design frontend, i flussi di lavoro pesanti di strumenti e i flussi di lavoro aziendali complessi, ti consigliamo di iniziare con effort medium. Se trovi che la latenza è troppo alta, considera di ridurre l'effort a low. Se hai bisogno di un'intelligenza più elevata, considera di aumentare l'effort a high o di migrare a Opus 4.6.
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)Per chat, generazione di contenuti, ricerca, classificazione e altri compiti non di codifica, ti consigliamo di iniziare con effort low con pensiero esteso. Se hai bisogno di più profondità, aumenta l'effort a medium.
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
betas=["interleaved-thinking-2025-05-14"],
messages=[{"role": "user", "content": "Your prompt here"}],
)I percorsi di migrazione sopra utilizzano il pensiero esteso con budget_tokens per un utilizzo di token prevedibile. Se il tuo carico di lavoro si adatta a uno dei seguenti modelli, considera di provare il pensiero adattivo invece:
high. Se la latenza o l'utilizzo di token è una preoccupazione, riduci a medium.Quando usi il pensiero adattivo, valuta l'effort medium e high sui tuoi compiti. Il livello giusto dipende dal compromesso del tuo carico di lavoro tra qualità, latenza e utilizzo di token.
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "Your prompt here"}],
)Se vedi comportamenti incoerenti o regressioni di qualità con il pensiero adattivo, passa al pensiero esteso con budget_tokens. Questo fornisce risultati più prevedibili con un limite sui costi del pensiero.
claude-sonnet-4-6output_config.format invecetext_editor_20250728, code_execution_20250825); le versioni legacy non sono supportate (se migri da 3.x)undo_edit (se applicabile)temperature O top_p, non entrambi (se migri da 3.x)refusal nella tua applicazionefine-grained-tool-streaming-2025-05-14 (ora GA)output_format a output_config.formatClaude Sonnet 4.5 combina forte intelligenza con prestazioni veloci, rendendolo ideale per compiti di codifica, analisi e contenuti quotidiani.
Per una panoramica completa delle capacità, vedi la panoramica dei modelli.
Il prezzo di Sonnet 4.5 è $3 per milione di token di input, $15 per milione di token di output. Vedi Prezzo di Claude per i dettagli.
Aggiorna il nome del tuo modello:
# Da Sonnet 4
model = "claude-sonnet-4-20250514" # Prima
model = "claude-sonnet-4-5-20250929" # Dopo
# Da Sonnet 3.7
model = "claude-3-7-sonnet-20250219" # Prima
model = "claude-sonnet-4-5-20250929" # DopoQuesti cambiamenti di rottura si applicano quando si migra dai modelli Claude 3.x Sonnet.
Aggiorna i parametri di campionamento
Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.
Usa solo temperature O top_p, non entrambi.
Aggiorna le versioni degli strumenti
Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.
Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.
Gestisci il motivo di arresto refusal
Aggiorna la tua applicazione per gestire i motivi di arresto refusal.
Aggiorna i tuoi prompt per i cambiamenti comportamentali
I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le migliori pratiche di prompt engineering per una guida all'ottimizzazione.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825); le versioni legacy non sono supportate (se migri da 3.x)undo_edit (se applicabile)temperature O top_p, non entrambi (se migri da 3.x)refusal nella tua applicazioneClaude Haiku 4.5 è il modello Haiku più veloce e intelligente con prestazioni quasi frontier, fornendo qualità del modello premium per applicazioni interattive e elaborazione ad alto volume.
Per una panoramica completa delle capacità, vedi la panoramica dei modelli.
Il prezzo di Haiku 4.5 è $1 per milione di token di input, $5 per milione di token di output. Vedi Prezzo di Claude per i dettagli.
Aggiorna il nome del tuo modello:
# Da Haiku 3.5
model = "claude-3-5-haiku-20241022" # Prima
model = "claude-haiku-4-5-20251001" # DopoRivedi i nuovi limiti di velocità: Haiku 4.5 ha limiti di velocità separati da Haiku 3.5. Vedi Documentazione dei limiti di velocità per i dettagli.
Per miglioramenti significativi delle prestazioni su compiti di codifica e ragionamento, considera di abilitare il pensiero esteso con thinking: {type: "enabled", budget_tokens: N}.
Il pensiero esteso influisce sull'efficienza della cache dei prompt.
Il pensiero esteso è deprecato nei modelli Claude 4.6 o più recenti. Se usi modelli più recenti, usa il pensiero adattivo invece.
Esplora le nuove capacità: Vedi la panoramica dei modelli per i dettagli sulla consapevolezza del contesto, capacità di output aumentata (64K token), intelligenza più elevata e velocità migliorata.
Questi cambiamenti di rottura si applicano quando si migra dai modelli Claude 3.x Haiku.
Aggiorna i parametri di campionamento
Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.
Usa solo temperature O top_p, non entrambi.
Aggiorna le versioni degli strumenti
Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.
Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.
Gestisci il motivo di arresto refusal
Aggiorna la tua applicazione per gestire i motivi di arresto refusal.
Aggiorna i tuoi prompt per i cambiamenti comportamentali
I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le migliori pratiche di prompt engineering per una guida all'ottimizzazione.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825); le versioni legacy non sono supportateundo_edit (se applicabile)temperature O top_p, non entrambirefusal nella tua applicazioneWas this page helpful?