Claude Opus 4.6 è un sostituto quasi drop-in per Claude 4.5, con alcuni cambiamenti significativi di cui essere consapevoli. Per un elenco completo delle nuove funzionalità, vedi Novità in Claude 4.6.
# Migrazione Opus
model="claude-opus-4-5" # Prima
model="claude-opus-4-6" # DopoRimozione del prefill: Il prefill dei messaggi dell'assistente restituisce un errore 400 sui modelli Claude 4.6. Utilizza output strutturati, istruzioni nel prompt di sistema, o output_config.format invece.
Quotazione dei parametri dello strumento: I modelli Claude 4.6 possono produrre un escaping JSON leggermente diverso delle stringhe negli argomenti delle chiamate di strumento (ad es., gestione diversa degli escape Unicode o dell'escaping della barra). Se analizzi l'input della chiamata di strumento come una stringa grezza anziché utilizzare un parser JSON, verifica la tua logica di parsing. I parser JSON standard (come json.loads() o JSON.parse()) gestiscono automaticamente queste differenze.
Questi non sono obbligatori ma miglioreranno la tua esperienza:
Migra al pensiero adattivo: thinking: {type: "enabled", budget_tokens: N} è deprecato sui modelli Claude 4.6 e verrà rimosso in una futura versione del modello. Passa a thinking: {type: "adaptive"} e utilizza il parametro effort per controllare la profondità del pensiero. Vedi Pensiero adattivo.
response = client.beta.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={
"type": "enabled",
"budget_tokens": 32000
},
betas=["interleaved-thinking-2025-05-14"],
messages=[...]
)Nota che la migrazione passa anche da client.beta.messages.create a client.messages.create — il pensiero adattivo e l'effort sono funzionalità GA e non richiedono lo spazio dei nomi beta SDK o alcun header beta.
Rimuovi l'header beta effort: Il parametro effort è ora GA. Rimuovi betas=["effort-2025-11-24"] dalle tue richieste.
Rimuovi l'header beta del fine-grained tool streaming: Il fine-grained tool streaming è ora GA. Rimuovi betas=["fine-grained-tool-streaming-2025-05-14"] dalle tue richieste.
Rimuovi l'header beta del pensiero interleaved: Il pensiero adattivo abilita automaticamente il pensiero interleaved. Rimuovi betas=["interleaved-thinking-2025-05-14"] dalle tue richieste.
Migra a output_config.format: Se utilizzi output strutturati, aggiorna output_format={...} a output_config={"format": {...}}. Il vecchio parametro rimane funzionale ma è deprecato e verrà rimosso in una futura versione del modello.
Se stai migrando da Opus 4.1, Sonnet 4, o modelli precedenti direttamente a Claude 4.6, applica i cambiamenti significativi di Claude 4.6 sopra più i cambiamenti aggiuntivi in questa sezione.
# Da Opus 4.1
model="claude-opus-4-1-20250805" # Prima
model="claude-opus-4-6" # Dopo
# Da Sonnet 4
model="claude-sonnet-4-20250514" # Prima
model="claude-opus-4-6" # Dopo
# Da Sonnet 3.7
model="claude-3-7-sonnet-20250219" # Prima
model="claude-opus-4-6" # DopoParametri di campionamento
Questo è un cambiamento significativo dai modelli Claude 3.x.
Utilizza solo temperature O top_p, non entrambi:
# Prima - Questo genererà un errore nei modelli Claude 4+
response = client.messages.create(
model="claude-3-7-sonnet-20250219",
temperature=0.7,
top_p=0.9, # Non puoi usare entrambi
...
)
# Dopo
response = client.messages.create(
model="claude-opus-4-6",
temperature=0.7, # Usa temperature O top_p, non entrambi
...
)Versioni degli strumenti
Questo è un cambiamento significativo dai modelli Claude 3.x.
Aggiorna alle versioni più recenti degli strumenti. Rimuovi qualsiasi codice che utilizza il comando undo_edit.
# Prima
tools=[{"type": "text_editor_20250124", "name": "str_replace_editor"}]
# Dopo
tools=[{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]text_editor_20250728 e str_replace_based_edit_tool. Vedi Documentazione dello strumento editor di testo per i dettagli.code_execution_20250825. Vedi Documentazione dello strumento di esecuzione del codice per le istruzioni di migrazione.Gestisci il motivo di arresto refusal
Aggiorna la tua applicazione per gestire i motivi di arresto refusal:
response = client.messages.create(...)
if response.stop_reason == "refusal":
# Gestisci il rifiuto in modo appropriato
passGestisci il motivo di arresto model_context_window_exceeded
I modelli Claude 4.5+ restituiscono un motivo di arresto model_context_window_exceeded quando la generazione si interrompe a causa del raggiungimento del limite della finestra di contesto, anziché il limite max_tokens richiesto. Aggiorna la tua applicazione per gestire questo nuovo motivo di arresto:
response = client.messages.create(...)
if response.stop_reason == "model_context_window_exceeded":
# Gestisci il limite della finestra di contesto in modo appropriato
passGestione dei parametri dello strumento (newline finali)
I modelli Claude 4.5+ preservano le newline finali nei parametri di stringa della chiamata di strumento che erano precedentemente rimosse. Se i tuoi strumenti si basano su corrispondenze di stringhe esatte rispetto ai parametri della chiamata di strumento, verifica che la tua logica gestisca correttamente le newline finali.
Aggiorna i tuoi prompt per i cambiamenti comportamentali
I modelli Claude 4+ hanno uno stile di comunicazione più conciso e diretto e richiedono indicazioni esplicite. Rivedi le best practice di prompting per la guida all'ottimizzazione.
token-efficient-tools-2025-02-19 e output-128k-2025-02-19 — tutti i modelli Claude 4+ hanno l'utilizzo di strumenti efficienti in termini di token integrato e questi header non hanno alcun effetto.claude-opus-4-6output_config.format invecethinking: {type: "enabled", budget_tokens: N} a thinking: {type: "adaptive"} con il parametro effort (budget_tokens è deprecato e verrà rimosso in una futura versione)effort-2025-11-24 (effort è ora GA)fine-grained-tool-streaming-2025-05-14interleaved-thinking-2025-05-14output_format a output_config.format (se applicabile)temperature O top_ptext_editor_20250728, code_execution_20250825)refusalmodel_context_window_exceededtoken-efficient-tools-2025-02-19, output-128k-2025-02-19)Claude Sonnet 4.5 combina un'intelligenza forte con prestazioni veloci, rendendolo ideale per compiti di codifica, analisi e contenuti quotidiani.
Per una panoramica completa delle capacità, vedi la panoramica dei modelli.
I prezzi di Sonnet 4.5 sono $3 per milione di token di input, $15 per milione di token di output. Vedi Prezzi di Claude per i dettagli.
Aggiorna il nome del tuo modello:
# Da Sonnet 4
model="claude-sonnet-4-20250514" # Prima
model="claude-sonnet-4-5-20250929" # Dopo
# Da Sonnet 3.7
model="claude-3-7-sonnet-20250219" # Prima
model="claude-sonnet-4-5-20250929" # DopoConsidera di abilitare il pensiero esteso per miglioramenti significativi delle prestazioni su compiti di codifica e ragionamento (disabilitato per impostazione predefinita):
response = client.messages.create(
model="claude-sonnet-4-5-20250929",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 10000},
messages=[...]
)Questi cambiamenti significativi si applicano quando si esegue la migrazione dai modelli Claude 3.x Sonnet.
Parametri di campionamento
Questo è un cambiamento significativo dai modelli Claude 3.x.
Utilizza solo temperature O top_p, non entrambi.
Versioni degli strumenti
Questo è un cambiamento significativo dai modelli Claude 3.x.
Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.
Gestisci il motivo di arresto refusal
Aggiorna la tua applicazione per gestire i motivi di arresto refusal.
Aggiorna i tuoi prompt per i cambiamenti comportamentali
I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le best practice di prompting per la guida all'ottimizzazione.
claude-sonnet-4-5-20250929text_editor_20250728, code_execution_20250825) — le versioni legacy non sono supportate (se stai migrando da 3.x)undo_edit (se applicabile)temperature O top_p, non entrambi (se stai migrando da 3.x)refusal nella tua applicazioneClaude Haiku 4.5 è il nostro modello Haiku più veloce e intelligente con prestazioni quasi frontier, fornendo qualità del modello premium per applicazioni interattive e elaborazione ad alto volume.
Per una panoramica completa delle capacità, vedi la panoramica dei modelli.
I prezzi di Haiku 4.5 sono $1 per milione di token di input, $5 per milione di token di output. Vedi Prezzi di Claude per i dettagli.
Aggiorna il nome del tuo modello:
# Da Haiku 3.5
model="claude-3-5-haiku-20241022" # Prima
model="claude-haiku-4-5-20251001" # DopoRivedi i nuovi limiti di velocità: Haiku 4.5 ha limiti di velocità separati da Haiku 3.5. Vedi Documentazione dei limiti di velocità per i dettagli.
Considera di abilitare il pensiero esteso per miglioramenti significativi delle prestazioni su compiti di codifica e ragionamento (disabilitato per impostazione predefinita):
response = client.messages.create(
model="claude-haiku-4-5-20251001",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 5000},
messages=[...]
)Il pensiero esteso influisce sull'efficienza della memorizzazione nella cache dei prompt.
Esplora le nuove capacità: Vedi la panoramica dei modelli per i dettagli sulla consapevolezza del contesto, capacità di output aumentata (64K token), intelligenza superiore e velocità migliorata.
Questi cambiamenti significativi si applicano quando si esegue la migrazione dai modelli Claude 3.x Haiku.
Parametri di campionamento
Questo è un cambiamento significativo dai modelli Claude 3.x.
Utilizza solo temperature O top_p, non entrambi.
Versioni degli strumenti
Questo è un cambiamento significativo dai modelli Claude 3.x.
Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.
Gestisci il motivo di arresto refusal
Aggiorna la tua applicazione per gestire i motivi di arresto refusal.
Aggiorna i tuoi prompt per i cambiamenti comportamentali
I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le best practice di prompting per la guida all'ottimizzazione.
claude-haiku-4-5-20251001text_editor_20250728, code_execution_20250825) — le versioni legacy non sono supportateundo_edit (se applicabile)temperature O top_p, non entrambirefusal nella tua applicazioneWas this page helpful?