Modelli e prezzi

Guida alla migrazione

Guida per la migrazione ai modelli Claude 4.6 dalle versioni precedenti di Claude

Migrazione a Claude 4.6

Claude Opus 4.6 è un sostituto quasi drop-in per Claude 4.5, con alcuni cambiamenti di rottura di cui essere consapevoli. Per un elenco completo delle nuove funzionalità, vedi Novità in Claude 4.6.

Aggiorna il nome del tuo modello

# Migrazione Opus
model = "claude-opus-4-5"  # Prima
model = "claude-opus-4-6"  # Dopo

Cambiamenti di rottura

Rimozione del prefill: Il prefill dei messaggi dell'assistente restituisce un errore 400 sui modelli Claude 4.6. Usa output strutturati, istruzioni del prompt di sistema, o output_config.format invece.
Quotazione dei parametri dello strumento: I modelli Claude 4.6 possono produrre un escaping JSON leggermente diverso nelle stringhe degli argomenti delle chiamate di strumento (ad es., gestione diversa degli escape Unicode o dell'escaping della barra). Se analizzi l'input della chiamata di strumento come una stringa grezza piuttosto che utilizzare un parser JSON, verifica la tua logica di parsing. I parser JSON standard (come json.loads() o JSON.parse()) gestiscono automaticamente queste differenze.

Modifiche consigliate

Queste non sono obbligatorie ma miglioreranno la tua esperienza:

Migra al pensiero adattivo: thinking: {type: "enabled", budget_tokens: N} è deprecato sui modelli Claude 4.6 e verrà rimosso in una futura versione del modello. Passa a thinking: {type: "adaptive"} e usa il parametro effort per controllare la profondità del pensiero. Vedi Pensiero adattivo.
```
response = client.beta.messages.create(
    model="claude-opus-4-5",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[...],
)
```
Nota che la migrazione passa anche da client.beta.messages.create a client.messages.create. Il pensiero adattivo e l'effort sono funzionalità GA e non richiedono lo spazio dei nomi beta SDK o alcun header beta.
Rimuovi l'header beta effort: Il parametro effort è ora GA. Rimuovi betas=["effort-2025-11-24"] dalle tue richieste.
Rimuovi l'header beta del fine-grained tool streaming: Il fine-grained tool streaming è ora GA. Rimuovi betas=["fine-grained-tool-streaming-2025-05-14"] dalle tue richieste.
Rimuovi l'header beta del pensiero interleaved (solo Opus 4.6): Il pensiero adattivo abilita automaticamente il pensiero interleaved su Opus 4.6. Rimuovi betas=["interleaved-thinking-2025-05-14"] dalle tue richieste Opus 4.6. Nota: Sonnet 4.6 continua a supportare questo header beta con il pensiero esteso manuale.
Migra a output_config.format: Se usi output strutturati, aggiorna output_format={...} a output_config={"format": {...}}. Il vecchio parametro rimane funzionale ma è deprecato e verrà rimosso in una futura versione del modello.

Migrazione da Claude 4.1 o precedente a Claude 4.6

Se stai migrando da Opus 4.1, Sonnet 4, o modelli precedenti direttamente a Claude 4.6, applica i cambiamenti di rottura di Claude 4.6 sopra più i cambiamenti aggiuntivi in questa sezione.

# Da Opus 4.1
model = "claude-opus-4-1-20250805"  # Prima
model = "claude-opus-4-6"  # Dopo

# Da Sonnet 4
model = "claude-sonnet-4-20250514"  # Prima
model = "claude-opus-4-6"  # Dopo

# Da Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Prima
model = "claude-opus-4-6"  # Dopo

Cambiamenti di rottura aggiuntivi

Aggiorna i parametri di campionamento

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Usa solo temperature O top_p, non entrambi:

# Prima - Questo darà errore nei modelli Claude 4+
response = client.messages.create(
    model="claude-3-7-sonnet-20250219",
    temperature=0.7,
    top_p=0.9,  # Non puoi usare entrambi
    # ...
)

# Dopo
response = client.messages.create(
    model="claude-opus-4-6",
    temperature=0.7,  # Usa temperature O top_p, non entrambi
    # ...
)

Aggiorna le versioni degli strumenti

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Aggiorna alle versioni più recenti degli strumenti. Rimuovi qualsiasi codice che utilizza il comando undo_edit.
```
# Prima
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]

# Dopo
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
```
- Editor di testo: Usa text_editor_20250728 e str_replace_based_edit_tool. Vedi Documentazione dello strumento editor di testo per i dettagli.
- Esecuzione del codice: Aggiorna a code_execution_20250825. Vedi Documentazione dello strumento di esecuzione del codice per le istruzioni di migrazione.

Gestisci il motivo di arresto refusal

Aggiorna la tua applicazione per gestire i motivi di arresto refusal:

response = client.messages.create(...)

if response.stop_reason == "refusal":
    # Gestisci il rifiuto in modo appropriato
    pass

Gestisci il motivo di arresto model_context_window_exceeded

I modelli Claude 4.5+ restituiscono un motivo di arresto model_context_window_exceeded quando la generazione si interrompe a causa del raggiungimento del limite della finestra di contesto, piuttosto che il limite max_tokens richiesto. Aggiorna la tua applicazione per gestire questo nuovo motivo di arresto:
```
response = client.messages.create(...)

if response.stop_reason == "model_context_window_exceeded":
    # Gestisci il limite della finestra di contesto in modo appropriato
    pass
```
Verifica la gestione dei parametri dello strumento (newline finali)

I modelli Claude 4.5+ preservano le newline finali nei parametri di stringa delle chiamate di strumento che erano precedentemente rimosse. Se i tuoi strumenti si basano sulla corrispondenza esatta delle stringhe rispetto ai parametri delle chiamate di strumento, verifica che la tua logica gestisca correttamente le newline finali.
Aggiorna i tuoi prompt per i cambiamenti comportamentali

I modelli Claude 4+ hanno uno stile di comunicazione più conciso e diretto e richiedono indicazioni esplicite. Rivedi le migliori pratiche di prompt engineering per una guida all'ottimizzazione.

Modifiche consigliate aggiuntive

Rimuovi gli header beta legacy: Rimuovi token-efficient-tools-2025-02-19 e output-128k-2025-02-19. Tutti i modelli Claude 4+ hanno l'uso degli strumenti efficiente in termini di token integrato e questi header non hanno alcun effetto.

Checklist di migrazione Claude 4.6

Migrazione a Claude Sonnet 4.6

Claude Sonnet 4.6 combina forte intelligenza con prestazioni veloci, con capacità di ricerca agentiche migliorate e esecuzione del codice gratuita quando utilizzato con ricerca web o web fetch. È ideale per compiti di codifica, analisi e contenuti quotidiani.

Per una panoramica completa delle capacità, vedi la panoramica dei modelli.

Il prezzo di Sonnet 4.6 è $3 per milione di token di input, $15 per milione di token di output. Vedi Prezzo di Claude per i dettagli.

Aggiorna il nome del tuo modello:

# Da Sonnet 4.5
model = "claude-sonnet-4-5"  # Prima
model = "claude-sonnet-4-6"  # Dopo

# Da Sonnet 4
model = "claude-sonnet-4-20250514"  # Prima
model = "claude-sonnet-4-6"  # Dopo

Cambiamenti di rottura

Quando si migra da Sonnet 4.5

Il prefill dei messaggi dell'assistente non è più supportato

Questo è un cambiamento di rottura quando si migra da Sonnet 4.5 o precedente.

Il prefill dei messaggi dell'assistente restituisce un errore 400 su Sonnet 4.6. Usa output strutturati, istruzioni del prompt di sistema, o output_config.format invece.

Casi d'uso comuni di prefill e migrazioni:
- Controllo della formattazione dell'output (forzare l'output JSON/YAML): Usa output strutturati o strumenti con campi enum per compiti di classificazione.
- Eliminazione dei preamboli (rimozione di frasi "Ecco..."): Aggiungi istruzioni dirette nel prompt di sistema: "Rispondi direttamente senza preambolo. Non iniziare con frasi come 'Ecco...', 'Basato su...', ecc."
- Evitare cattivi rifiuti: Claude è molto migliore nei rifiuti appropriati ora. Un prompt chiaro nel messaggio dell'utente senza prefill dovrebbe essere sufficiente.
- Continuazioni (ripresa di risposte interrotte): Sposta la continuazione al messaggio dell'utente: "La tua risposta precedente è stata interrotta e è terminata con [previous_response]. Continua da dove eri rimasto."
- Idratazione del contesto / coerenza del ruolo (aggiornamento del contesto in conversazioni lunghe): Inietta ciò che erano precedentemente promemoria dell'assistente prefilled nel turno dell'utente invece.
L'escaping JSON dei parametri dello strumento potrebbe differire

Questo è un cambiamento di rottura quando si migra da Sonnet 4.5 o precedente.

L'escaping delle stringhe JSON nei parametri dello strumento potrebbe differire dai modelli precedenti. I parser JSON standard lo gestiscono automaticamente, ma il parsing personalizzato basato su stringhe potrebbe richiedere aggiornamenti.

Quando si migra da Claude 3.x

Aggiorna i parametri di campionamento

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Usa solo temperature O top_p, non entrambi.
Aggiorna le versioni degli strumenti

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.
Gestisci il motivo di arresto refusal

Aggiorna la tua applicazione per gestire i motivi di arresto refusal.
Aggiorna i tuoi prompt per i cambiamenti comportamentali

I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le migliori pratiche di prompt engineering per una guida all'ottimizzazione.

Modifiche consigliate

Rimuovi l'header beta fine-grained-tool-streaming-2025-05-14 — Il fine-grained tool streaming è ora GA su Sonnet 4.6 e non richiede più un header beta.
Migra output_format a output_config.format — Il parametro output_format è deprecato. Usa output_config.format invece.

Migrazione da Sonnet 4.5

Ti incoraggiamo fortemente a migrare da Sonnet 4.5 a Sonnet 4.6, che offre più intelligenza allo stesso prezzo.

Sonnet 4.6 ha un livello di effort predefinito di high, in contrasto con Sonnet 4.5 che non aveva parametro effort. Ti consigliamo di regolare il parametro effort mentre migri da Sonnet 4.5 a Sonnet 4.6. Se non impostato esplicitamente, potresti sperimentare una latenza più elevata con il livello di effort predefinito.

Se non stai usando il pensiero esteso

Se non stai usando il pensiero esteso su Sonnet 4.5, puoi continuare senza di esso su Sonnet 4.6. Dovresti impostare esplicitamente l'effort al livello appropriato per il tuo caso d'uso. Con effort low e il pensiero disabilitato, puoi aspettarti prestazioni simili o migliori rispetto a Sonnet 4.5 senza pensiero esteso.

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Se stai usando il pensiero esteso

Se stai usando il pensiero esteso su Sonnet 4.5, continua ad essere supportato su Sonnet 4.6 senza modifiche necessarie alla tua configurazione di pensiero. Ti consigliamo di mantenere un budget di pensiero intorno a 16k token. In pratica, la maggior parte dei compiti non ne usa così tanto, ma fornisce spazio di manovra per problemi più difficili senza il rischio di un utilizzo di token incontrollato.

Casi d'uso di codifica e agentici

Per la codifica agentiva, il design frontend, i flussi di lavoro pesanti di strumenti e i flussi di lavoro aziendali complessi, ti consigliamo di iniziare con effort medium. Se trovi che la latenza è troppo alta, considera di ridurre l'effort a low. Se hai bisogno di un'intelligenza più elevata, considera di aumentare l'effort a high o di migrare a Opus 4.6.

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Chat e casi d'uso non di codifica

Per chat, generazione di contenuti, ricerca, classificazione e altri compiti non di codifica, ti consigliamo di iniziare con effort low con pensiero esteso. Se hai bisogno di più profondità, aumenta l'effort a medium.

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Quando provare il pensiero adattivo

I percorsi di migrazione sopra utilizzano il pensiero esteso con budget_tokens per un utilizzo di token prevedibile. Se il tuo carico di lavoro si adatta a uno dei seguenti modelli, considera di provare il pensiero adattivo invece:

Agenti multi-step autonomi: agenti di codifica che trasformano i requisiti in software funzionante, pipeline di analisi dei dati e ricerca di bug dove il modello viene eseguito indipendentemente su molti passaggi. Il pensiero adattivo consente al modello di calibrare il suo ragionamento per passaggio, rimanendo sulla strada su traiettorie più lunghe. Per questi carichi di lavoro, inizia con effort high. Se la latenza o l'utilizzo di token è una preoccupazione, riduci a medium.
Agenti di utilizzo del computer: Sonnet 4.6 ha raggiunto la migliore accuratezza in assoluto sulle valutazioni di utilizzo del computer utilizzando la modalità adattiva.
Carichi di lavoro bimodali: un mix di compiti facili e difficili dove l'adattivo salta il pensiero su query semplici e ragiona profondamente su quelle complesse.

Quando usi il pensiero adattivo, valuta l'effort medium e high sui tuoi compiti. Il livello giusto dipende dal compromesso del tuo carico di lavoro tra qualità, latenza e utilizzo di token.

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Se vedi comportamenti incoerenti o regressioni di qualità con il pensiero adattivo, passa al pensiero esteso con budget_tokens. Questo fornisce risultati più prevedibili con un limite sui costi del pensiero.

Checklist di migrazione Sonnet 4.6

Migrazione a Claude Sonnet 4.5

Claude Sonnet 4.5 combina forte intelligenza con prestazioni veloci, rendendolo ideale per compiti di codifica, analisi e contenuti quotidiani.

Per una panoramica completa delle capacità, vedi la panoramica dei modelli.

Il prezzo di Sonnet 4.5 è $3 per milione di token di input, $15 per milione di token di output. Vedi Prezzo di Claude per i dettagli.

Aggiorna il nome del tuo modello:

# Da Sonnet 4
model = "claude-sonnet-4-20250514"  # Prima
model = "claude-sonnet-4-5-20250929"  # Dopo

# Da Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Prima
model = "claude-sonnet-4-5-20250929"  # Dopo

Cambiamenti di rottura

Questi cambiamenti di rottura si applicano quando si migra dai modelli Claude 3.x Sonnet.

Aggiorna i parametri di campionamento

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Usa solo temperature O top_p, non entrambi.
Aggiorna le versioni degli strumenti

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.
Gestisci il motivo di arresto refusal

Aggiorna la tua applicazione per gestire i motivi di arresto refusal.
Aggiorna i tuoi prompt per i cambiamenti comportamentali

I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le migliori pratiche di prompt engineering per una guida all'ottimizzazione.

Checklist di migrazione Sonnet 4.5

Aggiorna l'ID del modello a claude-sonnet-4-5-20250929
ROTTURA: Aggiorna le versioni degli strumenti alle più recenti (text_editor_20250728, code_execution_20250825); le versioni legacy non sono supportate (se migri da 3.x)
ROTTURA: Rimuovi qualsiasi codice che utilizza il comando undo_edit (se applicabile)
ROTTURA: Aggiorna i parametri di campionamento per usare solo temperature O top_p, non entrambi (se migri da 3.x)
Gestisci il nuovo motivo di arresto refusal nella tua applicazione
Rivedi e aggiorna i prompt seguendo le migliori pratiche di prompt engineering
Considera di abilitare il pensiero esteso per compiti di ragionamento complesso
Testa nell'ambiente di sviluppo prima della distribuzione in produzione

Migrazione a Claude Haiku 4.5

Claude Haiku 4.5 è il modello Haiku più veloce e intelligente con prestazioni quasi frontier, fornendo qualità del modello premium per applicazioni interattive e elaborazione ad alto volume.

Per una panoramica completa delle capacità, vedi la panoramica dei modelli.

Il prezzo di Haiku 4.5 è $1 per milione di token di input, $5 per milione di token di output. Vedi Prezzo di Claude per i dettagli.

Aggiorna il nome del tuo modello:

# Da Haiku 3.5
model = "claude-3-5-haiku-20241022"  # Prima
model = "claude-haiku-4-5-20251001"  # Dopo

Rivedi i nuovi limiti di velocità: Haiku 4.5 ha limiti di velocità separati da Haiku 3.5. Vedi Documentazione dei limiti di velocità per i dettagli.

Per miglioramenti significativi delle prestazioni su compiti di codifica e ragionamento, considera di abilitare il pensiero esteso con thinking: {type: "enabled", budget_tokens: N}.

Il pensiero esteso influisce sull'efficienza della cache dei prompt.

Il pensiero esteso è deprecato nei modelli Claude 4.6 o più recenti. Se usi modelli più recenti, usa il pensiero adattivo invece.

Esplora le nuove capacità: Vedi la panoramica dei modelli per i dettagli sulla consapevolezza del contesto, capacità di output aumentata (64K token), intelligenza più elevata e velocità migliorata.

Cambiamenti di rottura

Questi cambiamenti di rottura si applicano quando si migra dai modelli Claude 3.x Haiku.

Aggiorna i parametri di campionamento

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Usa solo temperature O top_p, non entrambi.
Aggiorna le versioni degli strumenti

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.
Gestisci il motivo di arresto refusal

Aggiorna la tua applicazione per gestire i motivi di arresto refusal.
Aggiorna i tuoi prompt per i cambiamenti comportamentali

I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le migliori pratiche di prompt engineering per una guida all'ottimizzazione.

Checklist di migrazione Haiku 4.5

Aggiorna l'ID del modello a claude-haiku-4-5-20251001
ROTTURA: Aggiorna le versioni degli strumenti alle più recenti (text_editor_20250728, code_execution_20250825); le versioni legacy non sono supportate
ROTTURA: Rimuovi qualsiasi codice che utilizza il comando undo_edit (se applicabile)
ROTTURA: Aggiorna i parametri di campionamento per usare solo temperature O top_p, non entrambi
Gestisci il nuovo motivo di arresto refusal nella tua applicazione
Rivedi e regola per i nuovi limiti di velocità (separati da Haiku 3.5)
Rivedi e aggiorna i prompt seguendo le migliori pratiche di prompt engineering
Considera di abilitare il pensiero esteso per compiti di ragionamento complesso
Testa nell'ambiente di sviluppo prima della distribuzione in produzione

Hai bisogno di aiuto?

Controlla la documentazione dell'API per le specifiche dettagliate
Rivedi le capacità del modello per i confronti delle prestazioni
Rivedi le note di rilascio dell'API per gli aggiornamenti dell'API
Contatta il supporto se riscontri problemi durante la migrazione

Was this page helpful?

Modelli e prezzi

Guida alla migrazione

Guida per la migrazione ai modelli Claude 4.6 dalle versioni precedenti di Claude

Migrazione a Claude 4.6

Aggiorna il nome del tuo modello

# Migrazione Opus
model = "claude-opus-4-5"  # Prima
model = "claude-opus-4-6"  # Dopo

Cambiamenti di rottura

Rimozione del prefill: Il prefill dei messaggi dell'assistente restituisce un errore 400 sui modelli Claude 4.6. Usa output strutturati, istruzioni del prompt di sistema, o output_config.format invece.
Quotazione dei parametri dello strumento: I modelli Claude 4.6 possono produrre un escaping JSON leggermente diverso nelle stringhe degli argomenti delle chiamate di strumento (ad es., gestione diversa degli escape Unicode o dell'escaping della barra). Se analizzi l'input della chiamata di strumento come una stringa grezza piuttosto che utilizzare un parser JSON, verifica la tua logica di parsing. I parser JSON standard (come json.loads() o JSON.parse()) gestiscono automaticamente queste differenze.

Modifiche consigliate

Queste non sono obbligatorie ma miglioreranno la tua esperienza:

Migra al pensiero adattivo: thinking: {type: "enabled", budget_tokens: N} è deprecato sui modelli Claude 4.6 e verrà rimosso in una futura versione del modello. Passa a thinking: {type: "adaptive"} e usa il parametro effort per controllare la profondità del pensiero. Vedi Pensiero adattivo.
```
response = client.beta.messages.create(
    model="claude-opus-4-5",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[...],
)
```
Nota che la migrazione passa anche da client.beta.messages.create a client.messages.create. Il pensiero adattivo e l'effort sono funzionalità GA e non richiedono lo spazio dei nomi beta SDK o alcun header beta.
Rimuovi l'header beta effort: Il parametro effort è ora GA. Rimuovi betas=["effort-2025-11-24"] dalle tue richieste.
Rimuovi l'header beta del fine-grained tool streaming: Il fine-grained tool streaming è ora GA. Rimuovi betas=["fine-grained-tool-streaming-2025-05-14"] dalle tue richieste.
Rimuovi l'header beta del pensiero interleaved (solo Opus 4.6): Il pensiero adattivo abilita automaticamente il pensiero interleaved su Opus 4.6. Rimuovi betas=["interleaved-thinking-2025-05-14"] dalle tue richieste Opus 4.6. Nota: Sonnet 4.6 continua a supportare questo header beta con il pensiero esteso manuale.
Migra a output_config.format: Se usi output strutturati, aggiorna output_format={...} a output_config={"format": {...}}. Il vecchio parametro rimane funzionale ma è deprecato e verrà rimosso in una futura versione del modello.

Migrazione da Claude 4.1 o precedente a Claude 4.6

Se stai migrando da Opus 4.1, Sonnet 4, o modelli precedenti direttamente a Claude 4.6, applica i cambiamenti di rottura di Claude 4.6 sopra più i cambiamenti aggiuntivi in questa sezione.

# Da Opus 4.1
model = "claude-opus-4-1-20250805"  # Prima
model = "claude-opus-4-6"  # Dopo

# Da Sonnet 4
model = "claude-sonnet-4-20250514"  # Prima
model = "claude-opus-4-6"  # Dopo

# Da Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Prima
model = "claude-opus-4-6"  # Dopo

Cambiamenti di rottura aggiuntivi

Aggiorna i parametri di campionamento

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Usa solo temperature O top_p, non entrambi:

# Prima - Questo darà errore nei modelli Claude 4+
response = client.messages.create(
    model="claude-3-7-sonnet-20250219",
    temperature=0.7,
    top_p=0.9,  # Non puoi usare entrambi
    # ...
)

# Dopo
response = client.messages.create(
    model="claude-opus-4-6",
    temperature=0.7,  # Usa temperature O top_p, non entrambi
    # ...
)

Aggiorna le versioni degli strumenti

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Aggiorna alle versioni più recenti degli strumenti. Rimuovi qualsiasi codice che utilizza il comando undo_edit.
```
# Prima
tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]

# Dopo
tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
```
- Editor di testo: Usa text_editor_20250728 e str_replace_based_edit_tool. Vedi Documentazione dello strumento editor di testo per i dettagli.
- Esecuzione del codice: Aggiorna a code_execution_20250825. Vedi Documentazione dello strumento di esecuzione del codice per le istruzioni di migrazione.

Gestisci il motivo di arresto refusal

Aggiorna la tua applicazione per gestire i motivi di arresto refusal:

response = client.messages.create(...)

if response.stop_reason == "refusal":
    # Gestisci il rifiuto in modo appropriato
    pass

Gestisci il motivo di arresto model_context_window_exceeded

I modelli Claude 4.5+ restituiscono un motivo di arresto model_context_window_exceeded quando la generazione si interrompe a causa del raggiungimento del limite della finestra di contesto, piuttosto che il limite max_tokens richiesto. Aggiorna la tua applicazione per gestire questo nuovo motivo di arresto:
```
response = client.messages.create(...)

if response.stop_reason == "model_context_window_exceeded":
    # Gestisci il limite della finestra di contesto in modo appropriato
    pass
```
Verifica la gestione dei parametri dello strumento (newline finali)

I modelli Claude 4.5+ preservano le newline finali nei parametri di stringa delle chiamate di strumento che erano precedentemente rimosse. Se i tuoi strumenti si basano sulla corrispondenza esatta delle stringhe rispetto ai parametri delle chiamate di strumento, verifica che la tua logica gestisca correttamente le newline finali.
Aggiorna i tuoi prompt per i cambiamenti comportamentali

I modelli Claude 4+ hanno uno stile di comunicazione più conciso e diretto e richiedono indicazioni esplicite. Rivedi le migliori pratiche di prompt engineering per una guida all'ottimizzazione.

Modifiche consigliate aggiuntive

Rimuovi gli header beta legacy: Rimuovi token-efficient-tools-2025-02-19 e output-128k-2025-02-19. Tutti i modelli Claude 4+ hanno l'uso degli strumenti efficiente in termini di token integrato e questi header non hanno alcun effetto.

Checklist di migrazione Claude 4.6

Migrazione a Claude Sonnet 4.6

Per una panoramica completa delle capacità, vedi la panoramica dei modelli.

Il prezzo di Sonnet 4.6 è $3 per milione di token di input, $15 per milione di token di output. Vedi Prezzo di Claude per i dettagli.

Aggiorna il nome del tuo modello:

# Da Sonnet 4.5
model = "claude-sonnet-4-5"  # Prima
model = "claude-sonnet-4-6"  # Dopo

# Da Sonnet 4
model = "claude-sonnet-4-20250514"  # Prima
model = "claude-sonnet-4-6"  # Dopo

Cambiamenti di rottura

Quando si migra da Sonnet 4.5

Il prefill dei messaggi dell'assistente non è più supportato

Questo è un cambiamento di rottura quando si migra da Sonnet 4.5 o precedente.

Il prefill dei messaggi dell'assistente restituisce un errore 400 su Sonnet 4.6. Usa output strutturati, istruzioni del prompt di sistema, o output_config.format invece.

Casi d'uso comuni di prefill e migrazioni:
- Controllo della formattazione dell'output (forzare l'output JSON/YAML): Usa output strutturati o strumenti con campi enum per compiti di classificazione.
- Eliminazione dei preamboli (rimozione di frasi "Ecco..."): Aggiungi istruzioni dirette nel prompt di sistema: "Rispondi direttamente senza preambolo. Non iniziare con frasi come 'Ecco...', 'Basato su...', ecc."
- Evitare cattivi rifiuti: Claude è molto migliore nei rifiuti appropriati ora. Un prompt chiaro nel messaggio dell'utente senza prefill dovrebbe essere sufficiente.
- Continuazioni (ripresa di risposte interrotte): Sposta la continuazione al messaggio dell'utente: "La tua risposta precedente è stata interrotta e è terminata con [previous_response]. Continua da dove eri rimasto."
- Idratazione del contesto / coerenza del ruolo (aggiornamento del contesto in conversazioni lunghe): Inietta ciò che erano precedentemente promemoria dell'assistente prefilled nel turno dell'utente invece.
L'escaping JSON dei parametri dello strumento potrebbe differire

Questo è un cambiamento di rottura quando si migra da Sonnet 4.5 o precedente.

L'escaping delle stringhe JSON nei parametri dello strumento potrebbe differire dai modelli precedenti. I parser JSON standard lo gestiscono automaticamente, ma il parsing personalizzato basato su stringhe potrebbe richiedere aggiornamenti.

Quando si migra da Claude 3.x

Aggiorna i parametri di campionamento

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Usa solo temperature O top_p, non entrambi.
Aggiorna le versioni degli strumenti

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.
Gestisci il motivo di arresto refusal

Aggiorna la tua applicazione per gestire i motivi di arresto refusal.
Aggiorna i tuoi prompt per i cambiamenti comportamentali

I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le migliori pratiche di prompt engineering per una guida all'ottimizzazione.

Modifiche consigliate

Rimuovi l'header beta fine-grained-tool-streaming-2025-05-14 — Il fine-grained tool streaming è ora GA su Sonnet 4.6 e non richiede più un header beta.
Migra output_format a output_config.format — Il parametro output_format è deprecato. Usa output_config.format invece.

Migrazione da Sonnet 4.5

Ti incoraggiamo fortemente a migrare da Sonnet 4.5 a Sonnet 4.6, che offre più intelligenza allo stesso prezzo.

Se non stai usando il pensiero esteso

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Se stai usando il pensiero esteso

Casi d'uso di codifica e agentici

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Chat e casi d'uso non di codifica

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    betas=["interleaved-thinking-2025-05-14"],
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Quando provare il pensiero adattivo

Agenti multi-step autonomi: agenti di codifica che trasformano i requisiti in software funzionante, pipeline di analisi dei dati e ricerca di bug dove il modello viene eseguito indipendentemente su molti passaggi. Il pensiero adattivo consente al modello di calibrare il suo ragionamento per passaggio, rimanendo sulla strada su traiettorie più lunghe. Per questi carichi di lavoro, inizia con effort high. Se la latenza o l'utilizzo di token è una preoccupazione, riduci a medium.
Agenti di utilizzo del computer: Sonnet 4.6 ha raggiunto la migliore accuratezza in assoluto sulle valutazioni di utilizzo del computer utilizzando la modalità adattiva.
Carichi di lavoro bimodali: un mix di compiti facili e difficili dove l'adattivo salta il pensiero su query semplici e ragiona profondamente su quelle complesse.

Quando usi il pensiero adattivo, valuta l'effort medium e high sui tuoi compiti. Il livello giusto dipende dal compromesso del tuo carico di lavoro tra qualità, latenza e utilizzo di token.

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "Your prompt here"}],
)

Checklist di migrazione Sonnet 4.6

Migrazione a Claude Sonnet 4.5

Claude Sonnet 4.5 combina forte intelligenza con prestazioni veloci, rendendolo ideale per compiti di codifica, analisi e contenuti quotidiani.

Per una panoramica completa delle capacità, vedi la panoramica dei modelli.

Il prezzo di Sonnet 4.5 è $3 per milione di token di input, $15 per milione di token di output. Vedi Prezzo di Claude per i dettagli.

Aggiorna il nome del tuo modello:

# Da Sonnet 4
model = "claude-sonnet-4-20250514"  # Prima
model = "claude-sonnet-4-5-20250929"  # Dopo

# Da Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Prima
model = "claude-sonnet-4-5-20250929"  # Dopo

Cambiamenti di rottura

Questi cambiamenti di rottura si applicano quando si migra dai modelli Claude 3.x Sonnet.

Aggiorna i parametri di campionamento

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Usa solo temperature O top_p, non entrambi.
Aggiorna le versioni degli strumenti

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.
Gestisci il motivo di arresto refusal

Aggiorna la tua applicazione per gestire i motivi di arresto refusal.
Aggiorna i tuoi prompt per i cambiamenti comportamentali

I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le migliori pratiche di prompt engineering per una guida all'ottimizzazione.

Checklist di migrazione Sonnet 4.5

Aggiorna l'ID del modello a claude-sonnet-4-5-20250929
ROTTURA: Aggiorna le versioni degli strumenti alle più recenti (text_editor_20250728, code_execution_20250825); le versioni legacy non sono supportate (se migri da 3.x)
ROTTURA: Rimuovi qualsiasi codice che utilizza il comando undo_edit (se applicabile)
ROTTURA: Aggiorna i parametri di campionamento per usare solo temperature O top_p, non entrambi (se migri da 3.x)
Gestisci il nuovo motivo di arresto refusal nella tua applicazione
Rivedi e aggiorna i prompt seguendo le migliori pratiche di prompt engineering
Considera di abilitare il pensiero esteso per compiti di ragionamento complesso
Testa nell'ambiente di sviluppo prima della distribuzione in produzione

Migrazione a Claude Haiku 4.5

Claude Haiku 4.5 è il modello Haiku più veloce e intelligente con prestazioni quasi frontier, fornendo qualità del modello premium per applicazioni interattive e elaborazione ad alto volume.

Per una panoramica completa delle capacità, vedi la panoramica dei modelli.

Il prezzo di Haiku 4.5 è $1 per milione di token di input, $5 per milione di token di output. Vedi Prezzo di Claude per i dettagli.

Aggiorna il nome del tuo modello:

# Da Haiku 3.5
model = "claude-3-5-haiku-20241022"  # Prima
model = "claude-haiku-4-5-20251001"  # Dopo

Rivedi i nuovi limiti di velocità: Haiku 4.5 ha limiti di velocità separati da Haiku 3.5. Vedi Documentazione dei limiti di velocità per i dettagli.

Per miglioramenti significativi delle prestazioni su compiti di codifica e ragionamento, considera di abilitare il pensiero esteso con thinking: {type: "enabled", budget_tokens: N}.

Il pensiero esteso influisce sull'efficienza della cache dei prompt.

Il pensiero esteso è deprecato nei modelli Claude 4.6 o più recenti. Se usi modelli più recenti, usa il pensiero adattivo invece.

Cambiamenti di rottura

Questi cambiamenti di rottura si applicano quando si migra dai modelli Claude 3.x Haiku.

Aggiorna i parametri di campionamento

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Usa solo temperature O top_p, non entrambi.
Aggiorna le versioni degli strumenti

Questo è un cambiamento di rottura quando si migra dai modelli Claude 3.x.

Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.
Gestisci il motivo di arresto refusal

Aggiorna la tua applicazione per gestire i motivi di arresto refusal.
Aggiorna i tuoi prompt per i cambiamenti comportamentali

I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le migliori pratiche di prompt engineering per una guida all'ottimizzazione.

Checklist di migrazione Haiku 4.5

Aggiorna l'ID del modello a claude-haiku-4-5-20251001
ROTTURA: Aggiorna le versioni degli strumenti alle più recenti (text_editor_20250728, code_execution_20250825); le versioni legacy non sono supportate
ROTTURA: Rimuovi qualsiasi codice che utilizza il comando undo_edit (se applicabile)
ROTTURA: Aggiorna i parametri di campionamento per usare solo temperature O top_p, non entrambi
Gestisci il nuovo motivo di arresto refusal nella tua applicazione
Rivedi e regola per i nuovi limiti di velocità (separati da Haiku 3.5)
Rivedi e aggiorna i prompt seguendo le migliori pratiche di prompt engineering
Considera di abilitare il pensiero esteso per compiti di ragionamento complesso
Testa nell'ambiente di sviluppo prima della distribuzione in produzione

Hai bisogno di aiuto?

Controlla la documentazione dell'API per le specifiche dettagliate
Rivedi le capacità del modello per i confronti delle prestazioni
Rivedi le note di rilascio dell'API per gli aggiornamenti dell'API
Contatta il supporto se riscontri problemi durante la migrazione

Was this page helpful?