Loading...
  • Costruisci
  • Amministrazione
  • Modelli e prezzi
  • Client SDK
  • Riferimento API
Search...
⌘K
Modelli
Panoramica dei modelliScelta di un modelloNovità in Claude Opus 4.7Guida alla migrazioneDeprecazioni dei modelliSchede del modelloPrompt di sistema
Prezzi
Prezzi
Log in
Guida alla migrazione
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Modelli e prezzi/Modelli

Guida alla migrazione

Guida per la migrazione a Claude Opus 4.7 e Claude 4.6 da versioni precedenti di Claude

Was this page helpful?

  • Migrazione a Claude Opus 4.7
  • Aggiorna il nome del tuo modello
  • Cambiamenti che interrompono
  • Scelta di un livello di sforzo
  • Cambiamenti comportamentali
  • Cambiamenti consigliati
  • Elenco di controllo della migrazione
  • Migrazione a Claude Opus 4.7 da Opus 4.5 o precedente
  • Aggiorna il nome del tuo modello
  • Cambiamenti che interrompono
  • Cambiamenti consigliati
  • Migrazione da Claude 4.1 o precedente
  • Elenco di controllo della migrazione (da Opus 4.5 o precedente)
  • Migrazione a Claude Sonnet 4.6
  • Modifiche di rilievo
  • Modifiche consigliate
  • Migrazione da Sonnet 4.5
  • Elenco di controllo della migrazione Sonnet 4.6
  • Migrazione a Claude Sonnet 4.5
  • Modifiche di rilievo
  • Elenco di controllo della migrazione Sonnet 4.5
  • Migrazione a Claude Haiku 4.5
  • Modifiche di rilievo
  • Elenco di controllo della migrazione Haiku 4.5
  • Ottieni aiuto

Questa guida copre la migrazione del codice Messages API. Se utilizzi Claude Managed Agents, non sono richiesti cambiamenti oltre all'aggiornamento del nome del modello.

Migrazione a Claude Opus 4.7

Claude Opus 4.7 è il nostro modello disponibile in generale più capace fino ad oggi. È altamente autonomo e funziona eccezionalmente bene su lavori agentici a lungo termine, lavori di conoscenza, compiti di visione e compiti di memoria. Claude Opus 4.7 dovrebbe avere forti prestazioni out-of-the-box su prompt e eval esistenti di Claude Opus 4.6 allo stesso prezzo di $5 / $25 per MTok, ma ci sono alcuni cambiamenti comportamentali e API che vale la pena conoscere mentre esegui la migrazione. Supporta lo stesso set di funzionalità di Claude Opus 4.6, inclusa la finestra di contesto di 1M token ai prezzi API standard senza premio per contesto lungo, 128k token di output massimi, adaptive thinking, prompt caching, batch processing, Files API, supporto PDF, visione e l'intero set di strumenti lato server e lato client (bash, esecuzione del codice, computer use, editor di testo, ricerca web, web fetch, connettore MCP, memoria).

Automatizza questa migrazione con la competenza Claude API. In Claude Code, esegui /claude-api migrate per invocare la competenza Claude API inclusa:

/claude-api migrate this project to claude-opus-4-7

La competenza applica lo scambio di ID modello, i cambiamenti di parametri che interrompono, la sostituzione del prefill e la calibrazione dello sforzo descritti di seguito nel tuo codebase, quindi produce un elenco di controllo di elementi da verificare manualmente. Ti chiede di confermare l'ambito della migrazione (l'intera directory di lavoro, una sottodirectory o un elenco di file specifico) prima di modificare qualsiasi file.

Aggiorna il nome del tuo modello

# Migrazione Opus
model = "claude-opus-4-6"  # Prima
model = "claude-opus-4-7"  # Dopo

Cambiamenti che interrompono

  1. Extended thinking rimosso: thinking: {type: "enabled", budget_tokens: N} non è più supportato su Claude Opus 4.7 o modelli successivi e restituisce un errore 400. Passa a adaptive thinking (thinking: {type: "adaptive"}) e usa il parametro effort per controllare la profondità del thinking. Adaptive thinking è disattivato per impostazione predefinita su Claude Opus 4.7: le richieste senza il campo thinking vengono eseguite senza thinking, corrispondendo al comportamento di Opus 4.6. Imposta thinking: {type: "adaptive"} esplicitamente per abilitarlo.

    Prima (Claude Opus 4.6):

    client.messages.create(
        model="claude-opus-4-6",
        max_tokens=64000,
        thinking={"type": "enabled", "budget_tokens": 32000},
        messages=[{"role": "user", "content": "..."}],
    )

Scelta di un livello di sforzo

Il parametro effort ti consente di regolare l'intelligenza di Claude rispetto alla spesa di token, scambiando la capacità per velocità più veloce e costi inferiori. Inizia con il nuovo livello di sforzo xhigh per i casi di utilizzo di codifica e agentici, e usa un minimo di sforzo high per la maggior parte dei casi di utilizzo sensibili all'intelligenza. Sperimenta con altri livelli di sforzo per regolare ulteriormente l'utilizzo dei token e l'intelligenza:

  • max: Lo sforzo massimo può fornire guadagni di prestazioni in alcuni casi di utilizzo, ma può mostrare rendimenti decrescenti dall'aumento dell'utilizzo dei token. Questa impostazione può anche a volte essere soggetta al pensiero eccessivo. Consigliamo di testare lo sforzo massimo per compiti che richiedono molta intelligenza.
  • xhigh (nuovo): Lo sforzo extra alto è la migliore impostazione per la maggior parte dei casi di utilizzo di codifica e agentici.
  • high: Questa impostazione bilancia l'utilizzo dei token e l'intelligenza. Per la maggior parte dei casi di utilizzo sensibili all'intelligenza, consigliamo un minimo di sforzo high.
  • medium: Buono per i casi di utilizzo sensibili ai costi che devono ridurre l'utilizzo dei token mentre scambiano l'intelligenza.
  • low: Riservato per compiti brevi e limitati e carichi di lavoro sensibili alla latenza che non sono sensibili all'intelligenza.

Ci aspettiamo che lo sforzo sia più importante per questo modello che per qualsiasi Opus precedente, e consigliamo di sperimentare attivamente quando esegui l'upgrade.

Cambiamenti comportamentali

Claude Opus 4.7 ha diverse differenze comportamentali da Claude Opus 4.6 che non sono cambiamenti API che interrompono ma possono richiedere aggiornamenti di prompt o rimozione di scaffolding.

  1. La lunghezza della risposta varia in base al caso di utilizzo: Claude Opus 4.7 calibra la lunghezza della risposta in base a quanto complesso giudica il compito, piuttosto che impostare per impostazione predefinita una verbosità fissa. Questo di solito significa risposte più brevi su ricerche semplici e molto più lunghe su analisi aperte. Se il tuo prodotto dipende da un certo stile o verbosità dell'output, potrebbe essere necessario regolare i tuoi prompt. Ad esempio, per diminuire la verbosità, potresti aggiungere: "Fornisci risposte concise e mirate. Salta il contesto non essenziale e mantieni gli esempi minimi." Se vedi esempi specifici di tipi di verbosità (cioè spiegazioni eccessive), puoi aggiungere istruzioni aggiuntive nel tuo prompt per prevenirle. Gli esempi positivi che mostrano come Claude può comunicare con il livello appropriato di concisione tendono ad essere più efficaci degli esempi negativi o delle istruzioni che dicono al modello cosa non fare.

  2. Seguire le istruzioni più letterale: Claude Opus 4.7 interpreta i prompt in modo più letterale ed esplicito rispetto a Claude Opus 4.6, in particolare a livelli di sforzo inferiori. Non generalizzerà silenziosamente un'istruzione da un elemento a un altro, e non dedurrà richieste che non hai fatto. Il lato positivo di questo letteralismo è la precisione e meno confusione. Generalmente funziona meglio per i casi di utilizzo API con prompt accuratamente sintonizzati, estrazione strutturata e pipeline in cui desideri un comportamento prevedibile. Una revisione del prompt e dell'harness può essere particolarmente utile per la migrazione a Claude Opus 4.7.

  3. Tono più diretto: Come con qualsiasi nuovo modello, lo stile della prosa nella scrittura di forma lunga può cambiare. Claude Opus 4.7 è più diretto e opinabile, con meno frasi orientate alla convalida e meno emoji rispetto allo stile più caldo di Claude Opus 4.6. Se il tuo prodotto si basa su una voce specifica, rivaluta i prompt di stile rispetto alla nuova linea di base.

Cambiamenti consigliati

Questi non sono obbligatori ma miglioreranno la tua esperienza:

  1. Rivaluta max_tokens: Poiché lo stesso testo produce un conteggio di token più elevato su Claude Opus 4.7, suggeriamo di aggiornare i tuoi parametri max_tokens per fornire spazio aggiuntivo, inclusi i trigger di compattazione. Gli interventi di prompting, task_budget e effort possono aiutare a controllare i costi e garantire un utilizzo appropriato dei token.

  2. Controlla le aspettative di conteggio dei token: Qualsiasi percorso di codice che stima i token lato client o presuppone un rapporto fisso token-carattere dovrebbe essere ri-testato rispetto a Claude Opus 4.7. Usa l'endpoint di conteggio dei token per verificare.

  3. Adotta task budgets (beta): Claude Opus 4.7 introduce i budget dei compiti. Questi budget ti permettono di informare Claude quanti token ha per un ciclo agentici completo, incluso thinking, chiamate di strumento, risultati di strumento e output finale. Il modello vede un conto alla rovescia in esecuzione e lo utilizza per dare priorità al lavoro e terminare il compito con grazia man mano che il budget viene consumato. Per usare, imposta l'header beta task-budgets-2026-03-13 e aggiungi quanto segue alla tua configurazione di output:

Elenco di controllo della migrazione

  • Aggiorna il nome del modello da claude-opus-4-6 a claude-opus-4-7 (o aggiorna gli alias).
  • Rimuovi temperature, top_p e top_k dai payload delle richieste.
  • Sostituisci thinking: {type: "enabled", budget_tokens: N} con thinking: {type: "adaptive"} più il parametro effort.
  • Rimuovi eventuali prefill di messaggi dell'assistente.
  • Se la tua UI visualizza il contenuto del thinking, esplicitamente acconsenti al riassunto del thinking.
  • Ri-benchmark il costo end-to-end e la latenza sotto la tokenizzazione aggiornata.
  • Ri-regola per tenere conto della tokenizzazione aggiornata.

Migrazione a Claude Opus 4.7 da Opus 4.5 o precedente

Se stai migrando da Claude Opus 4.5, Opus 4.1 o un modello precedente direttamente a Claude Opus 4.7, applica tutti i cambiamenti di Opus 4.7 sopra più i cambiamenti cumulativi in questa sezione che hanno avuto effetto tra Opus 4.5 e Opus 4.7. Se stai migrando da Opus 4.6, hai solo bisogno della sezione Opus 4.7 sopra.

Aggiorna il nome del tuo modello

# Migrazione Opus
model = "claude-opus-4-5"  # Prima
model = "claude-opus-4-7"  # Dopo

Cambiamenti che interrompono

  1. Rimozione del prefill è coperta nei cambiamenti che interrompono di Opus 4.7 sopra.

  2. Quotazione del parametro dello strumento: Claude Opus 4.6 e i modelli successivi possono produrre un'escaping JSON leggermente diversa nelle stringhe negli argomenti della chiamata dello strumento (ad es., gestione diversa degli escape Unicode o dell'escape della barra inclinata). Se analizzi lo input della chiamata dello strumento come una stringa grezza piuttosto che utilizzare un parser JSON, verifica la tua logica di parsing. I parser JSON standard (come json.loads() o JSON.parse()) gestiscono automaticamente queste differenze.

Cambiamenti consigliati

Questi cambiamenti migliorano la tua esperienza su Opus 4.7. Gli elementi contrassegnati (obbligatorio su Opus 4.7) erano raccomandazioni facoltative quando Opus 4.6 è stato lanciato ma ora sono obbligatori; il resto rimane consigliato.

  1. Migra a adaptive thinking (obbligatorio su Opus 4.7): thinking: {type: "enabled", budget_tokens: N} restituisce un errore 400 su Claude Opus 4.7. Passa a thinking: {type: "adaptive"} e usa il parametro effort per controllare la profondità del thinking. Vedi Adaptive thinking.

Migrazione da Claude 4.1 o precedente

Se stai migrando da Opus 4.1, Sonnet 4 (deprecato) o modelli precedenti direttamente a Claude Opus 4.7, applica i cambiamenti di Claude Opus 4.7 in cima a questa guida e i cambiamenti cumulativi sopra più i cambiamenti aggiuntivi in questa sezione.

# Da Opus 4.1
model = "claude-opus-4-1-20250805"  # Prima
model = "claude-opus-4-7"  # Dopo

# Da Sonnet 4
model = "claude-sonnet-4-20250514"  # Prima
model = "claude-opus-4-7"  # Dopo

# Da Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Prima
model = "claude-opus-4-7"  # Dopo

Cambiamenti che interrompono aggiuntivi

  1. Rimuovi i parametri di campionamento

    Questo è un cambiamento che interrompe quando si esegue la migrazione da modelli Claude 3.x.

    A partire da Claude Opus 4.7, impostare temperature, top_p o top_k su qualsiasi valore non predefinito restituirà un errore 400. Il percorso di migrazione più sicuro è omettere completamente questi parametri dalle richieste e utilizzare il prompting per guidare il comportamento del modello. Se stavi usando temperature = 0 per il determinismo, nota che non ha mai garantito output identici.

    Python
    # Prima - Questo darà errore nei modelli Claude 4+
    response = client.messages.create(
        model="claude-3-7-sonnet-20250219",
        temperature=0.7,
        top_p=0.9,  # I parametri di campionamento non predefiniti restituiscono 400 su Opus 4.7
        # ...
    )
    
    # Dopo
    response = client.messages.create(
        model="claude-opus-4-7",
        # ...
    )

Cambiamenti consigliati aggiuntivi

  • Rimuovi gli header beta legacy: Rimuovi token-efficient-tools-2025-02-19 e output-128k-2025-02-19. Tutti i modelli Claude 4+ hanno l'utilizzo dello strumento efficiente in termini di token integrato e questi header non hanno alcun effetto.

Elenco di controllo della migrazione (da Opus 4.5 o precedente)

  • Aggiorna l'ID del modello a claude-opus-4-7
  • Applica tutti i cambiamenti che interrompono di Opus 4.7 (extended thinking rimosso, parametri di campionamento rimossi, visualizzazione del thinking omessa per impostazione predefinita, tokenizzazione aggiornata)
  • BREAKING: Rimuovi i prefill dei messaggi dell'assistente (restituisce errore 400); usa structured outputs o output_config.format invece
  • BREAKING su Opus 4.7: Sostituisci thinking: {type: "enabled", budget_tokens: N} con thinking: {type: "adaptive"} più il parametro effort (restituisce 400 su Opus 4.7)
  • Verifica che il parsing JSON della chiamata dello strumento utilizzi un parser JSON standard
  • Rimuovi l'header beta effort-2025-11-24 (effort è ora GA)
  • Rimuovi l'header beta

Migrazione a Claude Sonnet 4.6

Claude Sonnet 4.6 combina forte intelligenza con prestazioni veloci, con capacità di ricerca agentiche migliorate e esecuzione del codice gratuita quando utilizzato con ricerca web o web fetch. È ideale per compiti di codifica, analisi e contenuto quotidiani.

Per una panoramica completa delle capacità, vedi la panoramica dei modelli.

Il prezzo di Sonnet 4.6 è $3 per milione di token di input, $15 per milione di token di output. Vedi Claude pricing per i dettagli.

Aggiorna il nome del tuo modello:

# Da Sonnet 4.5
model = "claude-sonnet-4-5"  # Prima
model = "claude-sonnet-4-6"  # Dopo

# Da Sonnet 4
model = "claude-sonnet-4-20250514"  # Prima
model = "claude-sonnet-4-6"  # Dopo

Modifiche di rilievo

Durante la migrazione da Sonnet 4.5

  1. Il prefilling dei messaggi dell'assistente non è più supportato

    Questo è un cambiamento di rilievo durante la migrazione da Sonnet 4.5 o versioni precedenti.

    Il prefilling dei messaggi dell'assistente restituisce un errore 400 su Sonnet 4.6. Utilizza output strutturati, istruzioni nel prompt di sistema, o output_config.format invece.

    Casi d'uso comuni di prefill e migrazioni:

    • Controllo della formattazione dell'output (forzare output JSON/YAML): Utilizza output strutturati o strumenti con campi enum per attività di classificazione.

    • Eliminazione dei preamboli (rimozione di frasi come "Ecco..."): Aggiungi istruzioni dirette nel prompt di sistema: "Rispondi direttamente senza preambolo. Non iniziare con frasi come 'Ecco...', 'Basato su...', ecc."

    • Evitare rifiuti scorretti: Claude è molto più bravo nei rifiuti appropriati ora. Un prompt chiaro nel messaggio dell'utente senza prefill dovrebbe essere sufficiente.

Durante la migrazione da Claude 3.x

  1. Aggiorna i parametri di campionamento

    Questo è un cambiamento di rilievo durante la migrazione da modelli Claude 3.x.

    Utilizza solo temperature O top_p, non entrambi.

  2. Aggiorna le versioni degli strumenti

    Questo è un cambiamento di rilievo durante la migrazione da modelli Claude 3.x.

    Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.

  3. Gestisci il motivo di arresto refusal

    Aggiorna la tua applicazione per gestire i motivi di arresto refusal.

Modifiche consigliate

  1. Rimuovi l'header beta fine-grained-tool-streaming-2025-05-14: Lo streaming degli strumenti a grana fine è ora GA su Sonnet 4.6 e non richiede più un header beta.
  2. Migra output_format a output_config.format: Il parametro output_format è deprecato. Utilizza output_config.format invece.

Migrazione da Sonnet 4.5

Considera la migrazione da Sonnet 4.5 a Sonnet 4.6, che offre maggiore intelligenza allo stesso prezzo.

Sonnet 4.6 ha come impostazione predefinita un livello di sforzo di high, in contrasto con Sonnet 4.5 che non aveva parametro di sforzo. Considera l'aggiustamento del parametro di sforzo durante la migrazione da Sonnet 4.5 a Sonnet 4.6. Se non impostato esplicitamente, potresti riscontrare una latenza più elevata con il livello di sforzo predefinito.

Se non stai utilizzando il pensiero esteso

Se non stai utilizzando il pensiero esteso su Sonnet 4.5, puoi continuare senza di esso su Sonnet 4.6. Dovresti impostare esplicitamente lo sforzo al livello appropriato per il tuo caso d'uso. Con sforzo low e il pensiero disabilitato, puoi aspettarti prestazioni simili o migliori rispetto a Sonnet 4.5 senza pensiero esteso.

Se stai utilizzando il pensiero esteso

Se stai utilizzando il pensiero esteso con budget_tokens su Sonnet 4.5, è ancora funzionale su Sonnet 4.6 ma è deprecato. Migra al pensiero adattivo con il parametro di sforzo.

Migrazione al pensiero adattivo

Il pensiero adattivo è la sostituzione consigliata per budget_tokens su Sonnet 4.6. È particolarmente adatto ai seguenti modelli di carico di lavoro:

  • Agenti multi-step autonomi: agenti di codifica che trasformano i requisiti in software funzionante, pipeline di analisi dei dati e ricerca di bug dove il modello viene eseguito indipendentemente su molti passaggi. Il pensiero adattivo consente al modello di calibrare il suo ragionamento per passaggio, rimanendo sulla strada per traiettorie più lunghe. Per questi carichi di lavoro, inizia con sforzo high. Se la latenza o l'utilizzo dei token è una preoccupazione, riduci a medium.
  • Agenti di utilizzo del computer: Sonnet 4.6 ha raggiunto la migliore accuratezza in assoluto nelle valutazioni di utilizzo del computer utilizzando la modalità adattiva.
  • Carichi di lavoro bimodali: un mix di attività facili e difficili dove il pensiero adattivo salta il ragionamento su query semplici e ragiona profondamente su quelle complesse.

Quando utilizzi il pensiero adattivo, valuta lo sforzo medium e high sui tuoi compiti. Il livello giusto dipende dal compromesso del tuo carico di lavoro tra qualità, latenza e utilizzo dei token.

Se noti comportamenti incoerenti o regressioni di qualità con il pensiero adattivo, prova ad abbassare l'impostazione effort o utilizza max_tokens come limite rigido prima. Il pensiero esteso con budget_tokens è ancora funzionale su Sonnet 4.6 ma è deprecato e non è più consigliato.

Mantenimento di budget_tokens durante la migrazione

Se hai bisogno di mantenere budget_tokens temporaneamente durante la migrazione, un budget intorno a 16k token fornisce spazio per problemi più difficili senza rischio di utilizzo incontrollato dei token. Questa configurazione è deprecata e verrà rimossa in una futura versione del modello.

Casi d'uso di codifica e agentici

Per la codifica agentiva, il design frontend, i flussi di lavoro ricchi di strumenti e i flussi di lavoro aziendali complessi, inizia con sforzo medium. Se trovi che la latenza è troppo alta, considera di ridurre lo sforzo a low. Se hai bisogno di maggiore intelligenza, considera di aumentare lo sforzo a high o migrare a Opus 4.7.

Casi d'uso di chat e non-codifica

Per chat, generazione di contenuti, ricerca, classificazione e altri compiti non di codifica, inizia con sforzo low con pensiero esteso. Se hai bisogno di più profondità, aumenta lo sforzo a medium.

Elenco di controllo della migrazione Sonnet 4.6

  • Aggiorna l'ID del modello a claude-sonnet-4-6
  • BREAKING: Rimuovi il prefilling dei messaggi dell'assistente; utilizza output strutturati o output_config.format invece
  • BREAKING: Verifica che l'analisi JSON dei parametri dello strumento gestisca le differenze di escape
  • BREAKING: Aggiorna le versioni degli strumenti alle più recenti (text_editor_20250728, code_execution_20250825); le versioni legacy non sono supportate (se migri da 3.x)
  • BREAKING: Rimuovi qualsiasi codice che utilizza il comando undo_edit (se applicabile)
  • BREAKING: Aggiorna i parametri di campionamento per utilizzare solo temperature O top_p, non entrambi (se migri da 3.x)

Migrazione a Claude Sonnet 4.5

Claude Sonnet 4.5 combina forte intelligenza con prestazioni veloci, rendendolo ideale per attività di codifica, analisi e contenuti quotidiane.

Per una panoramica completa delle capacità, consulta la panoramica dei modelli.

Il prezzo di Sonnet 4.5 è $3 per milione di token di input, $15 per milione di token di output. Consulta Prezzi di Claude per i dettagli.

Aggiorna il nome del tuo modello:

# Da Sonnet 4
model = "claude-sonnet-4-20250514"  # Prima
model = "claude-sonnet-4-5-20250929"  # Dopo

# Da Sonnet 3.7
model = "claude-3-7-sonnet-20250219"  # Prima
model = "claude-sonnet-4-5-20250929"  # Dopo

Modifiche di rilievo

Questi cambiamenti di rilievo si applicano durante la migrazione da modelli Claude 3.x Sonnet.

  1. Aggiorna i parametri di campionamento

    Questo è un cambiamento di rilievo durante la migrazione da modelli Claude 3.x.

    Utilizza solo temperature O top_p, non entrambi.

  2. Aggiorna le versioni degli strumenti

    Questo è un cambiamento di rilievo durante la migrazione da modelli Claude 3.x.

    Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.

  3. Gestisci il motivo di arresto refusal

    Aggiorna la tua applicazione per gestire i motivi di arresto refusal.

Elenco di controllo della migrazione Sonnet 4.5

  • Aggiorna l'ID del modello a claude-sonnet-4-5-20250929
  • BREAKING: Aggiorna le versioni degli strumenti alle più recenti (text_editor_20250728, code_execution_20250825); le versioni legacy non sono supportate (se migri da 3.x)
  • BREAKING: Rimuovi qualsiasi codice che utilizza il comando undo_edit (se applicabile)
  • BREAKING: Aggiorna i parametri di campionamento per utilizzare solo temperature O top_p, non entrambi (se migri da 3.x)
  • Gestisci il nuovo motivo di arresto refusal nella tua applicazione
  • Rivedi e aggiorna i prompt seguendo le best practice di prompting

Migrazione a Claude Haiku 4.5

Claude Haiku 4.5 è il modello Haiku più veloce e intelligente con prestazioni quasi di frontiera, offrendo qualità del modello premium per applicazioni interattive e elaborazione ad alto volume.

Per una panoramica completa delle capacità, consulta la panoramica dei modelli.

Il prezzo di Haiku 4.5 è $1 per milione di token di input, $5 per milione di token di output. Consulta Prezzi di Claude per i dettagli.

Aggiorna il nome del tuo modello:

# Da Haiku 3.5
model = "claude-3-5-haiku-20241022"  # Prima
model = "claude-haiku-4-5-20251001"  # Dopo

# Da Haiku 3
model = "claude-3-haiku-20240307"  # Prima
model = "claude-haiku-4-5-20251001"  # Dopo

Rivedi i nuovi limiti di velocità: Haiku 4.5 ha limiti di velocità separati da Haiku 3.5 e Haiku 3. Consulta la documentazione dei limiti di velocità per i dettagli.

Per miglioramenti significativi delle prestazioni su attività di codifica e ragionamento, considera l'abilitazione del pensiero esteso con thinking: {type: "enabled", budget_tokens: N}.

Il pensiero esteso influisce sull'efficienza della cache dei prompt.

Il pensiero esteso è deprecato nei modelli Claude 4.6 o più recenti. Se utilizzi modelli più recenti, utilizza il pensiero adattivo invece.

Esplora le nuove capacità: Consulta la panoramica dei modelli per i dettagli sulla consapevolezza del contesto, capacità di output aumentata (64k token), intelligenza più elevata e velocità migliorata.

Modifiche di rilievo

Questi cambiamenti di rilievo si applicano durante la migrazione da modelli Claude 3.x Haiku.

  1. Aggiorna i parametri di campionamento

    Questo è un cambiamento di rilievo durante la migrazione da modelli Claude 3.x.

    Utilizza solo temperature O top_p, non entrambi.

  2. Aggiorna le versioni degli strumenti

    Questo è un cambiamento di rilievo durante la migrazione da modelli Claude 3.x.

    Aggiorna alle versioni più recenti degli strumenti (text_editor_20250728, code_execution_20250825). Rimuovi qualsiasi codice che utilizza il comando undo_edit.

  3. Gestisci il motivo di arresto refusal

    Aggiorna la tua applicazione per gestire i motivi di arresto refusal.

Elenco di controllo della migrazione Haiku 4.5

  • Aggiorna l'ID del modello a claude-haiku-4-5-20251001
  • BREAKING: Aggiorna le versioni degli strumenti alle più recenti (text_editor_20250728, code_execution_20250825); le versioni legacy non sono supportate
  • BREAKING: Rimuovi qualsiasi codice che utilizza il comando undo_edit (se applicabile)
  • BREAKING: Aggiorna i parametri di campionamento per utilizzare solo temperature O top_p, non entrambi
  • Gestisci il nuovo motivo di arresto refusal nella tua applicazione
  • Rivedi e regola per i nuovi limiti di velocità (separati da Haiku 3.5)
  • Rivedi e aggiorna i prompt seguendo le

Ottieni aiuto

  • Consulta la documentazione dell'API per le specifiche dettagliate
  • Rivedi le capacità del modello per i confronti delle prestazioni
  • Rivedi le note sulla versione dell'API per gli aggiornamenti dell'API
  • Contatta il supporto se riscontri problemi durante la migrazione

Dopo (Claude Opus 4.7):

client.messages.create(
    model="claude-opus-4-7",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},  # o "max", "xhigh", "medium", "low"
    messages=[{"role": "user", "content": "..."}],
)

Adaptive thinking è controllabile attraverso il prompting. Per una guida su come regolare quando il modello pensa troppo o troppo poco, vedi Calibrating effort and thinking depth.

  • Parametri di campionamento rimossi: Impostare temperature, top_p o top_k su qualsiasi valore non predefinito su Claude Opus 4.7 restituisce un errore 400. Il percorso di migrazione più sicuro è omettere completamente questi parametri dai payload delle richieste. Il prompting è il modo consigliato per guidare il comportamento del modello su Claude Opus 4.7. Se stavi usando temperature = 0 per il determinismo, nota che non ha mai garantito output identici su modelli precedenti.

  • Contenuto del thinking omesso per impostazione predefinita: I blocchi di thinking continuano ad apparire nel flusso di risposta su Claude Opus 4.7, ma il loro campo thinking è vuoto a meno che tu non esplicitamente acconsenta. Questo è un cambiamento silenzioso da Claude Opus 4.6, dove l'impostazione predefinita era restituire il testo del thinking riassunto. Per ripristinare il contenuto del thinking riassunto su Claude Opus 4.7, imposta thinking.display su "summarized":

    thinking = {
        "type": "adaptive",
        "display": "summarized",
    }

    L'impostazione predefinita è "omitted" su Claude Opus 4.7. Se il tuo prodotto trasmette il ragionamento agli utenti, la nuova impostazione predefinita appare come una lunga pausa prima dell'inizio dell'output; imposta display: "summarized" per ripristinare il progresso visibile durante il thinking. Vedi Extended thinking per i dettagli.

  • Conteggio dei token aggiornato: Claude Opus 4.7 utilizza un nuovo tokenizer, contribuendo alle sue prestazioni migliorate su un'ampia gamma di compiti. Questo nuovo tokenizer può utilizzare approssimativamente da 1x a 1,35x più token durante l'elaborazione del testo rispetto ai modelli precedenti (fino a ~35% in più, variando in base al contenuto), e /v1/messages/count_tokens restituirà un numero diverso di token per Claude Opus 4.7 rispetto a Claude Opus 4.6. L'efficienza dei token di Claude Opus 4.7 può variare in base alla forma del carico di lavoro. Gli interventi di prompting, task_budget e effort possono aiutare a controllare i costi e garantire un utilizzo appropriato dei token. Tieni presente che questi controlli possono compromettere l'intelligenza del modello. Suggeriamo di aggiornare i tuoi parametri max_tokens per fornire spazio aggiuntivo, inclusi i trigger di compattazione. Claude Opus 4.7 fornisce una finestra di contesto di 1M ai prezzi API standard senza premio per contesto lungo.

  • Rimozione del prefill (trasportata da Opus 4.6): Il prefill dei messaggi dell'assistente restituisce un errore 400 su Claude Opus 4.7. Usa structured outputs, istruzioni di prompt di sistema o output_config.format invece.

  • Aggiornamenti di progresso integrati nelle tracce agentiche: Claude Opus 4.7 fornisce aggiornamenti più regolari e di qualità superiore all'utente durante lunghe tracce agentiche. Se hai aggiunto scaffolding per forzare messaggi di stato intermedi ("Dopo ogni 3 chiamate di strumento, riassumi il progresso"), prova a rimuoverlo. Se scopri che la lunghezza o il contenuto degli aggiornamenti rivolti all'utente di Claude Opus 4.7 non sono ben calibrati al tuo caso di utilizzo, descrivi esplicitamente come dovrebbero apparire questi aggiornamenti nel prompt e fornisci esempi.

  • Meno subagenzi generati per impostazione predefinita: Claude Opus 4.7 tende a generare meno subagenzi per impostazione predefinita. Tuttavia, questo comportamento è controllabile attraverso il prompting; fornisci a Claude Opus 4.7 una guida esplicita su quando i subagenzi sono desiderabili.

  • Calibrazione dello sforzo più rigorosa: Cambiando significativamente da Claude Opus 4.6, Claude Opus 4.7 rispetta i livelli di sforzo rigorosamente, specialmente all'estremità inferiore. A low e medium, il modello limita il suo lavoro a quello che è stato chiesto piuttosto che andare oltre. Questo è buono per la latenza e il costo, ma su compiti moderatamente complessi in esecuzione a sforzo low c'è un certo rischio di pensiero insufficiente. Se osservi ragionamento superficiale su problemi complessi, aumenta lo sforzo a high o xhigh piuttosto che aggirarlo con il prompting. Se devi mantenere lo sforzo a low per la latenza, aggiungi una guida mirata: "Questo compito comporta un ragionamento multi-step. Pensa attentamente al problema prima di rispondere." Vedi Recommended effort levels for Claude Opus 4.7.

  • Meno chiamate di strumento per impostazione predefinita: Claude Opus 4.7 ha una tendenza a usare gli strumenti meno spesso rispetto a Claude Opus 4.6 e a usare il ragionamento di più. Questo produce risultati migliori nella maggior parte dei casi. Tuttavia, aumentare l'impostazione dello sforzo è una leva utile per aumentare il livello di utilizzo dello strumento, specialmente nel lavoro di conoscenza. Le impostazioni di sforzo high o xhigh mostrano sostanzialmente più utilizzo di strumenti nella ricerca agentici e nella codifica. Per scenari in cui desideri più utilizzo di strumenti, puoi anche regolare il tuo prompt per istruire esplicitamente il modello su quando e come utilizzare correttamente i suoi strumenti.

  • Salvaguardie di sicurezza informatica in tempo reale: Aggiunte di recente in Claude Opus 4.7, le richieste che coinvolgono argomenti proibiti o ad alto rischio possono portare a rifiuti. Per il lavoro di sicurezza legittimo come test di penetrazione, ricerca di vulnerabilità o red-teaming, candidati al Cyber Verification Program per richiedere restrizioni ridotte. Vedi Safeguards, warnings, and appeals per il background.

  • Supporto per immagini ad alta risoluzione: Claude Opus 4.7 è il primo modello Claude con supporto per immagini ad alta risoluzione, con una risoluzione massima dell'immagine di 2576 pixel sul bordo lungo (da 1568 pixel su modelli precedenti). Questo sblocca guadagni su carichi di lavoro pesanti di visione ed è particolarmente prezioso per computer use, comprensione degli screenshot e analisi dei documenti. Il supporto ad alta risoluzione è automatico e non richiede alcun header beta o opt-in lato client. Le immagini a risoluzione completa possono utilizzare fino a circa 3x più token di immagine rispetto ai modelli precedenti (fino a 4.784 token per immagine, rispetto al limite precedente di circa 1.600 token per immagine), quindi ri-budget max_tokens e aspettative di costo per carichi di lavoro pesanti di immagini, o ricampiona prima di inviare se non hai bisogno della fedeltà aggiuntiva. Le coordinate di puntamento e riquadro restituite dal modello sono 1

    con i pixel effettivi dell'immagine su Claude Opus 4.7, quindi non è richiesta alcuna conversione del fattore di scala. Vedi High-resolution image support on Claude Opus 4.7 per i dettagli.

  • output_config = {
        "effort": "high",
        "task_budget": {"type": "tokens", "total": 128000},
    }

    Potrebbe essere necessario sperimentare con diversi budget di compiti per il tuo caso di utilizzo. Se al modello viene assegnato un budget di compiti troppo restrittivo per un determinato compito, potrebbe completare il compito meno completamente, facendo riferimento al suo budget come vincolo. Per compiti agentici aperti in cui la qualità è più importante della velocità, non impostare un budget di compiti; riservare i budget di compiti per carichi di lavoro in cui hai bisogno che il modello limiti il suo lavoro a un'indennità di token. Il valore minimo per un budget di compiti è 20k token.

    Questo non è un limite rigido; è un suggerimento di cui il modello è consapevole. Questo è distinto da max_tokens, che è un limite rigido per richiesta sui token generati (max_tokens non viene passato al modello, e il modello non ne è consapevole), mentre task_budget è un limite consigliato su tutto il ciclo agentici. Usa task_budget quando desideri che il modello si auto-moderato, e max_tokens come limite rigido per richiesta per limitare l'utilizzo.

  • Imposta un grande max_tokens a sforzo max o xhigh: Se stai eseguendo Claude Opus 4.7 a sforzo max o xhigh, imposta un grande budget di token di output massimi in modo che il modello abbia spazio per pensare e agire nei suoi subagenzi e nelle chiamate di strumento. Consigliamo di iniziare con 64k token e regolare da lì.

  • Ricampiona le immagini se l'alta risoluzione non è necessaria: Claude Opus 4.7 supporta immagini fino a 2576px / 3,75MP. Le immagini ad alta risoluzione utilizzano più token. Se la fedeltà aggiuntiva dell'immagine non è necessaria, ricampiona le immagini prima di inviarle a Claude per evitare aumenti nell'utilizzo dei token. Vedi Images and vision.

  • max_tokens
  • Ri-testa eventuali stime di conteggio dei token lato client.
  • Se la tua applicazione invia immagini, ri-budget per il supporto di immagini ad alta risoluzione (fino a circa 3x più token di immagine per immagine a risoluzione completa). Ricampiona prima di inviare se non hai bisogno della fedeltà aggiuntiva. Se consumi coordinate di puntamento o riquadro dal modello, rimuovi eventuali conversioni del fattore di scala; le coordinate sono 1
    con i pixel effettivi dell'immagine su Claude Opus 4.7.
  • Rivedi i prompt per i cambiamenti comportamentali sopra (lunghezza della risposta, letteralismo, tono, aggiornamenti di progresso, subagenzi, calibrazione dello sforzo, attivazione dello strumento, salvaguardie informatiche, gestione di immagini ad alta risoluzione).
  • Ri-baseline la lunghezza della risposta con i prompt di controllo della lunghezza esistenti rimossi, quindi regola esplicitamente.
  • Se usi sforzo xhigh o max, aumenta max_tokens ad almeno 64k come punto di partenza.
  • Considera l'adozione di budget di compiti (beta) per flussi di lavoro agentici.
  • Se il tuo prodotto fa lavoro di sicurezza legittimo, candidati al Cyber Verification Program per accedere a restrizioni inferiori su contenuti informatici.
  • response = client.beta.messages.create(
        model="claude-opus-4-5",
        max_tokens=16000,
        thinking={"type": "enabled", "budget_tokens": 32000},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[...],
    )

    Nota che la migrazione si sposta anche da client.beta.messages.create a client.messages.create. Adaptive thinking e effort sono funzionalità GA e non richiedono lo spazio dei nomi SDK beta o alcun header beta.

  • Rimuovi l'header beta dello sforzo: Il parametro effort è ora GA. Rimuovi betas=["effort-2025-11-24"] dalle tue richieste.

  • Rimuovi l'header beta dello streaming dello strumento a grana fine: Lo streaming dello strumento a grana fine è ora GA. Rimuovi betas=["fine-grained-tool-streaming-2025-05-14"] dalle tue richieste.

  • Rimuovi l'header beta del thinking interleaved: Adaptive thinking abilita automaticamente il thinking interleaved su Claude Opus 4.7, Opus 4.6 e Sonnet 4.6. Rimuovi betas=["interleaved-thinking-2025-05-14"] dalle tue richieste. L'header è ancora funzionale su Sonnet 4.6 con extended thinking manuale, ma la modalità manuale è deprecata.

  • Migra a output_config.format: Se usi structured outputs, aggiorna output_format={...} a output_config={"format": {...}}. Il vecchio parametro rimane funzionale ma è deprecato e verrà rimosso in una futura versione del modello.

  • Aggiorna le versioni degli strumenti

    Questo è un cambiamento che interrompe quando si esegue la migrazione da modelli Claude 3.x.

    Aggiorna alle versioni più recenti degli strumenti. Rimuovi qualsiasi codice che utilizza il comando undo_edit.

    # Prima
    tools = [{"type": "text_editor_20250124", "name": "str_replace_editor"}]
    
    # Dopo
    tools = [{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"}]
    • Editor di testo: Usa text_editor_20250728 e str_replace_based_edit_tool. Vedi Text editor tool documentation per i dettagli.
    • Esecuzione del codice: Aggiorna a code_execution_20250825. Vedi Code execution tool documentation per le istruzioni di migrazione.
  • Gestisci il motivo di arresto refusal

    Aggiorna la tua applicazione per gestire i motivi di arresto refusal:

    Python
    response = client.messages.create(...)
    
    if response.stop_reason == "refusal":
        # Gestisci il rifiuto in modo appropriato
        pass
  • Gestisci il motivo di arresto model_context_window_exceeded

    I modelli Claude 4.5+ restituiscono un motivo di arresto model_context_window_exceeded quando la generazione si ferma a causa del raggiungimento del limite della finestra di contesto, piuttosto che il limite max_tokens richiesto. Aggiorna la tua applicazione per gestire questo nuovo motivo di arresto:

    Python
    response = client.messages.create(...)
    
    if response.stop_reason == "model_context_window_exceeded":
        # Gestisci il limite della finestra di contesto in modo appropriato
        pass
  • Verifica la gestione del parametro dello strumento (newline finali)

    I modelli Claude 4.5+ preservano le newline finali nei parametri di stringa della chiamata dello strumento che erano precedentemente eliminate. Se i tuoi strumenti si basano su corrispondenze di stringhe esatte rispetto ai parametri della chiamata dello strumento, verifica che la tua logica gestisca correttamente le newline finali.

  • Aggiorna i tuoi prompt per i cambiamenti comportamentali

    I modelli Claude 4+ hanno uno stile di comunicazione più conciso e diretto e richiedono una direzione esplicita. Rivedi le best practices di prompting per una guida all'ottimizzazione.

  • fine-grained-tool-streaming-2025-05-14
  • Rimuovi l'header beta interleaved-thinking-2025-05-14 (adaptive thinking abilita il thinking interleaved automaticamente)
  • Migra output_format a output_config.format (se applicabile)
  • Se stai migrando da Claude 4.1 o precedente: rimuovi temperature, top_p e top_k (i valori non predefiniti restituiscono 400 su Opus 4.7)
  • Se stai migrando da Claude 4.1 o precedente: aggiorna le versioni degli strumenti (text_editor_20250728, code_execution_20250825)
  • Se stai migrando da Claude 4.1 o precedente: gestisci il motivo di arresto refusal
  • Se stai migrando da Claude 4.1 o precedente: gestisci il motivo di arresto model_context_window_exceeded
  • Se stai migrando da Claude 4.1 o precedente: verifica la gestione del parametro di stringa dello strumento per le newline finali
  • Se stai migrando da Claude 4.1 o precedente: rimuovi gli header beta legacy (token-efficient-tools-2025-02-19, output-128k-2025-02-19)
  • Rivedi e aggiorna i prompt seguendo le best practices di prompting
  • Testa nell'ambiente di sviluppo prima della distribuzione in produzione
  • Continuazioni (riprendere risposte interrotte): Sposta la continuazione nel messaggio dell'utente: "La tua risposta precedente è stata interrotta e si è conclusa con [previous_response]. Continua da dove ti eri fermato."

  • Idratazione del contesto / coerenza del ruolo (aggiornamento del contesto in conversazioni lunghe): Inietta i promemoria dell'assistente prefilled precedenti nel turno dell'utente invece.

  • L'escape JSON dei parametri dello strumento potrebbe differire

    Questo è un cambiamento di rilievo durante la migrazione da Sonnet 4.5 o versioni precedenti.

    L'escape delle stringhe JSON nei parametri dello strumento potrebbe differire dai modelli precedenti. I parser JSON standard gestiscono questo automaticamente, ma l'analisi personalizzata basata su stringhe potrebbe richiedere aggiornamenti.

  • Aggiorna i tuoi prompt per i cambiamenti comportamentali

    I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le best practice di prompting per indicazioni di ottimizzazione.

    response = client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        output_config={"effort": "low"},
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    response = client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=64000,
        thinking={"type": "adaptive"},
        output_config={"effort": "medium"},
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    response = client.beta.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=16384,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "medium"},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
    response = client.beta.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "low"},
        betas=["interleaved-thinking-2025-05-14"],
        messages=[{"role": "user", "content": "Your prompt here"}],
    )
  • Gestisci il nuovo motivo di arresto refusal nella tua applicazione
  • Rimuovi l'header beta fine-grained-tool-streaming-2025-05-14 (ora GA)
  • Migra output_format a output_config.format
  • Rivedi e aggiorna i prompt seguendo le best practice di prompting
  • Consigliato: Migra da thinking: {type: "enabled", budget_tokens: N} a thinking: {type: "adaptive"} con il parametro di sforzo (budget_tokens è deprecato e verrà rimosso in una futura versione)
  • Testa nell'ambiente di sviluppo prima della distribuzione in produzione
  • Aggiorna i tuoi prompt per i cambiamenti comportamentali

    I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le best practice di prompting per indicazioni di ottimizzazione.

  • Considera l'abilitazione del pensiero esteso per attività di ragionamento complesso
  • Testa nell'ambiente di sviluppo prima della distribuzione in produzione
  • Aggiorna i tuoi prompt per i cambiamenti comportamentali

    I modelli Claude 4 hanno uno stile di comunicazione più conciso e diretto. Rivedi le best practice di prompting per indicazioni di ottimizzazione.

    best practice di prompting
  • Considera l'abilitazione del pensiero esteso per attività di ragionamento complesso
  • Testa nell'ambiente di sviluppo prima della distribuzione in produzione