Modelli e prezziModelli

Novità di Claude Opus 5

Panoramica delle nuove funzionalità e dei cambiamenti di comportamento in Claude Opus 5.

Claude Opus 5 rappresenta un miglioramento radicale rispetto a Claude Opus 4.8, con i guadagni maggiori nel ragionamento profondo, nei compiti agentici e a lungo orizzonte, e nello scaling del calcolo al momento dell'inferenza (test-time compute scaling). Questa pagina riassume tutte le novità di Claude Opus 5, incluso il thinking attivo per impostazione predefinita, le modifiche agli strumenti a metà conversazione e una modifica incompatibile (breaking change) relativa a quando il thinking può essere disabilitato.

Nuovo modello

Modello	ID modello API	Descrizione
Claude Opus 5	`claude-opus-5`	Per coding agentico complesso e lavoro enterprise

Claude Opus 5 ha una finestra di contesto da 1M di token (1M di token è sia il valore predefinito che il massimo; non esiste una variante di contesto più piccola), 128k token massimi di output e thinking attivo per impostazione predefinita.

Per prezzi e specifiche complete, consulta la panoramica dei modelli.

Nuove funzionalità

Modifiche agli strumenti a metà conversazione (beta)

Puoi aggiungere o rimuovere strumenti tra i turni di una conversazione preservando la cache dei prompt, invece di reinviare un elenco fisso di strumenti per tutta la durata di una sessione. Le modifiche agli strumenti a metà conversazione sono in beta: includi l'header beta mid-conversation-tool-changes-2026-07-01 nelle tue richieste. Consulta Modifiche agli strumenti a metà conversazione per l'utilizzo.

Modalità fallback predefinita

Il parametro fallbacks supporta una nuova modalità "default", che applica i modelli di fallback raccomandati da Anthropic per categoria di rifiuto invece di un elenco di modelli che mantieni tu stesso. L'intero parametro fallbacks è in beta. Usa l'header beta server-side-fallback-2026-07-01, che supporta sia la modalità "default" sia gli elenchi espliciti di modelli (l'header precedente server-side-fallback-2026-06-01 accetta solo elenchi espliciti). Consulta Rifiuti e fallback.

Minimo più basso per la cache dei prompt

La lunghezza minima del prompt memorizzabile nella cache su Claude Opus 5 è di 512 token, rispetto ai 1.024 token di Claude Opus 4.8. I prompt che erano troppo corti per essere memorizzati nella cache su Claude Opus 4.8 possono ora creare voci di cache senza modifiche al codice. Consulta Cache dei prompt per i minimi per modello.

Fast mode

Fast mode (anteprima di ricerca) è disponibile per Claude Opus 5 solo sulla Claude API; non è attualmente disponibile su Amazon Bedrock, Google Cloud o Microsoft Foundry. Fast mode per Claude Opus 5 ha un prezzo di $10 per milione di token di input e $50 per milione di token di output. Consulta Fast mode per accesso, modelli supportati e prezzi.

Cambiamenti di comportamento

Thinking attivo per impostazione predefinita

Su Claude Opus 4.8, le richieste vengono eseguite senza thinking a meno che tu non imposti thinking: {"type": "adaptive"}. Su Claude Opus 5, le stesse richieste vengono eseguite con il thinking attivo: il modello decide quando e quanto pensare a ogni turno, e il parametro effort è il controllo per la profondità del thinking. Il valore sul wire è invariato; thinking: {"type": "adaptive"} rimane valido ed equivalente al valore predefinito.

Poiché max_tokens è un limite rigido sull'output totale (thinking più testo di risposta), rivedilo per i carichi di lavoro che venivano eseguiti senza thinking su Claude Opus 4.8.

L'API mantiene l'opzione di disabilitare il thinking, soggetta alla restrizione sull'effort descritta di seguito.

L'effort conta di più

Claude Opus 5 converte effort aggiuntivo in risultati migliori in modo più affidabile rispetto a qualsiasi modello Opus precedente, quindi il livello di effort che scegli ha più peso. È disponibile l'intera scala: low, medium, high, xhigh e max, con max come livello massimo per il ragionamento più profondo possibile. Inizia dal valore predefinito, high, e regola in entrambe le direzioni in base alle tue valutazioni: scendi dove la qualità si mantiene per risparmiare token e latenza, oppure sali per il lavoro più impegnativo. Quando esegui con effort xhigh o max, imposta un max_tokens elevato in modo che il modello abbia spazio per pensare e agire attraverso subagenti e chiamate agli strumenti.

Questa richiesta porta l'effort al massimo, fino a max:

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

Il thinking è attivo per impostazione predefinita su Claude Opus 5, quindi non è necessario alcun campo thinking.

Disabilitare il thinking richiede effort `high` o inferiore

Su Claude Opus 5, thinking: {"type": "disabled"} è accettato solo quando il livello di effort è high o inferiore. Impostare thinking: {"type": "disabled"} con effort xhigh o max restituisce un errore 400. Questo è un comportamento disponibile in generale a partire da Claude Opus 5, applicato a ogni richiesta, ed è una modifica incompatibile rispetto a Claude Opus 4.8, dove la disabilitazione del thinking era indipendente dal livello di effort. Se oggi disabiliti il thinking a livelli di effort elevati, mantieni il thinking disabilitato e imposta l'effort su high o inferiore, oppure mantieni il livello di effort e rimuovi il campo thinking.

Con il thinking disabilitato, Claude Opus 5 può occasionalmente scrivere una chiamata a uno strumento nel suo output di testo invece di emettere un blocco tool_use, oppure includere tag XML interni nella sua risposta visibile. Dove possibile, mantieni il thinking abilitato e controlla il costo dei token con livelli di effort più bassi; per le integrazioni che devono mantenere il thinking disabilitato, consulta Esecuzione con thinking disabilitato per le mitigazioni tramite prompting.

Differenze di comportamento del modello

Oltre alle modifiche all'API descritte sopra, Claude Opus 5 si comporta in modo diverso da Claude Opus 4.8 in modi che potresti notare senza modificare alcun codice. Le risposte predefinite rivolte all'utente e i deliverable scritti sono più lunghi. Nelle sessioni agentiche, il modello racconta i suoi progressi all'utente più spesso. Nei framework multi-agente, delega ai subagenti più prontamente. Inoltre verifica il proprio lavoro senza che gli venga chiesto, quindi rimuovi le istruzioni di verifica ereditate dai modelli precedenti ("includi un passaggio finale di verifica", "usa un subagente per verificare"); causano una verifica eccessiva su Claude Opus 5. Per i pattern di prompting che regolano ciascuno di questi comportamenti, consulta Prompting per Claude Opus 5.

Miglioramenti delle capacità

Rispetto a Claude Opus 4.8, Claude Opus 5 è un miglioramento radicale piuttosto che incrementale, e offre intelligenza di frontiera a metà del costo di Claude Fable 5. I guadagni maggiori sono in:

Ragionamento profondo, sostenendo analisi multi-step attraverso lunghe catene di problemi.
Coding agentico e compiti a lungo orizzonte, rimanendo concentrato sul compito attraverso cicli estesi di uso degli strumenti e completando funzionalità multi-file, refactoring più ampi e lavoro end-to-end sulle funzionalità senza lasciare stub o segnaposto.
Scaling del calcolo al momento dell'inferenza, convertendo effort aggiuntivo (fino al livello max) in risultati migliori.
Efficienza a livelli di effort più bassi, con effort low e medium che producono una qualità elevata a una frazione dei token e della latenza delle impostazioni più alte.
Revisione del codice e individuazione di bug, facendo emergere bug reali a un tasso elevato per passaggio con pochi falsi positivi, e rimanendo accurato a livelli di effort più bassi.
Visione, comprendendo grafici, documenti e diagrammi e replicando elementi visivi di UI e frontend, con i risultati migliori quando gli vengono forniti strumenti per analizzare, ritagliare e verificare iterativamente il proprio lavoro.
Lavoro su contesti lunghi, con una finestra di contesto da 1M di token sia come valore predefinito che come massimo, e un'aderenza alle istruzioni, chiamate agli strumenti e ragionamento coerenti lungo tutta la finestra.
Attività d'ufficio e sui documenti, generando e modificando fogli di calcolo complessi multi-foglio con formule non banali, e producendo presentazioni ben strutturate.
Coordinamento multi-agente, gestendo team di subagenti con pattern writer-verifier efficaci e pochi casi di agenti che sovrascrivono il lavoro degli altri.

Per i pattern di prompting che sfruttano al meglio queste capacità, consulta Prompting per Claude Opus 5.

Prezzi

Claude Opus 5 ha un prezzo di $5 per milione di token di input e $25 per milione di token di output, invariato rispetto a Claude Opus 4.8.

Consulta Prezzi per i prezzi completi, inclusi elaborazione batch, cache dei prompt e tariffe fast mode.

Disponibilità

Claude Opus 5 è disponibile su:

Claude API: disponibile per tutti i clienti, come claude-opus-5.
AWS: disponibile tramite Claude in Amazon Bedrock, come anthropic.claude-opus-5. Claude Opus 5 è raggiungibile anche tramite l'API InvokeModel su bedrock-runtime, servita dalla stessa infrastruttura; l'integrazione Claude su Amazon Bedrock (legacy) non lo include nella sua tabella di ID modello con versione ARN.
Google Cloud: disponibile tramite Claude su Google Cloud, come claude-opus-5.
Microsoft Foundry: disponibile tramite Claude in Microsoft Foundry.

Claude Opus 4.8 rimane disponibile su tutte queste piattaforme.

Guida alla migrazione

Per migrare da Claude Opus 4.8, aggiorna il tuo ID modello:

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

Poi rivedi i due cambiamenti di comportamento: il thinking è attivo per impostazione predefinita, e disabilitare il thinking con effort xhigh o max restituisce un errore 400. Consulta la guida alla migrazione per istruzioni passo passo.

Prossimi passi

Panoramica dei modelli

Specifiche complete e prezzi per tutti i modelli Claude attuali.

Prompting per Claude Opus 5

Differenze comportamentali e pattern di prompting specifici per Claude Opus 5.

Effort

Controlla quanti token Claude usa quando risponde, da low a max.

Thinking

Come funziona il thinking quando è attivo per impostazione predefinita e quando può essere disabilitato.

Budget per i task

Fornisci a Claude un budget di token indicativo su cui calibrare il suo lavoro.

Guida alla migrazione

Guida per migrare ai modelli Claude più recenti dalle versioni precedenti di Claude.

Fast mode

Ottieni più token di output al secondo dai modelli Claude Opus a un prezzo premium.

Was this page helpful?

Modelli e prezziModelli

Novità di Claude Opus 5

Panoramica delle nuove funzionalità e dei cambiamenti di comportamento in Claude Opus 5.

Nuovo modello

Modello	ID modello API	Descrizione
Claude Opus 5	`claude-opus-5`	Per coding agentico complesso e lavoro enterprise

Per prezzi e specifiche complete, consulta la panoramica dei modelli.

Nuove funzionalità

Modifiche agli strumenti a metà conversazione (beta)

Modalità fallback predefinita

Minimo più basso per la cache dei prompt

Fast mode

Cambiamenti di comportamento

Thinking attivo per impostazione predefinita

Poiché max_tokens è un limite rigido sull'output totale (thinking più testo di risposta), rivedilo per i carichi di lavoro che venivano eseguiti senza thinking su Claude Opus 4.8.

L'API mantiene l'opzione di disabilitare il thinking, soggetta alla restrizione sull'effort descritta di seguito.

L'effort conta di più

Questa richiesta porta l'effort al massimo, fino a max:

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

Il thinking è attivo per impostazione predefinita su Claude Opus 5, quindi non è necessario alcun campo thinking.

Disabilitare il thinking richiede effort `high` o inferiore

Differenze di comportamento del modello

Miglioramenti delle capacità

Rispetto a Claude Opus 4.8, Claude Opus 5 è un miglioramento radicale piuttosto che incrementale, e offre intelligenza di frontiera a metà del costo di Claude Fable 5. I guadagni maggiori sono in:

Ragionamento profondo, sostenendo analisi multi-step attraverso lunghe catene di problemi.
Coding agentico e compiti a lungo orizzonte, rimanendo concentrato sul compito attraverso cicli estesi di uso degli strumenti e completando funzionalità multi-file, refactoring più ampi e lavoro end-to-end sulle funzionalità senza lasciare stub o segnaposto.
Scaling del calcolo al momento dell'inferenza, convertendo effort aggiuntivo (fino al livello max) in risultati migliori.
Efficienza a livelli di effort più bassi, con effort low e medium che producono una qualità elevata a una frazione dei token e della latenza delle impostazioni più alte.
Revisione del codice e individuazione di bug, facendo emergere bug reali a un tasso elevato per passaggio con pochi falsi positivi, e rimanendo accurato a livelli di effort più bassi.
Visione, comprendendo grafici, documenti e diagrammi e replicando elementi visivi di UI e frontend, con i risultati migliori quando gli vengono forniti strumenti per analizzare, ritagliare e verificare iterativamente il proprio lavoro.
Lavoro su contesti lunghi, con una finestra di contesto da 1M di token sia come valore predefinito che come massimo, e un'aderenza alle istruzioni, chiamate agli strumenti e ragionamento coerenti lungo tutta la finestra.
Attività d'ufficio e sui documenti, generando e modificando fogli di calcolo complessi multi-foglio con formule non banali, e producendo presentazioni ben strutturate.
Coordinamento multi-agente, gestendo team di subagenti con pattern writer-verifier efficaci e pochi casi di agenti che sovrascrivono il lavoro degli altri.

Per i pattern di prompting che sfruttano al meglio queste capacità, consulta Prompting per Claude Opus 5.

Prezzi

Claude Opus 5 ha un prezzo di $5 per milione di token di input e $25 per milione di token di output, invariato rispetto a Claude Opus 4.8.

Consulta Prezzi per i prezzi completi, inclusi elaborazione batch, cache dei prompt e tariffe fast mode.

Disponibilità

Claude Opus 5 è disponibile su:

Claude API: disponibile per tutti i clienti, come claude-opus-5.
AWS: disponibile tramite Claude in Amazon Bedrock, come anthropic.claude-opus-5. Claude Opus 5 è raggiungibile anche tramite l'API InvokeModel su bedrock-runtime, servita dalla stessa infrastruttura; l'integrazione Claude su Amazon Bedrock (legacy) non lo include nella sua tabella di ID modello con versione ARN.
Google Cloud: disponibile tramite Claude su Google Cloud, come claude-opus-5.
Microsoft Foundry: disponibile tramite Claude in Microsoft Foundry.

Claude Opus 4.8 rimane disponibile su tutte queste piattaforme.

Guida alla migrazione

Per migrare da Claude Opus 4.8, aggiorna il tuo ID modello:

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

Prossimi passi

Panoramica dei modelli

Specifiche complete e prezzi per tutti i modelli Claude attuali.

Prompting per Claude Opus 5

Differenze comportamentali e pattern di prompting specifici per Claude Opus 5.

Effort

Controlla quanti token Claude usa quando risponde, da low a max.

Thinking

Come funziona il thinking quando è attivo per impostazione predefinita e quando può essere disabilitato.

Budget per i task

Fornisci a Claude un budget di token indicativo su cui calibrare il suo lavoro.

Guida alla migrazione

Guida per migrare ai modelli Claude più recenti dalle versioni precedenti di Claude.

Fast mode

Ottieni più token di output al secondo dai modelli Claude Opus a un prezzo premium.

Was this page helpful?

Nuovo modello

Nuove funzionalità

Modifiche agli strumenti a metà conversazione (beta)

Modalità fallback predefinita

Minimo più basso per la cache dei prompt

Fast mode

Cambiamenti di comportamento

Thinking attivo per impostazione predefinita

L'effort conta di più

Disabilitare il thinking richiede effort high o inferiore

Differenze di comportamento del modello

Miglioramenti delle capacità

Prezzi

Disponibilità

Guida alla migrazione

Prossimi passi

Nuovo modello

Nuove funzionalità

Modifiche agli strumenti a metà conversazione (beta)

Modalità fallback predefinita

Minimo più basso per la cache dei prompt

Fast mode

Cambiamenti di comportamento

Thinking attivo per impostazione predefinita

L'effort conta di più

Disabilitare il thinking richiede effort high o inferiore

Differenze di comportamento del modello

Miglioramenti delle capacità

Prezzi

Disponibilità

Guida alla migrazione

Prossimi passi

Nuovo modello

Nuove funzionalità

Modifiche agli strumenti a metà conversazione (beta)

Modalità fallback predefinita

Minimo più basso per la cache dei prompt

Fast mode

Cambiamenti di comportamento

Thinking attivo per impostazione predefinita

L'effort conta di più

Disabilitare il thinking richiede effort `high` o inferiore

Differenze di comportamento del modello

Miglioramenti delle capacità

Prezzi

Disponibilità

Guida alla migrazione

Prossimi passi

Nuovo modello

Nuove funzionalità

Modifiche agli strumenti a metà conversazione (beta)

Modalità fallback predefinita

Minimo più basso per la cache dei prompt

Fast mode

Cambiamenti di comportamento

Thinking attivo per impostazione predefinita

L'effort conta di più

Disabilitare il thinking richiede effort `high` o inferiore

Differenze di comportamento del modello

Miglioramenti delle capacità

Prezzi

Disponibilità

Guida alla migrazione

Prossimi passi