Claude Opus 4.8 è il modello di livello Opus più capace di Anthropic. Si basa su Claude Opus 4.7. Questa pagina riassume tutte le novità al momento del lancio, inclusa la "fast mode" (modalità veloce, anteprima di ricerca sull'API di Claude) e una lunghezza minima del prompt memorizzabile in cache ridotta a 1.024 token.
| Modello | ID modello API | Descrizione |
|---|---|---|
| Claude Opus 4.8 | claude-opus-4-8 | Il modello di livello Opus più capace di Anthropic per ragionamento complesso, codifica agentica a lungo orizzonte e lavoro ad alta autonomia |
Claude Opus 4.8 supporta la finestra di contesto da 1M di token per impostazione predefinita sull'API di Claude, Amazon Bedrock e Vertex AI (200k su Microsoft Foundry), 128k token di output massimi, adaptive thinking (pensiero adattivo) e lo stesso set di strumenti e funzionalità di piattaforma di Claude Opus 4.7.
Per prezzi e specifiche complete, consulta la panoramica dei modelli.
Claude Opus 4.8 accetta messaggi con role: "system" immediatamente dopo un turno utente nell'array messages (soggetto a regole di posizionamento). Questo ti consente di aggiungere istruzioni aggiornate più avanti in una conversazione di lunga durata senza ripetere l'intero prompt di sistema, preservando così i riscontri nella cache dei prompt sui turni precedenti e riducendo il costo di input nei cicli agentici. Non è richiesto alcun header beta. Consulta Messaggi di sistema a metà conversazione per i dettagli sull'utilizzo.
L'oggetto stop_details nelle risposte di rifiuto (disponibile da Claude Opus 4.7) è ora documentato pubblicamente. Quando Claude rifiuta di completare una richiesta, questo oggetto descrive la categoria del rifiuto, in aggiunta al motivo di stop refusal esistente, rendendo più facile per la tua applicazione distinguere tra diverse classi di richieste rifiutate e indirizzare l'utente al passaggio successivo corretto. Non è richiesto alcun header beta. Consulta Gestione dei motivi di stop per l'elenco delle categorie e le indicazioni sulla gestione.
Il valore predefinito del parametro effort su Claude Opus 4.8 è high su tutte le superfici, incluse l'API di Claude e Claude Code. Se oggi imposti effort esplicitamente, la tua impostazione rimane invariata. Consulta Effort per indicazioni su ciascun livello.
La fast mode (modalità veloce) è ora disponibile per Claude Opus 4.8 come anteprima di ricerca sull'API di Claude. Imposta speed: "fast" per ottenere fino a 2,5 volte più token di output al secondo dallo stesso modello a un prezzo premium. Consulta Fast mode per accesso, modelli supportati e prezzi.
La lunghezza minima del prompt memorizzabile in cache su Claude Opus 4.8 è di 1.024 token, inferiore rispetto a Claude Opus 4.7. I prompt che erano troppo brevi per essere memorizzati in cache su Claude Opus 4.7 possono ora creare voci di cache senza modifiche al codice. Consulta Cache dei prompt per i minimi per modello.
Questi vincoli sono invariati rispetto a Claude Opus 4.7, quindi il codice che già funziona su Claude Opus 4.7 non necessita di modifiche. Si applicano solo alla Messages API; i Claude Managed Agents non sono interessati.
Impostare temperature, top_p o top_k su un valore non predefinito restituisce un errore 400 su Claude Opus 4.8, come su Claude Opus 4.7. Ometti questi parametri e usa il prompting per guidare il comportamento del modello.
Come Claude Opus 4.7, Claude Opus 4.8 non supporta i budget di pensiero esteso. Impostare thinking: {"type": "enabled", "budget_tokens": N} restituisce un errore 400. Usa adaptive thinking e il parametro effort per controllare la profondità del pensiero.
# Prima (Opus 4.6 o precedenti)
thinking = {"type": "enabled", "budget_tokens": 32000}
# Dopo (Opus 4.7 e successivi)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}Rispetto a Claude Opus 4.7, Claude Opus 4.8 punta a miglioramenti comportamentali in:
Con adaptive thinking abilitato, Claude Opus 4.8 attiva il ragionamento solo quando ritiene che il turno lo richieda. Per ricerche semplici e brevi passaggi agentici risponde direttamente; per problemi complessi multi-step ragiona prima di rispondere. Questo riduce i token di pensiero sprecati su carichi di lavoro bimodali rispetto a Claude Opus 4.7 allo stesso livello di effort. Come su Claude Opus 4.7, il pensiero è disattivato a meno che tu non imposti esplicitamente thinking: {type: "adaptive"} nella tua richiesta.
Questi non sono cambiamenti che interrompono la compatibilità dell'API, ma potrebbero richiedere aggiornamenti ai prompt. Consulta Migrazione a Claude Opus 4.8 per indicazioni complete.
Per istruzioni di migrazione passo passo e la checklist completa di migrazione, consulta Migrazione a Claude Opus 4.8. Se usi Claude Code o l'Agent SDK, la skill Claude API può applicare automaticamente questi passaggi di migrazione alla tua codebase.
Istruzioni di aggiornamento passo passo da Claude Opus 4.7.
Indicazioni sull'effort per livello, inclusi i nuovi valori predefiniti.
L'unica modalità di pensiero attivo supportata su Claude Opus 4.8.
Come i messaggi di sistema a metà conversazione preservano i riscontri in cache.
Dettagli di stop per rifiuto e come gestirli.
Velocità di output più elevata a un prezzo premium.
Was this page helpful?