• Messaggi
  • Agenti gestiti
  • Amministrazione

Search...
⌘K
Modelli
Panoramica dei modelliID dei modelli e versioningScegliere un modelloPresentazione di Claude Fable 5 e Claude Mythos 5Novità di Claude Opus 4.8Aggiornamento tra versioni del modelloDeprecazioni dei modelliSchede dei modelliPrompt di sistemaPrezzi

Log in
Novità di Claude Opus 4.8
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Modelli e prezzi/Modelli

Novità in Claude Opus 4.8

Panoramica delle nuove funzionalità e dei cambiamenti di comportamento in Claude Opus 4.8.

Claude Opus 4.8 è il modello di livello Opus più capace di Anthropic. Si basa su Claude Opus 4.7. Questa pagina riassume tutte le novità al momento del lancio, inclusa la "fast mode" (modalità veloce, anteprima di ricerca sull'API di Claude) e una lunghezza minima del prompt memorizzabile in cache ridotta a 1.024 token.

Nuovo modello

ModelloID modello APIDescrizione
Claude Opus 4.8claude-opus-4-8Il modello di livello Opus più capace di Anthropic per ragionamento complesso, codifica agentica a lungo orizzonte e lavoro ad alta autonomia

Claude Opus 4.8 supporta la finestra di contesto da 1M di token per impostazione predefinita sull'API di Claude, Amazon Bedrock e Vertex AI (200k su Microsoft Foundry), 128k token di output massimi, adaptive thinking (pensiero adattivo) e lo stesso set di strumenti e funzionalità di piattaforma di Claude Opus 4.7.

Per prezzi e specifiche complete, consulta la panoramica dei modelli.

Nuove funzionalità

Messaggi di sistema a metà conversazione

Claude Opus 4.8 accetta messaggi con role: "system" immediatamente dopo un turno utente nell'array messages (soggetto a regole di posizionamento). Questo ti consente di aggiungere istruzioni aggiornate più avanti in una conversazione di lunga durata senza ripetere l'intero prompt di sistema, preservando così i riscontri nella cache dei prompt sui turni precedenti e riducendo il costo di input nei cicli agentici. Non è richiesto alcun header beta. Consulta Messaggi di sistema a metà conversazione per i dettagli sull'utilizzo.

Dettagli di stop per rifiuto

L'oggetto stop_details nelle risposte di rifiuto (disponibile da Claude Opus 4.7) è ora documentato pubblicamente. Quando Claude rifiuta di completare una richiesta, questo oggetto descrive la categoria del rifiuto, in aggiunta al motivo di stop refusal esistente, rendendo più facile per la tua applicazione distinguere tra diverse classi di richieste rifiutate e indirizzare l'utente al passaggio successivo corretto. Non è richiesto alcun header beta. Consulta Gestione dei motivi di stop per l'elenco delle categorie e le indicazioni sulla gestione.

Valori predefiniti di effort

Il valore predefinito del parametro effort su Claude Opus 4.8 è high su tutte le superfici, incluse l'API di Claude e Claude Code. Se oggi imposti effort esplicitamente, la tua impostazione rimane invariata. Consulta Effort per indicazioni su ciascun livello.

Fast mode

La fast mode (modalità veloce) è ora disponibile per Claude Opus 4.8 come anteprima di ricerca sull'API di Claude. Imposta speed: "fast" per ottenere fino a 2,5 volte più token di output al secondo dallo stesso modello a un prezzo premium. Consulta Fast mode per accesso, modelli supportati e prezzi.

Minimo ridotto per la cache dei prompt

La lunghezza minima del prompt memorizzabile in cache su Claude Opus 4.8 è di 1.024 token, inferiore rispetto a Claude Opus 4.7. I prompt che erano troppo brevi per essere memorizzati in cache su Claude Opus 4.7 possono ora creare voci di cache senza modifiche al codice. Consulta Cache dei prompt per i minimi per modello.

Vincoli API ereditati da Claude Opus 4.7



Questi vincoli sono invariati rispetto a Claude Opus 4.7, quindi il codice che già funziona su Claude Opus 4.7 non necessita di modifiche. Si applicano solo alla Messages API; i Claude Managed Agents non sono interessati.

Parametri di campionamento non supportati

Impostare temperature, top_p o top_k su un valore non predefinito restituisce un errore 400 su Claude Opus 4.8, come su Claude Opus 4.7. Ometti questi parametri e usa il prompting per guidare il comportamento del modello.

Adaptive thinking è l'unica modalità di pensiero

Come Claude Opus 4.7, Claude Opus 4.8 non supporta i budget di pensiero esteso. Impostare thinking: {"type": "enabled", "budget_tokens": N} restituisce un errore 400. Usa adaptive thinking e il parametro effort per controllare la profondità del pensiero.

Python
# Prima (Opus 4.6 o precedenti)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Dopo (Opus 4.7 e successivi)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

Miglioramenti delle capacità

Aree di miglioramento

Rispetto a Claude Opus 4.7, Claude Opus 4.8 punta a miglioramenti comportamentali in:

  • Codifica agentica a lungo orizzonte, inclusa una migliore gestione del contesto lungo, meno compattazioni e un migliore recupero dalla compattazione.
  • Calibrazione dell'effort di ragionamento, con un comportamento più affidabile a ciascun livello di effort in una varietà di domini.
  • Attivazione degli strumenti, con meno casi in cui viene saltata una chiamata a uno strumento richiesta dal compito.

Adaptive thinking

Con adaptive thinking abilitato, Claude Opus 4.8 attiva il ragionamento solo quando ritiene che il turno lo richieda. Per ricerche semplici e brevi passaggi agentici risponde direttamente; per problemi complessi multi-step ragiona prima di rispondere. Questo riduce i token di pensiero sprecati su carichi di lavoro bimodali rispetto a Claude Opus 4.7 allo stesso livello di effort. Come su Claude Opus 4.7, il pensiero è disattivato a meno che tu non imposti esplicitamente thinking: {type: "adaptive"} nella tua richiesta.

Cambiamenti di comportamento

Questi non sono cambiamenti che interrompono la compatibilità dell'API, ma potrebbero richiedere aggiornamenti ai prompt. Consulta Migrazione a Claude Opus 4.8 per indicazioni complete.

  • Meno token di pensiero sprecati allo stesso livello di effort quando adaptive thinking è abilitato, perché il modello decide per ogni turno se pensare.
  • Migliore attivazione degli strumenti. Il modello è meno propenso a saltare una chiamata a uno strumento richiesta dal compito, un problema segnalato da alcuni utenti su Claude Opus 4.7.
  • Migliore gestione della compattazione e qualità del contesto lungo. Le tracce agentiche lunghe rimangono focalizzate sul compito con meno deragliamenti dopo la compattazione.

Guida alla migrazione

Per istruzioni di migrazione passo passo e la checklist completa di migrazione, consulta Migrazione a Claude Opus 4.8. Se usi Claude Code o l'Agent SDK, la skill Claude API può applicare automaticamente questi passaggi di migrazione alla tua codebase.

Passaggi successivi


Guida alla migrazione

Istruzioni di aggiornamento passo passo da Claude Opus 4.7.

Effort

Indicazioni sull'effort per livello, inclusi i nuovi valori predefiniti.

Adaptive thinking

L'unica modalità di pensiero attivo supportata su Claude Opus 4.8.

Cache dei prompt

Come i messaggi di sistema a metà conversazione preservano i riscontri in cache.

Gestione dei motivi di stop

Dettagli di stop per rifiuto e come gestirli.


Fast mode

Velocità di output più elevata a un prezzo premium.

Was this page helpful?

  • Nuovo modello
  • Nuove funzionalità
  • Messaggi di sistema a metà conversazione
  • Dettagli di stop per rifiuto
  • Valori predefiniti di effort
  • Fast mode
  • Minimo ridotto per la cache dei prompt
  • Vincoli API ereditati da Claude Opus 4.7
  • Parametri di campionamento non supportati
  • Adaptive thinking è l'unica modalità di pensiero
  • Miglioramenti delle capacità
  • Aree di miglioramento
  • Adaptive thinking
  • Cambiamenti di comportamento
  • Guida alla migrazione
  • Passaggi successivi