Claude 4.5 introduce tre modelli progettati per diversi casi d'uso:
Claude Opus 4.5 rappresenta il nostro modello più intelligente, combinando la massima capacità con prestazioni pratiche. Offre miglioramenti significativi nel ragionamento, nella codifica e nei compiti di risoluzione di problemi complessi, mantenendo gli output di alta qualità attesi dalla famiglia Opus.
Claude Opus 4.5 è l'unico modello che supporta il parametro effort, permettendoti di controllare quanti token Claude utilizza quando risponde. Questo ti dà la possibilità di fare un compromesso tra la completezza della risposta e l'efficienza dei token con un singolo modello.
Il parametro effort influisce su tutti i token nella risposta, incluse le risposte di testo, le chiamate di strumenti e il pensiero esteso. Puoi scegliere tra:
Claude Opus 4.5 introduce capacità di computer use migliorate con una nuova azione di zoom che consente un'ispezione dettagliata di specifiche regioni dello schermo a risoluzione completa. Questo permette a Claude di esaminare elementi UI a grana fine, testo piccolo e informazioni visive dettagliate che potrebbero essere poco chiare negli screenshot standard.
La capacità di zoom è particolarmente preziosa per:
Claude Opus 4.5 offre intelligenza di livello flagship a un prezzo più accessibile rispetto ai precedenti modelli Opus, rendendo le capacità di IA avanzate disponibili per una gamma più ampia di applicazioni e casi d'uso.
Claude Opus 4.5 preserva automaticamente tutti i blocchi di pensiero precedenti durante le conversazioni, mantenendo la continuità del ragionamento attraverso interazioni multi-turno estese e sessioni di utilizzo di strumenti. Questo assicura che Claude possa sfruttare efficacemente la sua intera cronologia di ragionamento quando lavora su compiti complessi e di lunga durata.
Claude Sonnet 4.5 è il nostro miglior modello di codifica fino ad oggi, con miglioramenti significativi in tutto il ciclo di vita dello sviluppo:
Claude Sonnet 4.5 funziona significativamente meglio nei compiti di codifica quando il pensiero esteso è abilitato. Il pensiero esteso è disabilitato per impostazione predefinita, ma consigliamo di abilitarlo per il lavoro di codifica complesso. Tieni presente che il pensiero esteso influisce sull'efficienza della cache dei prompt. Consulta la guida alla migrazione per i dettagli di configurazione.
Claude Sonnet 4.5 introduce importanti progressi nelle capacità degli agenti:
Claude Sonnet 4.5 ha un approccio comunicativo raffinato che è conciso, diretto e naturale. Fornisce aggiornamenti di progresso basati su fatti e può saltare riepiloghi dettagliati dopo le chiamate di strumenti per mantenere lo slancio del flusso di lavoro (anche se questo può essere regolato con il prompting).
Per una guida dettagliata su come lavorare con questo stile di comunicazione, consulta Best practice di Claude 4.
Claude Sonnet 4.5 eccelle nei compiti di contenuti creativi:
Claude Haiku 4.5 rappresenta un salto trasformativo per la famiglia di modelli Haiku, portando capacità all'avanguardia alla nostra classe di modelli più veloce:
Claude Haiku 4.5 offre prestazioni quasi all'avanguardia che corrispondono a Sonnet 4 a un costo significativamente inferiore e una velocità più elevata:
Claude Haiku 4.5 è il primo modello Haiku a supportare il pensiero esteso, portando capacità di ragionamento avanzate alla famiglia Haiku:
Il pensiero esteso deve essere abilitato esplicitamente aggiungendo un parametro thinking alle tue richieste API. Consulta la documentazione del pensiero esteso per i dettagli di implementazione.
Claude Haiku 4.5 funziona significativamente meglio nei compiti di codifica e ragionamento quando il pensiero esteso è abilitato. Il pensiero esteso è disabilitato per impostazione predefinita, ma consigliamo di abilitarlo per la risoluzione di problemi complessi, il lavoro di codifica e il ragionamento multi-step. Tieni presente che il pensiero esteso influisce sull'efficienza della cache dei prompt. Consulta la guida alla migrazione per i dettagli di configurazione.
Claude Haiku 4.5 presenta consapevolezza del contesto, consentendo al modello di tracciare la sua finestra di contesto rimanente durante una conversazione:
Questo è il primo modello Haiku con capacità native di consapevolezza del contesto. Per la guida al prompting, consulta Best practice di Claude 4.
Claude Haiku 4.5 offre solide capacità di codifica attese dai moderni modelli Claude:
Haiku 4.5 è progettato per casi d'uso che richiedono sia intelligenza che efficienza:
La chiamata di strumenti programmatica consente a Claude di scrivere codice che chiama i tuoi strumenti in modo programmatico all'interno di un contenitore di esecuzione del codice, piuttosto che richiedere round trip attraverso il modello per ogni invocazione di strumento. Questo riduce significativamente la latenza per i flussi di lavoro multi-strumento e diminuisce il consumo di token consentendo a Claude di filtrare o elaborare i dati prima che raggiungano la finestra di contesto del modello.
tools=[
{
"type": "code_execution_20250825",
"name": "code_execution"
},
{
"name": "query_database",
"description": "Execute a SQL query against the sales database. Returns a list of rows as JSON objects.",
"input_schema": {...},
"allowed_callers": ["code_execution_20250825"] # Enable programmatic calling
}
]Vantaggi chiave:
advanced-tool-use-2025-11-20Lo strumento di ricerca degli strumenti consente a Claude di lavorare con centinaia o migliaia di strumenti scoprendo e caricando dinamicamente quelli necessari su richiesta. Invece di caricare tutte le definizioni degli strumenti nella finestra di contesto in anticipo, Claude cerca il tuo catalogo di strumenti e carica solo gli strumenti di cui ha bisogno.
Sono disponibili due varianti di ricerca:
tool_search_tool_regex_20251119): Claude costruisce pattern regex per cercare nomi, descrizioni e argomenti degli strumentitool_search_tool_bm25_20251119): Claude utilizza query in linguaggio naturale per cercare gli strumentitools=[
{
"type": "tool_search_tool_regex_20251119",
"name": "tool_search_tool_regex"
},
{
"name": "get_weather",
"description": "Get the weather at a specific location",
"input_schema": {...},
"defer_loading": True # Load on-demand via search
}
]Questo approccio risolve due sfide critiche:
advanced-tool-use-2025-11-20Il parametro effort ti consente di controllare quanti token Claude utilizza quando risponde, facendo un compromesso tra la completezza della risposta e l'efficienza dei token:
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
output_config={
"effort": "medium" # "low", "medium", or "high"
}
)Il parametro effort influisce su tutti i token nella risposta, incluse le risposte di testo, le chiamate di strumenti e il pensiero esteso. I livelli di effort inferiore producono risposte più concise con spiegazioni minime, mentre l'effort superiore fornisce ragionamento dettagliato e risposte complete.
effort-2025-11-24Gli esempi di utilizzo degli strumenti ti consentono di fornire esempi concreti di input di strumenti validi per aiutare Claude a comprendere come utilizzare i tuoi strumenti più efficacemente. Questo è particolarmente utile per strumenti complessi con oggetti annidati, parametri opzionali o input sensibili al formato.
tools=[
{
"name": "get_weather",
"description": "Get the current weather in a given location",
"input_schema": {...},
"input_examples": [
{
"location": "San Francisco, CA",
"unit": "fahrenheit"
},
{
"location": "Tokyo, Japan",
"unit": "celsius"
},
{
"location": "New York, NY" # Demonstrates optional 'unit' parameter
}
]
}
]Gli esempi sono inclusi nel prompt insieme al tuo schema degli strumenti, mostrando a Claude pattern concreti per chiamate di strumenti ben formate. Ogni esempio deve essere valido secondo lo input_schema dello strumento.
advanced-tool-use-2025-11-20.Il nuovo strumento di memoria consente a Claude di archiviare e recuperare informazioni al di fuori della finestra di contesto:
tools=[
{
"type": "memory_20250818",
"name": "memory"
}
]Questo consente:
context-management-2025-06-27Utilizza la modifica del contesto per la gestione intelligente del contesto attraverso la cancellazione automatica delle chiamate di strumenti:
response = client.beta.messages.create(
betas=["context-management-2025-06-27"],
model="claude-sonnet-4-5", # or claude-haiku-4-5
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
context_management={
"edits": [
{
"type": "clear_tool_uses_20250919",
"trigger": {"type": "input_tokens", "value": 500},
"keep": {"type": "tool_uses", "value": 2},
"clear_at_least": {"type": "input_tokens", "value": 100}
}
]
},
tools=[...]
)Questa funzionalità rimuove automaticamente le chiamate di strumenti e i risultati più vecchi quando ci si avvicina ai limiti dei token, aiutando a gestire il contesto nelle sessioni di agenti di lunga durata.
context-management-2025-06-27I modelli Claude 4.5 introducono un nuovo motivo di arresto model_context_window_exceeded che indica esplicitamente quando la generazione si è fermata a causa del raggiungimento del limite della finestra di contesto, piuttosto che il limite max_tokens richiesto. Questo rende più facile gestire i limiti della finestra di contesto nella logica dell'applicazione.
{
"stop_reason": "model_context_window_exceeded",
"usage": {
"input_tokens": 150000,
"output_tokens": 49950
}
}I modelli Claude 4.5 includono una correzione di bug che preserva la formattazione intenzionale nei parametri di stringa delle chiamate di strumenti. In precedenza, le newline finali nei parametri di stringa venivano talvolta rimosse in modo errato. Questa correzione assicura che gli strumenti che richiedono una formattazione precisa (come gli editor di testo) ricevano i parametri esattamente come previsto.
Questo è un miglioramento dietro le quinte senza modifiche API richieste. Tuttavia, gli strumenti con parametri di stringa potrebbero ora ricevere valori con newline finali che erano precedentemente rimosse.
Esempio:
// Prima: Newline finale rimossa accidentalmente
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit"
}
}
// Dopo: Newline finale preservata come previsto
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit\n"
}
}I modelli Claude 4.5 includono ottimizzazioni automatiche per migliorare le prestazioni del modello. Queste ottimizzazioni possono aggiungere piccole quantità di token alle richieste, ma non ti viene addebitato per questi token aggiunti dal sistema.
Le seguenti funzionalità sono state introdotte in Claude 4 e sono disponibili su tutti i modelli Claude 4, inclusi Claude Sonnet 4.5 e Claude Haiku 4.5.
I modelli Claude 4 introducono un nuovo motivo di arresto refusal per i contenuti che il modello rifiuta di generare per motivi di sicurezza:
{
"id": "msg_014XEDjypDjFzgKVWdFUXxZP",
"type": "message",
"role": "assistant",
"model": "claude-sonnet-4-5",
"content": [{"type": "text", "text": "I would be happy to assist you. You can "}],
"stop_reason": "refusal",
"stop_sequence": null,
"usage": {
"input_tokens": 564,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"output_tokens": 22
}
}Quando utilizzi i modelli Claude 4, dovresti aggiornare la tua applicazione per gestire i motivi di arresto refusal.
Con il pensiero esteso abilitato, l'API Messages per i modelli Claude 4 restituisce un riassunto del processo di pensiero completo di Claude. Il pensiero riassunto fornisce i vantaggi di intelligenza completa del pensiero esteso, prevenendo l'uso improprio.
Mentre l'API è coerente tra i modelli Claude 3.7 e 4, le risposte in streaming per il pensiero esteso potrebbero tornare in un pattern di consegna "frammentato", con possibili ritardi tra gli eventi di streaming.
La riassunzione viene elaborata da un modello diverso da quello che specifichi nelle tue richieste. Il modello di pensiero non vede l'output riassunto.
Per ulteriori informazioni, consulta la documentazione del pensiero esteso.
I modelli Claude 4 supportano l'intercalamento dell'utilizzo degli strumenti con il pensiero esteso, consentendo conversazioni più naturali in cui gli utilizzi degli strumenti e le risposte possono essere mescolati con messaggi regolari.
Il pensiero intercalato è in beta. Per abilitare il pensiero intercalato, aggiungi l'intestazione beta interleaved-thinking-2025-05-14 alla tua richiesta API.
Per ulteriori informazioni, consulta la documentazione del pensiero esteso.
I modelli Claude 4 hanno notevoli cambiamenti comportamentali che possono influire su come strutturi i prompt:
I modelli Claude 4 sono addestrati per il seguimento preciso delle istruzioni e richiedono una direzione più esplicita:
Per una guida completa su come lavorare con questi modelli, consulta Best practice di prompt engineering di Claude 4.
Lo strumento editor di testo è stato aggiornato per i modelli Claude 4 con le seguenti modifiche:
text_editor_20250728str_replace_based_edit_toolundo_edit non è più supportatoLo strumento editor di testo str_replace_editor rimane lo stesso per Claude Sonnet 3.7.
Se stai migrando da Claude Sonnet 3.7 e utilizzi lo strumento editor di testo:
# Claude Sonnet 3.7
tools=[
{
"type": "text_editor_20250124",
"name": "str_replace_editor"
}
]
# Modelli Claude 4
tools=[
{
"type": "text_editor_20250728",
"name": "str_replace_based_edit_tool"
}
]Per ulteriori informazioni, consulta la documentazione dello strumento editor di testo.
Se stai utilizzando lo strumento di esecuzione del codice, assicurati di utilizzare la versione più recente code_execution_20250825, che aggiunge comandi Bash e capacità di manipolazione dei file.
La versione legacy code_execution_20250522 (solo Python) è ancora disponibile ma non consigliata per le nuove implementazioni.
Per le istruzioni di migrazione, consulta la documentazione dello strumento di esecuzione del codice.
I modelli Claude 4.5 mantengono prezzi competitivi:
| Modello | Input | Output |
|---|---|---|
| Claude Opus 4.5 | $5 per milione di token | $25 per milione di token |
| Claude Sonnet 4.5 | $3 per milione di token | $15 per milione di token |
| Claude Haiku 4.5 | $1 per milione di token | $5 per milione di token |
Per ulteriori dettagli, consulta la documentazione dei prezzi.
A partire dai modelli Claude 4.5 (Opus 4.5, Sonnet 4.5 e Haiku 4.5), AWS Bedrock e Google Vertex AI offrono due tipi di endpoint:
Questo prezzo regionale si applica a tutti i modelli Claude 4.5: Opus 4.5, Sonnet 4.5 e Haiku 4.5.
L'API Claude (1P) è globale per impostazione predefinita e non è interessata da questo cambiamento. L'API Claude è solo globale (equivalente all'offerta e ai prezzi dell'endpoint globale di altri provider).
Per i dettagli di implementazione e la guida alla migrazione:
I modelli Claude 4.5 sono disponibili su:
| Modello | Claude API | Amazon Bedrock | Google Cloud Vertex AI |
|---|---|---|---|
| Claude Opus 4.5 | claude-opus-4-5-20251101 | anthropic.claude-opus-4-5-20251101-v1:0 | claude-opus-4-5@20251101 |
| Claude Sonnet 4.5 | claude-sonnet-4-5-20250929 | anthropic.claude-sonnet-4-5-20250929-v1:0 | claude-sonnet-4-5@20250929 |
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 | anthropic.claude-haiku-4-5-20251001-v1:0 | claude-haiku-4-5@20251001 |
Disponibile anche tramite le piattaforme Claude.ai e Claude Code.
I cambiamenti di rilievo e i requisiti di migrazione variano a seconda dal modello da cui stai eseguendo l'upgrade. Per istruzioni di migrazione dettagliate, incluse guide passo dopo passo, cambiamenti di rilievo e liste di controllo della migrazione, consulta Migrazione a Claude 4.5.
La guida alla migrazione copre i seguenti scenari:
Esegui l'upgrade dai modelli precedenti