Claude 4.5 introduce tre modelli progettati per diversi casi d'uso:
Claude Opus 4.5 rappresenta il nostro modello più intelligente, combinando la massima capacità con prestazioni pratiche. Offre miglioramenti significativi nel ragionamento, nella codifica e nei compiti di risoluzione di problemi complessi, mantenendo gli output di alta qualità attesi dalla famiglia Opus.
Claude Opus 4.5 è l'unico modello che supporta il parametro effort, permettendoti di controllare quanti token Claude utilizza quando risponde. Questo ti dà la possibilità di fare un compromesso tra la completezza della risposta e l'efficienza dei token con un singolo modello.
Il parametro effort influisce su tutti i token nella risposta, incluse le risposte di testo, le chiamate di strumenti e il pensiero esteso. Puoi scegliere tra:
Claude Opus 4.5 introduce capacità di computer use migliorate con una nuova azione di zoom che consente l'ispezione dettagliata di specifiche regioni dello schermo a risoluzione completa. Questo consente a Claude di esaminare elementi UI a grana fine, testo piccolo e informazioni visive dettagliate che potrebbero essere poco chiare negli screenshot standard.
La capacità di zoom è particolarmente preziosa per:
Claude Opus 4.5 offre intelligenza di punta a un punto di prezzo più accessibile rispetto ai precedenti modelli Opus, rendendo le capacità di IA avanzate disponibili per una gamma più ampia di applicazioni e casi d'uso.
Claude Opus 4.5 preserva automaticamente tutti i precedenti blocchi di pensiero durante le conversazioni, mantenendo la continuità del ragionamento attraverso interazioni multi-turno estese e sessioni di utilizzo di strumenti. Questo assicura che Claude possa sfruttare efficacemente la sua intera cronologia di ragionamento quando lavora su compiti complessi e di lunga durata.
Claude Sonnet 4.5 è il nostro miglior modello di codifica fino ad oggi, con miglioramenti significativi in tutto il ciclo di vita dello sviluppo:
Claude Sonnet 4.5 ha prestazioni significativamente migliori nei compiti di codifica quando il pensiero esteso è abilitato. Il pensiero esteso è disabilitato per impostazione predefinita, ma consigliamo di abilitarlo per il lavoro di codifica complesso. Tieni presente che il pensiero esteso influisce sull'efficienza della cache dei prompt. Consulta la guida alla migrazione per i dettagli di configurazione.
Claude Sonnet 4.5 introduce importanti progressi nelle capacità degli agenti:
Claude Sonnet 4.5 ha un approccio comunicativo raffinato che è conciso, diretto e naturale. Fornisce aggiornamenti di progresso basati su fatti e può saltare riepiloghi verbosi dopo le chiamate di strumenti per mantenere lo slancio del flusso di lavoro (anche se questo può essere regolato con il prompting).
Per una guida dettagliata su come lavorare con questo stile di comunicazione, consulta Claude 4 best practices.
Claude Sonnet 4.5 eccelle nei compiti di contenuti creativi:
Claude Haiku 4.5 rappresenta un salto trasformativo per la famiglia di modelli Haiku, portando capacità ai confini della nostra classe di modelli più veloce:
Claude Haiku 4.5 offre prestazioni quasi ai confini che corrispondono a Sonnet 4 a costi significativamente inferiori e velocità più elevata:
Claude Haiku 4.5 è il primo modello Haiku a supportare il pensiero esteso, portando capacità di ragionamento avanzate alla famiglia Haiku:
Il pensiero esteso deve essere abilitato esplicitamente aggiungendo un parametro thinking alle tue richieste API. Consulta la documentazione del pensiero esteso per i dettagli di implementazione.
Claude Haiku 4.5 ha prestazioni significativamente migliori nei compiti di codifica e ragionamento quando il pensiero esteso è abilitato. Il pensiero esteso è disabilitato per impostazione predefinita, ma consigliamo di abilitarlo per la risoluzione di problemi complessi, il lavoro di codifica e il ragionamento multi-step. Tieni presente che il pensiero esteso influisce sull'efficienza della cache dei prompt. Consulta la guida alla migrazione per i dettagli di configurazione.
Claude Haiku 4.5 presenta consapevolezza del contesto, consentendo al modello di tracciare la sua finestra di contesto rimanente durante una conversazione:
Questo è il primo modello Haiku con capacità di consapevolezza del contesto nativa. Per la guida al prompting, consulta Claude 4 best practices.
Claude Haiku 4.5 offre robuste capacità di codifica attese dai moderni modelli Claude:
Haiku 4.5 è progettato per casi d'uso che richiedono sia intelligenza che efficienza:
La chiamata di strumenti programmatica consente a Claude di scrivere codice che chiama i tuoi strumenti in modo programmatico all'interno di un contenitore di esecuzione del codice, piuttosto che richiedere round trip attraverso il modello per ogni invocazione di strumento. Questo riduce significativamente la latenza per i flussi di lavoro multi-strumento e diminuisce il consumo di token consentendo a Claude di filtrare o elaborare i dati prima che raggiungano la finestra di contesto del modello.
tools=[
{
"type": "code_execution_20250825",
"name": "code_execution"
},
{
"name": "query_database",
"description": "Execute a SQL query against the sales database. Returns a list of rows as JSON objects.",
"input_schema": {...},
"allowed_callers": ["code_execution_20250825"] # Enable programmatic calling
}
]Vantaggi chiave:
advanced-tool-use-2025-11-20Lo strumento di ricerca di strumenti consente a Claude di lavorare con centinaia o migliaia di strumenti scoprendoli e caricandoli dinamicamente su richiesta. Invece di caricare tutte le definizioni di strumenti nella finestra di contesto in anticipo, Claude cerca il tuo catalogo di strumenti e carica solo gli strumenti di cui ha bisogno.
Sono disponibili due varianti di ricerca:
tool_search_tool_regex_20251119): Claude costruisce pattern regex per cercare nomi di strumenti, descrizioni e argomentitool_search_tool_bm25_20251119): Claude utilizza query in linguaggio naturale per cercare strumentitools=[
{
"type": "tool_search_tool_regex_20251119",
"name": "tool_search_tool_regex"
},
{
"name": "get_weather",
"description": "Get the weather at a specific location",
"input_schema": {...},
"defer_loading": True # Load on-demand via search
}
]Questo approccio risolve due sfide critiche:
advanced-tool-use-2025-11-20Il parametro effort ti consente di controllare quanti token Claude utilizza quando risponde, facendo un compromesso tra la completezza della risposta e l'efficienza dei token:
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
output_config={
"effort": "medium" # "low", "medium", or "high"
}
)Il parametro effort influisce su tutti i token nella risposta, incluse le risposte di testo, le chiamate di strumenti e il pensiero esteso. I livelli di effort inferiori producono risposte più concise con spiegazioni minime, mentre l'effort superiore fornisce ragionamento dettagliato e risposte complete.
effort-2025-11-24Gli esempi di utilizzo di strumenti ti consentono di fornire esempi concreti di input di strumenti validi per aiutare Claude a comprendere come utilizzare i tuoi strumenti in modo più efficace. Questo è particolarmente utile per strumenti complessi con oggetti annidati, parametri opzionali o input sensibili al formato.
tools=[
{
"name": "get_weather",
"description": "Get the current weather in a given location",
"input_schema": {...},
"input_examples": [
{
"location": "San Francisco, CA",
"unit": "fahrenheit"
},
{
"location": "Tokyo, Japan",
"unit": "celsius"
},
{
"location": "New York, NY" # Demonstrates optional 'unit' parameter
}
]
}
]Gli esempi sono inclusi nel prompt insieme allo schema dello strumento, mostrando a Claude pattern concreti per chiamate di strumenti ben formate. Ogni esempio deve essere valido secondo l'input_schema dello strumento.
advanced-tool-use-2025-11-20.Il nuovo strumento di memoria consente a Claude di archiviare e recuperare informazioni al di fuori della finestra di contesto:
tools=[
{
"type": "memory_20250818",
"name": "memory"
}
]Questo consente:
context-management-2025-06-27Utilizza la modifica del contesto per la gestione intelligente del contesto attraverso la cancellazione automatica delle chiamate di strumenti:
response = client.beta.messages.create(
betas=["context-management-2025-06-27"],
model="claude-sonnet-4-5", # or claude-haiku-4-5
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
context_management={
"edits": [
{
"type": "clear_tool_uses_20250919",
"trigger": {"type": "input_tokens", "value": 500},
"keep": {"type": "tool_uses", "value": 2},
"clear_at_least": {"type": "input_tokens", "value": 100}
}
]
},
tools=[...]
)Questa funzionalità rimuove automaticamente le chiamate di strumenti e i risultati più vecchi quando ci si avvicina ai limiti dei token, aiutando a gestire il contesto nelle sessioni di agenti di lunga durata.
context-management-2025-06-27I modelli Claude 4.5 introducono un nuovo motivo di arresto model_context_window_exceeded che indica esplicitamente quando la generazione si è fermata a causa del raggiungimento del limite della finestra di contesto, piuttosto che il limite max_tokens richiesto. Questo rende più facile gestire i limiti della finestra di contesto nella logica dell'applicazione.
{
"stop_reason": "model_context_window_exceeded",
"usage": {
"input_tokens": 150000,
"output_tokens": 49950
}
}I modelli Claude 4.5 includono una correzione di bug che preserva la formattazione intenzionale nei parametri di stringa delle chiamate di strumenti. In precedenza, le newline finali nei parametri di stringa venivano talvolta rimosse in modo errato. Questa correzione assicura che gli strumenti che richiedono una formattazione precisa (come gli editor di testo) ricevano i parametri esattamente come previsto.
Questo è un miglioramento dietro le quinte senza modifiche API richieste. Tuttavia, gli strumenti con parametri di stringa potrebbero ora ricevere valori con newline finali che erano precedentemente rimosse.
Esempio:
// Before: Final newline accidentally stripped
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit"
}
}
// After: Trailing newline preserved as intended
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit\n"
}
}I modelli Claude 4.5 includono ottimizzazioni automatiche per migliorare le prestazioni del modello. Queste ottimizzazioni potrebbero aggiungere piccole quantità di token alle richieste, ma non ti viene addebitato per questi token aggiunti dal sistema.
Le seguenti funzionalità sono state introdotte in Claude 4 e sono disponibili in tutti i modelli Claude 4, inclusi Claude Sonnet 4.5 e Claude Haiku 4.5.
I modelli Claude 4 introducono un nuovo motivo di arresto refusal per i contenuti che il modello rifiuta di generare per motivi di sicurezza:
{
"id": "msg_014XEDjypDjFzgKVWdFUXxZP",
"type": "message",
"role": "assistant",
"model": "claude-sonnet-4-5",
"content": [{"type": "text", "text": "I would be happy to assist you. You can "}],
"stop_reason": "refusal",
"stop_sequence": null,
"usage": {
"input_tokens": 564,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"output_tokens": 22
}
}Quando utilizzi i modelli Claude 4, dovresti aggiornare la tua applicazione per gestire i motivi di arresto refusal.
Con il pensiero esteso abilitato, l'API Messages per i modelli Claude 4 restituisce un riepilogo del processo di pensiero completo di Claude. Il pensiero riepilogato fornisce i pieni vantaggi di intelligenza del pensiero esteso, prevenendo l'uso improprio.
Sebbene l'API sia coerente tra i modelli Claude 3.7 e 4, le risposte in streaming per il pensiero esteso potrebbero tornare in un modello di consegna "frammentato", con possibili ritardi tra gli eventi di streaming.
La riepilogazione viene elaborata da un modello diverso da quello che scegli nelle tue richieste. Il modello di pensiero non vede l'output riepilogato.
Per ulteriori informazioni, consulta la documentazione del pensiero esteso.
I modelli Claude 4 supportano l'intercalazione dell'utilizzo di strumenti con il pensiero esteso, consentendo conversazioni più naturali in cui gli utilizzi di strumenti e le risposte possono essere mescolati con messaggi regolari.
Il pensiero intercalato è in beta. Per abilitare il pensiero intercalato, aggiungi l'intestazione beta interleaved-thinking-2025-05-14 alla tua richiesta API.
Per ulteriori informazioni, consulta la documentazione del pensiero esteso.
I modelli Claude 4 hanno notevoli cambiamenti comportamentali che potrebbero influire su come strutturi i prompt:
I modelli Claude 4 sono addestrati per il seguimento preciso delle istruzioni e richiedono una direzione più esplicita:
Per una guida completa su come lavorare con questi modelli, consulta Claude 4 prompt engineering best practices.
Lo strumento editor di testo è stato aggiornato per i modelli Claude 4 con i seguenti cambiamenti:
text_editor_20250728str_replace_based_edit_toolundo_edit non è più supportatoLo strumento editor di testo str_replace_editor rimane lo stesso per Claude Sonnet 3.7.
Se stai migrando da Claude Sonnet 3.7 e utilizzi lo strumento editor di testo:
# Claude Sonnet 3.7
tools=[
{
"type": "text_editor_20250124",
"name": "str_replace_editor"
}
]
# Claude 4 models
tools=[
{
"type": "text_editor_20250728",
"name": "str_replace_based_edit_tool"
}
]Per ulteriori informazioni, consulta la documentazione dello strumento editor di testo.
Se utilizzi lo strumento di esecuzione del codice, assicurati di utilizzare la versione più recente code_execution_20250825, che aggiunge comandi Bash e capacità di manipolazione dei file.
La versione legacy code_execution_20250522 (solo Python) è ancora disponibile ma non consigliata per le nuove implementazioni.
Per le istruzioni di migrazione, consulta la documentazione dello strumento di esecuzione del codice.
I modelli Claude 4.5 mantengono prezzi competitivi:
| Modello | Input | Output |
|---|---|---|
| Claude Opus 4.5 | $5 per milione di token | $25 per milione di token |
| Claude Sonnet 4.5 | $3 per milione di token | $15 per milione di token |
| Claude Haiku 4.5 | $1 per milione di token | $5 per milione di token |
Per ulteriori dettagli, consulta la documentazione dei prezzi.
A partire dai modelli Claude 4.5 (Opus 4.5, Sonnet 4.5 e Haiku 4.5), AWS Bedrock e Google Vertex AI offrono due tipi di endpoint:
Questo prezzo regionale si applica a tutti i modelli Claude 4.5: Opus 4.5, Sonnet 4.5 e Haiku 4.5.
L'API Claude (1P) è globale per impostazione predefinita e non è interessata da questo cambiamento. L'API Claude è solo globale (equivalente all'offerta e ai prezzi dell'endpoint globale di altri provider).
Per i dettagli di implementazione e la guida alla migrazione:
I modelli Claude 4.5 sono disponibili su:
| Modello | Claude API | Amazon Bedrock | Google Cloud Vertex AI |
|---|---|---|---|
| Claude Opus 4.5 | claude-opus-4-5-20251101 | anthropic.claude-opus-4-5-20251101-v1:0 | claude-opus-4-5@20251101 |
| Claude Sonnet 4.5 | claude-sonnet-4-5-20250929 | anthropic.claude-sonnet-4-5-20250929-v1:0 | claude-sonnet-4-5@20250929 |
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 | anthropic.claude-haiku-4-5-20251001-v1:0 | claude-haiku-4-5@20251001 |
Disponibile anche attraverso le piattaforme Claude.ai e Claude Code.
I cambiamenti di rilievo e i requisiti di migrazione variano a seconda dal modello da cui stai effettuando l'upgrade. Per istruzioni di migrazione dettagliate, incluse guide passo dopo passo, cambiamenti di rilievo e liste di controllo della migrazione, consulta Migrazione a Claude 4.5.
La guida alla migrazione copre i seguenti scenari: