Questa pagina fornisce informazioni dettagliate sui prezzi dei modelli e delle funzionalità di Anthropic. Tutti i prezzi sono in USD.
Per le informazioni sui prezzi più attuali, visita claude.com/pricing.
La seguente tabella mostra i prezzi per tutti i modelli Claude in diversi livelli di utilizzo:
| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.7 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.6 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.5 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok |
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.6 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Milioni di token. La colonna "Base Input Tokens" mostra i prezzi di input standard, "Cache Writes" e "Cache Hits" sono specifici del prompt caching, e "Output Tokens" mostra i prezzi di output. Vedi prezzi del prompt caching di seguito per una spiegazione delle colonne della cache e dei moltiplicatori di prezzo.
Opus 4.7 utilizza un nuovo tokenizer rispetto ai modelli precedenti, contribuendo alle sue prestazioni migliorate su un'ampia gamma di attività. Questo nuovo tokenizer può utilizzare fino al 35% più token per lo stesso testo fisso.
I modelli Claude sono disponibili su AWS Bedrock, Google Vertex AI, e Microsoft Foundry. Per i prezzi ufficiali, visita:
Prezzi degli endpoint regionali e multi-region per i modelli Claude 4.5 e successivi
A partire da Claude Sonnet 4.5 e Haiku 4.5:
Gli endpoint regionali e multi-region includono un premio del 10% rispetto agli endpoint globali. L'API Claude (1P) è globale per impostazione predefinita; per le opzioni di residenza dei dati 1P e i prezzi, vedi Prezzi della residenza dei dati di seguito.
Ambito: Questa struttura di prezzo si applica a Claude Sonnet 4.5, Haiku 4.5 e a tutti i modelli futuri. I modelli precedenti (Claude Sonnet 4 (deprecato), Opus 4 (deprecato) e versioni precedenti) mantengono i loro prezzi esistenti.
Per i dettagli di implementazione e gli esempi di codice:
Il prompt caching riduce i costi e la latenza riutilizzando le porzioni precedentemente elaborate del tuo prompt tra le chiamate API. Invece di rielaborare lo stesso grande prompt di sistema, documento o cronologia della conversazione ad ogni richiesta, l'API legge dalla cache a una frazione del prezzo di input standard.
Ci sono due modi per abilitare il prompt caching:
cache_control al livello superiore della tua richiesta. Il sistema gestisce automaticamente i punti di interruzione della cache man mano che le conversazioni crescono. Questo è il punto di partenza consigliato per la maggior parte dei casi d'uso.cache_control direttamente su singoli blocchi di contenuto per un controllo granulare su esattamente cosa viene memorizzato nella cache.Il prompt caching utilizza i seguenti moltiplicatori di prezzo relativi alle tariffe di token di input di base:
| Operazione di cache | Moltiplicatore | Durata |
|---|---|---|
| Scrittura cache di 5 minuti | 1,25x prezzo di input di base | Cache valida per 5 minuti |
| Scrittura cache di 1 ora | 2x prezzo di input di base | Cache valida per 1 ora |
| Lettura cache (hit) | 0,1x prezzo di input di base | Stessa durata della scrittura precedente |
I token di scrittura della cache vengono addebitati quando il contenuto viene archiviato per la prima volta. I token di lettura della cache vengono addebitati quando una richiesta successiva recupera il contenuto memorizzato nella cache. Un hit della cache costa il 10% del prezzo di input standard, il che significa che il caching si ripaga dopo solo una lettura della cache per la durata di 5 minuti (1,25x scrittura), o dopo due letture della cache per la durata di 1 ora (2x scrittura).
Questi moltiplicatori si sommano con altri modificatori di prezzo, incluso lo sconto dell'API Batch e la residenza dei dati.
Per i dettagli di implementazione, i modelli supportati e gli esempi di codice, vedi la documentazione del prompt caching.
Per Claude Opus 4.7, Claude Opus 4.6 e i modelli più recenti, specificare l'inferenza solo negli Stati Uniti tramite il parametro inference_geo comporta un moltiplicatore di 1,1x su tutte le categorie di prezzi dei token, inclusi i token di input, i token di output, le scritture della cache e le letture della cache. Il routing globale (l'impostazione predefinita) utilizza i prezzi standard.
Questo si applica solo all'API Claude (1P). Le piattaforme di terze parti hanno i loro propri prezzi regionali. Vedi AWS Bedrock e Google Vertex AI per i dettagli. I modelli precedenti mantengono i loro prezzi esistenti indipendentemente dalle impostazioni di inference_geo.
Per ulteriori informazioni, vedi la documentazione sulla residenza dei dati.
La modalità veloce (beta: anteprima di ricerca) per Claude Opus 4.6 fornisce output significativamente più veloce a prezzi premium (6x tariffe standard). I prezzi della modalità veloce si applicano all'intera finestra di contesto, incluse le richieste con oltre 200k token di input. Attualmente supportato su Opus 4.6:
| Input | Output |
|---|---|
| $30 / MTok | $150 / MTok |
I prezzi della modalità veloce si sommano con altri modificatori di prezzo:
La modalità veloce non è disponibile con l'API Batch.
Per ulteriori informazioni, vedi la documentazione sulla modalità veloce.
L'API Batch consente l'elaborazione asincrona di grandi volumi di richieste con uno sconto del 50% sia sui token di input che di output.
| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.7 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.6 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.5 | $2.50 / MTok | $12.50 / MTok |
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.6 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Per ulteriori informazioni sull'elaborazione batch, vedi la documentazione sull'elaborazione batch.
Claude Mythos Preview, Opus 4.7, Opus 4.6 e Sonnet 4.6 includono la finestra di contesto completa di 1M token ai prezzi standard. (Una richiesta di 900k token viene fatturata alla stessa tariffa per token di una richiesta di 9k token.) Gli sconti del prompt caching e dell'elaborazione batch si applicano alle tariffe standard su tutta la finestra di contesto.
Tool use requests are priced based on:
tools parameter)Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
tools parameter in API requests (tool names, descriptions, and schemas)tool_use content blocks in API requests and responsestool_result content blocks in API requestsWhen you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.7 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.6 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
Per i prezzi attuali per modello, fai riferimento alla sezione prezzi dei modelli.
Per ulteriori informazioni sull'implementazione dell'uso degli strumenti e le migliori pratiche, vedi la documentazione sull'uso degli strumenti.
The bash tool adds 245 input tokens to your API calls.
Additional tokens are consumed by:
Vedi prezzi dell'uso degli strumenti per i dettagli completi dei prezzi.
Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.
When used without these tools, code execution is billed by execution time, tracked separately from token usage:
Code execution usage is tracked in the response:
"usage": {
"input_tokens": 105,
"output_tokens": 239,
"server_tool_use": {
"code_execution_requests": 1
}
}The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.
In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
Vedi prezzi dell'uso degli strumenti per i dettagli completi dei prezzi.
Web search usage is charged in addition to token usage:
"usage": {
"input_tokens": 105,
"output_tokens": 6039,
"cache_read_input_tokens": 7123,
"cache_creation_input_tokens": 7345,
"server_tool_use": {
"web_search_requests": 1
}
}Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Web fetch usage has no additional charges beyond standard token costs:
"usage": {
"input_tokens": 25039,
"output_tokens": 931,
"cache_read_input_tokens": 0,
"cache_creation_input_tokens": 0,
"server_tool_use": {
"web_fetch_requests": 1
}
}The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.
To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
Additional token consumption:
If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Claude Managed Agents viene fatturato su due dimensioni: token e runtime della sessione.
Tutti i token consumati da una sessione di Claude Managed Agents vengono fatturati alle tariffe mostrate in Prezzi dei modelli sopra. I moltiplicatori del prompt caching si applicano in modo identico. La ricerca web attivata all'interno di una sessione comporta il costo standard di $10 per 1.000 ricerche.
I seguenti modificatori dell'API Messages non si applicano alle sessioni di Claude Managed Agents:
| Modificatore | Perché non si applica |
|---|---|
| Sconto dell'API Batch | Le sessioni sono stateful e interattive. Non c'è modalità batch. |
| Premium della modalità veloce | La velocità di inferenza è gestita dal runtime. |
| Moltiplicatore della residenza dei dati | inference_geo è un campo di richiesta dell'API Messages. |
| Premium del contesto lungo | La finestra di contesto è gestita dal runtime. |
| Prezzi della piattaforma di terze parti | Claude Managed Agents è disponibile solo tramite l'API Claude direttamente. |
| SKU | Tariffa | Misurazione |
|---|---|---|
| Runtime della sessione | $0,08 per ora di sessione | Durata dello stato running |
Il runtime viene misurato al millisecondo e si accumula solo mentre lo stato della sessione è running. Il tempo trascorso idle (in attesa del tuo prossimo messaggio o di una conferma dello strumento), rescheduling o terminated non conta verso il runtime.
Il runtime della sessione sostituisce il modello di fatturazione per ore di contenitore del Code Execution quando si utilizza Claude Managed Agents. Non ti viene addebitato separatamente per le ore di contenitore in aggiunta al runtime della sessione.
Una sessione di codifica di un'ora utilizzando Claude Opus 4.7 che consuma 50.000 token di input e 15.000 token di output:
| Voce | Calcolo | Costo |
|---|---|---|
| Token di input | 50.000 × $5 / 1.000.000 | $0,25 |
| Token di output | 15.000 × $25 / 1.000.000 | $0,375 |
| Runtime della sessione | 1,0 ora × $0,08 | $0,08 |
| Totale | $0,705 |
Se il prompt caching è attivo e 40.000 dei token di input sono letture della cache:
| Voce | Calcolo | Costo |
|---|---|---|
| Token di input non memorizzati nella cache | 10.000 × $5 / 1.000.000 | $0,05 |
| Token di lettura della cache | 40.000 × $5 × 0,1 / 1.000.000 | $0,02 |
| Token di output | 15.000 × $25 / 1.000.000 | $0,375 |
| Runtime della sessione | 1,0 ora × $0,08 | $0,08 |
| Totale | $0,525 |
Esempio di calcolo per l'elaborazione di 10.000 ticket di supporto:
Per una procedura dettagliata di questo calcolo, vedi la guida dell'agente di supporto clienti.
Quando costruisci agenti con Claude:
Per applicazioni di agenti ad alto volume, contatta il team di vendita aziendale per accordi di prezzo personalizzati.
I limiti di velocità variano in base al livello di utilizzo e influiscono su quante richieste puoi effettuare:
Per informazioni dettagliate sui limiti di velocità, vedi la documentazione sui limiti di velocità.
Per limiti di velocità più alti o accordi di prezzo personalizzati, contatta il team di vendita.
Gli sconti per volume possono essere disponibili per gli utenti ad alto volume. Questi vengono negoziati caso per caso.
Per i clienti Enterprise con esigenze specifiche:
Contatta il team di vendita all'indirizzo [email protected] o tramite la Claude Console per discutere le opzioni di prezzo Enterprise.
Come viene calcolato l'utilizzo dei token?
I token sono pezzi di testo che i modelli elaborano. Come stima approssimativa, 1 token è approssimativamente 4 caratteri o 0,75 parole in inglese. Il conteggio esatto varia in base alla lingua e al tipo di contenuto.
Ci sono tier gratuiti o prove?
I nuovi utenti ricevono una piccola quantità di crediti gratuiti per testare l'API. Contatta le vendite per informazioni su prove estese per la valutazione aziendale.
Come si sommano gli sconti?
Gli sconti dell'API Batch e del prompt caching possono essere combinati. Ad esempio, l'utilizzo di entrambe le funzionalità insieme fornisce risparmi sui costi significativi rispetto alle chiamate API standard. Vedi prezzi del prompt caching per come i moltiplicatori interagiscono.
Quali metodi di pagamento sono accettati?
Le principali carte di credito sono accettate per gli account standard. I clienti Enterprise possono organizzare la fatturazione e altri metodi di pagamento.
Per domande aggiuntive sui prezzi, contatta [email protected].
Was this page helpful?