Loading...
    • Crea
    • Admin
    • Modelli e prezzi
    • SDK client
    • Riferimento API
    Search...
    ⌘K
    Modelli
    Panoramica dei modelliScelta di un modelloNovità in Claude Opus 4.7Guida alla migrazioneDeprecazioni del modelloSchede modelloPrompt di sistema
    Prezzi
    Prezzi
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Prezzi

    Prezzi

    Scopri la struttura dei prezzi di Anthropic per i modelli e le funzionalità

    Questa pagina fornisce informazioni dettagliate sui prezzi dei modelli e delle funzionalità di Anthropic. Tutti i prezzi sono in USD.

    Per le informazioni sui prezzi più attuali, visita claude.com/pricing.

    Prezzi dei modelli

    La seguente tabella mostra i prezzi per tutti i modelli Claude in diversi livelli di utilizzo:

    ModelBase Input Tokens5m Cache Writes1h Cache WritesCache Hits & RefreshesOutput Tokens
    Claude Opus 4.7$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
    Claude Opus 4.6$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
    Claude Opus 4.5$5 / MTok$6.25 / MTok$10 / MTok$0.50 / MTok$25 / MTok
    Claude Opus 4.1$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
    Claude Opus 4$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
    Claude Sonnet 4.6$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Sonnet 4.5$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Sonnet 4$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Sonnet 3.7 (deprecated)$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
    Claude Haiku 4.5$1 / MTok$1.25 / MTok$2 / MTok$0.10 / MTok$5 / MTok
    Claude Haiku 3.5$0.80 / MTok$1 / MTok$1.6 / MTok$0.08 / MTok$4 / MTok
    Claude Opus 3 (deprecated)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
    Claude Haiku 3$0.25 / MTok$0.30 / MTok$0.50 / MTok$0.03 / MTok$1.25 / MTok

    MTok = Milioni di token. La colonna "Base Input Tokens" mostra i prezzi di input standard, "Cache Writes" e "Cache Hits" sono specifici del prompt caching, e "Output Tokens" mostra i prezzi di output. Vedi prezzi del prompt caching di seguito per una spiegazione delle colonne della cache e dei moltiplicatori di prezzo.

    Opus 4.7 utilizza un nuovo tokenizer rispetto ai modelli precedenti, contribuendo alle sue prestazioni migliorate su un'ampia gamma di attività. Questo nuovo tokenizer può utilizzare fino al 35% più token per lo stesso testo fisso.

    Prezzi delle piattaforme di terze parti

    I modelli Claude sono disponibili su AWS Bedrock, Google Vertex AI, e Microsoft Foundry. Per i prezzi ufficiali, visita:

    • Prezzi di AWS Bedrock
    • Prezzi di Google Vertex AI
    • Prezzi di Microsoft Foundry

    Prezzi degli endpoint regionali e multi-region per i modelli Claude 4.5 e successivi

    A partire da Claude Sonnet 4.5 e Haiku 4.5:

    • AWS Bedrock offre due tipi di endpoint: endpoint globali (routing dinamico per la massima disponibilità) e endpoint regionali (routing dati garantito attraverso regioni geografiche specifiche).
    • Google Vertex AI offre tre tipi di endpoint: endpoint globali, endpoint multi-region (routing dinamico all'interno di un'area geografica), e endpoint regionali.

    Gli endpoint regionali e multi-region includono un premio del 10% rispetto agli endpoint globali. L'API Claude (1P) è globale per impostazione predefinita; per le opzioni di residenza dei dati 1P e i prezzi, vedi Prezzi della residenza dei dati di seguito.

    Ambito: Questa struttura di prezzo si applica a Claude Sonnet 4.5, Haiku 4.5 e a tutti i modelli futuri. I modelli precedenti (Claude Sonnet 4 (deprecato), Opus 4 (deprecato) e versioni precedenti) mantengono i loro prezzi esistenti.

    Per i dettagli di implementazione e gli esempi di codice:

    • Endpoint globali vs regionali di AWS Bedrock
    • Endpoint globali, multi-region e regionali di Google Vertex AI

    Prezzi specifici delle funzionalità

    Prompt caching

    Il prompt caching riduce i costi e la latenza riutilizzando le porzioni precedentemente elaborate del tuo prompt tra le chiamate API. Invece di rielaborare lo stesso grande prompt di sistema, documento o cronologia della conversazione ad ogni richiesta, l'API legge dalla cache a una frazione del prezzo di input standard.

    Ci sono due modi per abilitare il prompt caching:

    • Caching automatico: Aggiungi un singolo campo cache_control al livello superiore della tua richiesta. Il sistema gestisce automaticamente i punti di interruzione della cache man mano che le conversazioni crescono. Questo è il punto di partenza consigliato per la maggior parte dei casi d'uso.
    • Punti di interruzione della cache espliciti: Posiziona cache_control direttamente su singoli blocchi di contenuto per un controllo granulare su esattamente cosa viene memorizzato nella cache.

    Il prompt caching utilizza i seguenti moltiplicatori di prezzo relativi alle tariffe di token di input di base:

    Operazione di cacheMoltiplicatoreDurata
    Scrittura cache di 5 minuti1,25x prezzo di input di baseCache valida per 5 minuti
    Scrittura cache di 1 ora2x prezzo di input di baseCache valida per 1 ora
    Lettura cache (hit)0,1x prezzo di input di baseStessa durata della scrittura precedente

    I token di scrittura della cache vengono addebitati quando il contenuto viene archiviato per la prima volta. I token di lettura della cache vengono addebitati quando una richiesta successiva recupera il contenuto memorizzato nella cache. Un hit della cache costa il 10% del prezzo di input standard, il che significa che il caching si ripaga dopo solo una lettura della cache per la durata di 5 minuti (1,25x scrittura), o dopo due letture della cache per la durata di 1 ora (2x scrittura).

    Questi moltiplicatori si sommano con altri modificatori di prezzo, incluso lo sconto dell'API Batch e la residenza dei dati.

    Per i dettagli di implementazione, i modelli supportati e gli esempi di codice, vedi la documentazione del prompt caching.

    Prezzi della residenza dei dati

    Per Claude Opus 4.7, Claude Opus 4.6 e i modelli più recenti, specificare l'inferenza solo negli Stati Uniti tramite il parametro inference_geo comporta un moltiplicatore di 1,1x su tutte le categorie di prezzi dei token, inclusi i token di input, i token di output, le scritture della cache e le letture della cache. Il routing globale (l'impostazione predefinita) utilizza i prezzi standard.

    Questo si applica solo all'API Claude (1P). Le piattaforme di terze parti hanno i loro propri prezzi regionali. Vedi AWS Bedrock e Google Vertex AI per i dettagli. I modelli precedenti mantengono i loro prezzi esistenti indipendentemente dalle impostazioni di inference_geo.

    Per ulteriori informazioni, vedi la documentazione sulla residenza dei dati.

    Prezzi della modalità veloce

    La modalità veloce (beta: anteprima di ricerca) per Claude Opus 4.6 fornisce output significativamente più veloce a prezzi premium (6x tariffe standard). I prezzi della modalità veloce si applicano all'intera finestra di contesto, incluse le richieste con oltre 200k token di input. Attualmente supportato su Opus 4.6:

    InputOutput
    $30 / MTok$150 / MTok

    I prezzi della modalità veloce si sommano con altri modificatori di prezzo:

    • I moltiplicatori del prompt caching si applicano in aggiunta ai prezzi della modalità veloce
    • I moltiplicatori della residenza dei dati si applicano in aggiunta ai prezzi della modalità veloce

    La modalità veloce non è disponibile con l'API Batch.

    Per ulteriori informazioni, vedi la documentazione sulla modalità veloce.

    Elaborazione batch

    L'API Batch consente l'elaborazione asincrona di grandi volumi di richieste con uno sconto del 50% sia sui token di input che di output.

    ModelBatch inputBatch output
    Claude Opus 4.7$2.50 / MTok$12.50 / MTok
    Claude Opus 4.6$2.50 / MTok$12.50 / MTok
    Claude Opus 4.5$2.50 / MTok$12.50 / MTok
    Claude Opus 4.1$7.50 / MTok$37.50 / MTok
    Claude Opus 4$7.50 / MTok$37.50 / MTok
    Claude Sonnet 4.6$1.50 / MTok$7.50 / MTok
    Claude Sonnet 4.5$1.50 / MTok$7.50 / MTok
    Claude Sonnet 4$1.50 / MTok$7.50 / MTok
    Claude Sonnet 3.7 (deprecated)$1.50 / MTok$7.50 / MTok
    Claude Haiku 4.5$0.50 / MTok$2.50 / MTok
    Claude Haiku 3.5$0.40 / MTok$2 / MTok
    Claude Opus 3 (deprecated)$7.50 / MTok$37.50 / MTok
    Claude Haiku 3$0.125 / MTok$0.625 / MTok

    Per ulteriori informazioni sull'elaborazione batch, vedi la documentazione sull'elaborazione batch.

    Prezzi del contesto lungo

    Claude Mythos Preview, Opus 4.7, Opus 4.6 e Sonnet 4.6 includono la finestra di contesto completa di 1M token ai prezzi standard. (Una richiesta di 900k token viene fatturata alla stessa tariffa per token di una richiesta di 9k token.) Gli sconti del prompt caching e dell'elaborazione batch si applicano alle tariffe standard su tutta la finestra di contesto.

    Prezzi dell'uso degli strumenti

    Tool use requests are priced based on:

    1. The total number of input tokens sent to the model (including in the tools parameter)
    2. The number of output tokens generated
    3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

    Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

    The additional tokens from tool use come from:

    • The tools parameter in API requests (tool names, descriptions, and schemas)
    • tool_use content blocks in API requests and responses
    • tool_result content blocks in API requests

    When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

    ModelTool choiceTool use system prompt token count
    Claude Opus 4.7auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Opus 4.6auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Opus 4.5auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Opus 4.1auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Opus 4auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 4.6auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 4.5auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 4auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Sonnet 3.7 (deprecated)auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Haiku 4.5auto, none
    any, tool
    346 tokens
    313 tokens
    Claude Haiku 3.5auto, none
    any, tool
    264 tokens
    340 tokens
    Claude Opus 3 (deprecated)auto, none
    any, tool
    530 tokens
    281 tokens
    Claude Sonnet 3auto, none
    any, tool
    159 tokens
    235 tokens
    Claude Haiku 3auto, none
    any, tool
    264 tokens
    340 tokens

    These token counts are added to your normal input and output tokens to calculate the total cost of a request.

    Per i prezzi attuali per modello, fai riferimento alla sezione prezzi dei modelli.

    Per ulteriori informazioni sull'implementazione dell'uso degli strumenti e le migliori pratiche, vedi la documentazione sull'uso degli strumenti.

    Prezzi di strumenti specifici

    Strumento Bash

    The bash tool adds 245 input tokens to your API calls.

    Additional tokens are consumed by:

    • Command outputs (stdout/stderr)
    • Error messages
    • Large file contents

    Vedi prezzi dell'uso degli strumenti per i dettagli completi dei prezzi.

    Strumento di esecuzione del codice

    Code execution is free when used with web search or web fetch. When web_search_20260209 or web_fetch_20260209 is included in your API request, there are no additional charges for code execution tool calls beyond the standard input and output token costs.

    When used without these tools, code execution is billed by execution time, tracked separately from token usage:

    • Execution time has a minimum of 5 minutes
    • Each organization receives 1,550 free hours of usage per month
    • Additional usage beyond 1,550 hours is billed at $0.05 per hour, per container
    • If files are included in the request, execution time is billed even if the tool is not invoked, due to files being preloaded onto the container

    Code execution usage is tracked in the response:

    "usage": {
      "input_tokens": 105,
      "output_tokens": 239,
      "server_tool_use": {
        "code_execution_requests": 1
      }
    }

    Strumento editor di testo

    The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you're using.

    In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

    ToolAdditional input tokens
    text_editor_20250429 (Claude 4.x)700 tokens
    text_editor_20250124 (Claude Sonnet 3.7 (deprecated))700 tokens

    Vedi prezzi dell'uso degli strumenti per i dettagli completi dei prezzi.

    Strumento di ricerca web

    Web search usage is charged in addition to token usage:

    "usage": {
      "input_tokens": 105,
      "output_tokens": 6039,
      "cache_read_input_tokens": 7123,
      "cache_creation_input_tokens": 7345,
      "server_tool_use": {
        "web_search_requests": 1
      }
    }

    Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.

    Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

    Strumento di recupero web

    Web fetch usage has no additional charges beyond standard token costs:

    "usage": {
      "input_tokens": 25039,
      "output_tokens": 931,
      "cache_read_input_tokens": 0,
      "cache_creation_input_tokens": 0,
      "server_tool_use": {
        "web_fetch_requests": 1
      }
    }

    The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context.

    To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.

    Example token usage for typical content:

    • Average web page (10 kB): ~2,500 tokens
    • Large documentation page (100 kB): ~25,000 tokens
    • Research paper PDF (500 kB): ~125,000 tokens

    Strumento di uso del computer

    Computer use follows the standard tool use pricing. When using the computer use tool:

    System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

    Computer use tool token usage:

    ModelInput tokens per tool definition
    Claude 4.x models735 tokens
    Claude Sonnet 3.7 (deprecated)735 tokens

    Additional token consumption:

    • Screenshot images (see Vision pricing)
    • Tool execution results returned to Claude

    If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

    Prezzi di Claude Managed Agents

    Claude Managed Agents viene fatturato su due dimensioni: token e runtime della sessione.

    Token

    Tutti i token consumati da una sessione di Claude Managed Agents vengono fatturati alle tariffe mostrate in Prezzi dei modelli sopra. I moltiplicatori del prompt caching si applicano in modo identico. La ricerca web attivata all'interno di una sessione comporta il costo standard di $10 per 1.000 ricerche.

    I seguenti modificatori dell'API Messages non si applicano alle sessioni di Claude Managed Agents:

    ModificatorePerché non si applica
    Sconto dell'API BatchLe sessioni sono stateful e interattive. Non c'è modalità batch.
    Premium della modalità veloceLa velocità di inferenza è gestita dal runtime.
    Moltiplicatore della residenza dei datiinference_geo è un campo di richiesta dell'API Messages.
    Premium del contesto lungoLa finestra di contesto è gestita dal runtime.
    Prezzi della piattaforma di terze partiClaude Managed Agents è disponibile solo tramite l'API Claude direttamente.

    Runtime della sessione

    SKUTariffaMisurazione
    Runtime della sessione$0,08 per ora di sessioneDurata dello stato running

    Il runtime viene misurato al millisecondo e si accumula solo mentre lo stato della sessione è running. Il tempo trascorso idle (in attesa del tuo prossimo messaggio o di una conferma dello strumento), rescheduling o terminated non conta verso il runtime.

    Il runtime della sessione sostituisce il modello di fatturazione per ore di contenitore del Code Execution quando si utilizza Claude Managed Agents. Non ti viene addebitato separatamente per le ore di contenitore in aggiunta al runtime della sessione.

    Esempio elaborato

    Una sessione di codifica di un'ora utilizzando Claude Opus 4.7 che consuma 50.000 token di input e 15.000 token di output:

    VoceCalcoloCosto
    Token di input50.000 × $5 / 1.000.000$0,25
    Token di output15.000 × $25 / 1.000.000$0,375
    Runtime della sessione1,0 ora × $0,08$0,08
    Totale$0,705

    Se il prompt caching è attivo e 40.000 dei token di input sono letture della cache:

    VoceCalcoloCosto
    Token di input non memorizzati nella cache10.000 × $5 / 1.000.000$0,05
    Token di lettura della cache40.000 × $5 × 0,1 / 1.000.000$0,02
    Token di output15.000 × $25 / 1.000.000$0,375
    Runtime della sessione1,0 ora × $0,08$0,08
    Totale$0,525

    Esempio di calcolo per l'elaborazione di 10.000 ticket di supporto:

    • Media di ~3.700 token per conversazione
    • Utilizzo di Claude Haiku 4.5 a $1/MTok di input, $5/MTok di output
    • Costo totale: ~$37,00 per 10.000 ticket

    Per una procedura dettagliata di questo calcolo, vedi la guida dell'agente di supporto clienti.

    Considerazioni di prezzo aggiuntive

    Strategie di ottimizzazione dei costi

    Quando costruisci agenti con Claude:

    1. Usa modelli appropriati: Scegli Haiku per attività semplici, Sonnet per ragionamento complesso
    2. Implementa il prompt caching: Riduci i costi per il contesto ripetuto
    3. Operazioni batch: Usa l'API Batch per attività non sensibili al tempo
    4. Monitora i modelli di utilizzo: Traccia il consumo di token per identificare opportunità di ottimizzazione

    Per applicazioni di agenti ad alto volume, contatta il team di vendita aziendale per accordi di prezzo personalizzati.

    Limiti di velocità

    I limiti di velocità variano in base al livello di utilizzo e influiscono su quante richieste puoi effettuare:

    • Tier 1: Utilizzo a livello di ingresso con limiti di base
    • Tier 2: Limiti aumentati per applicazioni in crescita
    • Tier 3: Limiti più alti per applicazioni consolidate
    • Tier 4: Limiti standard massimi
    • Enterprise: Limiti personalizzati disponibili

    Per informazioni dettagliate sui limiti di velocità, vedi la documentazione sui limiti di velocità.

    Per limiti di velocità più alti o accordi di prezzo personalizzati, contatta il team di vendita.

    Sconti per volume

    Gli sconti per volume possono essere disponibili per gli utenti ad alto volume. Questi vengono negoziati caso per caso.

    • I tier standard utilizzano i prezzi mostrati sopra
    • I clienti Enterprise possono contattare le vendite per prezzi personalizzati
    • Gli sconti accademici e di ricerca possono essere disponibili

    Prezzi Enterprise

    Per i clienti Enterprise con esigenze specifiche:

    • Limiti di velocità personalizzati
    • Sconti per volume
    • Supporto dedicato
    • Termini personalizzati

    Contatta il team di vendita all'indirizzo [email protected] o tramite la Claude Console per discutere le opzioni di prezzo Enterprise.

    Fatturazione e pagamento

    • La fatturazione si basa sull'utilizzo mensile effettivo
    • Tutti i pagamenti sono in USD
    • Opzioni di carta di credito e fatturazione disponibili
    • Tracciamento dell'utilizzo disponibile nella Claude Console

    Domande frequenti

    Come viene calcolato l'utilizzo dei token?

    I token sono pezzi di testo che i modelli elaborano. Come stima approssimativa, 1 token è approssimativamente 4 caratteri o 0,75 parole in inglese. Il conteggio esatto varia in base alla lingua e al tipo di contenuto.

    Ci sono tier gratuiti o prove?

    I nuovi utenti ricevono una piccola quantità di crediti gratuiti per testare l'API. Contatta le vendite per informazioni su prove estese per la valutazione aziendale.

    Come si sommano gli sconti?

    Gli sconti dell'API Batch e del prompt caching possono essere combinati. Ad esempio, l'utilizzo di entrambe le funzionalità insieme fornisce risparmi sui costi significativi rispetto alle chiamate API standard. Vedi prezzi del prompt caching per come i moltiplicatori interagiscono.

    Quali metodi di pagamento sono accettati?

    Le principali carte di credito sono accettate per gli account standard. I clienti Enterprise possono organizzare la fatturazione e altri metodi di pagamento.

    Per domande aggiuntive sui prezzi, contatta [email protected].

    Was this page helpful?

    • Prezzi dei modelli
    • Prezzi delle piattaforme di terze parti
    • Prezzi specifici delle funzionalità
    • Prompt caching
    • Prezzi della residenza dei dati
    • Prezzi della modalità veloce
    • Elaborazione batch
    • Prezzi del contesto lungo
    • Prezzi dell'uso degli strumenti
    • Prezzi di strumenti specifici
    • Prezzi di Claude Managed Agents
    • Token
    • Runtime della sessione
    • Esempio elaborato
    • Considerazioni di prezzo aggiuntive
    • Strategie di ottimizzazione dei costi
    • Limiti di velocità
    • Sconti per volume
    • Prezzi Enterprise
    • Fatturazione e pagamento
    • Domande frequenti