Loading...
    • Guida per sviluppatori
    • Riferimento API
    • MCP
    • Risorse
    • Note sulla versione
    Search...
    ⌘K
    Primi passi
    Introduzione a ClaudeAvvio rapido
    Modelli e prezzi
    Panoramica dei modelliScelta di un modelloNovità in Claude 4.6Guida alla migrazioneDeprecazioni dei modelliPrezzi
    Crea con Claude
    Panoramica delle funzioniUtilizzo dell'API MessagesGestione dei motivi di arrestoBest practice per i prompt
    Capacità del modello
    Extended thinkingAdaptive thinkingEffortFast mode (anteprima di ricerca)Output strutturatiCitazioniStreaming dei messaggiElaborazione batchSupporto PDFRisultati di ricercaSupporto multilingueEmbeddingsVision
    Strumenti
    PanoramicaCome implementare l'uso degli strumentiStrumento di ricerca webStrumento di recupero webStrumento di esecuzione del codiceStrumento di memoriaStrumento BashStrumento Computer useStrumento editor di testo
    Infrastruttura degli strumenti
    Ricerca strumentiChiamata programmatica degli strumentiStreaming granulare degli strumenti
    Gestione del contesto
    Finestre di contestoCompattazioneModifica del contestoPrompt cachingConteggio dei token
    File e risorse
    API Files
    Agent Skills
    PanoramicaAvvio rapidoBest practiceSkills per l'aziendaUtilizzo di Skills con l'API
    Agent SDK
    PanoramicaAvvio rapidoTypeScript SDKTypeScript V2 (anteprima)Python SDKGuida alla migrazione
    MCP nell'API
    Connettore MCPServer MCP remoti
    Claude su piattaforme di terze parti
    Amazon BedrockMicrosoft FoundryVertex AI
    Prompt engineering
    PanoramicaGeneratore di promptUsa modelli di promptMiglioratore di promptSii chiaro e direttoUsa esempi (multishot prompting)Lascia che Claude pensi (CoT)Usa tag XMLDai a Claude un ruolo (prompt di sistema)Concatena prompt complessiSuggerimenti per il contesto lungoSuggerimenti per extended thinking
    Test e valutazione
    Definisci criteri di successoSviluppa casi di testUtilizzo dello strumento di valutazioneRiduzione della latenza
    Rafforza i guardrail
    Riduci le allucinazioniAumenta la coerenza dell'outputMitiga i jailbreakStreaming dei rifiutiRiduci la perdita di promptMantieni Claude nel personaggio
    Amministrazione e monitoraggio
    Panoramica dell'API AdminResidenza dei datiWorkspaceAPI di utilizzo e costiAPI Claude Code AnalyticsZero Data Retention
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Claude su piattaforme di terze parti

    Claude su Vertex AI

    I modelli Claude di Anthropic sono ora generalmente disponibili tramite Vertex AI.

    L'API Vertex per accedere a Claude è quasi identica all'API Messages e supporta tutte le stesse opzioni, con due differenze fondamentali:

    • In Vertex, model non viene passato nel corpo della richiesta. Invece, viene specificato nell'URL dell'endpoint di Google Cloud.
    • In Vertex, anthropic_version viene passato nel corpo della richiesta (piuttosto che come intestazione) e deve essere impostato al valore vertex-2023-10-16.

    Vertex è supportato anche dagli SDK client ufficiali di Anthropic. Questa guida ti guiderà attraverso il processo di effettuazione di una richiesta a Claude su Vertex AI in Python o TypeScript.

    Nota che questa guida presuppone che tu abbia già un progetto GCP in grado di utilizzare Vertex AI. Vedi utilizzo dei modelli Claude 3 di Anthropic per ulteriori informazioni sulla configurazione richiesta, nonché una procedura dettagliata completa.

    Installa un SDK per accedere a Vertex AI

    Innanzitutto, installa l'SDK client di Anthropic per il linguaggio di tua scelta.

    Accesso a Vertex AI

    Disponibilità del modello

    Nota che la disponibilità del modello Anthropic varia in base alla regione. Cerca "Claude" in Vertex AI Model Garden oppure vai a Usa Claude 3 per le informazioni più recenti.

    ID modello API

    ModelloID modello API Vertex AI
    Claude Opus 4.6claude-opus-4-6
    Claude Sonnet 4.6claude-sonnet-4-6
    Claude Sonnet 4.5claude-sonnet-4-5@20250929
    Claude Sonnet 4claude-sonnet-4@20250514
    Claude Sonnet 3.7 ⚠️claude-3-7-sonnet@20250219
    Claude Opus 4.5claude-opus-4-5@20251101
    Claude Opus 4.1claude-opus-4-1@20250805
    Claude Opus 4claude-opus-4@20250514
    Claude Haiku 4.5claude-haiku-4-5@20251001
    Claude Haiku 3.5 ⚠️claude-3-5-haiku@20241022
    Claude Haiku 3claude-3-haiku@20240307

    Effettuazione di richieste

    Prima di eseguire le richieste, potrebbe essere necessario eseguire gcloud auth application-default login per autenticarsi con GCP.

    L'esempio seguente mostra come generare testo da Claude su Vertex AI:

    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "global"
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)

    Consulta i nostri SDK client e la documentazione ufficiale di Vertex AI per ulteriori dettagli.

    Claude è disponibile anche tramite Amazon Bedrock e Microsoft Foundry.

    Registrazione dell'attività

    Vertex fornisce un servizio di registrazione delle richieste-risposte che consente ai clienti di registrare i prompt e i completamenti associati al tuo utilizzo.

    Anthropic consiglia di registrare la tua attività su almeno una base mobile di 30 giorni per comprendere la tua attività e indagare su eventuali usi impropri.

    L'attivazione di questo servizio non dà a Google o Anthropic alcun accesso ai tuoi contenuti.

    Supporto delle funzionalità

    Puoi trovare tutte le funzionalità attualmente supportate su Vertex qui.

    Endpoint globali e regionali

    A partire da Claude Sonnet 4.5 e tutti i modelli futuri, Google Vertex AI offre due tipi di endpoint:

    • Endpoint globali: Routing dinamico per la massima disponibilità
    • Endpoint regionali: Routing dei dati garantito attraverso regioni geografiche specifiche

    Gli endpoint regionali includono un premio di prezzo del 10% rispetto agli endpoint globali.

    Questo si applica solo a Claude Sonnet 4.5 e ai modelli futuri. I modelli più vecchi (Claude Sonnet 4, Opus 4 e versioni precedenti) mantengono le loro strutture di prezzo esistenti.

    Quando utilizzare ciascuna opzione

    Endpoint globali (consigliato):

    • Forniscono la massima disponibilità e tempo di attività
    • Instradano dinamicamente le richieste alle regioni con capacità disponibile
    • Nessun premio di prezzo
    • Migliore per le applicazioni in cui la residenza dei dati è flessibile
    • Supporta solo il traffico pay-as-you-go (il throughput con provisioning richiede endpoint regionali)

    Endpoint regionali:

    • Instradano il traffico attraverso regioni geografiche specifiche
    • Richiesti per i requisiti di residenza dei dati e conformità
    • Supportano sia il traffico pay-as-you-go che il throughput con provisioning
    • Il premio di prezzo del 10% riflette i costi dell'infrastruttura per la capacità regionale dedicata

    Implementazione

    Utilizzo di endpoint globali (consigliato):

    Imposta il parametro region su "global" quando inizializzi il client:

    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "global"
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)

    Utilizzo di endpoint regionali:

    Specifica una regione specifica come "us-east1" o "europe-west1":

    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "us-east1"  # Specify a specific region
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)

    Risorse aggiuntive

    • Prezzi di Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
    • Documentazione dei modelli Claude: Claude su Vertex AI
    • Post del blog di Google: Endpoint globale per i modelli Claude
    • Dettagli sui prezzi di Anthropic: Documentazione sui prezzi

    Was this page helpful?

    • Installa un SDK per accedere a Vertex AI
    • Accesso a Vertex AI
    • Disponibilità del modello
    • Effettuazione di richieste
    • Registrazione dell'attività
    • Supporto delle funzionalità
    • Endpoint globali e regionali
    • Quando utilizzare ciascuna opzione
    • Implementazione
    • Risorse aggiuntive