L'API Vertex per accedere a Claude è quasi identica all'API Messages e supporta tutte le stesse opzioni, con due differenze fondamentali:
model non viene passato nel corpo della richiesta. Invece, viene specificato nell'URL dell'endpoint di Google Cloud.anthropic_version viene passato nel corpo della richiesta (piuttosto che come intestazione) e deve essere impostato al valore vertex-2023-10-16.Vertex è supportato anche dagli SDK client ufficiali di Anthropic. Questa guida ti guida attraverso l'esecuzione di una richiesta a Claude su Vertex AI utilizzando uno degli SDK client di Anthropic.
Nota che questa guida presuppone che tu abbia già un progetto GCP in grado di utilizzare Vertex AI. Vedi utilizzo dei modelli Claude 3 da Anthropic per ulteriori informazioni sulla configurazione richiesta, nonché una procedura dettagliata completa.
Innanzitutto, installa l'SDK client di Anthropic per il linguaggio di tua scelta.
Nota che la disponibilità dei modelli Anthropic varia in base alla regione. Cerca "Claude" in Vertex AI Model Garden oppure vai a Usa Claude 3 per le informazioni più recenti.
| Modello | ID modello API Vertex AI |
|---|---|
| Claude Opus 4.7 | claude-opus-4-7 |
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 ⚠️ | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 ⚠️ | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 ⚠️ | claude-opus-4@20250514 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 ⚠️ | claude-3-5-haiku@20241022 |
| Claude Haiku 3 ⚠️ | claude-3-haiku@20240307 |
Prima di eseguire le richieste, potrebbe essere necessario eseguire gcloud auth application-default login per autenticarsi con GCP.
I seguenti esempi mostrano come generare testo da Claude su Vertex AI:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Vedi gli SDK client e la documentazione ufficiale di Vertex AI per ulteriori dettagli.
Claude è disponibile anche tramite Amazon Bedrock e Microsoft Foundry.
Vertex fornisce un servizio di registrazione richiesta-risposta che consente ai clienti di registrare i prompt e i completamenti associati al tuo utilizzo.
Anthropic consiglia di registrare la tua attività su almeno una base mobile di 30 giorni per comprendere la tua attività e investigare qualsiasi potenziale uso improprio.
L'attivazione di questo servizio non dà a Google o Anthropic alcun accesso ai tuoi contenuti.
Per tutte le funzionalità attualmente supportate su Vertex AI, vedi Panoramica delle funzionalità API.
Claude Opus 4.7, Claude Opus 4.6 e Claude Sonnet 4.6 hanno una finestra di contesto di 1M token su Vertex AI. Gli altri modelli Claude, inclusi Sonnet 4.5 e Sonnet 4 (deprecato), hanno una finestra di contesto di 200k token.
Vertex AI limita i payload delle richieste a 30 MB. Quando invii documenti di grandi dimensioni o molte immagini, potresti raggiungere questo limite prima del limite di token.
Google Vertex AI offre tre tipi di endpoint:
Gli endpoint regionali e multi-region includono un premio di prezzo del 10% rispetto agli endpoint globali.
Questo si applica solo a Claude Sonnet 4.5 e ai modelli futuri. I modelli più vecchi (Claude Sonnet 4 (deprecato), Opus 4 (deprecato) e versioni precedenti) mantengono le loro strutture di prezzo esistenti.
Endpoint globali (consigliati):
Endpoint multi-region:
us e eu)Endpoint regionali:
Utilizzo di endpoint globali (consigliati):
Imposta il parametro region su "global" quando inizializzi il client:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Utilizzo di endpoint multi-region:
Imposta il parametro region su un identificatore multi-region: "us" per gli Stati Uniti o "eu" per l'Unione Europea. L'SDK instrada le richieste all'endpoint multi-region corrispondente (https://aiplatform.us.rep.googleapis.com o https://aiplatform.eu.rep.googleapis.com), che bilancia dinamicamente il traffico tra le regioni all'interno di quella geografia.
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us" # Multi-region identifier: "us" or "eu"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Utilizzo di endpoint regionali:
Specifica una regione specifica come "us-east1" o "europe-west1":
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Claude Mythos Preview è un'anteprima di ricerca disponibile per i clienti invitati su Google Vertex AI. Per ulteriori informazioni, vedi Project Glasswing.
Was this page helpful?