L'API Vertex per accedere a Claude è quasi identica all'API Messages e supporta tutte le stesse opzioni, con due differenze chiave:
model non viene passato nel corpo della richiesta. Invece, viene specificato nell'URL dell'endpoint di Google Cloud.anthropic_version viene passato nel corpo della richiesta (piuttosto che come intestazione) e deve essere impostato al valore vertex-2023-10-16.Vertex è supportato anche dagli SDK client ufficiali di Anthropic. Questa guida ti guiderà attraverso il processo di effettuare una richiesta a Claude su Vertex AI in Python o TypeScript.
Nota che questa guida presuppone che tu abbia già un progetto GCP in grado di utilizzare Vertex AI. Vedi utilizzo dei modelli Claude 3 di Anthropic per ulteriori informazioni sulla configurazione richiesta, nonché una procedura dettagliata completa.
Per prima cosa, installa l'SDK client di Anthropic per il linguaggio di tua scelta.
pip install -U google-cloud-aiplatform "anthropic[vertex]"Nota che la disponibilità dei modelli Anthropic varia in base alla regione. Cerca "Claude" in Vertex AI Model Garden o vai a Usa Claude 3 per le informazioni più recenti.
| Modello | ID modello API Vertex AI |
|---|---|
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 ⚠️ | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 | claude-opus-4@20250514 |
| Claude Opus 3 ⚠️ | claude-3-opus@20240229 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 ⚠️ | claude-3-5-haiku@20241022 |
| Claude Haiku 3 | claude-3-haiku@20240307 |
Prima di eseguire le richieste, potrebbe essere necessario eseguire gcloud auth application-default login per autenticarsi con GCP.
I seguenti esempi mostrano come generare testo da Claude su Vertex AI:
Vedi i nostri SDK client e la documentazione ufficiale di Vertex AI per ulteriori dettagli.
Vertex fornisce un servizio di registrazione delle richieste-risposte che consente ai clienti di registrare i prompt e i completamenti associati al tuo utilizzo.
Anthropic consiglia di registrare la tua attività almeno su base mobile di 30 giorni per comprendere la tua attività e indagare su eventuali usi impropri.
L'attivazione di questo servizio non dà a Google o Anthropic alcun accesso ai tuoi contenuti.
Puoi trovare tutte le funzionalità attualmente supportate su Vertex qui.
A partire da Claude Sonnet 4.5 e tutti i modelli futuri, Google Vertex AI offre due tipi di endpoint:
Gli endpoint regionali includono un premio di prezzo del 10% rispetto agli endpoint globali.
Questo si applica solo a Claude Sonnet 4.5 e ai modelli futuri. I modelli più vecchi (Claude Sonnet 4, Opus 4 e versioni precedenti) mantengono le loro strutture di prezzo esistenti.
Endpoint globali (consigliato):
Endpoint regionali:
Utilizzo di endpoint globali (consigliato):
Imposta il parametro region su "global" quando inizializzi il client:
Utilizzo di endpoint regionali:
Specifica una regione specifica come "us-east1" o "europe-west1":
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)