A API Vertex para acessar Claude é quase idêntica à API de Mensagens e suporta todas as mesmas opções, com duas diferenças principais:
model não é passado no corpo da solicitação. Em vez disso, é especificado na URL do endpoint do Google Cloud.anthropic_version é passado no corpo da solicitação (em vez de como um cabeçalho), e deve ser definido para o valor vertex-2023-10-16.O Vertex também é suportado pelos SDKs de cliente oficiais da Anthropic. Este guia o orientará através do processo de fazer uma solicitação para Claude no Vertex AI em Python ou TypeScript.
Observe que este guia assume que você já tem um projeto GCP que é capaz de usar Vertex AI. Consulte usando os modelos Claude 3 da Anthropic para obter mais informações sobre a configuração necessária, bem como um passo a passo completo.
Primeiro, instale o SDK de cliente da Anthropic para a linguagem de sua escolha.
pip install -U google-cloud-aiplatform "anthropic[vertex]"Observe que a disponibilidade de modelos Anthropic varia por região. Procure por "Claude" no Vertex AI Model Garden ou acesse Usar Claude 3 para obter as informações mais recentes.
| Modelo | ID do modelo da API Vertex AI |
|---|---|
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 ⚠️ | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 | claude-opus-4@20250514 |
| Claude Opus 3 ⚠️ | claude-3-opus@20240229 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 ⚠️ | claude-3-5-haiku@20241022 |
| Claude Haiku 3 | claude-3-haiku@20240307 |
Antes de executar solicitações, você pode precisar executar gcloud auth application-default login para autenticar com GCP.
O exemplo a seguir mostra como gerar texto a partir de Claude no Vertex AI:
Consulte nossos SDKs de cliente e a documentação oficial do Vertex AI para obter mais detalhes.
O Vertex fornece um serviço de registro de solicitação-resposta que permite aos clientes registrar os prompts e conclusões associados ao seu uso.
A Anthropic recomenda que você registre sua atividade em pelo menos uma base móvel de 30 dias para entender sua atividade e investigar qualquer possível uso indevido.
Ativar este serviço não dá ao Google ou à Anthropic nenhum acesso ao seu conteúdo.
Você pode encontrar todos os recursos atualmente suportados no Vertex aqui.
A partir de Claude Sonnet 4.5 e todos os modelos futuros, o Google Vertex AI oferece dois tipos de endpoint:
Os endpoints regionais incluem um prêmio de preço de 10% sobre os endpoints globais.
Isso se aplica apenas a Claude Sonnet 4.5 e modelos futuros. Modelos mais antigos (Claude Sonnet 4, Opus 4 e anteriores) mantêm suas estruturas de preço existentes.
Endpoints globais (recomendado):
Endpoints regionais:
Usando endpoints globais (recomendado):
Defina o parâmetro region para "global" ao inicializar o cliente:
Usando endpoints regionais:
Especifique uma região específica como "us-east1" ou "europe-west1":
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)