Was this page helpful?
A API do Vertex para acessar Claude é quase idêntica à API de Mensagens e suporta todas as mesmas opções, com duas diferenças principais:
model não é passado no corpo da solicitação. Em vez disso, é especificado na URL do endpoint do Google Cloud.anthropic_version é passado no corpo da solicitação (em vez de como um cabeçalho) e deve ser definido para o valor vertex-2023-10-16.O Vertex também é suportado pelos SDKs de cliente oficiais da Anthropic. Este guia o orienta através de como fazer uma solicitação ao Claude no Vertex AI usando um dos SDKs de cliente da Anthropic.
Observe que este guia pressupõe que você já tenha um projeto GCP que possa usar o Vertex AI. Consulte usando os modelos Claude 3 da Anthropic para obter mais informações sobre a configuração necessária, bem como um passo a passo completo.
Primeiro, instale o SDK de cliente da Anthropic para a linguagem de sua escolha.
Observe que a disponibilidade do modelo Anthropic varia por região. Procure por "Claude" no Vertex AI Model Garden ou acesse Use Claude 3 para obter as informações mais recentes.
| Modelo | ID do modelo da API do Vertex AI |
|---|---|
| Claude Opus 4.7 | claude-opus-4-7 |
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 ⚠️ | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 ⚠️ | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 ⚠️ | claude-opus-4@20250514 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
Antes de executar solicitações, você pode precisar executar gcloud auth application-default login para autenticar com o GCP.
Os exemplos a seguir mostram como gerar texto a partir do Claude no Vertex AI:
Consulte os SDKs de cliente e a documentação oficial do Vertex AI para obter mais detalhes.
Claude também está disponível através do Amazon Bedrock e Microsoft Foundry.
O Vertex fornece um serviço de registro de solicitação-resposta que permite aos clientes registrar os prompts e conclusões associados ao seu uso.
A Anthropic recomenda que você registre sua atividade em pelo menos uma base móvel de 30 dias para entender sua atividade e investigar qualquer possível uso indevido.
Ativar este serviço não dá ao Google ou à Anthropic nenhum acesso ao seu conteúdo.
Para todos os recursos atualmente suportados no Vertex AI, consulte visão geral dos recursos da API.
Claude Opus 4.7, Claude Opus 4.6 e Claude Sonnet 4.6 têm uma janela de contexto de 1M de tokens no Vertex AI. Outros modelos Claude, incluindo Sonnet 4.5 e Sonnet 4 (descontinuado), têm uma janela de contexto de 200k tokens.
O Vertex AI limita cargas de solicitação a 30 MB. Ao enviar documentos grandes ou muitas imagens, você pode atingir este limite antes do limite de tokens.
O Google Vertex AI oferece três tipos de endpoint:
Os endpoints regionais e multi-região incluem um prêmio de preço de 10% sobre os endpoints globais.
Isto se aplica apenas ao Claude Sonnet 4.5 e modelos futuros. Modelos mais antigos (Claude Sonnet 4 (descontinuado), Opus 4 (descontinuado) e anteriores) mantêm suas estruturas de preço existentes.
Endpoints globais (recomendado):
Endpoints multi-região:
us e eu)Endpoints regionais:
Usando endpoints globais (recomendado):
Defina o parâmetro region para "global" ao inicializar o cliente:
Usando endpoints multi-região:
Defina o parâmetro region para um identificador multi-região: "us" para os Estados Unidos ou "eu" para a União Europeia. O SDK roteia solicitações para o endpoint multi-região correspondente (https://aiplatform.us.rep.googleapis.com ou https://aiplatform.eu.rep.googleapis.com), que equilibra dinamicamente o tráfego entre regiões dentro dessa geografia.
Usando endpoints regionais:
Especifique uma região específica como "us-east1" ou "europe-west1":
Claude Mythos Preview é uma visualização de pesquisa disponível para clientes convidados no Google Vertex AI. Para obter mais informações, consulte Project Glasswing.
| Claude Haiku 3.5 ⚠️ | claude-3-5-haiku@20241022 |
| Claude Haiku 3 ⚠️ | claude-3-haiku@20240307 |
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us" # Multi-region identifier: "us" or "eu"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)