Loading...
  • Construir
  • Admin
  • Modelos e preços
  • SDKs do cliente
  • Referência da API
Search...
⌘K
Log in
Vertex AI
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Admin/Plataformas de terceiros

Claude no Vertex AI

Os modelos Claude da Anthropic agora estão disponíveis em geral através do Vertex AI.

Was this page helpful?

  • Instale um SDK para acessar o Vertex AI
  • Acessando o Vertex AI
  • Disponibilidade de modelos
  • Fazendo solicitações
  • Registro de atividades
  • Suporte a recursos
  • Janela de contexto
  • Endpoints globais, multi-região e regionais
  • Quando usar cada opção
  • Implementação
  • Recursos adicionais

A API do Vertex para acessar Claude é quase idêntica à API de Mensagens e suporta todas as mesmas opções, com duas diferenças principais:

  • No Vertex, model não é passado no corpo da solicitação. Em vez disso, é especificado na URL do endpoint do Google Cloud.
  • No Vertex, anthropic_version é passado no corpo da solicitação (em vez de como um cabeçalho) e deve ser definido para o valor vertex-2023-10-16.

O Vertex também é suportado pelos SDKs de cliente oficiais da Anthropic. Este guia o orienta através de como fazer uma solicitação ao Claude no Vertex AI usando um dos SDKs de cliente da Anthropic.

Observe que este guia pressupõe que você já tenha um projeto GCP que possa usar o Vertex AI. Consulte usando os modelos Claude 3 da Anthropic para obter mais informações sobre a configuração necessária, bem como um passo a passo completo.

Instale um SDK para acessar o Vertex AI

Primeiro, instale o SDK de cliente da Anthropic para a linguagem de sua escolha.

Acessando o Vertex AI

Disponibilidade de modelos

Observe que a disponibilidade do modelo Anthropic varia por região. Procure por "Claude" no Vertex AI Model Garden ou acesse Use Claude 3 para obter as informações mais recentes.

IDs de modelo da API

ModeloID do modelo da API do Vertex AI
Claude Opus 4.7claude-opus-4-7
Claude Opus 4.6claude-opus-4-6
Claude Sonnet 4.6claude-sonnet-4-6
Claude Sonnet 4.5claude-sonnet-4-5@20250929
Claude Sonnet 4 ⚠️claude-sonnet-4@20250514
Claude Sonnet 3.7 ⚠️claude-3-7-sonnet@20250219
Claude Opus 4.5claude-opus-4-5@20251101
Claude Opus 4.1claude-opus-4-1@20250805
Claude Opus 4 ⚠️claude-opus-4@20250514
Claude Haiku 4.5claude-haiku-4-5@20251001

Fazendo solicitações

Antes de executar solicitações, você pode precisar executar gcloud auth application-default login para autenticar com o GCP.

Os exemplos a seguir mostram como gerar texto a partir do Claude no Vertex AI:

Consulte os SDKs de cliente e a documentação oficial do Vertex AI para obter mais detalhes.

Claude também está disponível através do Amazon Bedrock e Microsoft Foundry.

Registro de atividades

O Vertex fornece um serviço de registro de solicitação-resposta que permite aos clientes registrar os prompts e conclusões associados ao seu uso.

A Anthropic recomenda que você registre sua atividade em pelo menos uma base móvel de 30 dias para entender sua atividade e investigar qualquer possível uso indevido.

Ativar este serviço não dá ao Google ou à Anthropic nenhum acesso ao seu conteúdo.

Suporte a recursos

Para todos os recursos atualmente suportados no Vertex AI, consulte visão geral dos recursos da API.

Janela de contexto

Claude Opus 4.7, Claude Opus 4.6 e Claude Sonnet 4.6 têm uma janela de contexto de 1M de tokens no Vertex AI. Outros modelos Claude, incluindo Sonnet 4.5 e Sonnet 4 (descontinuado), têm uma janela de contexto de 200k tokens.

O Vertex AI limita cargas de solicitação a 30 MB. Ao enviar documentos grandes ou muitas imagens, você pode atingir este limite antes do limite de tokens.

Endpoints globais, multi-região e regionais

O Google Vertex AI oferece três tipos de endpoint:

  • Endpoints globais: Roteamento dinâmico para máxima disponibilidade
  • Endpoints multi-região: Roteamento dinâmico dentro de uma área geográfica (por exemplo, Estados Unidos ou União Europeia) para residência de dados com alta disponibilidade
  • Endpoints regionais: Roteamento de dados garantido através de regiões geográficas específicas

Os endpoints regionais e multi-região incluem um prêmio de preço de 10% sobre os endpoints globais.

Isto se aplica apenas ao Claude Sonnet 4.5 e modelos futuros. Modelos mais antigos (Claude Sonnet 4 (descontinuado), Opus 4 (descontinuado) e anteriores) mantêm suas estruturas de preço existentes.

Quando usar cada opção

Endpoints globais (recomendado):

  • Fornecem máxima disponibilidade e tempo de atividade
  • Roteiam dinamicamente solicitações para regiões com capacidade disponível
  • Sem prêmio de preço
  • Melhor para aplicações onde a residência de dados é flexível
  • Suporta apenas tráfego de pagamento conforme você usa (throughput provisionado requer endpoints regionais)

Endpoints multi-região:

  • Roteiam dinamicamente solicitações entre regiões dentro de uma área geográfica (atualmente us e eu)
  • Útil quando você precisa de residência de dados dentro de uma geografia ampla, mas deseja maior disponibilidade do que uma única região
  • Prêmio de preço de 10% sobre endpoints globais
  • Suporta apenas tráfego de pagamento conforme você usa (throughput provisionado requer endpoints regionais)

Endpoints regionais:

  • Roteiam tráfego através de regiões geográficas específicas
  • Necessários para residência de dados de região única, mandatos de conformidade rigorosos ou throughput provisionado
  • Suportam tráfego de pagamento conforme você usa e throughput provisionado
  • Prêmio de preço de 10% reflete custos de infraestrutura para capacidade regional dedicada

Implementação

Usando endpoints globais (recomendado):

Defina o parâmetro region para "global" ao inicializar o cliente:

Usando endpoints multi-região:

Defina o parâmetro region para um identificador multi-região: "us" para os Estados Unidos ou "eu" para a União Europeia. O SDK roteia solicitações para o endpoint multi-região correspondente (https://aiplatform.us.rep.googleapis.com ou https://aiplatform.eu.rep.googleapis.com), que equilibra dinamicamente o tráfego entre regiões dentro dessa geografia.

Usando endpoints regionais:

Especifique uma região específica como "us-east1" ou "europe-west1":

Claude Mythos Preview é uma visualização de pesquisa disponível para clientes convidados no Google Vertex AI. Para obter mais informações, consulte Project Glasswing.

Recursos adicionais

  • Preço do Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
  • Documentação de modelos Claude: Claude no Vertex AI
  • Postagem do blog do Google: Endpoint global para modelos Claude
  • Detalhes de preço da Anthropic: Documentação de preço
Claude Haiku 3.5 ⚠️claude-3-5-haiku@20241022
Claude Haiku 3 ⚠️claude-3-haiku@20240307
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us"  # Multi-region identifier: "us" or "eu"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # Specify a specific region

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)