Claude em plataformas de terceiros

Claude no Vertex AI

Os modelos Claude da Anthropic agora estão geralmente disponíveis através do Vertex AI.

A API Vertex para acessar Claude é quase idêntica à API de Mensagens e suporta todas as mesmas opções, com duas diferenças principais:

No Vertex, model não é passado no corpo da solicitação. Em vez disso, é especificado na URL do endpoint do Google Cloud.
No Vertex, anthropic_version é passado no corpo da solicitação (em vez de como um cabeçalho), e deve ser definido para o valor vertex-2023-10-16.

O Vertex também é suportado pelos SDKs de cliente oficiais da Anthropic. Este guia o orientará no processo de fazer uma solicitação ao Claude no Vertex AI em Python ou TypeScript.

Observe que este guia assume que você já tem um projeto GCP que pode usar o Vertex AI. Consulte usando os modelos Claude 3 da Anthropic para obter mais informações sobre a configuração necessária, bem como um passo a passo completo.

Instale um SDK para acessar o Vertex AI

Primeiro, instale o SDK de cliente da Anthropic para a linguagem de sua escolha.

Acessando o Vertex AI

Disponibilidade de Modelos

Observe que a disponibilidade do modelo Anthropic varia por região. Procure por "Claude" no Vertex AI Model Garden ou acesse Usar Claude 3 para obter as informações mais recentes.

IDs de modelo da API

Modelo	ID do modelo da API Vertex AI
Claude Opus 4.6	claude-opus-4-6
Claude Sonnet 4.6	claude-sonnet-4-6
Claude Sonnet 4.5	claude-sonnet-4-5@20250929
Claude Sonnet 4	claude-sonnet-4@20250514
Claude Sonnet 3.7 ⚠️	claude-3-7-sonnet@20250219
Claude Opus 4.5	claude-opus-4-5@20251101
Claude Opus 4.1	claude-opus-4-1@20250805
Claude Opus 4	claude-opus-4@20250514
Claude Haiku 4.5	claude-haiku-4-5@20251001
Claude Haiku 3.5 ⚠️	claude-3-5-haiku@20241022
Claude Haiku 3	claude-3-haiku@20240307

Fazendo solicitações

Antes de executar solicitações, você pode precisar executar gcloud auth application-default login para autenticar com o GCP.

O exemplo a seguir mostra como gerar texto do Claude no Vertex AI:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Consulte nossos SDKs de cliente e a documentação oficial do Vertex AI para obter mais detalhes.

Claude também está disponível através do Amazon Bedrock e Microsoft Foundry.

Registro de atividades

O Vertex fornece um serviço de registro de solicitação-resposta que permite aos clientes registrar os prompts e conclusões associados ao seu uso.

A Anthropic recomenda que você registre sua atividade em pelo menos uma base móvel de 30 dias para entender sua atividade e investigar qualquer possível abuso.

Ativar este serviço não dá ao Google ou à Anthropic nenhum acesso ao seu conteúdo.

Suporte de recursos

Você pode encontrar todos os recursos atualmente suportados no Vertex aqui.

Endpoints globais vs regionais

A partir de Claude Sonnet 4.5 e todos os modelos futuros, o Google Vertex AI oferece dois tipos de endpoint:

Endpoints globais: Roteamento dinâmico para máxima disponibilidade
Endpoints regionais: Roteamento de dados garantido através de regiões geográficas específicas

Os endpoints regionais incluem um prêmio de preço de 10% sobre os endpoints globais.

Isso se aplica apenas ao Claude Sonnet 4.5 e modelos futuros. Modelos mais antigos (Claude Sonnet 4, Opus 4 e anteriores) mantêm suas estruturas de preço existentes.

Quando usar cada opção

Endpoints globais (recomendado):

Fornecem máxima disponibilidade e tempo de atividade
Roteiam dinamicamente solicitações para regiões com capacidade disponível
Sem prêmio de preço
Melhor para aplicações onde a residência de dados é flexível
Suporta apenas tráfego de pagamento conforme o uso (throughput provisionado requer endpoints regionais)

Endpoints regionais:

Roteiam tráfego através de regiões geográficas específicas
Necessários para requisitos de residência de dados e conformidade
Suportam tráfego de pagamento conforme o uso e throughput provisionado
Prêmio de preço de 10% reflete custos de infraestrutura para capacidade regional dedicada

Implementação

Usando endpoints globais (recomendado):

Defina o parâmetro region como "global" ao inicializar o cliente:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Usando endpoints regionais:

Especifique uma região específica como "us-east1" ou "europe-west1":

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # Specify a specific region

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Recursos adicionais

Preço do Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
Documentação dos modelos Claude: Claude no Vertex AI
Postagem do blog do Google: Endpoint global para modelos Claude
Detalhes de preço da Anthropic: Documentação de preço

Was this page helpful?

Claude em plataformas de terceiros

Claude no Vertex AI

Os modelos Claude da Anthropic agora estão geralmente disponíveis através do Vertex AI.

A API Vertex para acessar Claude é quase idêntica à API de Mensagens e suporta todas as mesmas opções, com duas diferenças principais:

No Vertex, model não é passado no corpo da solicitação. Em vez disso, é especificado na URL do endpoint do Google Cloud.
No Vertex, anthropic_version é passado no corpo da solicitação (em vez de como um cabeçalho), e deve ser definido para o valor vertex-2023-10-16.

O Vertex também é suportado pelos SDKs de cliente oficiais da Anthropic. Este guia o orientará no processo de fazer uma solicitação ao Claude no Vertex AI em Python ou TypeScript.

Instale um SDK para acessar o Vertex AI

Primeiro, instale o SDK de cliente da Anthropic para a linguagem de sua escolha.

Acessando o Vertex AI

Disponibilidade de Modelos

Observe que a disponibilidade do modelo Anthropic varia por região. Procure por "Claude" no Vertex AI Model Garden ou acesse Usar Claude 3 para obter as informações mais recentes.

IDs de modelo da API

Modelo	ID do modelo da API Vertex AI
Claude Opus 4.6	claude-opus-4-6
Claude Sonnet 4.6	claude-sonnet-4-6
Claude Sonnet 4.5	claude-sonnet-4-5@20250929
Claude Sonnet 4	claude-sonnet-4@20250514
Claude Sonnet 3.7 ⚠️	claude-3-7-sonnet@20250219
Claude Opus 4.5	claude-opus-4-5@20251101
Claude Opus 4.1	claude-opus-4-1@20250805
Claude Opus 4	claude-opus-4@20250514
Claude Haiku 4.5	claude-haiku-4-5@20251001
Claude Haiku 3.5 ⚠️	claude-3-5-haiku@20241022
Claude Haiku 3	claude-3-haiku@20240307

Fazendo solicitações

Antes de executar solicitações, você pode precisar executar gcloud auth application-default login para autenticar com o GCP.

O exemplo a seguir mostra como gerar texto do Claude no Vertex AI:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Consulte nossos SDKs de cliente e a documentação oficial do Vertex AI para obter mais detalhes.

Claude também está disponível através do Amazon Bedrock e Microsoft Foundry.

Registro de atividades

O Vertex fornece um serviço de registro de solicitação-resposta que permite aos clientes registrar os prompts e conclusões associados ao seu uso.

A Anthropic recomenda que você registre sua atividade em pelo menos uma base móvel de 30 dias para entender sua atividade e investigar qualquer possível abuso.

Ativar este serviço não dá ao Google ou à Anthropic nenhum acesso ao seu conteúdo.

Suporte de recursos

Você pode encontrar todos os recursos atualmente suportados no Vertex aqui.

Endpoints globais vs regionais

A partir de Claude Sonnet 4.5 e todos os modelos futuros, o Google Vertex AI oferece dois tipos de endpoint:

Endpoints globais: Roteamento dinâmico para máxima disponibilidade
Endpoints regionais: Roteamento de dados garantido através de regiões geográficas específicas

Os endpoints regionais incluem um prêmio de preço de 10% sobre os endpoints globais.

Isso se aplica apenas ao Claude Sonnet 4.5 e modelos futuros. Modelos mais antigos (Claude Sonnet 4, Opus 4 e anteriores) mantêm suas estruturas de preço existentes.

Quando usar cada opção

Endpoints globais (recomendado):

Fornecem máxima disponibilidade e tempo de atividade
Roteiam dinamicamente solicitações para regiões com capacidade disponível
Sem prêmio de preço
Melhor para aplicações onde a residência de dados é flexível
Suporta apenas tráfego de pagamento conforme o uso (throughput provisionado requer endpoints regionais)

Endpoints regionais:

Roteiam tráfego através de regiões geográficas específicas
Necessários para requisitos de residência de dados e conformidade
Suportam tráfego de pagamento conforme o uso e throughput provisionado
Prêmio de preço de 10% reflete custos de infraestrutura para capacidade regional dedicada

Implementação

Usando endpoints globais (recomendado):

Defina o parâmetro region como "global" ao inicializar o cliente:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Usando endpoints regionais:

Especifique uma região específica como "us-east1" ou "europe-west1":

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # Specify a specific region

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Recursos adicionais

Preço do Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
Documentação dos modelos Claude: Claude no Vertex AI
Postagem do blog do Google: Endpoint global para modelos Claude
Detalhes de preço da Anthropic: Documentação de preço

Was this page helpful?