Loading...
    • Guia do Desenvolvedor
    • Referência da API
    • MCP
    • Recursos
    • Notas de lançamento
    Search...
    ⌘K
    Primeiros passos
    Introdução ao ClaudeInício rápido
    Modelos e preços
    Visão geral dos modelosEscolhendo um modeloNovidades no Claude 4.5Migrando para Claude 4.5Descontinuação de modelosPreços
    Construir com Claude
    Visão geral de recursosUsando a API MessagesJanelas de contextoMelhores práticas de prompting
    Capacidades
    Cache de promptEdição de contextoPensamento estendidoEsforçoStreaming de mensagensProcessamento em loteCitaçõesSuporte multilíngueContagem de tokensEmbeddingsVisãoSuporte a PDFAPI de arquivosResultados de buscaSaídas estruturadasComplemento Google Sheets
    Ferramentas
    Visão geralComo implementar o uso de ferramentasUso eficiente de ferramentas em tokensStreaming de ferramentas granularFerramenta BashFerramenta de execução de códigoChamada de ferramentas programáticaFerramenta de uso de computadorFerramenta de editor de textoFerramenta de busca na webFerramenta de pesquisa na webFerramenta de memóriaFerramenta de busca de ferramentas
    Habilidades do agente
    Visão geralInício rápidoMelhores práticasUsando habilidades com a API
    SDK do agente
    Visão geralSDK TypeScriptSDK PythonGuia de migração
    Guias
    Entrada de streamingTratamento de permissõesGerenciamento de sessãoSaídas estruturadas no SDKHospedando o SDK do agenteModificando prompts do sistemaMCP no SDKFerramentas personalizadasSubagentos no SDKComandos de barra no SDKHabilidades do agente no SDKRastreando custos e usoListas de tarefasPlugins no SDK
    MCP na API
    Conector MCPServidores MCP remotos
    Claude em plataformas de terceiros
    Amazon BedrockMicrosoft FoundryVertex AI
    Engenharia de prompts
    Visão geralGerador de promptsUsar modelos de promptsMelhorador de promptsSeja claro e diretoUse exemplos (prompting multisshot)Deixe Claude pensar (CoT)Use tags XMLDê um papel ao Claude (prompts do sistema)Preencha previamente a resposta do ClaudeEncadeie prompts complexosDicas de contexto longoDicas de pensamento estendido
    Testar e avaliar
    Definir critérios de sucessoDesenvolver casos de testeUsando a ferramenta de avaliaçãoReduzindo latência
    Fortalecer proteções
    Reduzir alucinaçõesAumentar consistência de saídaMitigar ataques de jailbreakRecusas de streamingReduzir vazamento de promptManter Claude em personagem
    Administração e monitoramento
    Visão geral da API de administraçãoAPI de uso e custoAPI de análise do Claude Code
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Claude em plataformas de terceiros

    Claude no Vertex AI

    Os modelos Claude da Anthropic agora estão geralmente disponíveis através do Vertex AI.

    A API do Vertex para acessar Claude é quase idêntica à API de Mensagens e suporta todas as mesmas opções, com duas diferenças principais:

    • No Vertex, model não é passado no corpo da solicitação. Em vez disso, é especificado na URL do endpoint do Google Cloud.
    • No Vertex, anthropic_version é passado no corpo da solicitação (em vez de como um cabeçalho), e deve ser definido para o valor vertex-2023-10-16.

    O Vertex também é suportado pelos SDKs de cliente oficiais da Anthropic. Este guia o orientará através do processo de fazer uma solicitação ao Claude no Vertex AI em Python ou TypeScript.

    Observe que este guia pressupõe que você já tenha um projeto GCP que possa usar o Vertex AI. Consulte usando os modelos Claude 3 da Anthropic para obter mais informações sobre a configuração necessária, bem como um passo a passo completo.

    Instale um SDK para acessar o Vertex AI

    Primeiro, instale o SDK de cliente da Anthropic para a linguagem de sua escolha.

    pip install -U google-cloud-aiplatform "anthropic[vertex]"

    Acessando o Vertex AI

    Disponibilidade de Modelos

    Observe que a disponibilidade do modelo Anthropic varia por região. Procure por "Claude" no Vertex AI Model Garden ou acesse Usar Claude 3 para obter as informações mais recentes.

    IDs de modelo da API

    ModeloID do modelo da API do Vertex AI
    Claude Sonnet 4.5claude-sonnet-4-5@20250929
    Claude Sonnet 4claude-sonnet-4@20250514
    Claude Sonnet 3.7 ⚠️claude-3-7-sonnet@20250219
    Claude Opus 4.5claude-opus-4-5@20251101
    Claude Opus 4.1claude-opus-4-1@20250805
    Claude Opus 4claude-opus-4@20250514
    Claude Opus 3 ⚠️claude-3-opus@20240229
    Claude Haiku 4.5claude-haiku-4-5@20251001
    Claude Haiku 3.5claude-3-5-haiku@20241022
    Claude Haiku 3claude-3-haiku@20240307

    Fazendo solicitações

    Antes de executar solicitações, você pode precisar executar gcloud auth application-default login para autenticar com o GCP.

    O exemplo a seguir mostra como gerar texto do Claude no Vertex AI:

    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "global"
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-sonnet-4-5@20250929",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)

    Consulte nossos SDKs de cliente e a documentação oficial do Vertex AI para obter mais detalhes.

    Registro de atividades

    O Vertex fornece um serviço de registro de solicitação-resposta que permite aos clientes registrar os prompts e conclusões associados ao seu uso.

    A Anthropic recomenda que você registre sua atividade em pelo menos uma base móvel de 30 dias para entender sua atividade e investigar qualquer possível uso indevido.

    Ativar este serviço não dá ao Google ou à Anthropic nenhum acesso ao seu conteúdo.

    Suporte de recursos

    Você pode encontrar todos os recursos atualmente suportados no Vertex aqui.

    Endpoints globais vs regionais

    A partir de Claude Sonnet 4.5 e todos os modelos futuros, o Google Vertex AI oferece dois tipos de endpoint:

    • Endpoints globais: Roteamento dinâmico para máxima disponibilidade
    • Endpoints regionais: Roteamento de dados garantido através de regiões geográficas específicas

    Os endpoints regionais incluem um prêmio de preço de 10% sobre os endpoints globais.

    Isto se aplica apenas ao Claude Sonnet 4.5 e modelos futuros. Modelos mais antigos (Claude Sonnet 4, Opus 4 e anteriores) mantêm suas estruturas de preço existentes.

    Quando usar cada opção

    Endpoints globais (recomendado):

    • Fornecem máxima disponibilidade e tempo de atividade
    • Roteiam dinamicamente solicitações para regiões com capacidade disponível
    • Sem prêmio de preço
    • Melhor para aplicações onde a residência de dados é flexível
    • Suporta apenas tráfego de pagamento conforme o uso (throughput provisionado requer endpoints regionais)

    Endpoints regionais:

    • Roteiam tráfego através de regiões geográficas específicas
    • Necessários para requisitos de residência de dados e conformidade
    • Suportam tráfego de pagamento conforme o uso e throughput provisionado
    • Prêmio de preço de 10% reflete custos de infraestrutura para capacidade regional dedicada

    Implementação

    Usando endpoints globais (recomendado):

    Defina o parâmetro region para "global" ao inicializar o cliente:

    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "global"
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-sonnet-4-5@20250929",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)

    Usando endpoints regionais:

    Especifique uma região específica como "us-east1" ou "europe-west1":

    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "us-east1"  # Specify a specific region
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-sonnet-4-5@20250929",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)

    Recursos adicionais

    • Preços do Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
    • Documentação dos modelos Claude: Claude no Vertex AI
    • Postagem do blog do Google: Endpoint global para modelos Claude
    • Detalhes de preço da Anthropic: Documentação de preços
    • Instale um SDK para acessar o Vertex AI
    • Acessando o Vertex AI
    • Disponibilidade de Modelos
    • Fazendo solicitações
    • Registro de atividades
    • Suporte de recursos
    • Endpoints globais vs regionais
    • Quando usar cada opção
    • Implementação
    • Recursos adicionais