Loading...
    • Construir
    • Administración
    • Modelos y precios
    • SDKs de cliente
    • Referencia de la API
    Search...
    ⌘K
    Administración
    Descripción general de la API de administraciónEspacios de trabajoResidencia de datosRetención de API y datos
    Monitoreo
    API de análisis de Claude CodeAPI de uso y costos
    Plataformas de terceros
    Amazon BedrockMicrosoft FoundryVertex AI
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Plataformas de terceros

    Claude en Vertex AI

    Los modelos Claude de Anthropic están ahora disponibles de forma general a través de Vertex AI.

    Was this page helpful?

    • Instalar un SDK para acceder a Vertex AI
    • Acceder a Vertex AI
    • Disponibilidad de modelos
    • Realizar solicitudes
    • Registro de actividad
    • Compatibilidad de funciones
    • Ventana de contexto
    • Endpoints globales, multirregionales y regionales
    • Cuándo usar cada opción
    • Implementación
    • Recursos adicionales

    La API de Vertex para acceder a Claude es casi idéntica a la API de Messages y admite todas las mismas opciones, con dos diferencias clave:

    • En Vertex, model no se pasa en el cuerpo de la solicitud. En cambio, se especifica en la URL del endpoint de Google Cloud.
    • En Vertex, anthropic_version se pasa en el cuerpo de la solicitud (en lugar de como encabezado), y debe establecerse en el valor vertex-2023-10-16.

    Vertex también es compatible con los SDK de cliente oficiales de Anthropic. Esta guía te explica cómo realizar una solicitud a Claude en Vertex AI utilizando uno de los SDK de cliente de Anthropic.

    Ten en cuenta que esta guía asume que ya tienes un proyecto de GCP que puede usar Vertex AI. Consulta usar los modelos Claude 3 de Anthropic para obtener más información sobre la configuración requerida, así como un recorrido completo.

    Instalar un SDK para acceder a Vertex AI

    Primero, instala el SDK de cliente de Anthropic para el lenguaje de tu elección.

    Acceder a Vertex AI

    Disponibilidad de modelos

    Ten en cuenta que la disponibilidad de los modelos de Anthropic varía según la región. Busca "Claude" en el Vertex AI Model Garden o ve a Usar Claude 3 para obtener la información más reciente.

    IDs de modelos de la API

    ModeloID de modelo de la API de Vertex AI
    Claude Opus 4.6claude-opus-4-6
    Claude Sonnet 4.6claude-sonnet-4-6
    Claude Sonnet 4.5claude-sonnet-4-5@20250929
    Claude Sonnet 4claude-sonnet-4@20250514
    Claude Sonnet 3.7 ⚠️claude-3-7-sonnet@20250219
    Claude Opus 4.5claude-opus-4-5@20251101
    Claude Opus 4.1claude-opus-4-1@20250805
    Claude Opus 4claude-opus-4@20250514
    Claude Haiku 4.5claude-haiku-4-5@20251001
    Claude Haiku 3.5 ⚠️claude-3-5-haiku@20241022
    Claude Haiku 3

    Realizar solicitudes

    Antes de ejecutar solicitudes, es posible que necesites ejecutar gcloud auth application-default login para autenticarte con GCP.

    Los siguientes ejemplos muestran cómo generar texto desde Claude en Vertex AI:

    Consulta los SDK de cliente y la documentación oficial de Vertex AI para obtener más detalles.

    Claude también está disponible a través de Amazon Bedrock y Microsoft Foundry.

    Registro de actividad

    Vertex proporciona un servicio de registro de solicitudes y respuestas que permite a los clientes registrar los prompts y las respuestas asociadas con tu uso.

    Anthropic recomienda que registres tu actividad al menos en una base rotativa de 30 días para comprender tu actividad e investigar cualquier posible uso indebido.

    Activar este servicio no le da a Google ni a Anthropic ningún acceso a tu contenido.

    Compatibilidad de funciones

    Para todas las funciones actualmente compatibles en Vertex AI, consulta la descripción general de funciones de la API.

    Ventana de contexto

    Claude Opus 4.6 y Claude Sonnet 4.6 tienen una ventana de contexto de 1M de tokens en Vertex AI. Otros modelos Claude, incluidos Sonnet 4.5 y Sonnet 4, tienen una ventana de contexto de 200k tokens.

    Vertex AI limita las cargas útiles de las solicitudes a 30 MB. Al enviar documentos grandes o muchas imágenes, es posible que alcances este límite antes del límite de tokens.

    Endpoints globales, multirregionales y regionales

    Google Vertex AI ofrece tres tipos de endpoints:

    • Endpoints globales: Enrutamiento dinámico para máxima disponibilidad
    • Endpoints multirregionales: Enrutamiento dinámico dentro de un área geográfica (por ejemplo, Estados Unidos) para residencia de datos con alta disponibilidad
    • Endpoints regionales: Enrutamiento de datos garantizado a través de regiones geográficas específicas

    Los endpoints regionales y multirregionales incluyen un recargo del 10% sobre los endpoints globales.

    Esto aplica solo a Claude Sonnet 4.5 y modelos futuros. Los modelos más antiguos (Claude Sonnet 4, Opus 4 y anteriores) mantienen sus estructuras de precios existentes.

    Cuándo usar cada opción

    Endpoints globales (recomendado):

    • Proporcionan máxima disponibilidad y tiempo de actividad
    • Enrutan dinámicamente las solicitudes a regiones con capacidad disponible
    • Sin recargo de precio
    • Ideal para aplicaciones donde la residencia de datos es flexible
    • Solo admite tráfico de pago por uso (el rendimiento aprovisionado requiere endpoints regionales)

    Endpoints multirregionales:

    • Enrutan dinámicamente las solicitudes entre regiones dentro de un área geográfica (actualmente us, con eu próximamente)
    • Útil cuando necesitas residencia de datos dentro de una geografía amplia pero deseas mayor disponibilidad que una sola región
    • Recargo del 10% sobre los endpoints globales
    • Solo admite tráfico de pago por uso (el rendimiento aprovisionado requiere endpoints regionales)

    Endpoints regionales:

    • Enrutan el tráfico a través de regiones geográficas específicas
    • Requeridos para residencia de datos en una sola región, mandatos de cumplimiento estrictos o rendimiento aprovisionado
    • Admiten tanto pago por uso como rendimiento aprovisionado
    • El recargo del 10% refleja los costos de infraestructura para capacidad regional dedicada

    Implementación

    Usando endpoints globales (recomendado):

    Establece el parámetro region en "global" al inicializar el cliente:

    Usando endpoints multirregionales:

    Establece el parámetro region en un identificador multirregional como "us". El SDK enruta las solicitudes al endpoint multirregional (por ejemplo, https://aiplatform.us.rep.googleapis.com), que equilibra dinámicamente el tráfico entre regiones dentro de esa geografía.

    Usando endpoints regionales:

    Especifica una región específica como "us-east1" o "europe-west1":

    Claude Mythos Preview es una vista previa de investigación disponible para clientes invitados en Google Vertex AI. Para obtener más información, consulta Project Glasswing.

    Recursos adicionales

    • Precios de Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
    • Documentación de modelos Claude: Claude en Vertex AI
    • Publicación del blog de Google: Endpoint global para modelos Claude
    • Detalles de precios de Anthropic: Documentación de precios
    ⚠️
    claude-3-haiku@20240307
    MODEL_ID=claude-opus-4-6
    LOCATION=global
    PROJECT_ID=MY_PROJECT_ID
    
    curl \
    -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    https://$LOCATION-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/anthropic/models/${MODEL_ID}:streamRawPredict -d \
    '{
      "anthropic_version": "vertex-2023-10-16",
      "messages": [{
        "role": "user",
        "content": "Hey Claude!"
      }],
      "max_tokens": 100,
    }'
    # El CLI ant aún no es compatible con Vertex AI.
    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "us"  # Multirregional: enruta dentro de las regiones de EE. UU.
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)
    # El CLI ant aún no es compatible con Vertex AI.