Loading...
    • Guía para desarrolladores
    • Referencia de API
    • MCP
    • Recursos
    • Notas de la versión
    Search...
    ⌘K
    Primeros pasos
    Introducción a ClaudeInicio rápido
    Modelos y precios
    Descripción general de modelosElegir un modeloNovedades en Claude 4.6Guía de migraciónModelos deprecadosPrecios
    Crear con Claude
    Descripción general de característicasUsar la API de MessagesManejar razones de paradaMejores prácticas de prompting
    Capacidades del modelo
    Extended thinkingAdaptive thinkingEsfuerzoModo rápido (vista previa de investigación)Salidas estructuradasCitasStreaming de MessagesProcesamiento por lotesSoporte de PDFResultados de búsquedaSoporte multilingüeEmbeddingsVisión
    Herramientas
    Descripción generalCómo implementar el uso de herramientasHerramienta de búsqueda webHerramienta de obtención webHerramienta de ejecución de códigoHerramienta de memoriaHerramienta BashHerramienta de uso de computadoraHerramienta de editor de texto
    Infraestructura de herramientas
    Búsqueda de herramientasLlamada de herramientas programáticaStreaming de herramientas de grano fino
    Gestión de contexto
    Ventanas de contextoCompactaciónEdición de contextoAlmacenamiento en caché de promptsConteo de tokens
    Archivos y activos
    API de archivos
    Agent Skills
    Descripción generalInicio rápidoMejores prácticasSkills para empresasUsar Skills con la API
    Agent SDK
    Descripción generalInicio rápidoTypeScript SDKTypeScript V2 (vista previa)Python SDKGuía de migración
    MCP en la API
    Conector MCPServidores MCP remotos
    Claude en plataformas de terceros
    Amazon BedrockMicrosoft FoundryVertex AI
    Ingeniería de prompts
    Descripción generalGenerador de promptsUsar plantillas de promptsMejorador de promptsSer claro y directoUsar ejemplos (prompting multishot)Dejar que Claude piense (CoT)Usar etiquetas XMLDar a Claude un rol (prompts del sistema)Encadenar prompts complejosConsejos de contexto largoConsejos de extended thinking
    Probar y evaluar
    Definir criterios de éxitoDesarrollar casos de pruebaUsar la herramienta de evaluaciónReducir latencia
    Fortalecer guardarraíles
    Reducir alucinacionesAumentar consistencia de salidaMitigar jailbreaksRechazos de streamingReducir fuga de promptsMantener a Claude en personaje
    Administración y monitoreo
    Descripción general de Admin APIResidencia de datosEspacios de trabajoAPI de uso y costosAPI de análisis de Claude CodeRetención de datos cero
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Claude en plataformas de terceros

    Claude en Vertex AI

    Los modelos Claude de Anthropic ahora están disponibles de forma general a través de Vertex AI.

    Was this page helpful?

    • Instala un SDK para acceder a Vertex AI
    • Accediendo a Vertex AI
    • Disponibilidad de Modelos
    • Realizando solicitudes
    • Registro de actividad
    • Soporte de características
    • Puntos de conexión globales frente a regionales
    • Cuándo usar cada opción
    • Implementación
    • Recursos adicionales

    La API de Vertex para acceder a Claude es casi idéntica a la API de Mensajes y admite todas las mismas opciones, con dos diferencias clave:

    • En Vertex, model no se pasa en el cuerpo de la solicitud. En su lugar, se especifica en la URL del punto de conexión de Google Cloud.
    • En Vertex, anthropic_version se pasa en el cuerpo de la solicitud (en lugar de como encabezado) y debe establecerse en el valor vertex-2023-10-16.

    Vertex también es compatible con los SDK de cliente oficiales de Anthropic. Esta guía te guiará a través del proceso de realizar una solicitud a Claude en Vertex AI en Python o TypeScript.

    Ten en cuenta que esta guía asume que ya tienes un proyecto de GCP que puede usar Vertex AI. Consulta usando los modelos Claude 3 de Anthropic para obtener más información sobre la configuración requerida, así como un tutorial completo.

    Instala un SDK para acceder a Vertex AI

    Primero, instala el SDK de cliente de Anthropic para tu lenguaje de programación preferido.

    Accediendo a Vertex AI

    Disponibilidad de Modelos

    Ten en cuenta que la disponibilidad del modelo de Anthropic varía según la región. Busca "Claude" en el Vertex AI Model Garden o ve a Usar Claude 3 para obtener la información más reciente.

    ID de modelo de API

    ModeloID de modelo de API de Vertex AI
    Claude Opus 4.6claude-opus-4-6
    Claude Sonnet 4.6claude-sonnet-4-6
    Claude Sonnet 4.5claude-sonnet-4-5@20250929
    Claude Sonnet 4claude-sonnet-4@20250514
    Claude Sonnet 3.7 ⚠️claude-3-7-sonnet@20250219
    Claude Opus 4.5claude-opus-4-5@20251101
    Claude Opus 4.1claude-opus-4-1@20250805
    Claude Opus 4claude-opus-4@20250514
    Claude Haiku 4.5claude-haiku-4-5@20251001
    Claude Haiku 3.5 ⚠️claude-3-5-haiku@20241022
    Claude Haiku 3

    Realizando solicitudes

    Antes de ejecutar solicitudes, es posible que debas ejecutar gcloud auth application-default login para autenticarte con GCP.

    Los siguientes ejemplos muestran cómo generar texto desde Claude en Vertex AI:

    Consulta nuestros SDK de cliente y la documentación oficial de Vertex AI para obtener más detalles.

    Claude también está disponible a través de Amazon Bedrock y Microsoft Foundry.

    Registro de actividad

    Vertex proporciona un servicio de registro de solicitud-respuesta que permite a los clientes registrar los indicadores y las finalizaciones asociadas con tu uso.

    Anthropic recomienda que registres tu actividad en al menos una base móvil de 30 días para comprender tu actividad e investigar cualquier posible mal uso.

    Activar este servicio no le da a Google ni a Anthropic acceso a tu contenido.

    Soporte de características

    Puedes encontrar todas las características actualmente compatibles en Vertex aquí.

    Puntos de conexión globales frente a regionales

    A partir de Claude Sonnet 4.5 y todos los modelos futuros, Google Vertex AI ofrece dos tipos de puntos de conexión:

    • Puntos de conexión globales: Enrutamiento dinámico para máxima disponibilidad
    • Puntos de conexión regionales: Enrutamiento de datos garantizado a través de regiones geográficas específicas

    Los puntos de conexión regionales incluyen una prima de precios del 10% sobre los puntos de conexión globales.

    Esto se aplica solo a Claude Sonnet 4.5 y modelos futuros. Los modelos más antiguos (Claude Sonnet 4, Opus 4 y anteriores) mantienen sus estructuras de precios existentes.

    Cuándo usar cada opción

    Puntos de conexión globales (recomendado):

    • Proporcionan máxima disponibilidad y tiempo de actividad
    • Enrutan dinámicamente las solicitudes a regiones con capacidad disponible
    • Sin prima de precios
    • Mejor para aplicaciones donde la residencia de datos es flexible
    • Solo admite tráfico de pago por uso (el rendimiento aprovisionado requiere puntos de conexión regionales)

    Puntos de conexión regionales:

    • Enrutan el tráfico a través de regiones geográficas específicas
    • Requerido para requisitos de residencia de datos y cumplimiento normativo
    • Admiten tanto tráfico de pago por uso como rendimiento aprovisionado
    • La prima de precios del 10% refleja los costos de infraestructura para la capacidad regional dedicada

    Implementación

    Usando puntos de conexión globales (recomendado):

    Establece el parámetro region en "global" al inicializar el cliente:

    Usando puntos de conexión regionales:

    Especifica una región específica como "us-east1" o "europe-west1":

    Recursos adicionales

    • Precios de Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
    • Documentación de modelos Claude: Claude en Vertex AI
    • Publicación del blog de Google: Punto de conexión global para modelos Claude
    • Detalles de precios de Anthropic: Documentación de precios
    claude-3-haiku@20240307
    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "global"
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)
    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "global"
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)
    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "us-east1"  # Specify a specific region
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)