Claude en Vertex AI
La API de Vertex para acceder a Claude es casi idéntica a la API de Mensajes y admite todas las mismas opciones, con dos diferencias clave:
- En Vertex,
modelno se pasa en el cuerpo de la solicitud. En su lugar, se especifica en la URL del punto de conexión de Google Cloud. - En Vertex,
anthropic_versionse pasa en el cuerpo de la solicitud (en lugar de como encabezado) y debe establecerse en el valorvertex-2023-10-16.
Vertex también es compatible con los SDK de cliente oficiales de Anthropic. Esta guía te guiará a través del proceso de realizar una solicitud a Claude en Vertex AI en Python o TypeScript.
Ten en cuenta que esta guía asume que ya tienes un proyecto de GCP que puede usar Vertex AI. Consulta usar los modelos Claude 3 de Anthropic para obtener más información sobre la configuración requerida, así como un tutorial completo.
Instalar un SDK para acceder a Vertex AI
Primero, instala el SDK de cliente de Anthropic para el lenguaje de tu elección.
pip install -U google-cloud-aiplatform "anthropic[vertex]"npm install @anthropic-ai/vertex-sdkAcceder a Vertex AI
Disponibilidad de modelos
Ten en cuenta que la disponibilidad del modelo Anthropic varía según la región. Busca "Claude" en el Vertex AI Model Garden o ve a Usar Claude 3 para obtener la información más reciente.
ID de modelo de la API
| Modelo | ID de modelo de la API de Vertex AI |
|---|---|
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 | claude-3-7-sonnet@20250219 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 | claude-opus-4@20250514 |
| Claude Opus 3 | claude-3-opus@20240229 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 | claude-3-5-haiku@20241022 |
| Claude Haiku 3 | claude-3-haiku@20240307 |
Realizar solicitudes
Antes de ejecutar solicitudes, es posible que debas ejecutar gcloud auth application-default login para autenticarte con GCP.
Los siguientes ejemplos muestran cómo generar texto desde Claude en Vertex AI:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Consulta nuestros SDK de cliente y la documentación oficial de Vertex AI para obtener más detalles.
Registro de actividad
Vertex proporciona un servicio de registro de solicitud-respuesta que permite a los clientes registrar los mensajes y las finalizaciones asociados con tu uso.
Anthropic recomienda que registres tu actividad al menos en una base móvil de 30 días para comprender tu actividad e investigar cualquier posible mal uso.
Activar este servicio no le da a Google ni a Anthropic acceso a tu contenido.
Soporte de características
Puedes encontrar todas las características actualmente compatibles en Vertex aquí.
Puntos de conexión globales frente a regionales
A partir de Claude Sonnet 4.5 y todos los modelos futuros, Google Vertex AI ofrece dos tipos de puntos de conexión:
- Puntos de conexión globales: Enrutamiento dinámico para máxima disponibilidad
- Puntos de conexión regionales: Enrutamiento de datos garantizado a través de regiones geográficas específicas
Los puntos de conexión regionales incluyen una prima de precios del 10% sobre los puntos de conexión globales.
Esto se aplica solo a Claude Sonnet 4.5 y modelos futuros. Los modelos más antiguos (Claude Sonnet 4, Opus 4 y anteriores) mantienen sus estructuras de precios existentes.
Cuándo usar cada opción
Puntos de conexión globales (recomendado):
- Proporcionan máxima disponibilidad y tiempo de actividad
- Enrutan dinámicamente las solicitudes a regiones con capacidad disponible
- Sin prima de precios
- Mejor para aplicaciones donde la residencia de datos es flexible
- Solo admite tráfico de pago por uso (el rendimiento aprovisionado requiere puntos de conexión regionales)
Puntos de conexión regionales:
- Enrutan el tráfico a través de regiones geográficas específicas
- Requerido para requisitos de residencia de datos y cumplimiento normativo
- Admiten tanto tráfico de pago por uso como rendimiento aprovisionado
- La prima de precios del 10% refleja los costos de infraestructura para la capacidad regional dedicada
Implementación
Usando puntos de conexión globales (recomendado):
Establece el parámetro region en "global" al inicializar el cliente:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Usando puntos de conexión regionales:
Especifica una región específica como "us-east1" o "europe-west1":
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Recursos adicionales
- Precios de Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
- Documentación de modelos Claude: Claude en Vertex AI
- Publicación del blog de Google: Punto de conexión global para modelos Claude
- Detalles de precios de Anthropic: Documentación de precios