La API de Vertex para acceder a Claude es casi idéntica a la API de Mensajes y admite todas las mismas opciones, con dos diferencias clave:
model no se pasa en el cuerpo de la solicitud. En su lugar, se especifica en la URL del punto de conexión de Google Cloud.anthropic_version se pasa en el cuerpo de la solicitud (en lugar de como encabezado), y debe establecerse en el valor vertex-2023-10-16.Vertex también es compatible con los SDK de cliente oficiales de Anthropic. Esta guía te guiará a través del proceso de realizar una solicitud a Claude en Vertex AI en Python o TypeScript.
Tenga en cuenta que esta guía asume que ya tiene un proyecto de GCP que puede usar Vertex AI. Consulte usar los modelos Claude 3 de Anthropic para obtener más información sobre la configuración requerida, así como un tutorial completo.
Primero, instale el SDK de cliente de Anthropic para el lenguaje de su elección.
pip install -U google-cloud-aiplatform "anthropic[vertex]"Tenga en cuenta que la disponibilidad del modelo Anthropic varía según la región. Busque "Claude" en el Vertex AI Model Garden o vaya a Usar Claude 3 para obtener la información más reciente.
| Modelo | ID de modelo de API de Vertex AI |
|---|---|
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 ⚠️ | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 | claude-opus-4@20250514 |
| Claude Opus 3 ⚠️ | claude-3-opus@20240229 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 ⚠️ | claude-3-5-haiku@20241022 |
| Claude Haiku 3 | claude-3-haiku@20240307 |
Antes de ejecutar solicitudes, es posible que deba ejecutar gcloud auth application-default login para autenticarse con GCP.
El siguiente ejemplo muestra cómo generar texto desde Claude en Vertex AI:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Consulte nuestros SDK de cliente y la documentación oficial de Vertex AI para obtener más detalles.
Vertex proporciona un servicio de registro de solicitud-respuesta que permite a los clientes registrar los indicadores y las finalizaciones asociadas con su uso.
Anthropic recomienda que registre su actividad al menos en una base móvil de 30 días para comprender su actividad e investigar cualquier posible mal uso.
Activar este servicio no le da a Google ni a Anthropic acceso a su contenido.
Puede encontrar todas las características actualmente compatibles en Vertex aquí.
A partir de Claude Sonnet 4.5 y todos los modelos futuros, Google Vertex AI ofrece dos tipos de puntos de conexión:
Los puntos de conexión regionales incluyen una prima de precios del 10% sobre los puntos de conexión globales.
Esto se aplica solo a Claude Sonnet 4.5 y modelos futuros. Los modelos más antiguos (Claude Sonnet 4, Opus 4 y anteriores) mantienen sus estructuras de precios existentes.
Puntos de conexión globales (recomendado):
Puntos de conexión regionales:
Usando puntos de conexión globales (recomendado):
Establezca el parámetro region en "global" al inicializar el cliente:
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Usando puntos de conexión regionales:
Especifique una región específica como "us-east1" o "europe-west1":
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-sonnet-4-5@20250929",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)