Was this page helpful?
La API de Vertex para acceder a Claude es casi idéntica a la API de Mensajes y admite todas las mismas opciones, con dos diferencias clave:
model no se pasa en el cuerpo de la solicitud. En su lugar, se especifica en la URL del punto de conexión de Google Cloud.anthropic_version se pasa en el cuerpo de la solicitud (en lugar de como encabezado) y debe establecerse en el valor vertex-2023-10-16.Vertex también es compatible con los SDK de cliente oficiales de Anthropic. Esta guía te guiará a través del proceso de realizar una solicitud a Claude en Vertex AI en Python o TypeScript.
Ten en cuenta que esta guía asume que ya tienes un proyecto de GCP que puede usar Vertex AI. Consulta usando los modelos Claude 3 de Anthropic para obtener más información sobre la configuración requerida, así como un tutorial completo.
Primero, instala el SDK de cliente de Anthropic para tu lenguaje de programación preferido.
Ten en cuenta que la disponibilidad del modelo de Anthropic varía según la región. Busca "Claude" en el Vertex AI Model Garden o ve a Usar Claude 3 para obtener la información más reciente.
| Modelo | ID de modelo de API de Vertex AI |
|---|---|
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 ⚠️ | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 | claude-opus-4@20250514 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 ⚠️ | claude-3-5-haiku@20241022 |
| Claude Haiku 3 |
Antes de ejecutar solicitudes, es posible que debas ejecutar gcloud auth application-default login para autenticarte con GCP.
Los siguientes ejemplos muestran cómo generar texto desde Claude en Vertex AI:
Consulta nuestros SDK de cliente y la documentación oficial de Vertex AI para obtener más detalles.
Claude también está disponible a través de Amazon Bedrock y Microsoft Foundry.
Vertex proporciona un servicio de registro de solicitud-respuesta que permite a los clientes registrar los indicadores y las finalizaciones asociadas con tu uso.
Anthropic recomienda que registres tu actividad en al menos una base móvil de 30 días para comprender tu actividad e investigar cualquier posible mal uso.
Activar este servicio no le da a Google ni a Anthropic acceso a tu contenido.
Puedes encontrar todas las características actualmente compatibles en Vertex aquí.
A partir de Claude Sonnet 4.5 y todos los modelos futuros, Google Vertex AI ofrece dos tipos de puntos de conexión:
Los puntos de conexión regionales incluyen una prima de precios del 10% sobre los puntos de conexión globales.
Esto se aplica solo a Claude Sonnet 4.5 y modelos futuros. Los modelos más antiguos (Claude Sonnet 4, Opus 4 y anteriores) mantienen sus estructuras de precios existentes.
Puntos de conexión globales (recomendado):
Puntos de conexión regionales:
Usando puntos de conexión globales (recomendado):
Establece el parámetro region en "global" al inicializar el cliente:
Usando puntos de conexión regionales:
Especifica una región específica como "us-east1" o "europe-west1":
| claude-3-haiku@20240307 |
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-6",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-6",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-6",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)