Was this page helpful?
La API de Vertex para acceder a Claude es casi idéntica a la API de Messages y admite todas las mismas opciones, con dos diferencias clave:
model no se pasa en el cuerpo de la solicitud. En cambio, se especifica en la URL del endpoint de Google Cloud.anthropic_version se pasa en el cuerpo de la solicitud (en lugar de como encabezado), y debe establecerse en el valor vertex-2023-10-16.Vertex también es compatible con los SDK de cliente oficiales de Anthropic. Esta guía te explica cómo realizar una solicitud a Claude en Vertex AI utilizando uno de los SDK de cliente de Anthropic.
Ten en cuenta que esta guía asume que ya tienes un proyecto de GCP que puede usar Vertex AI. Consulta usar los modelos Claude 3 de Anthropic para obtener más información sobre la configuración requerida, así como un recorrido completo.
Primero, instala el SDK de cliente de Anthropic para el lenguaje de tu elección.
Ten en cuenta que la disponibilidad de los modelos de Anthropic varía según la región. Busca "Claude" en el Vertex AI Model Garden o ve a Usar Claude 3 para obtener la información más reciente.
| Modelo | ID de modelo de la API de Vertex AI |
|---|---|
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 ⚠️ | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 | claude-opus-4@20250514 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 ⚠️ | claude-3-5-haiku@20241022 |
| Claude Haiku 3 |
Antes de ejecutar solicitudes, es posible que necesites ejecutar gcloud auth application-default login para autenticarte con GCP.
Los siguientes ejemplos muestran cómo generar texto desde Claude en Vertex AI:
Consulta los SDK de cliente y la documentación oficial de Vertex AI para obtener más detalles.
Claude también está disponible a través de Amazon Bedrock y Microsoft Foundry.
Vertex proporciona un servicio de registro de solicitudes y respuestas que permite a los clientes registrar los prompts y las respuestas asociadas con tu uso.
Anthropic recomienda que registres tu actividad al menos en una base rotativa de 30 días para comprender tu actividad e investigar cualquier posible uso indebido.
Activar este servicio no le da a Google ni a Anthropic ningún acceso a tu contenido.
Para todas las funciones actualmente compatibles en Vertex AI, consulta la descripción general de funciones de la API.
Claude Opus 4.6 y Claude Sonnet 4.6 tienen una ventana de contexto de 1M de tokens en Vertex AI. Otros modelos Claude, incluidos Sonnet 4.5 y Sonnet 4, tienen una ventana de contexto de 200k tokens.
Vertex AI limita las cargas útiles de las solicitudes a 30 MB. Al enviar documentos grandes o muchas imágenes, es posible que alcances este límite antes del límite de tokens.
Google Vertex AI ofrece tres tipos de endpoints:
Los endpoints regionales y multirregionales incluyen un recargo del 10% sobre los endpoints globales.
Esto aplica solo a Claude Sonnet 4.5 y modelos futuros. Los modelos más antiguos (Claude Sonnet 4, Opus 4 y anteriores) mantienen sus estructuras de precios existentes.
Endpoints globales (recomendado):
Endpoints multirregionales:
us, con eu próximamente)Endpoints regionales:
Usando endpoints globales (recomendado):
Establece el parámetro region en "global" al inicializar el cliente:
Usando endpoints multirregionales:
Establece el parámetro region en un identificador multirregional como "us". El SDK enruta las solicitudes al endpoint multirregional (por ejemplo, https://aiplatform.us.rep.googleapis.com), que equilibra dinámicamente el tráfico entre regiones dentro de esa geografía.
Usando endpoints regionales:
Especifica una región específica como "us-east1" o "europe-west1":
Claude Mythos Preview es una vista previa de investigación disponible para clientes invitados en Google Vertex AI. Para obtener más información, consulta Project Glasswing.
| claude-3-haiku@20240307 |
MODEL_ID=claude-opus-4-6
LOCATION=global
PROJECT_ID=MY_PROJECT_ID
curl \
-X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://$LOCATION-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/anthropic/models/${MODEL_ID}:streamRawPredict -d \
'{
"anthropic_version": "vertex-2023-10-16",
"messages": [{
"role": "user",
"content": "Hey Claude!"
}],
"max_tokens": 100,
}'# El CLI ant aún no es compatible con Vertex AI.from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us" # Multirregional: enruta dentro de las regiones de EE. UU.
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-6",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)# El CLI ant aún no es compatible con Vertex AI.