Claude en plataformas de terceros

Claude en Vertex AI

Los modelos Claude de Anthropic ahora están disponibles de forma general a través de Vertex AI.

La API de Vertex para acceder a Claude es casi idéntica a la API de Mensajes y admite todas las mismas opciones, con dos diferencias clave:

En Vertex, model no se pasa en el cuerpo de la solicitud. En su lugar, se especifica en la URL del punto de conexión de Google Cloud.
En Vertex, anthropic_version se pasa en el cuerpo de la solicitud (en lugar de como encabezado), y debe establecerse en el valor vertex-2023-10-16.

Vertex también es compatible con los SDK de cliente oficiales de Anthropic. Esta guía te guiará a través del proceso de realizar una solicitud a Claude en Vertex AI en Python o TypeScript.

Tenga en cuenta que esta guía asume que ya tiene un proyecto de GCP que puede usar Vertex AI. Consulte usar los modelos Claude 3 de Anthropic para obtener más información sobre la configuración requerida, así como un tutorial completo.

Instalar un SDK para acceder a Vertex AI

Primero, instale el SDK de cliente de Anthropic para el lenguaje de su elección.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Acceso a Vertex AI

Disponibilidad de modelos

Tenga en cuenta que la disponibilidad del modelo Anthropic varía según la región. Busque "Claude" en el Vertex AI Model Garden o vaya a Usar Claude 3 para obtener la información más reciente.

ID de modelo de API

Modelo	ID de modelo de API de Vertex AI
Claude Sonnet 4.5	claude-sonnet-4-5@20250929
Claude Sonnet 4	claude-sonnet-4@20250514
Claude Sonnet 3.7 ⚠️	claude-3-7-sonnet@20250219
Claude Opus 4.5	claude-opus-4-5@20251101
Claude Opus 4.1	claude-opus-4-1@20250805
Claude Opus 4	claude-opus-4@20250514
Claude Opus 3 ⚠️	claude-3-opus@20240229
Claude Haiku 4.5	claude-haiku-4-5@20251001
Claude Haiku 3.5 ⚠️	claude-3-5-haiku@20241022
Claude Haiku 3	claude-3-haiku@20240307

Realizar solicitudes

Antes de ejecutar solicitudes, es posible que deba ejecutar gcloud auth application-default login para autenticarse con GCP.

El siguiente ejemplo muestra cómo generar texto desde Claude en Vertex AI:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Consulte nuestros SDK de cliente y la documentación oficial de Vertex AI para obtener más detalles.

Registro de actividad

Vertex proporciona un servicio de registro de solicitud-respuesta que permite a los clientes registrar los indicadores y las finalizaciones asociadas con su uso.

Anthropic recomienda que registre su actividad al menos en una base móvil de 30 días para comprender su actividad e investigar cualquier posible mal uso.

Activar este servicio no le da a Google ni a Anthropic acceso a su contenido.

Soporte de características

Puede encontrar todas las características actualmente compatibles en Vertex aquí.

Puntos de conexión globales frente a regionales

A partir de Claude Sonnet 4.5 y todos los modelos futuros, Google Vertex AI ofrece dos tipos de puntos de conexión:

Puntos de conexión globales: Enrutamiento dinámico para máxima disponibilidad
Puntos de conexión regionales: Enrutamiento de datos garantizado a través de regiones geográficas específicas

Los puntos de conexión regionales incluyen una prima de precios del 10% sobre los puntos de conexión globales.

Esto se aplica solo a Claude Sonnet 4.5 y modelos futuros. Los modelos más antiguos (Claude Sonnet 4, Opus 4 y anteriores) mantienen sus estructuras de precios existentes.

Cuándo usar cada opción

Puntos de conexión globales (recomendado):

Proporcionan máxima disponibilidad y tiempo de actividad
Enrutan dinámicamente las solicitudes a regiones con capacidad disponible
Sin prima de precios
Mejor para aplicaciones donde la residencia de datos es flexible
Solo admite tráfico de pago por uso (el rendimiento aprovisionado requiere puntos de conexión regionales)

Puntos de conexión regionales:

Enrutan el tráfico a través de regiones geográficas específicas
Requerido para requisitos de residencia de datos y cumplimiento normativo
Admiten tráfico de pago por uso y rendimiento aprovisionado
La prima de precios del 10% refleja los costos de infraestructura para la capacidad regional dedicada

Implementación

Usando puntos de conexión globales (recomendado):

Establezca el parámetro region en "global" al inicializar el cliente:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Usando puntos de conexión regionales:

Especifique una región específica como "us-east1" o "europe-west1":

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # Specify a specific region

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Recursos adicionales

Precios de Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
Documentación de modelos Claude: Claude en Vertex AI
Publicación del blog de Google: Punto de conexión global para modelos Claude
Detalles de precios de Anthropic: Documentación de precios

Claude en plataformas de terceros

Claude en Vertex AI

Los modelos Claude de Anthropic ahora están disponibles de forma general a través de Vertex AI.

La API de Vertex para acceder a Claude es casi idéntica a la API de Mensajes y admite todas las mismas opciones, con dos diferencias clave:

En Vertex, model no se pasa en el cuerpo de la solicitud. En su lugar, se especifica en la URL del punto de conexión de Google Cloud.
En Vertex, anthropic_version se pasa en el cuerpo de la solicitud (en lugar de como encabezado), y debe establecerse en el valor vertex-2023-10-16.

Vertex también es compatible con los SDK de cliente oficiales de Anthropic. Esta guía te guiará a través del proceso de realizar una solicitud a Claude en Vertex AI en Python o TypeScript.

Instalar un SDK para acceder a Vertex AI

Primero, instale el SDK de cliente de Anthropic para el lenguaje de su elección.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Acceso a Vertex AI

Disponibilidad de modelos

Tenga en cuenta que la disponibilidad del modelo Anthropic varía según la región. Busque "Claude" en el Vertex AI Model Garden o vaya a Usar Claude 3 para obtener la información más reciente.

ID de modelo de API

Modelo	ID de modelo de API de Vertex AI
Claude Sonnet 4.5	claude-sonnet-4-5@20250929
Claude Sonnet 4	claude-sonnet-4@20250514
Claude Sonnet 3.7 ⚠️	claude-3-7-sonnet@20250219
Claude Opus 4.5	claude-opus-4-5@20251101
Claude Opus 4.1	claude-opus-4-1@20250805
Claude Opus 4	claude-opus-4@20250514
Claude Opus 3 ⚠️	claude-3-opus@20240229
Claude Haiku 4.5	claude-haiku-4-5@20251001
Claude Haiku 3.5 ⚠️	claude-3-5-haiku@20241022
Claude Haiku 3	claude-3-haiku@20240307

Realizar solicitudes

Antes de ejecutar solicitudes, es posible que deba ejecutar gcloud auth application-default login para autenticarse con GCP.

El siguiente ejemplo muestra cómo generar texto desde Claude en Vertex AI:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Consulte nuestros SDK de cliente y la documentación oficial de Vertex AI para obtener más detalles.

Registro de actividad

Vertex proporciona un servicio de registro de solicitud-respuesta que permite a los clientes registrar los indicadores y las finalizaciones asociadas con su uso.

Anthropic recomienda que registre su actividad al menos en una base móvil de 30 días para comprender su actividad e investigar cualquier posible mal uso.

Activar este servicio no le da a Google ni a Anthropic acceso a su contenido.

Soporte de características

Puede encontrar todas las características actualmente compatibles en Vertex aquí.

Puntos de conexión globales frente a regionales

A partir de Claude Sonnet 4.5 y todos los modelos futuros, Google Vertex AI ofrece dos tipos de puntos de conexión:

Puntos de conexión globales: Enrutamiento dinámico para máxima disponibilidad
Puntos de conexión regionales: Enrutamiento de datos garantizado a través de regiones geográficas específicas

Los puntos de conexión regionales incluyen una prima de precios del 10% sobre los puntos de conexión globales.

Esto se aplica solo a Claude Sonnet 4.5 y modelos futuros. Los modelos más antiguos (Claude Sonnet 4, Opus 4 y anteriores) mantienen sus estructuras de precios existentes.

Cuándo usar cada opción

Puntos de conexión globales (recomendado):

Proporcionan máxima disponibilidad y tiempo de actividad
Enrutan dinámicamente las solicitudes a regiones con capacidad disponible
Sin prima de precios
Mejor para aplicaciones donde la residencia de datos es flexible
Solo admite tráfico de pago por uso (el rendimiento aprovisionado requiere puntos de conexión regionales)

Puntos de conexión regionales:

Enrutan el tráfico a través de regiones geográficas específicas
Requerido para requisitos de residencia de datos y cumplimiento normativo
Admiten tráfico de pago por uso y rendimiento aprovisionado
La prima de precios del 10% refleja los costos de infraestructura para la capacidad regional dedicada

Implementación

Usando puntos de conexión globales (recomendado):

Establezca el parámetro region en "global" al inicializar el cliente:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Usando puntos de conexión regionales:

Especifique una región específica como "us-east1" o "europe-west1":

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # Specify a specific region

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Recursos adicionales

Precios de Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
Documentación de modelos Claude: Claude en Vertex AI
Publicación del blog de Google: Punto de conexión global para modelos Claude
Detalles de precios de Anthropic: Documentación de precios