Was this page helpful?
L'API Vertex pour accéder à Claude est presque identique à l'API Messages et prend en charge toutes les mêmes options, avec deux différences clés :
model n'est pas transmis dans le corps de la requête. Au lieu de cela, il est spécifié dans l'URL du point de terminaison Google Cloud.anthropic_version est transmis dans le corps de la requête (plutôt que comme en-tête), et doit être défini sur la valeur vertex-2023-10-16.Vertex est également pris en charge par les SDK clients officiels d'Anthropic. Ce guide vous montre comment faire une requête à Claude sur Vertex AI en utilisant l'un des SDK clients d'Anthropic.
Notez que ce guide suppose que vous disposez déjà d'un projet GCP capable d'utiliser Vertex AI. Consultez utiliser les modèles Claude 3 d'Anthropic pour plus d'informations sur la configuration requise, ainsi qu'une procédure pas à pas complète.
Tout d'abord, installez le SDK client d'Anthropic pour le langage de votre choix.
Notez que la disponibilité des modèles Anthropic varie selon la région. Recherchez « Claude » dans le Vertex AI Model Garden ou allez à Utiliser Claude 3 pour les dernières informations.
| Modèle | ID de modèle API Vertex AI |
|---|---|
| Claude Opus 4.7 | claude-opus-4-7 |
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 ⚠️ | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 ⚠️ | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
| Claude Opus 4 ⚠️ | claude-opus-4@20250514 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
Avant d'exécuter les requêtes, vous devrez peut-être exécuter gcloud auth application-default login pour vous authentifier auprès de GCP.
Les exemples suivants montrent comment générer du texte à partir de Claude sur Vertex AI :
Consultez les SDK clients et la documentation officielle Vertex AI pour plus de détails.
Claude est également disponible via Amazon Bedrock et Microsoft Foundry.
Vertex fournit un service de journalisation des requêtes-réponses qui permet aux clients de journaliser les invites et les complétions associées à votre utilisation.
Anthropic recommande que vous journalisiez votre activité sur au moins une base glissante de 30 jours afin de comprendre votre activité et d'enquêter sur tout abus potentiel.
L'activation de ce service ne donne à Google ou à Anthropic aucun accès à votre contenu.
Pour toutes les fonctionnalités actuellement prises en charge sur Vertex AI, consultez Aperçu des fonctionnalités API.
Claude Opus 4.7, Claude Opus 4.6 et Claude Sonnet 4.6 ont une fenêtre de contexte de 1M tokens sur Vertex AI. Les autres modèles Claude, y compris Sonnet 4.5 et Sonnet 4 (déprécié), ont une fenêtre de contexte de 200k tokens.
Vertex AI limite les charges utiles des requêtes à 30 Mo. Lors de l'envoi de documents volumineux ou de nombreuses images, vous pouvez atteindre cette limite avant la limite de tokens.
Google Vertex AI offre trois types de points de terminaison :
Les points de terminaison régionaux et multi-régions incluent une prime tarifaire de 10 % par rapport aux points de terminaison globaux.
Ceci s'applique uniquement à Claude Sonnet 4.5 et aux modèles futurs. Les modèles plus anciens (Claude Sonnet 4 (déprécié), Opus 4 (déprécié) et antérieurs) conservent leurs structures tarifaires existantes.
Points de terminaison globaux (recommandé) :
Points de terminaison multi-régions :
us et eu)Points de terminaison régionaux :
Utilisation des points de terminaison globaux (recommandé) :
Définissez le paramètre region sur "global" lors de l'initialisation du client :
Utilisation des points de terminaison multi-régions :
Définissez le paramètre region sur un identifiant multi-région : "us" pour les États-Unis ou "eu" pour l'Union européenne. Le SDK achemine les requêtes vers le point de terminaison multi-région correspondant (https://aiplatform.us.rep.googleapis.com ou https://aiplatform.eu.rep.googleapis.com), qui équilibre dynamiquement le trafic entre les régions au sein de cette géographie.
Utilisation des points de terminaison régionaux :
Spécifiez une région spécifique comme "us-east1" ou "europe-west1" :
Claude Mythos Preview est une version de recherche disponible pour les clients invités sur Google Vertex AI. Pour plus d'informations, consultez Project Glasswing.
| Claude Haiku 3.5 ⚠️ |
| claude-3-5-haiku@20241022 |
| Claude Haiku 3 ⚠️ | claude-3-haiku@20240307 |
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us" # Multi-region identifier: "us" or "eu"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)