L'API Vertex pour accéder à Claude est presque identique à l'API Messages, avec deux différences clés dans le format de requête :
model n'est pas transmis dans le corps de la requête. Il est plutôt spécifié dans l'URL du point de terminaison Google Cloud.anthropic_version est transmis dans le corps de la requête (plutôt que comme en-tête), et doit être défini sur la valeur vertex-2023-10-16.Vertex est également pris en charge par les SDK clients officiels d'Anthropic. Ce guide vous accompagne dans l'envoi d'une requête à Claude sur Vertex AI en utilisant l'un des SDK clients d'Anthropic.
Notez que ce guide suppose que vous disposez déjà d'un projet GCP capable d'utiliser Vertex AI. Consultez Modèles Claude d'Anthropic sur Vertex AI pour plus d'informations sur la configuration requise et une présentation complète.
Tout d'abord, installez le SDK client d'Anthropic pour le langage de votre choix.
Notez que la disponibilité des modèles Anthropic varie selon la région. Recherchez « Claude » dans le Vertex AI Model Garden ou consultez Modèles Claude d'Anthropic pour obtenir les informations les plus récentes.
Les termes de cycle de vie (Obsolète, Retiré) sont définis dans Obsolescence des modèles. Les dates de cycle de vie sur les plateformes exploitées par des partenaires sont fixées par le partenaire et peuvent différer du calendrier de l'API Claude. Pour connaître la date de retrait actuelle de tout modèle sur Vertex AI, consultez la documentation Google Cloud pour les modèles Claude sur Vertex AI.
| Modèle | Identifiant de modèle API Vertex AI |
|---|---|
| Claude Fable 5 | claude-fable-5 |
| Claude Opus 4.8 | claude-opus-4-8 |
| Claude Opus 4.7 | claude-opus-4-7 |
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Sonnet 4 Obsolète. | claude-sonnet-4@20250514 |
| Claude Sonnet 3.7 Retiré. | claude-3-7-sonnet@20250219 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
| Claude Opus 4.1 Obsolète. | claude-opus-4-1@20250805 |
| Claude Opus 4 Obsolète. | claude-opus-4@20250514 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Haiku 3.5 Obsolète. | claude-3-5-haiku@20241022 |
Vous effectuez une mise à niveau vers un modèle Claude plus récent ? Dans Claude Code, exécutez /claude-api migrate pour appliquer les remplacements d'identifiants de modèle et les changements de paramètres incompatibles dans l'ensemble de votre base de code. La compétence détecte la plateforme cloud ciblée par votre code et ajuste les formats d'identifiants de modèle ainsi que les changements de fonctionnalités pour cette plateforme. Consultez Migration vers un modèle Claude plus récent.
Avant d'exécuter des requêtes, vous devrez peut-être exécuter gcloud auth application-default login pour vous authentifier auprès de GCP.
Les exemples suivants montrent comment générer du texte à partir de Claude sur Vertex AI :
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Consultez les SDK clients et la documentation officielle de Vertex AI pour plus de détails.
Claude est également disponible via Amazon Bedrock, Claude Platform sur AWS et Microsoft Foundry.
Le traitement des données pour cette offre est régi par Google Cloud Vertex AI. Pour plus de détails, consultez Vertex AI et la conservation zéro des données.
Vertex fournit un service de journalisation des requêtes et réponses qui permet aux clients de journaliser les prompts et les complétions associés à votre utilisation.
Anthropic recommande de journaliser votre activité sur une base glissante d'au moins 30 jours afin de comprendre votre activité et d'enquêter sur toute utilisation abusive potentielle.
L'activation de ce service ne donne à Google ni à Anthropic aucun accès à votre contenu.
Pour la liste complète des fonctionnalités avec leur disponibilité sur Vertex AI, consultez Vue d'ensemble des fonctionnalités.
fallbacks ; utilisez plutôt le modèle de repli côté client)Claude Fable 5, Claude Opus 4.8, Claude Opus 4.7, Claude Opus 4.6 et Claude Sonnet 4.6 disposent d'une « context window » (fenêtre de contexte) de 1 million de tokens sur Vertex AI. Les autres modèles Claude, y compris Sonnet 4.5 et Sonnet 4 (obsolète), disposent d'une fenêtre de contexte de 200 000 tokens.
Vertex AI limite les charges utiles de requête à 30 Mo. Lors de l'envoi de documents volumineux ou de nombreuses images, vous pouvez atteindre cette limite avant la limite de tokens.
Vertex AI propose trois types de points de terminaison :
Les points de terminaison régionaux et multirégionaux incluent un supplément tarifaire de 10 % par rapport aux points de terminaison globaux.
Cela s'applique uniquement à Claude Sonnet 4.5 et aux modèles ultérieurs. Les modèles plus anciens (Claude Sonnet 4 (obsolète), Opus 4 (obsolète) et antérieurs) conservent leurs structures tarifaires existantes.
Points de terminaison globaux (recommandés) :
Points de terminaison multirégionaux :
us et eu).Points de terminaison régionaux :
Utilisation des points de terminaison globaux (recommandé) :
Définissez le paramètre region sur "global" lors de l'initialisation du client :
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Utilisation des points de terminaison multirégionaux :
Définissez le paramètre region sur un identifiant multirégional : "us" pour les États-Unis ou "eu" pour l'Union européenne. Le SDK achemine les requêtes vers le point de terminaison multirégional correspondant (https://aiplatform.us.rep.googleapis.com ou https://aiplatform.eu.rep.googleapis.com), qui équilibre dynamiquement le trafic entre les régions au sein de cette zone géographique.
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us" # Multi-region identifier: "us" or "eu"
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Utilisation des points de terminaison régionaux :
Spécifiez une région précise comme "us-east1" ou "europe-west1" :
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "us-east1" # Specify a specific region
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=100,
messages=[
{
"role": "user",
"content": "Hey Claude!",
}
],
)
print(message)Claude Mythos Preview est un aperçu de recherche disponible pour les clients invités sur Vertex AI. Pour plus d'informations, consultez Project Glasswing.
Was this page helpful?