• Messages
  • Agents gérés
  • Administration
Search...
⌘K
Premiers pas
Introduction à ClaudeDémarrage rapide
Développer avec Claude
Aperçu des fonctionnalitésUtilisation de l'API MessagesRaisons d'arrêt et repliRefus et repliCrédit de repli
Capacités du modèle
Réflexion étendueRéflexion adaptativeEffortBudgets de tâches (bêta)Mode rapide (aperçu de recherche)Sorties structuréesCitationsMessages en streamingTraitement par lotsRésultats de rechercheRefus en streamingPrise en charge multilingueEmbeddings
Outils
AperçuFonctionnement de l'utilisation d'outilsTutoriel : Créer un agent utilisant des outilsDéfinir des outilsGérer les appels d'outilsUtilisation d'outils en parallèleTool Runner (SDK)Utilisation d'outils stricteUtilisation d'outils avec mise en cache des promptsOutils serveurDépannageOutil de recherche webOutil de récupération webOutil d'exécution de codeOutil conseillerOutil de mémoireOutil BashOutil d'utilisation de l'ordinateurOutil d'éditeur de texte
Infrastructure des outils
Référence des outilsGérer le contexte des outilsCombinaisons d'outilsRecherche d'outilsAppel d'outils programmatiqueStreaming d'outils granulaire
Gestion du contexte
Fenêtres de contexteCompactageÉdition du contexteMise en cache des promptsMessages système en cours de conversationCréer un mode d'orchestrationDiagnostics de cache (bêta)Comptage de tokens
Travailler avec des fichiers
API FilesPrise en charge des PDFImages et vision
Compétences
AperçuDémarrage rapideBonnes pratiquesCompétences pour l'entrepriseCompétences dans l'API
MCP
Serveurs MCP distantsConnecteur MCP
Claude sur les plateformes cloud
Amazon BedrockAmazon Bedrock (ancienne version)Claude Platform sur AWSMicrosoft FoundryVertex AI
Log in
Vertex AI
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Messages/Claude sur les plateformes cloud

Claude sur Vertex AI

Les modèles Claude d'Anthropic sont disponibles via Vertex AI.

L'API Vertex pour accéder à Claude est presque identique à l'API Messages, avec deux différences clés dans le format de requête :

  • Dans Vertex, model n'est pas transmis dans le corps de la requête. Il est plutôt spécifié dans l'URL du point de terminaison Google Cloud.
  • Dans Vertex, anthropic_version est transmis dans le corps de la requête (plutôt que comme en-tête), et doit être défini sur la valeur vertex-2023-10-16.

Vertex est également pris en charge par les SDK clients officiels d'Anthropic. Ce guide vous accompagne dans l'envoi d'une requête à Claude sur Vertex AI en utilisant l'un des SDK clients d'Anthropic.

Notez que ce guide suppose que vous disposez déjà d'un projet GCP capable d'utiliser Vertex AI. Consultez Modèles Claude d'Anthropic sur Vertex AI pour plus d'informations sur la configuration requise et une présentation complète.

Installer un SDK pour accéder à Vertex AI

Tout d'abord, installez le SDK client d'Anthropic pour le langage de votre choix.

Accéder à Vertex AI

Disponibilité des modèles

Notez que la disponibilité des modèles Anthropic varie selon la région. Recherchez « Claude » dans le Vertex AI Model Garden ou consultez Modèles Claude d'Anthropic pour obtenir les informations les plus récentes.

Identifiants de modèle API

Les termes de cycle de vie (Obsolète, Retiré) sont définis dans Obsolescence des modèles. Les dates de cycle de vie sur les plateformes exploitées par des partenaires sont fixées par le partenaire et peuvent différer du calendrier de l'API Claude. Pour connaître la date de retrait actuelle de tout modèle sur Vertex AI, consultez la documentation Google Cloud pour les modèles Claude sur Vertex AI.

ModèleIdentifiant de modèle API Vertex AI
Claude Fable 5claude-fable-5
Claude Opus 4.8claude-opus-4-8
Claude Opus 4.7claude-opus-4-7
Claude Opus 4.6claude-opus-4-6
Claude Sonnet 4.6claude-sonnet-4-6
Claude Sonnet 4.5claude-sonnet-4-5@20250929
Claude Sonnet 4
Obsolète.
claude-sonnet-4@20250514
Claude Sonnet 3.7
Retiré.
claude-3-7-sonnet@20250219
Claude Opus 4.5claude-opus-4-5@20251101
Claude Opus 4.1
Obsolète.
claude-opus-4-1@20250805
Claude Opus 4
Obsolète.
claude-opus-4@20250514
Claude Haiku 4.5claude-haiku-4-5@20251001
Claude Haiku 3.5
Obsolète.
claude-3-5-haiku@20241022

Vous effectuez une mise à niveau vers un modèle Claude plus récent ? Dans Claude Code, exécutez /claude-api migrate pour appliquer les remplacements d'identifiants de modèle et les changements de paramètres incompatibles dans l'ensemble de votre base de code. La compétence détecte la plateforme cloud ciblée par votre code et ajuste les formats d'identifiants de modèle ainsi que les changements de fonctionnalités pour cette plateforme. Consultez Migration vers un modèle Claude plus récent.

Effectuer des requêtes

Avant d'exécuter des requêtes, vous devrez peut-être exécuter gcloud auth application-default login pour vous authentifier auprès de GCP.

Les exemples suivants montrent comment générer du texte à partir de Claude sur Vertex AI :

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Consultez les SDK clients et la documentation officielle de Vertex AI pour plus de détails.

Claude est également disponible via Amazon Bedrock, Claude Platform sur AWS et Microsoft Foundry.

Conservation des données

Le traitement des données pour cette offre est régi par Google Cloud Vertex AI. Pour plus de détails, consultez Vertex AI et la conservation zéro des données.

Journalisation de l'activité

Vertex fournit un service de journalisation des requêtes et réponses qui permet aux clients de journaliser les prompts et les complétions associés à votre utilisation.

Anthropic recommande de journaliser votre activité sur une base glissante d'au moins 30 jours afin de comprendre votre activité et d'enquêter sur toute utilisation abusive potentielle.

L'activation de ce service ne donne à Google ni à Anthropic aucun accès à votre contenu.

Prise en charge des fonctionnalités

Pour la liste complète des fonctionnalités avec leur disponibilité sur Vertex AI, consultez Vue d'ensemble des fonctionnalités.

Principales fonctionnalités prises en charge

  • API Messages
  • Mise en cache des prompts
  • Réflexion étendue
  • Utilisation d'outils, y compris l'outil Bash, l'outil d'utilisation de l'ordinateur, l'outil de mémoire et l'outil d'édition de texte
  • Outil de recherche web
  • Citations
  • Sorties structurées

Fonctionnalités non prises en charge

  • Sources d'entrée (sources URL pour les images et documents, API Files)
  • Outils côté serveur (exécution de code, récupération web, advisor)
  • Infrastructure d'agent (Agent Skills, connecteur MCP, appel d'outils programmatique)
  • Points de terminaison API (Message Batches, Models, Admin, Compliance, Usage and Cost)
  • Claude Managed Agents
  • Repli côté serveur (le paramètre fallbacks ; utilisez plutôt le modèle de repli côté client)

Fenêtre de contexte

Claude Fable 5, Claude Opus 4.8, Claude Opus 4.7, Claude Opus 4.6 et Claude Sonnet 4.6 disposent d'une « context window » (fenêtre de contexte) de 1 million de tokens sur Vertex AI. Les autres modèles Claude, y compris Sonnet 4.5 et Sonnet 4 (obsolète), disposent d'une fenêtre de contexte de 200 000 tokens.

Vertex AI limite les charges utiles de requête à 30 Mo. Lors de l'envoi de documents volumineux ou de nombreuses images, vous pouvez atteindre cette limite avant la limite de tokens.

Points de terminaison globaux, multirégionaux et régionaux

Vertex AI propose trois types de points de terminaison :

  • Points de terminaison globaux : routage dynamique pour une disponibilité maximale.
  • Points de terminaison multirégionaux : routage dynamique au sein d'une zone géographique (par exemple, les États-Unis ou l'Union européenne) pour la résidence des données avec une haute disponibilité.
  • Points de terminaison régionaux : routage des données garanti via des régions géographiques spécifiques.

Les points de terminaison régionaux et multirégionaux incluent un supplément tarifaire de 10 % par rapport aux points de terminaison globaux.

Cela s'applique uniquement à Claude Sonnet 4.5 et aux modèles ultérieurs. Les modèles plus anciens (Claude Sonnet 4 (obsolète), Opus 4 (obsolète) et antérieurs) conservent leurs structures tarifaires existantes.

Quand utiliser chaque option

Points de terminaison globaux (recommandés) :

  • Offrent une disponibilité et un temps de fonctionnement maximaux.
  • Acheminent dynamiquement les requêtes vers les régions disposant de capacité disponible.
  • Aucun supplément tarifaire.
  • Idéal pour les applications où la résidence des données est flexible.
  • Prend uniquement en charge le trafic à la demande (le débit provisionné nécessite des points de terminaison régionaux).

Points de terminaison multirégionaux :

  • Acheminent dynamiquement les requêtes entre les régions au sein d'une zone géographique (actuellement us et eu).
  • Utiles lorsque vous avez besoin d'une résidence des données au sein d'une zone géographique large tout en souhaitant une disponibilité supérieure à celle d'une seule région.
  • Supplément tarifaire de 10 % par rapport aux points de terminaison globaux.
  • Prend uniquement en charge le trafic à la demande (le débit provisionné nécessite des points de terminaison régionaux).

Points de terminaison régionaux :

  • Acheminent le trafic via des régions géographiques spécifiques.
  • Requis pour la résidence des données dans une seule région, les exigences de conformité strictes ou le débit provisionné.
  • Prennent en charge à la fois le trafic à la demande et le débit provisionné.
  • Le supplément tarifaire de 10 % reflète les coûts d'infrastructure pour une capacité régionale dédiée.

Implémentation

Utilisation des points de terminaison globaux (recommandé) :

Définissez le paramètre region sur "global" lors de l'initialisation du client :

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Utilisation des points de terminaison multirégionaux :

Définissez le paramètre region sur un identifiant multirégional : "us" pour les États-Unis ou "eu" pour l'Union européenne. Le SDK achemine les requêtes vers le point de terminaison multirégional correspondant (https://aiplatform.us.rep.googleapis.com ou https://aiplatform.eu.rep.googleapis.com), qui équilibre dynamiquement le trafic entre les régions au sein de cette zone géographique.

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us"  # Multi-region identifier: "us" or "eu"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Utilisation des points de terminaison régionaux :

Spécifiez une région précise comme "us-east1" ou "europe-west1" :

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # Specify a specific region

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Claude Mythos Preview est un aperçu de recherche disponible pour les clients invités sur Vertex AI. Pour plus d'informations, consultez Project Glasswing.

Ressources supplémentaires

  • Tarification Vertex AI : cloud.google.com/vertex-ai/generative-ai/pricing
  • Documentation des modèles Claude : Claude sur Vertex AI
  • Article de blog Google : Point de terminaison global pour les modèles Claude
  • Détails de la tarification Anthropic : Tarification des plateformes cloud

Was this page helpful?

  • Installer un SDK pour accéder à Vertex AI
  • Accéder à Vertex AI
  • Disponibilité des modèles
  • Effectuer des requêtes
  • Conservation des données
  • Journalisation de l'activité
  • Prise en charge des fonctionnalités
  • Principales fonctionnalités prises en charge
  • Fonctionnalités non prises en charge
  • Fenêtre de contexte
  • Points de terminaison globaux, multirégionaux et régionaux
  • Quand utiliser chaque option
  • Implémentation
  • Ressources supplémentaires