Les contrôles de résidence des données vous permettent de gérer où vos données sont traitées et stockées. Deux paramètres indépendants régissent ceci :
inference_geo ou comme valeur par défaut de l'espace de travail.Le paramètre inference_geo contrôle où l'inférence du modèle s'exécute pour une demande API spécifique. Ajoutez-le à n'importe quel appel POST /v1/messages.
| Valeur | Description |
|---|---|
"global" | Par défaut. L'inférence peut s'exécuter dans n'importe quelle géographie disponible pour des performances et une disponibilité optimales. |
Was this page helpful?
"us"| L'inférence s'exécute uniquement sur l'infrastructure basée aux États-Unis. |
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-6",
"max_tokens": 1024,
"inference_geo": "us",
"messages": [{
"role": "user",
"content": "Summarize the key points of this document."
}]
}'L'objet usage de la réponse inclut un champ inference_geo indiquant où l'inférence s'est exécutée :
{
"usage": {
"input_tokens": 25,
"output_tokens": 150,
"inference_geo": "us"
}
}Le paramètre inference_geo est pris en charge sur Claude Opus 4.6 et tous les modèles ultérieurs. Les modèles plus anciens publiés avant Opus 4.6 ne prennent pas en charge le paramètre. Les demandes avec inference_geo sur les modèles hérités retournent une erreur 400.
Le paramètre inference_geo n'est disponible que sur l'API Claude (1P). Sur les plateformes tierces (AWS Bedrock, Google Vertex AI), la région d'inférence est déterminée par l'URL du point de terminaison ou le profil d'inférence, donc inference_geo n'est pas applicable. Le paramètre inference_geo n'est pas non plus disponible via le point de terminaison de compatibilité du SDK OpenAI.
Les paramètres de l'espace de travail prennent également en charge la restriction des géographies d'inférence disponibles :
allowed_inference_geos : Restreint les géographies qu'un espace de travail peut utiliser. Si une demande spécifie un inference_geo qui ne figure pas dans cette liste, l'API retourne une erreur.default_inference_geo : Définit la géographie de secours lorsque inference_geo est omis d'une demande. Les demandes individuelles peuvent remplacer cela en définissant inference_geo explicitement.Ces paramètres peuvent être configurés via la Console ou l'API Admin sous le champ data_residency.
La géographie de l'espace de travail est définie lors de la création d'un espace de travail et ne peut pas être modifiée par la suite. Actuellement, "us" est la seule géographie d'espace de travail disponible.
Pour définir la géographie de l'espace de travail, créez un nouvel espace de travail dans la Console :
La tarification de la résidence des données varie selon la génération du modèle :
inference_geo: "us") est facturée à 1,1x le taux standard dans toutes les catégories de tarification des jetons (jetons d'entrée, jetons de sortie, écritures de cache et lectures de cache).inference_geo: "global" ou omis) : La tarification standard s'applique.inference_geo.Cette tarification s'applique uniquement à l'API Claude (1P). Les plateformes tierces (AWS Bedrock, Google Vertex AI, Microsoft Foundry) ont leur propre tarification régionale. Consultez la page de tarification pour plus de détails.
Si vous utilisez Priority Tier, le multiplicateur 1,1x pour l'inférence réservée aux États-Unis affecte également la façon dont les jetons sont comptabilisés par rapport à votre capacité Priority Tier. Chaque jeton consommé avec inference_geo: "us" réduit 1,1 jetons de votre TPM engagé, conformément à la façon dont d'autres multiplicateurs de tarification (mise en cache des invites, contexte long) affectent les taux de consommation.
Le paramètre inference_geo est pris en charge sur l'API Batch. Chaque demande dans un lot peut spécifier sa propre valeur inference_geo.
Si votre organisation s'était précédemment exclue du routage global pour maintenir l'inférence aux États-Unis, votre espace de travail a été automatiquement configuré avec allowed_inference_geos: ["us"] et default_inference_geo: "us". Aucune modification du code n'est requise. Vos exigences existantes en matière de résidence des données continuent d'être appliquées via les nouveaux contrôles géographiques.
L'exclusion héritée était un paramètre au niveau de l'organisation qui restreignait toutes les demandes à l'infrastructure basée aux États-Unis. Les nouveaux contrôles de résidence des données remplacent cela par deux mécanismes :
inference_geo vous permet de spécifier "us" ou "global" sur chaque appel API, vous donnant une flexibilité au niveau de la demande.default_inference_geo et allowed_inference_geos dans la Console vous permettent d'appliquer des politiques géographiques sur toutes les clés d'un espace de travail.Votre espace de travail a été migré automatiquement :
| Paramètre hérité | Équivalent nouveau |
|---|---|
| Exclusion du routage global (États-Unis uniquement) | allowed_inference_geos: ["us"], default_inference_geo: "us" |
Toutes les demandes API utilisant des clés de votre espace de travail continuent de s'exécuter sur l'infrastructure basée aux États-Unis. Aucune action n'est nécessaire pour maintenir votre comportement actuel.
Si vos exigences en matière de résidence des données ont changé et que vous souhaitez profiter du routage global pour de meilleures performances et disponibilité, mettez à jour les paramètres de géographie d'inférence de votre espace de travail pour inclure "global" dans les géographies autorisées et définissez default_inference_geo sur "global". Consultez Restrictions au niveau de l'espace de travail pour plus de détails.
Les modèles hérités ne sont pas affectés par cette migration. Pour la tarification actuelle sur les modèles plus récents, consultez Tarification.
"us" et "global" sont disponibles au lancement. Des régions supplémentaires seront ajoutées au fil du temps."us" est actuellement disponible. La géographie de l'espace de travail ne peut pas être modifiée après la création de l'espace de travail.