Ce guide vous expliquera comment configurer et effectuer des appels API à Claude dans Foundry en Python, TypeScript ou en utilisant des requêtes HTTP directes. Lorsque vous pouvez accéder à Claude dans Foundry, vous serez facturé pour l'utilisation de Claude sur la Place de marché Microsoft avec votre abonnement Azure, ce qui vous permet d'accéder aux dernières capacités de Claude tout en gérant les coûts via votre abonnement Azure.
Disponibilité régionale : Au lancement, Claude est disponible en tant que type de déploiement Global Standard dans les ressources Foundry avec la zone de données US à venir bientôt. La tarification de Claude sur la Place de marché Microsoft utilise la tarification API standard d'Anthropic. Visitez notre page de tarification pour plus de détails.
Dans cette intégration de plateforme en aperçu, les modèles Claude s'exécutent sur l'infrastructure d'Anthropic. Il s'agit d'une intégration commerciale pour la facturation et l'accès via Azure. En tant que processeur indépendant pour Microsoft, les clients utilisant Claude via Microsoft Foundry sont soumis aux conditions d'utilisation des données d'Anthropic. Anthropic continue de fournir ses engagements en matière de sécurité et de données de premier plan, y compris la disponibilité de zéro rétention de données.
Avant de commencer, assurez-vous que vous disposez de :
Les SDK clients d'Anthropic prennent en charge Foundry via des packages spécifiques à la plateforme.
# Python
pip install -U "anthropic"
# Typescript
npm install @anthropic-ai/foundry-sdkFoundry utilise une hiérarchie à deux niveaux : les ressources contiennent votre configuration de sécurité et de facturation, tandis que les déploiements sont les instances de modèle que vous appelez via l'API. Vous créerez d'abord une ressource Foundry, puis créerez un ou plusieurs déploiements Claude dans celle-ci.
Créez une ressource Foundry, qui est requise pour utiliser et gérer les services dans Azure. Vous pouvez suivre ces instructions pour créer une ressource Foundry. Vous pouvez également commencer par créer un projet Foundry, ce qui implique de créer une ressource Foundry.
Pour approvisionner votre ressource :
{resource} dans les points de terminaison API (par exemple, https://{resource}.services.ai.azure.com/anthropic/v1/*)Après avoir créé votre ressource, déployez un modèle Claude pour le rendre disponible pour les appels API :
claude-sonnet-4-5)my-claude-deployment). Le nom du déploiement ne peut pas être modifié après sa création.Le nom du déploiement que vous choisissez devient la valeur que vous transmettez dans le paramètre model de vos requêtes API. Vous pouvez créer plusieurs déploiements du même modèle avec des noms différents pour gérer des configurations ou des limites de débit séparées.
Claude sur Foundry prend en charge deux méthodes d'authentification : les clés API et les jetons Entra ID. Les deux méthodes utilisent des points de terminaison hébergés par Azure au format https://{resource}.services.ai.azure.com/anthropic/v1/*.
Après avoir approvisionné votre ressource Claude Foundry, vous pouvez obtenir une clé API à partir du portail Foundry :
api-key ou x-api-key dans vos requêtes, ou fournissez-le au SDKLes SDK Python et TypeScript nécessitent une clé API et soit un nom de ressource, soit une URL de base. Les SDK liront automatiquement ces éléments à partir des variables d'environnement suivantes s'ils sont définis :
ANTHROPIC_FOUNDRY_API_KEY - Votre clé APIANTHROPIC_FOUNDRY_RESOURCE - Le nom de votre ressource (par exemple, example-resource)ANTHROPIC_FOUNDRY_BASE_URL - Alternative au nom de la ressource ; l'URL de base complète (par exemple, https://example-resource.services.ai.azure.com/anthropic/)Les paramètres resource et base_url s'excluent mutuellement. Fournissez soit le nom de la ressource (que le SDK utilise pour construire l'URL comme https://{resource}.services.ai.azure.com/anthropic/) soit l'URL de base complète directement.
Exemple utilisant une clé API :
import os
from anthropic import AnthropicFoundry
client = AnthropicFoundry(
api_key=os.environ.get("ANTHROPIC_FOUNDRY_API_KEY"),
resource='example-resource', # your resource name
)
message = client.messages.create(
model="claude-sonnet-4-5",
max_tokens=1024,
messages=[{"role": "user", "content": "Hello!"}]
)
print(message.content)Gardez vos clés API sécurisées. Ne les validez jamais dans le contrôle de version et ne les partagez pas publiquement. Toute personne ayant accès à votre clé API peut faire des requêtes à Claude via votre ressource Foundry.
Pour une sécurité renforcée et une gestion centralisée des accès, vous pouvez utiliser les jetons Entra ID (anciennement Azure Active Directory) :
Authorization: Bearer {TOKEN}Exemple utilisant Entra ID :
import os
from anthropic import AnthropicFoundry
from azure.identity import DefaultAzureCredential, get_bearer_token_provider
# Get Azure Entra ID token using token provider pattern
token_provider = get_bearer_token_provider(
DefaultAzureCredential(),
"https://cognitiveservices.azure.com/.default"
)
# Create client with Entra ID authentication
client = AnthropicFoundry(
resource='example-resource', # your resource name
azure_ad_token_provider=token_provider # Use token provider for Entra ID auth
)
# Make request
message = client.messages.create(
model="claude-sonnet-4-5",
max_tokens=1024,
messages=[{"role": "user", "content": "Hello!"}]
)
print(message.content)L'authentification Azure Entra ID vous permet de gérer l'accès à l'aide d'Azure RBAC, d'intégrer la gestion des identités de votre organisation et d'éviter de gérer manuellement les clés API.
Foundry inclut des identifiants de requête dans les en-têtes de réponse HTTP pour le débogage et le suivi. Lorsque vous contactez le support, fournissez les valeurs request-id et apim-request-id pour aider les équipes à localiser et enquêter rapidement sur votre requête dans les systèmes Anthropic et Azure.
Claude sur Foundry prend en charge la plupart des puissantes fonctionnalités de Claude. Vous pouvez trouver toutes les fonctionnalités actuellement prises en charge ici.
/v1/organizations/*)/v1/models)/v1/messages/batches)Les réponses API de Claude sur Foundry suivent le format de réponse API Anthropic standard. Cela inclut l'objet usage dans les corps de réponse, qui fournit des informations détaillées sur la consommation de jetons pour vos requêtes. L'objet usage est cohérent sur toutes les plateformes (API propriétaire, Foundry, Amazon Bedrock et Google Vertex AI).
Pour plus de détails sur les en-têtes de réponse spécifiques à Foundry, consultez la section des ID de requête de corrélation.
Les modèles Claude suivants sont disponibles via Foundry. Les modèles de dernière génération (Sonnet 4.5, Opus 4.1 et Haiku 4.5) offrent les capacités les plus avancées :
| Modèle | Nom de déploiement par défaut |
|---|---|
| Claude Opus 4.5 | claude-opus-4-5 |
| Claude Sonnet 4.5 | claude-sonnet-4-5 |
| Claude Opus 4.1 | claude-opus-4-1 |
| Claude Haiku 4.5 | claude-haiku-4-5 |
Par défaut, les noms de déploiement correspondent aux ID de modèle affichés ci-dessus. Cependant, vous pouvez créer des déploiements personnalisés avec des noms différents dans le portail Foundry pour gérer différentes configurations, versions ou limites de débit. Utilisez le nom du déploiement (pas nécessairement l'ID du modèle) dans vos requêtes API.
Azure fournit des capacités complètes de surveillance et de journalisation pour votre utilisation de Claude via des modèles Azure standard :
Anthropic recommande de journaliser votre activité sur au moins une base de 30 jours glissants pour comprendre les modèles d'utilisation et enquêter sur les problèmes potentiels.
Les services de journalisation d'Azure sont configurés dans votre abonnement Azure. L'activation de la journalisation ne donne pas à Microsoft ou à Anthropic accès à votre contenu au-delà de ce qui est nécessaire pour la facturation et l'exploitation du service.
Erreur : 401 Unauthorized ou Invalid API key
Erreur : 403 Forbidden
Erreur : 429 Too Many Requests
Foundry n'inclut pas les en-têtes de limite de débit standard d'Anthropic (anthropic-ratelimit-tokens-limit, anthropic-ratelimit-tokens-remaining, anthropic-ratelimit-tokens-reset, anthropic-ratelimit-input-tokens-limit, anthropic-ratelimit-input-tokens-remaining, anthropic-ratelimit-input-tokens-reset, anthropic-ratelimit-output-tokens-limit, anthropic-ratelimit-output-tokens-remaining et anthropic-ratelimit-output-tokens-reset) dans les réponses. Gérez la limitation de débit via les outils de surveillance d'Azure à la place.
Erreur : Model not found ou Deployment not found
claude-sonnet-4-5).Erreur : Invalid model parameter