Ce guide vous accompagne dans la configuration et l'effectuation d'appels API à Claude dans Amazon Bedrock. Claude dans Amazon Bedrock s'exécute sur l'infrastructure gérée par AWS sans accès opérateur (le personnel d'Anthropic n'a pas accès à l'infrastructure d'inférence), ce qui vous permet de créer des applications sensibles entièrement à l'intérieur de la limite de sécurité AWS tout en utilisant la même forme d'API Messages que celle que vous utilisez avec l'API propriétaire d'Anthropic.
Cette page couvre la nouvelle offre Claude dans Amazon Bedrock, qui expose l'API Messages à /anthropic/v1/messages. Pour l'intégration Bedrock héritée (l'API InvokeModel avec des identifiants de modèle versionnés par ARN et l'encodage d'événement AWS), consultez Claude sur Amazon Bedrock.
Claude dans Amazon Bedrock est en aperçu de recherche, disponible dans la région US East (N. Virginia) us-east-1 au lancement. Contactez votre responsable de compte Anthropic pour demander l'accès.
Avant de commencer, assurez-vous que vous disposez de :
us-east-1. L'aperçu de recherche nécessite un compte dédié pour l'isolation. Votre responsable de compte Anthropic soumettra votre ID de compte à l'équipe Bedrock Marketplace pour l'ajout à la liste blanche (généralement traité dans les 24 heures).Claude dans Amazon Bedrock prend en charge trois chemins d'authentification. Choisissez celui qui correspond le mieux à vos exigences de sécurité.
Utilisez un rôle de service Bedrock avec des clés gérées par AWS pour l'accès le plus sécurisé et durable :
Admin : provisionner le rôle de service
Un administrateur AWS provisionne un rôle de service Bedrock et accorde aux développeurs la permission iam:PassRole sur l'ARN du rôle de service.
Développeur : transmettre le rôle
Lors de l'appel de l'API, transmettez l'ARN du rôle de service comme paramètre de requête. Bedrock assume le rôle en votre nom et signe les requêtes avec des identifiants gérés par AWS. Un exemple de code montrant où va le paramètre ARN sera ajouté lors de la publication des packages SDK.
Pour l'accès fédéré par identité avec une session maximale de 12 heures :
Admin : configurer le rôle IAM
Créez un rôle IAM limité à vos modèles Claude. La politique de confiance nomme votre fournisseur d'identité (SAML, OIDC ou AWS Identity Center). La politique de permissions accorde bedrock-mantle:CreateInference uniquement sur les ARN de modèle autorisés.
Développeur : authentifier et assumer
Authentifiez-vous via votre fournisseur d'identité d'entreprise, puis assumez le rôle IAM. AWS STS émet des identifiants temporaires que le SDK ou l'interface CLI utilise pour signer les requêtes.
Pour l'accès à court terme sans rôles IAM (maximum 12 heures, le moins préféré) :
Admin : restreindre les types de jetons
Bloquez les clés à long terme en attachant une politique qui refuse bedrock:CallWithBearerToken sauf si la condition bedrock:BearerTokenType correspond à un jeton à court terme.
Développeur : générer un jeton
Utilisez l'interface CLI aws-bedrock-token-generator (lien en attente de publication) pour générer un jeton porteur. Transmettez-le dans l'en-tête x-api-key à chaque requête.
Les SDK clients d'Anthropic prennent en charge Claude dans Amazon Bedrock via un package ou module spécifique à Bedrock.
Le point de terminaison suit le modèle https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages. Contrairement à l'intégration Bedrock héritée, ce point de terminaison utilise le streaming SSE standard et la même forme de corps de requête que l'API propriétaire d'Anthropic.
Le SDK résout les identifiants et la région en utilisant la précédence AWS standard : arguments du constructeur, puis variables d'environnement (AWS_ACCESS_KEY_ID, AWS_SECRET_ACCESS_KEY, AWS_SESSION_TOKEN, AWS_REGION), puis le fichier de configuration AWS et la chaîne d'identifiants (SSO, rôles assumés, rôle de tâche ECS, IMDS).
from anthropic import AnthropicBedrockMantle
client = AnthropicBedrockMantle(aws_region="us-east-1")
message = client.messages.create(
model="CLAUDE_MODEL_ID",
max_tokens=1024,
messages=[{"role": "user", "content": "Hello, Claude"}],
)
print(message.content[0].text)Si le client dédié AnthropicBedrockMantle n'est pas encore disponible dans la version SDK de votre langage, vous pouvez utiliser le client Anthropic standard à la place : définissez base_url sur https://bedrock-mantle.{region}.api.aws/anthropic et transmettez votre jeton porteur comme api_key. Ce chemin ne prend en charge que l'authentification par jeton porteur. La signature SigV4 nécessite le client dédié.
Les ID de modèle dans Claude dans Amazon Bedrock portent un préfixe de fournisseur anthropic.. Les capacités et comportements des modèles sont documentés sur la page Aperçu des modèles. Consultez votre e-mail de bienvenue AWS pour l'ID de modèle exact activé pour votre compte.
Claude dans Amazon Bedrock prend en charge les fonctionnalités qui s'exécutent à l'intérieur du modèle. Les fonctionnalités qui nécessitent une infrastructure exploitée par Anthropic ne sont pas disponibles.
Pris en charge :
/v1/messages)Non pris en charge :
/v1/usersL'aperçu de recherche est disponible uniquement dans us-east-1 (IAD).
Le quota par défaut est de 2 millions de jetons d'entrée par minute (TPM). Vous pouvez demander jusqu'à 4 millions de TPM d'entrée sans approbation Anthropic supplémentaire. AWS applique des limites de requêtes par minute (RPM) du côté Bedrock ; contactez le support AWS pour les ajustements RPM.
Toutes les données d'inférence sont conservées pendant 30 jours dans votre stockage AWS. Il n'y a pas d'option de rétention zéro données sur cette offre. Pour les clients standard, Anthropic peut inspecter les données stockées pour l'examen de la sécurité et des abus. Pour les clients de niveau Select, seul AWS peut inspecter les données ; Anthropic peut exécuter des opérations automatisées mais pas d'examen manuel. Pour plus de détails sur l'admissibilité au niveau Select, contactez votre responsable de compte Anthropic.
Claude dans Amazon Bedrock émet des journaux vers CloudWatch et CloudTrail. Anthropic recommande de conserver les journaux d'activité sur au moins une base glissante de 30 jours pour comprendre les modèles d'utilisation et enquêter sur les problèmes potentiels.
Pour le support en aperçu de recherche, contactez [email protected]. Incluez votre ID de compte AWS et l'request-id de toute réponse API échouée.
Was this page helpful?