Este guia o orienta na configuração e na realização de chamadas de API para Claude no Amazon Bedrock. Claude no Amazon Bedrock é executado em infraestrutura gerenciada pela AWS com acesso zero do operador (pessoal da Anthropic não tem acesso à infraestrutura de inferência), permitindo que você crie aplicações sensíveis inteiramente dentro do limite de segurança da AWS enquanto usa a mesma forma de API Messages que você usa com a API de primeira parte da Anthropic.
Esta página aborda a nova oferta Claude no Amazon Bedrock, que expõe a API Messages em /anthropic/v1/messages. Para a integração Bedrock legada (a API InvokeModel com identificadores de modelo com versão ARN e codificação de fluxo de eventos da AWS), consulte Claude no Amazon Bedrock.
Claude no Amazon Bedrock está em visualização de pesquisa, disponível na região US East (N. Virginia) us-east-1 no lançamento. Entre em contato com seu executivo de conta Anthropic para solicitar acesso.
Antes de começar, certifique-se de que você tem:
us-east-1. A visualização de pesquisa requer uma conta dedicada para isolamento. Seu executivo de conta Anthropic enviará seu ID de conta para a equipe do Bedrock Marketplace para inclusão na lista de permissões (normalmente processado em 24 horas).Claude no Amazon Bedrock suporta três caminhos de autenticação. Escolha o que melhor se adequa aos seus requisitos de segurança.
Use uma função de serviço Bedrock com chaves gerenciadas pela AWS para o acesso mais seguro e de longa duração:
Admin: provisionar a função de serviço
Um administrador da AWS provisiona uma função de serviço Bedrock e concede aos desenvolvedores permissão iam:PassRole no ARN da função de serviço.
Desenvolvedor: passar a função
Ao chamar a API, passe o ARN da função de serviço como um parâmetro de solicitação. Bedrock assume a função em seu nome e assina solicitações com credenciais gerenciadas pela AWS. Um exemplo de código mostrando onde o parâmetro ARN vai será adicionado quando os pacotes SDK forem publicados.
Para acesso federado por identidade com uma sessão máxima de 12 horas:
Admin: configurar a função IAM
Crie uma função IAM com escopo para seus modelos Claude. A política de confiança nomeia seu provedor de identidade (SAML, OIDC ou AWS Identity Center). A política de permissões concede bedrock-mantle:CreateInference apenas nos ARNs de modelo permitidos.
Desenvolvedor: autenticar e assumir
Autentique-se através de seu provedor de identidade corporativo e, em seguida, assuma a função IAM. AWS STS emite credenciais temporárias que o SDK ou CLI usa para assinar solicitações.
Para acesso de curto prazo sem funções IAM (máximo de 12 horas, menos preferido):
Admin: restringir tipos de token
Bloqueie chaves de longa duração anexando uma política que nega bedrock:CallWithBearerToken a menos que a condição bedrock:BearerTokenType corresponda a um token de curto prazo.
Desenvolvedor: criar um token
Use a CLI aws-bedrock-token-generator (link pendente de publicação) para criar um token portador. Passe-o no cabeçalho x-api-key em cada solicitação.
Os SDKs de cliente da Anthropic suportam Claude no Amazon Bedrock através de um pacote ou módulo específico do Bedrock.
O endpoint segue o padrão https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages. Ao contrário da integração Bedrock legada, este endpoint usa streaming SSE padrão e a mesma forma de corpo de solicitação que a API de primeira parte da Anthropic.
O SDK resolve credenciais e região usando a precedência padrão da AWS: argumentos do construtor, depois variáveis de ambiente (AWS_ACCESS_KEY_ID, AWS_SECRET_ACCESS_KEY, AWS_SESSION_TOKEN, AWS_REGION), depois o arquivo de configuração da AWS e a cadeia de credenciais (SSO, funções assumidas, função de tarefa ECS, IMDS).
from anthropic import AnthropicBedrockMantle
client = AnthropicBedrockMantle(aws_region="us-east-1")
message = client.messages.create(
model="CLAUDE_MODEL_ID",
max_tokens=1024,
messages=[{"role": "user", "content": "Hello, Claude"}],
)
print(message.content[0].text)Se o cliente dedicado AnthropicBedrockMantle ainda não estiver disponível na versão do SDK da sua linguagem, você pode usar o cliente padrão Anthropic em seu lugar: defina base_url como https://bedrock-mantle.{region}.api.aws/anthropic e passe seu token portador como api_key. Este caminho suporta apenas autenticação por token portador. A assinatura SigV4 requer o cliente dedicado.
IDs de modelo no Claude no Amazon Bedrock carregam um prefixo de provedor anthropic.. Os recursos e comportamentos do modelo são documentados na página Visão geral de modelos. Consulte seu email de boas-vindas da AWS para o ID de modelo exato habilitado para sua conta.
Claude no Amazon Bedrock suporta recursos que são executados dentro do modelo. Recursos que requerem infraestrutura operada pela Anthropic não estão disponíveis.
Suportado:
/v1/messages)Não suportado:
/v1/usersA visualização de pesquisa está disponível apenas em us-east-1 (IAD).
A cota padrão é de 2 milhões de tokens de entrada por minuto (TPM). Você pode solicitar até 4 milhões de TPM de entrada sem aprovação adicional da Anthropic. A AWS impõe limites de solicitações por minuto (RPM) no lado do Bedrock; entre em contato com o suporte da AWS para ajustes de RPM.
Todos os dados de inferência são retidos por 30 dias no seu armazenamento da AWS. Não há opção de retenção zero de dados nesta oferta. Para clientes padrão, a Anthropic pode inspecionar dados armazenados para revisão de segurança e abuso. Para clientes de nível Select, apenas a AWS pode inspecionar dados; a Anthropic pode executar operações automatizadas, mas não revisão manual. Para detalhes sobre elegibilidade de nível Select, entre em contato com seu executivo de conta Anthropic.
Claude no Amazon Bedrock emite logs para CloudWatch e CloudTrail. A Anthropic recomenda reter logs de atividade em pelo menos uma base móvel de 30 dias para entender padrões de uso e investigar possíveis problemas.
Para suporte de visualização de pesquisa, entre em contato com [email protected]. Inclua seu ID de conta da AWS e o request-id de qualquer resposta de API com falha.
Was this page helpful?