O Claude Agent SDK difere das APIs LLM tradicionais sem estado, pois mantém o estado conversacional e executa comandos em um ambiente persistente. Este guia aborda a arquitetura, considerações de hospedagem e melhores práticas para implantar agentes baseados em SDK em produção.
Para endurecimento de segurança além da sandbox básica—incluindo controles de rede, gerenciamento de credenciais e opções de isolamento—consulte Implantação Segura.
Para segurança e isolamento, o SDK deve ser executado dentro de um ambiente de container em sandbox. Isso fornece isolamento de processo, limites de recursos, controle de rede e sistemas de arquivos efêmeros.
O SDK também suporta configuração de sandbox programática para execução de comandos.
Cada instância do SDK requer:
Dependências de tempo de execução
npm install -g @anthropic-ai/claude-codeAlocação de recursos
Acesso à rede
api.anthropic.comDiferentemente das chamadas de API sem estado, o Claude Agent SDK opera como um processo de longa duração que:
Vários provedores se especializam em ambientes de container seguro para execução de código de IA:
Para opções auto-hospedadas (Docker, gVisor, Firecracker) e configuração detalhada de isolamento, consulte Tecnologias de Isolamento.
Crie um novo container para cada tarefa do usuário e destrua-o quando concluído.
Melhor para tarefas únicas, o usuário ainda pode interagir com a IA enquanto a tarefa está sendo concluída, mas uma vez concluída, o container é destruído.
Exemplos:
Manter instâncias de container persistentes para tarefas de longa duração. Frequentemente executando múltiplos processos Claude Agent dentro do container com base na demanda.
Melhor para agentes proativos que tomam ações sem entrada do usuário, agentes que servem conteúdo ou agentes que processam grandes quantidades de mensagens.
Exemplos:
Containers efêmeros que são hidratados com histórico e estado, possivelmente de um banco de dados ou dos recursos de retomada de sessão do SDK.
Melhor para containers com interação intermitente do usuário que inicia trabalho e desliga quando o trabalho é concluído, mas pode ser continuado.
Exemplos:
Execute múltiplos processos Claude Agent SDK em um container global.
Melhor para agentes que devem colaborar estreitamente. Este é provavelmente o padrão menos popular porque você terá que evitar que agentes sobrescrevam um ao outro.
Exemplos:
Ao hospedar em containers, exponha portas para se comunicar com suas instâncias do SDK. Sua aplicação pode expor endpoints HTTP/WebSocket para clientes externos enquanto o SDK é executado internamente dentro do container.
Descobrimos que o custo dominante de servir agentes é os tokens, containers variam com base no que você provisiona, mas um custo mínimo é aproximadamente 5 centavos por hora em execução.
Isso provavelmente depende do provedor, diferentes provedores de sandbox permitirão que você defina diferentes critérios para tempos limite de ociosidade após os quais uma sandbox pode desligar. Você desejará ajustar este tempo limite com base em com que frequência você acha que a resposta do usuário pode ocorrer.
O Claude Code CLI é versionado com semver, portanto quaisquer mudanças significativas serão versionadas.
Como containers são apenas servidores, a mesma infraestrutura de logging que você usa para o backend funcionará para containers.
Uma sessão de agente não atingirá o tempo limite, mas recomendamos definir uma propriedade 'maxTurns' para evitar que Claude fique preso em um loop.
Was this page helpful?