O Claude Agent SDK difere das APIs LLM tradicionais sem estado, pois mantém o estado conversacional e executa comandos em um ambiente persistente. Este guia cobre a arquitetura, considerações de hospedagem e melhores práticas para implantar agentes baseados em SDK em produção.
Para endurecimento de segurança além da sandboxing básica—incluindo controles de rede, gerenciamento de credenciais e opções de isolamento—veja Implantação Segura.
Para segurança e isolamento, o SDK deve ser executado dentro de um ambiente de contêiner em sandbox. Isso fornece isolamento de processo, limites de recursos, controle de rede e sistemas de arquivos efêmeros.
O SDK também suporta configuração de sandbox programática para execução de comandos.
Cada instância do SDK requer:
Dependências de tempo de execução
npm install -g @anthropic-ai/claude-codeAlocação de recursos
Acesso à rede
api.anthropic.comDiferentemente das chamadas de API sem estado, o Claude Agent SDK opera como um processo de longa duração que:
Vários provedores se especializam em ambientes de contêiner seguro para execução de código de IA:
Para opções auto-hospedadas (Docker, gVisor, Firecracker) e configuração de isolamento detalhada, veja Tecnologias de Isolamento.
Crie um novo contêiner para cada tarefa do usuário e destrua-o quando concluído.
Melhor para tarefas únicas, o usuário ainda pode interagir com a IA enquanto a tarefa está sendo concluída, mas uma vez concluída, o contêiner é destruído.
Exemplos:
Mantenha instâncias de contêiner persistentes para tarefas de longa duração. Frequentemente, executando múltiplos processos Claude Agent dentro do contêiner com base na demanda.
Melhor para agentes proativos que tomam ação sem a entrada do usuário, agentes que servem conteúdo ou agentes que processam grandes quantidades de mensagens.
Exemplos:
Contêineres efêmeros que são hidratados com histórico e estado, possivelmente de um banco de dados ou dos recursos de retomada de sessão do SDK.
Melhor para contêineres com interação intermitente do usuário que inicia o trabalho e desliga quando o trabalho é concluído, mas pode ser continuado.
Exemplos:
Execute múltiplos processos Claude Agent SDK em um contêiner global.
Melhor para agentes que devem colaborar estreitamente. Este é provavelmente o padrão menos popular porque você terá que evitar que os agentes sobrescrevam um ao outro.
Exemplos:
Ao hospedar em contêineres, exponha portas para se comunicar com suas instâncias do SDK. Sua aplicação pode expor endpoints HTTP/WebSocket para clientes externos enquanto o SDK é executado internamente dentro do contêiner.
Descobrimos que o custo dominante de servir agentes são os tokens, contêineres variam com base no que você provisiona, mas um custo mínimo é aproximadamente 5 centavos por hora em execução.
Isso provavelmente depende do provedor, diferentes provedores de sandbox permitirão que você defina critérios diferentes para tempos limite de ociosidade após os quais um sandbox pode desligar. Você vai querer ajustar esse tempo limite com base na frequência com que você acha que a resposta do usuário pode ser.
O Claude Code CLI é versionado com semver, portanto quaisquer mudanças significativas serão versionadas.
Como contêineres são apenas servidores, a mesma infraestrutura de logging que você usa para o backend funcionará para contêineres.
Uma sessão de agente não atingirá o tempo limite, mas recomendamos definir uma propriedade 'maxTurns' para evitar que Claude fique preso em um loop.