El Claude Agent SDK difiere de las API LLM tradicionales sin estado en que mantiene el estado conversacional y ejecuta comandos en un entorno persistente. Esta guía cubre la arquitectura, las consideraciones de alojamiento y las mejores prácticas para implementar agentes basados en SDK en producción.
Para endurecimiento de seguridad más allá del sandboxing básico, incluyendo controles de red, gestión de credenciales y opciones de aislamiento, consulte Implementación Segura.
Para seguridad y aislamiento, el SDK debe ejecutarse dentro de un entorno de contenedor aislado. Esto proporciona aislamiento de procesos, límites de recursos, control de red y sistemas de archivos efímeros.
El SDK también admite configuración de sandbox programática para la ejecución de comandos.
Cada instancia de SDK requiere:
Dependencias de tiempo de ejecución
npm install -g @anthropic-ai/claude-codeAsignación de recursos
Acceso de red
api.anthropic.comA diferencia de las llamadas API sin estado, el Claude Agent SDK funciona como un proceso de larga duración que:
Varios proveedores se especializan en entornos de contenedores seguros para la ejecución de código de IA:
Para opciones autohospedadas (Docker, gVisor, Firecracker) y configuración de aislamiento detallada, consulte Tecnologías de Aislamiento.
Cree un nuevo contenedor para cada tarea de usuario y luego destrúyalo cuando se complete.
Mejor para tareas puntuales, el usuario aún puede interactuar con la IA mientras se completa la tarea, pero una vez completada, el contenedor se destruye.
Ejemplos:
Mantener instancias de contenedor persistentes para tareas de larga duración. A menudo ejecutando múltiples procesos de Claude Agent dentro del contenedor según la demanda.
Mejor para agentes proactivos que toman medidas sin la entrada del usuario, agentes que sirven contenido o agentes que procesan grandes cantidades de mensajes.
Ejemplos:
Contenedores efímeros que se hidratan con historial y estado, posiblemente desde una base de datos o desde las características de reanudación de sesión del SDK.
Mejor para contenedores con interacción intermitente del usuario que inicia trabajo y se apaga cuando se completa el trabajo pero puede continuarse.
Ejemplos:
Ejecutar múltiples procesos de Claude Agent SDK en un contenedor global.
Mejor para agentes que deben colaborar estrechamente. Este es probablemente el patrón menos popular porque tendrá que evitar que los agentes se sobrescriban entre sí.
Ejemplos:
Al alojar en contenedores, exponga puertos para comunicarse con sus instancias de SDK. Su aplicación puede exponer puntos finales HTTP/WebSocket para clientes externos mientras el SDK se ejecuta internamente dentro del contenedor.
Hemos encontrado que el costo dominante de servir agentes son los tokens, los contenedores varían según lo que aprovisione pero un costo mínimo es aproximadamente 5 centavos por hora de ejecución.
Esto probablemente dependa del proveedor, diferentes proveedores de sandbox le permitirán establecer diferentes criterios para tiempos de espera de inactividad después de los cuales un sandbox podría apagarse. Querrá ajustar este tiempo de espera en función de la frecuencia con la que crea que podría haber respuesta del usuario.
Claude Code CLI se versiona con semver, por lo que cualquier cambio importante se versionará.
Dado que los contenedores son solo servidores, la misma infraestructura de registro que usa para el backend funcionará para contenedores.
Una sesión de agente no se agotará el tiempo, pero recomendamos establecer una propiedad 'maxTurns' para evitar que Claude se quede atrapado en un bucle.