Agentes gestionados/Sandboxes autoalojados
Modelo de responsabilidad compartida para entornos de sandbox autoalojados.
Anthropic protege el plano de control en todos los entornos: integridad de sesiones y colas de trabajo, aislamiento multiinquilino y minimización del contexto del agente. Cuando autoalojas, las siguientes responsabilidades recaen en ti.
- Calidad de la imagen del sandbox y endurecimiento del entorno de ejecución. Anthropic no inspecciona ni verifica tu imagen de sandbox. Sigue las mejores prácticas, como eliminar capacidades de Linux innecesarias, ejecutar como usuario no root y usar un sistema de archivos raíz de solo lectura.
- Controles de salida de red. El acceso de red de tu sandbox está determinado por tu VPC y tus reglas de firewall. Sin restricciones de salida, una ejecución de herramienta comprometida puede alcanzar hosts externos arbitrarios. Restringe el tráfico saliente únicamente a los endpoints que tus herramientas requieren.
- Almacenamiento y rotación de la clave de servicio. La clave de servicio del entorno (
ANTHROPIC_ENVIRONMENT_KEY) autoriza el sondeo de la cola de trabajo de tu entorno y el envío de resultados de vuelta a las sesiones. Almacénala en un gestor de secretos, no en archivos de entorno ni en imágenes de sandbox. Rótala de inmediato si sospechas que ha sido expuesta.
- Aislamiento de cargas de trabajo no confiables. La clave de servicio del entorno está limitada a la cola de trabajo de un solo entorno. Si ejecutas código no confiable dentro de tu sandbox, considera aprovisionar un espacio de trabajo y un entorno separados para cada límite de confianza. Esto limita cada clave a las sesiones de un solo usuario en lugar de a un grupo compartido.
- Radio de impacto de la ejecución de herramientas. Las herramientas se ejecutan dentro de tu sandbox con los permisos que tenga tu proceso. Aplica el principio de mínimo privilegio al usuario del proceso y monta únicamente los directorios que tus herramientas requieren.
- Retención de registros y contenido de sesiones. El contenido de las conversaciones y las salidas de las herramientas pasan por tu worker y permanecen en tu entorno. Eres responsable de retener, anonimizar o eliminar esos datos en cumplimiento con tus propias políticas. Anthropic no tiene visibilidad sobre lo que tu worker hace con el contenido de la sesión una vez entregado.
Lo que Anthropic no puede hacer por ti
- Invalidar instantáneamente una clave filtrada. Anthropic puede detectar patrones de uso anómalos, pero no puede invalidar una clave de forma instantánea. Trata
ANTHROPIC_ENVIRONMENT_KEY como una contraseña de base de datos: rótala de inmediato si se ve comprometida.
- Verificar la compilación de tu worker. Anthropic no inspecciona tu imagen de sandbox ni tu entorno de ejecución. Un compromiso en la cadena de suministro de tu imagen no es detectable desde el plano de control.
- Aislar herramientas dentro de tu sandbox. El límite de seguridad de Anthropic termina en el sandbox. Cómo aíslas las ejecuciones individuales de herramientas entre sí dentro de ese límite es enteramente tu responsabilidad.
- Aplicar políticas de retención de datos en tu entorno. Una vez que el contenido de la sesión llega a tu worker, queda fuera de los controles del ciclo de vida de datos de Anthropic.