Claude Agent SDK는 기존의 상태 비저장 LLM API와 달리 대화 상태를 유지하고 지속적인 환경에서 명령을 실행합니다. 이 가이드는 프로덕션에서 SDK 기반 에이전트를 배포하기 위한 아키텍처, 호스팅 고려사항 및 모범 사례를 다룹니다.
기본 샌드박싱을 넘어선 보안 강화—네트워크 제어, 자격증명 관리 및 격리 옵션 포함—에 대해서는 보안 배포를 참조하세요.
보안 및 격리를 위해 SDK는 샌드박싱된 컨테이너 환경 내에서 실행되어야 합니다. 이는 프로세스 격리, 리소스 제한, 네트워크 제어 및 임시 파일시스템을 제공합니다.
SDK는 또한 명령 실행을 위한 프로그래밍 방식의 샌드박스 구성을 지원합니다.
각 SDK 인스턴스에는 다음이 필요합니다:
런타임 종속성
npm install -g @anthropic-ai/claude-code리소스 할당
네트워크 액세스
api.anthropic.com으로의 아웃바운드 HTTPS상태 비저장 API 호출과 달리 Claude Agent SDK는 다음을 수행하는 장기 실행 프로세스로 작동합니다:
여러 제공자가 AI 코드 실행을 위한 보안 컨테이너 환경을 전문으로 합니다:
자체 호스팅 옵션(Docker, gVisor, Firecracker) 및 상세한 격리 구성에 대해서는 격리 기술을 참조하세요.
각 사용자 작업에 대해 새 컨테이너를 생성한 후 완료되면 삭제합니다.
일회성 작업에 최적이며, 사용자는 작업이 완료되는 동안 AI와 상호작용할 수 있지만 완료되면 컨테이너가 삭제됩니다.
예시:
장기 실행 작업을 위해 지속적인 컨테이너 인스턴스를 유지합니다. 종종 수요에 따라 컨테이너 내에서 여러 Claude Agent 프로세스를 실행합니다.
사용자 입력 없이 조치를 취하는 사전 예방적 에이전트, 콘텐츠를 제공하는 에이전트 또는 많은 양의 메시지를 처리하는 에이전트에 최적입니다.
예시:
데이터베이스 또는 SDK의 세션 재개 기능에서 가져온 기록 및 상태로 수화된 임시 컨테이너입니다.
사용자로부터 간헐적인 상호작용이 있는 컨테이너에 최적이며, 작업을 시작하고 작업이 완료되면 종료되지만 계속할 수 있습니다.
예시:
하나의 글로벌 컨테이너에서 여러 Claude Agent SDK 프로세스를 실행합니다.
긴밀하게 협력해야 하는 에이전트에 최적입니다. 에이전트가 서로를 덮어쓰지 않도록 방지해야 하기 때문에 이것이 가장 인기 없는 패턴일 가능성이 높습니다.
예시:
컨테이너에서 호스팅할 때 SDK 인스턴스와 통신하기 위해 포트를 노출합니다. 애플리케이션은 외부 클라이언트를 위한 HTTP/WebSocket 엔드포인트를 노출할 수 있으며 SDK는 컨테이너 내에서 내부적으로 실행됩니다.
우리는 에이전트 제공의 지배적인 비용이 토큰이라는 것을 발견했으며, 컨테이너는 프로비저닝하는 것에 따라 다르지만 최소 비용은 대략 시간당 5센트입니다.
이것은 제공자에 따라 다를 가능성이 높으며, 다양한 샌드박스 제공자는 샌드박스가 종료될 수 있는 유휴 타임아웃에 대해 다양한 기준을 설정할 수 있습니다. 사용자 응답이 얼마나 자주 발생할 것으로 예상되는지에 따라 이 타임아웃을 조정하고 싶을 것입니다.
Claude Code CLI는 semver로 버전이 지정되므로 모든 주요 변경사항이 버전이 지정됩니다.
컨테이너는 단지 서버이므로 백엔드에 사용하는 것과 동일한 로깅 인프라가 컨테이너에서 작동합니다.
에이전트 세션은 타임아웃되지 않지만 Claude가 루프에 갇히는 것을 방지하기 위해 'maxTurns' 속성을 설정하는 것을 권장합니다.