Claude Agent SDK berbeda dari API LLM stateless tradisional karena mempertahankan status percakapan dan mengeksekusi perintah di lingkungan yang persisten. Panduan ini mencakup arsitektur, pertimbangan hosting, dan praktik terbaik untuk menerapkan agen berbasis SDK dalam produksi.
Untuk keamanan dan isolasi, SDK harus berjalan di dalam lingkungan container yang tersandbox. Ini menyediakan:
Setiap instans SDK memerlukan:
Dependensi runtime
npm install -g @anthropic-ai/claude-codeAlokasi sumber daya
Akses jaringan
api.anthropic.comTidak seperti panggilan API stateless, Claude Agent SDK beroperasi sebagai proses yang berjalan lama yang:
Beberapa penyedia mengkhususkan diri dalam lingkungan container aman untuk eksekusi kode AI:
Buat container baru untuk setiap tugas pengguna, kemudian hancurkan saat selesai.
Terbaik untuk tugas sekali jadi, pengguna mungkin masih berinteraksi dengan AI saat tugas sedang diselesaikan, tetapi setelah selesai container akan dihancurkan.
Contoh:
Pertahankan instans container persisten untuk tugas yang berjalan lama. Sering kali menjalankan beberapa proses Claude Agent di dalam container berdasarkan permintaan.
Terbaik untuk agen proaktif yang mengambil tindakan tanpa masukan pengguna, agen yang melayani konten atau agen yang memproses jumlah pesan yang tinggi.
Contoh:
Container ephemeral yang dihidrasi dengan riwayat dan status, mungkin dari database atau dari fitur resumption sesi SDK.
Terbaik untuk container dengan interaksi intermiten dari pengguna yang memulai pekerjaan dan berhenti saat pekerjaan selesai tetapi dapat dilanjutkan.
Contoh:
Jalankan beberapa proses Claude Agent SDK dalam satu container global.
Terbaik untuk agen yang harus berkolaborasi erat. Ini mungkin pola yang paling tidak populer karena Anda harus mencegah agen saling menimpa.
Contoh:
Saat hosting di container, buka port untuk berkomunikasi dengan instans SDK Anda. Aplikasi Anda dapat membuka endpoint HTTP/WebSocket untuk klien eksternal sementara SDK berjalan secara internal dalam container.
Kami telah menemukan bahwa biaya dominan untuk melayani agen adalah token, container bervariasi berdasarkan apa yang Anda sediakan tetapi biaya minimum kira-kira 5 sen per jam berjalan.
Ini mungkin bergantung pada penyedia, penyedia sandbox yang berbeda akan membiarkan Anda menetapkan kriteria berbeda untuk timeout idle setelah itu sandbox mungkin berhenti. Anda akan ingin menyesuaikan timeout ini berdasarkan seberapa sering Anda pikir respons pengguna mungkin terjadi.
Claude Code CLI diberi versi dengan semver, jadi perubahan breaking apa pun akan diberi versi.
Karena container hanya server, infrastruktur logging yang sama yang Anda gunakan untuk backend akan bekerja untuk container.
Sesi agen tidak akan timeout, tetapi kami merekomendasikan menetapkan properti 'maxTurns' untuk mencegah Claude terjebak dalam loop.