Panduan

Hosting the Agent SDK

Sebarkan dan hosting Claude Agent SDK di lingkungan produksi

Claude Agent SDK berbeda dari API LLM stateless tradisional karena mempertahankan status percakapan dan menjalankan perintah di lingkungan yang persisten. Panduan ini mencakup arsitektur, pertimbangan hosting, dan praktik terbaik untuk menyebarkan agen berbasis SDK dalam produksi.

Untuk pengerasan keamanan di luar sandboxing dasar—termasuk kontrol jaringan, manajemen kredensial, dan opsi isolasi—lihat Secure Deployment.

Persyaratan Hosting

Sandboxing Berbasis Container

Untuk keamanan dan isolasi, SDK harus berjalan di dalam lingkungan container yang tersandbox. Ini menyediakan isolasi proses, batas sumber daya, kontrol jaringan, dan sistem file yang bersifat sementara.

SDK juga mendukung konfigurasi sandbox terprogram untuk eksekusi perintah.

Persyaratan Sistem

Setiap instans SDK memerlukan:

Dependensi runtime
- Python 3.10+ (untuk Python SDK) atau Node.js 18+ (untuk TypeScript SDK)
- Node.js (diperlukan oleh Claude Code CLI)
- Claude Code CLI: npm install -g @anthropic-ai/claude-code
Alokasi sumber daya
- Direkomendasikan: 1GiB RAM, 5GiB disk, dan 1 CPU (sesuaikan ini berdasarkan tugas Anda sesuai kebutuhan)
Akses jaringan
- HTTPS keluar ke api.anthropic.com
- Opsional: Akses ke server MCP atau alat eksternal

Memahami Arsitektur SDK

Tidak seperti panggilan API stateless, Claude Agent SDK beroperasi sebagai proses yang berjalan lama yang:

Menjalankan perintah di lingkungan shell yang persisten
Mengelola operasi file dalam direktori kerja
Menangani eksekusi alat dengan konteks dari interaksi sebelumnya

Opsi Penyedia Sandbox

Beberapa penyedia mengkhususkan diri dalam lingkungan container aman untuk eksekusi kode AI:

Untuk opsi self-hosted (Docker, gVisor, Firecracker) dan konfigurasi isolasi terperinci, lihat Isolation Technologies.

Pola Penyebaran Produksi

Pola 1: Sesi Ephemeral

Buat container baru untuk setiap tugas pengguna, kemudian hancurkan saat selesai.

Terbaik untuk tugas sekali jalan, pengguna mungkin masih berinteraksi dengan AI saat tugas sedang diselesaikan, tetapi setelah selesai container dihancurkan.

Contoh:

Investigasi & Perbaikan Bug: Debug dan selesaikan masalah spesifik dengan konteks yang relevan
Pemrosesan Invoice: Ekstrak dan strukturkan data dari kwitansi/invoice untuk sistem akuntansi
Tugas Terjemahan: Terjemahkan dokumen atau batch konten antar bahasa
Pemrosesan Gambar/Video: Terapkan transformasi, optimasi, atau ekstrak metadata dari file media

Pola 2: Sesi Berjalan Lama

Pertahankan instans container persisten untuk tugas yang berjalan lama. Sering kali menjalankan beberapa proses Claude Agent di dalam container berdasarkan permintaan.

Terbaik untuk agen proaktif yang mengambil tindakan tanpa masukan pengguna, agen yang melayani konten atau agen yang memproses jumlah pesan yang tinggi.

Contoh:

Email Agent: Memantau email masuk dan secara otomatis melakukan triase, merespons, atau mengambil tindakan berdasarkan konten
Site Builder: Menghost situs web khusus per pengguna dengan kemampuan pengeditan langsung yang disajikan melalui port container
Chat Bot Frekuensi Tinggi: Menangani aliran pesan berkelanjutan dari platform seperti Slack di mana waktu respons cepat sangat penting

Pola 3: Sesi Hybrid

Container ephemeral yang dihidrasi dengan riwayat dan status, mungkin dari database atau dari fitur resumption sesi SDK.

Terbaik untuk container dengan interaksi intermiten dari pengguna yang memulai pekerjaan dan berhenti saat pekerjaan selesai tetapi dapat dilanjutkan.

Contoh:

Personal Project Manager: Membantu mengelola proyek berkelanjutan dengan check-in intermiten, mempertahankan konteks tugas, keputusan, dan kemajuan
Deep Research: Melakukan tugas penelitian multi-jam, menyimpan temuan dan melanjutkan investigasi saat pengguna kembali
Customer Support Agent: Menangani tiket dukungan yang mencakup beberapa interaksi, memuat riwayat tiket dan konteks pelanggan

Pola 4: Container Tunggal

Jalankan beberapa proses Claude Agent SDK dalam satu container global.

Terbaik untuk agen yang harus berkolaborasi erat satu sama lain. Ini mungkin pola yang paling tidak populer karena Anda harus mencegah agen saling menimpa.

Contoh:

Simulasi: Agen yang berinteraksi satu sama lain dalam simulasi seperti video game.

FAQ

Bagaimana cara saya berkomunikasi dengan sandbox saya?

Saat hosting di container, ekspos port untuk berkomunikasi dengan instans SDK Anda. Aplikasi Anda dapat mengekspos endpoint HTTP/WebSocket untuk klien eksternal sementara SDK berjalan secara internal dalam container.

Berapa biaya hosting container?

Kami telah menemukan bahwa biaya dominan untuk melayani agen adalah token, container bervariasi berdasarkan apa yang Anda sediakan tetapi biaya minimum kira-kira 5 sen per jam berjalan.

Kapan saya harus mematikan container idle vs. menjaganya tetap hangat?

Ini mungkin tergantung penyedia, penyedia sandbox yang berbeda akan membiarkan Anda menetapkan kriteria berbeda untuk idle timeout setelah itu sandbox mungkin berhenti. Anda akan ingin menyetel timeout ini berdasarkan seberapa sering Anda pikir respons pengguna mungkin terjadi.

Seberapa sering saya harus memperbarui Claude Code CLI?

Claude Code CLI diversi dengan semver, jadi perubahan breaking apa pun akan diversi.

Bagaimana cara saya memantau kesehatan container dan kinerja agen?

Karena container hanyalah server, infrastruktur logging yang sama yang Anda gunakan untuk backend akan bekerja untuk container.

Berapa lama sesi agen dapat berjalan sebelum timeout?

Sesi agen tidak akan timeout, tetapi kami merekomendasikan menetapkan properti 'maxTurns' untuk mencegah Claude terjebak dalam loop.

Langkah Selanjutnya

Secure Deployment - Kontrol jaringan, manajemen kredensial, dan pengerasan isolasi
TypeScript SDK - Sandbox Settings - Konfigurasi sandbox secara terprogram
Sessions Guide - Pelajari tentang manajemen sesi
Permissions - Konfigurasi izin alat
Cost Tracking - Pantau penggunaan API
MCP Integration - Perluas dengan alat khusus

Was this page helpful?

Panduan

Hosting the Agent SDK

Sebarkan dan hosting Claude Agent SDK di lingkungan produksi

Untuk pengerasan keamanan di luar sandboxing dasar—termasuk kontrol jaringan, manajemen kredensial, dan opsi isolasi—lihat Secure Deployment.

Persyaratan Hosting

Sandboxing Berbasis Container

SDK juga mendukung konfigurasi sandbox terprogram untuk eksekusi perintah.

Persyaratan Sistem

Setiap instans SDK memerlukan:

Dependensi runtime
- Python 3.10+ (untuk Python SDK) atau Node.js 18+ (untuk TypeScript SDK)
- Node.js (diperlukan oleh Claude Code CLI)
- Claude Code CLI: npm install -g @anthropic-ai/claude-code
Alokasi sumber daya
- Direkomendasikan: 1GiB RAM, 5GiB disk, dan 1 CPU (sesuaikan ini berdasarkan tugas Anda sesuai kebutuhan)
Akses jaringan
- HTTPS keluar ke api.anthropic.com
- Opsional: Akses ke server MCP atau alat eksternal

Memahami Arsitektur SDK

Tidak seperti panggilan API stateless, Claude Agent SDK beroperasi sebagai proses yang berjalan lama yang:

Menjalankan perintah di lingkungan shell yang persisten
Mengelola operasi file dalam direktori kerja
Menangani eksekusi alat dengan konteks dari interaksi sebelumnya

Opsi Penyedia Sandbox

Beberapa penyedia mengkhususkan diri dalam lingkungan container aman untuk eksekusi kode AI:

Untuk opsi self-hosted (Docker, gVisor, Firecracker) dan konfigurasi isolasi terperinci, lihat Isolation Technologies.

Pola Penyebaran Produksi

Pola 1: Sesi Ephemeral

Buat container baru untuk setiap tugas pengguna, kemudian hancurkan saat selesai.

Terbaik untuk tugas sekali jalan, pengguna mungkin masih berinteraksi dengan AI saat tugas sedang diselesaikan, tetapi setelah selesai container dihancurkan.

Contoh:

Investigasi & Perbaikan Bug: Debug dan selesaikan masalah spesifik dengan konteks yang relevan
Pemrosesan Invoice: Ekstrak dan strukturkan data dari kwitansi/invoice untuk sistem akuntansi
Tugas Terjemahan: Terjemahkan dokumen atau batch konten antar bahasa
Pemrosesan Gambar/Video: Terapkan transformasi, optimasi, atau ekstrak metadata dari file media

Pola 2: Sesi Berjalan Lama

Pertahankan instans container persisten untuk tugas yang berjalan lama. Sering kali menjalankan beberapa proses Claude Agent di dalam container berdasarkan permintaan.

Terbaik untuk agen proaktif yang mengambil tindakan tanpa masukan pengguna, agen yang melayani konten atau agen yang memproses jumlah pesan yang tinggi.

Contoh:

Email Agent: Memantau email masuk dan secara otomatis melakukan triase, merespons, atau mengambil tindakan berdasarkan konten
Site Builder: Menghost situs web khusus per pengguna dengan kemampuan pengeditan langsung yang disajikan melalui port container
Chat Bot Frekuensi Tinggi: Menangani aliran pesan berkelanjutan dari platform seperti Slack di mana waktu respons cepat sangat penting

Pola 3: Sesi Hybrid

Container ephemeral yang dihidrasi dengan riwayat dan status, mungkin dari database atau dari fitur resumption sesi SDK.

Terbaik untuk container dengan interaksi intermiten dari pengguna yang memulai pekerjaan dan berhenti saat pekerjaan selesai tetapi dapat dilanjutkan.

Contoh:

Personal Project Manager: Membantu mengelola proyek berkelanjutan dengan check-in intermiten, mempertahankan konteks tugas, keputusan, dan kemajuan
Deep Research: Melakukan tugas penelitian multi-jam, menyimpan temuan dan melanjutkan investigasi saat pengguna kembali
Customer Support Agent: Menangani tiket dukungan yang mencakup beberapa interaksi, memuat riwayat tiket dan konteks pelanggan

Pola 4: Container Tunggal

Jalankan beberapa proses Claude Agent SDK dalam satu container global.

Terbaik untuk agen yang harus berkolaborasi erat satu sama lain. Ini mungkin pola yang paling tidak populer karena Anda harus mencegah agen saling menimpa.

Contoh:

Simulasi: Agen yang berinteraksi satu sama lain dalam simulasi seperti video game.

FAQ

Bagaimana cara saya berkomunikasi dengan sandbox saya?

Berapa biaya hosting container?

Kami telah menemukan bahwa biaya dominan untuk melayani agen adalah token, container bervariasi berdasarkan apa yang Anda sediakan tetapi biaya minimum kira-kira 5 sen per jam berjalan.

Kapan saya harus mematikan container idle vs. menjaganya tetap hangat?

Seberapa sering saya harus memperbarui Claude Code CLI?

Claude Code CLI diversi dengan semver, jadi perubahan breaking apa pun akan diversi.

Bagaimana cara saya memantau kesehatan container dan kinerja agen?

Karena container hanyalah server, infrastruktur logging yang sama yang Anda gunakan untuk backend akan bekerja untuk container.

Berapa lama sesi agen dapat berjalan sebelum timeout?

Sesi agen tidak akan timeout, tetapi kami merekomendasikan menetapkan properti 'maxTurns' untuk mencegah Claude terjebak dalam loop.

Langkah Selanjutnya

Secure Deployment - Kontrol jaringan, manajemen kredensial, dan pengerasan isolasi
TypeScript SDK - Sandbox Settings - Konfigurasi sandbox secara terprogram
Sessions Guide - Pelajari tentang manajemen sesi
Permissions - Konfigurasi izin alat
Cost Tracking - Pantau penggunaan API
MCP Integration - Perluas dengan alat khusus

Was this page helpful?