Leitfäden

Hosting des Agent SDK

Bereitstellung und Hosting des Claude Agent SDK in Produktionsumgebungen

Das Claude Agent SDK unterscheidet sich von traditionellen zustandslosen LLM-APIs dadurch, dass es den Konversationszustand beibehält und Befehle in einer persistenten Umgebung ausführt. Dieses Handbuch behandelt die Architektur, Hosting-Überlegungen und Best Practices für die Bereitstellung von SDK-basierten Agenten in der Produktion.

Für Sicherheitshärtung über grundlegende Sandboxing hinaus – einschließlich Netzwerkkontrollen, Credential-Management und Isolationsoptionen – siehe Sichere Bereitstellung.

Hosting-Anforderungen

Container-basiertes Sandboxing

Aus Sicherheits- und Isolationsgründen sollte das SDK in einer Sandbox-Container-Umgebung ausgeführt werden. Dies bietet Prozessisolation, Ressourcenlimits, Netzwerksteuerung und ephemere Dateisysteme.

Das SDK unterstützt auch programmgesteuerte Sandbox-Konfiguration für die Befehlsausführung.

Systemanforderungen

Jede SDK-Instanz erfordert:

Laufzeit-Abhängigkeiten
- Python 3.10+ (für Python SDK) oder Node.js 18+ (für TypeScript SDK)
- Node.js (erforderlich von Claude Code CLI)
- Claude Code CLI: npm install -g @anthropic-ai/claude-code
Ressourcenallokation
- Empfohlen: 1GiB RAM, 5GiB Festplatte und 1 CPU (variieren Sie dies je nach Aufgabe nach Bedarf)
Netzwerkzugriff
- Ausgehend HTTPS zu api.anthropic.com
- Optional: Zugriff auf MCP-Server oder externe Tools

Verständnis der SDK-Architektur

Im Gegensatz zu zustandslosen API-Aufrufen funktioniert das Claude Agent SDK als ein lang laufender Prozess, der:

Befehle ausführt in einer persistenten Shell-Umgebung
Dateivorgänge verwaltet innerhalb eines Arbeitsverzeichnisses
Tool-Ausführung handhabt mit Kontext aus vorherigen Interaktionen

Sandbox-Provider-Optionen

Mehrere Provider spezialisieren sich auf sichere Container-Umgebungen für KI-Code-Ausführung:

Modal Sandbox - Demo-Implementierung
Cloudflare Sandboxes
Daytona
E2B
Fly Machines
Vercel Sandbox

Für selbst gehostete Optionen (Docker, gVisor, Firecracker) und detaillierte Isolationskonfiguration siehe Isolationstechnologien.

Produktions-Bereitstellungsmuster

Muster 1: Ephemere Sitzungen

Erstellen Sie einen neuen Container für jede Benutzeraufgabe und zerstören Sie ihn nach Abschluss.

Am besten für einmalige Aufgaben, der Benutzer kann möglicherweise immer noch mit der KI interagieren, während die Aufgabe abgeschlossen wird, aber nach Abschluss wird der Container zerstört.

Beispiele:

Bug-Untersuchung & Behebung: Debuggen und Beheben eines spezifischen Problems mit relevantem Kontext
Rechnungsverarbeitung: Extrahieren und Strukturieren von Daten aus Quittungen/Rechnungen für Buchhaltungssysteme
Übersetzungsaufgaben: Übersetzen von Dokumenten oder Inhaltschargen zwischen Sprachen
Bild-/Videobearbeitung: Anwenden von Transformationen, Optimierungen oder Extrahieren von Metadaten aus Mediendateien

Muster 2: Lang laufende Sitzungen

Behalten Sie persistente Container-Instanzen für lang laufende Aufgaben bei. Oft laufen mehrere Claude Agent-Prozesse im Container basierend auf Bedarf.

Am besten für proaktive Agenten, die ohne Benutzereingabe handeln, Agenten, die Inhalte bereitstellen, oder Agenten, die große Mengen an Nachrichten verarbeiten.

Beispiele:

E-Mail-Agent: Überwacht eingehende E-Mails und sortiert, antwortet oder ergreift Maßnahmen basierend auf Inhalten autonom
Website-Builder: Hostet benutzerdefinierte Websites pro Benutzer mit Live-Bearbeitungsfunktionen, die über Container-Ports bereitgestellt werden
Hochfrequente Chat-Bots: Verarbeitet kontinuierliche Nachrichtenströme von Plattformen wie Slack, wo schnelle Antwortzeiten entscheidend sind

Muster 3: Hybrid-Sitzungen

Ephemere Container, die mit Verlauf und Zustand hydratisiert werden, möglicherweise aus einer Datenbank oder aus den Sitzungswiederaufnahmefunktionen des SDK.

Am besten für Container mit intermittierender Benutzerinteraktion, die Arbeit startet und herunterfährt, wenn die Arbeit abgeschlossen ist, aber fortgesetzt werden kann.

Beispiele:

Persönlicher Projektmanager: Hilft bei der Verwaltung laufender Projekte mit intermittierenden Check-ins, behält den Kontext von Aufgaben, Entscheidungen und Fortschritt
Tiefgreifende Recherche: Führt mehrstündige Recherchaufgaben durch, speichert Erkenntnisse und setzt die Untersuchung fort, wenn der Benutzer zurückkehrt
Kundenservice-Agent: Verarbeitet Support-Tickets, die mehrere Interaktionen umfassen, lädt Ticket-Verlauf und Kundenkontext

Muster 4: Einzelne Container

Führen Sie mehrere Claude Agent SDK-Prozesse in einem globalen Container aus.

Am besten für Agenten, die eng zusammenarbeiten müssen. Dies ist wahrscheinlich das am wenigsten beliebte Muster, da Sie verhindern müssen, dass Agenten sich gegenseitig überschreiben.

Beispiele:

Simulationen: Agenten, die in Simulationen wie Videospielen miteinander interagieren.

FAQ

Wie kommuniziere ich mit meinen Sandboxes?

Beim Hosting in Containern exponieren Sie Ports, um mit Ihren SDK-Instanzen zu kommunizieren. Ihre Anwendung kann HTTP/WebSocket-Endpunkte für externe Clients exponieren, während das SDK intern im Container ausgeführt wird.

Was kostet das Hosting eines Containers?

Wir haben festgestellt, dass die dominanten Kosten für die Bereitstellung von Agenten die Token sind, Container variieren je nachdem, was Sie bereitstellen, aber die Mindestkosten liegen bei etwa 5 Cent pro Stunde Laufzeit.

Wann sollte ich untätige Container herunterfahren und wann sollte ich sie warm halten?

Dies ist wahrscheinlich anbieterabhängig, verschiedene Sandbox-Provider ermöglichen es Ihnen, unterschiedliche Kriterien für Leerlauf-Timeouts festzulegen, nach denen eine Sandbox möglicherweise heruntergefahren wird. Sie sollten diesen Timeout basierend darauf abstimmen, wie häufig Sie denken, dass eine Benutzerantwort erfolgen könnte.

Wie oft sollte ich die Claude Code CLI aktualisieren?

Die Claude Code CLI wird mit Semver versioniert, daher werden alle Breaking Changes versioniert.

Wie überwache ich die Container-Gesundheit und die Agent-Leistung?

Da Container nur Server sind, funktioniert die gleiche Logging-Infrastruktur, die Sie für das Backend verwenden, auch für Container.

Wie lange kann eine Agent-Sitzung laufen, bevor sie ausfällt?

Eine Agent-Sitzung wird nicht ausfallen, aber wir empfehlen, eine 'maxTurns'-Eigenschaft festzulegen, um zu verhindern, dass Claude in einer Schleife stecken bleibt.

Nächste Schritte

Sichere Bereitstellung - Netzwerkkontrollen, Credential-Management und Isolationshärtung
TypeScript SDK - Sandbox-Einstellungen - Konfigurieren Sie Sandbox programmgesteuert
Sitzungshandbuch - Erfahren Sie mehr über Sitzungsverwaltung
Berechtigungen - Konfigurieren Sie Tool-Berechtigungen
Kostentracking - Überwachen Sie die API-Nutzung
MCP-Integration - Erweitern Sie mit benutzerdefinierten Tools

Was this page helpful?

Leitfäden

Hosting des Agent SDK

Bereitstellung und Hosting des Claude Agent SDK in Produktionsumgebungen

Für Sicherheitshärtung über grundlegende Sandboxing hinaus – einschließlich Netzwerkkontrollen, Credential-Management und Isolationsoptionen – siehe Sichere Bereitstellung.

Hosting-Anforderungen

Container-basiertes Sandboxing

Das SDK unterstützt auch programmgesteuerte Sandbox-Konfiguration für die Befehlsausführung.

Systemanforderungen

Jede SDK-Instanz erfordert:

Laufzeit-Abhängigkeiten
- Python 3.10+ (für Python SDK) oder Node.js 18+ (für TypeScript SDK)
- Node.js (erforderlich von Claude Code CLI)
- Claude Code CLI: npm install -g @anthropic-ai/claude-code
Ressourcenallokation
- Empfohlen: 1GiB RAM, 5GiB Festplatte und 1 CPU (variieren Sie dies je nach Aufgabe nach Bedarf)
Netzwerkzugriff
- Ausgehend HTTPS zu api.anthropic.com
- Optional: Zugriff auf MCP-Server oder externe Tools

Verständnis der SDK-Architektur

Im Gegensatz zu zustandslosen API-Aufrufen funktioniert das Claude Agent SDK als ein lang laufender Prozess, der:

Befehle ausführt in einer persistenten Shell-Umgebung
Dateivorgänge verwaltet innerhalb eines Arbeitsverzeichnisses
Tool-Ausführung handhabt mit Kontext aus vorherigen Interaktionen

Sandbox-Provider-Optionen

Mehrere Provider spezialisieren sich auf sichere Container-Umgebungen für KI-Code-Ausführung:

Modal Sandbox - Demo-Implementierung
Cloudflare Sandboxes
Daytona
E2B
Fly Machines
Vercel Sandbox

Für selbst gehostete Optionen (Docker, gVisor, Firecracker) und detaillierte Isolationskonfiguration siehe Isolationstechnologien.

Produktions-Bereitstellungsmuster

Muster 1: Ephemere Sitzungen

Erstellen Sie einen neuen Container für jede Benutzeraufgabe und zerstören Sie ihn nach Abschluss.

Am besten für einmalige Aufgaben, der Benutzer kann möglicherweise immer noch mit der KI interagieren, während die Aufgabe abgeschlossen wird, aber nach Abschluss wird der Container zerstört.

Beispiele:

Bug-Untersuchung & Behebung: Debuggen und Beheben eines spezifischen Problems mit relevantem Kontext
Rechnungsverarbeitung: Extrahieren und Strukturieren von Daten aus Quittungen/Rechnungen für Buchhaltungssysteme
Übersetzungsaufgaben: Übersetzen von Dokumenten oder Inhaltschargen zwischen Sprachen
Bild-/Videobearbeitung: Anwenden von Transformationen, Optimierungen oder Extrahieren von Metadaten aus Mediendateien

Muster 2: Lang laufende Sitzungen

Behalten Sie persistente Container-Instanzen für lang laufende Aufgaben bei. Oft laufen mehrere Claude Agent-Prozesse im Container basierend auf Bedarf.

Am besten für proaktive Agenten, die ohne Benutzereingabe handeln, Agenten, die Inhalte bereitstellen, oder Agenten, die große Mengen an Nachrichten verarbeiten.

Beispiele:

E-Mail-Agent: Überwacht eingehende E-Mails und sortiert, antwortet oder ergreift Maßnahmen basierend auf Inhalten autonom
Website-Builder: Hostet benutzerdefinierte Websites pro Benutzer mit Live-Bearbeitungsfunktionen, die über Container-Ports bereitgestellt werden
Hochfrequente Chat-Bots: Verarbeitet kontinuierliche Nachrichtenströme von Plattformen wie Slack, wo schnelle Antwortzeiten entscheidend sind

Muster 3: Hybrid-Sitzungen

Ephemere Container, die mit Verlauf und Zustand hydratisiert werden, möglicherweise aus einer Datenbank oder aus den Sitzungswiederaufnahmefunktionen des SDK.

Am besten für Container mit intermittierender Benutzerinteraktion, die Arbeit startet und herunterfährt, wenn die Arbeit abgeschlossen ist, aber fortgesetzt werden kann.

Beispiele:

Persönlicher Projektmanager: Hilft bei der Verwaltung laufender Projekte mit intermittierenden Check-ins, behält den Kontext von Aufgaben, Entscheidungen und Fortschritt
Tiefgreifende Recherche: Führt mehrstündige Recherchaufgaben durch, speichert Erkenntnisse und setzt die Untersuchung fort, wenn der Benutzer zurückkehrt
Kundenservice-Agent: Verarbeitet Support-Tickets, die mehrere Interaktionen umfassen, lädt Ticket-Verlauf und Kundenkontext

Muster 4: Einzelne Container

Führen Sie mehrere Claude Agent SDK-Prozesse in einem globalen Container aus.

Am besten für Agenten, die eng zusammenarbeiten müssen. Dies ist wahrscheinlich das am wenigsten beliebte Muster, da Sie verhindern müssen, dass Agenten sich gegenseitig überschreiben.

Beispiele:

Simulationen: Agenten, die in Simulationen wie Videospielen miteinander interagieren.

FAQ

Wie kommuniziere ich mit meinen Sandboxes?

Was kostet das Hosting eines Containers?

Wann sollte ich untätige Container herunterfahren und wann sollte ich sie warm halten?

Wie oft sollte ich die Claude Code CLI aktualisieren?

Die Claude Code CLI wird mit Semver versioniert, daher werden alle Breaking Changes versioniert.

Wie überwache ich die Container-Gesundheit und die Agent-Leistung?

Da Container nur Server sind, funktioniert die gleiche Logging-Infrastruktur, die Sie für das Backend verwenden, auch für Container.

Wie lange kann eine Agent-Sitzung laufen, bevor sie ausfällt?

Eine Agent-Sitzung wird nicht ausfallen, aber wir empfehlen, eine 'maxTurns'-Eigenschaft festzulegen, um zu verhindern, dass Claude in einer Schleife stecken bleibt.

Nächste Schritte

Sichere Bereitstellung - Netzwerkkontrollen, Credential-Management und Isolationshärtung
TypeScript SDK - Sandbox-Einstellungen - Konfigurieren Sie Sandbox programmgesteuert
Sitzungshandbuch - Erfahren Sie mehr über Sitzungsverwaltung
Berechtigungen - Konfigurieren Sie Tool-Berechtigungen
Kostentracking - Überwachen Sie die API-Nutzung
MCP-Integration - Erweitern Sie mit benutzerdefinierten Tools

Was this page helpful?