Das Claude Agent SDK unterscheidet sich von traditionellen zustandslosen LLM-APIs dadurch, dass es den Konversationszustand beibehält und Befehle in einer persistenten Umgebung ausführt. Dieses Handbuch behandelt die Architektur, Hosting-Überlegungen und Best Practices für die Bereitstellung von SDK-basierten Agenten in der Produktion.
Für Sicherheitshärtung über grundlegende Sandboxing hinaus – einschließlich Netzwerkkontrollen, Credential-Management und Isolationsoptionen – siehe Sichere Bereitstellung.
Aus Sicherheits- und Isolationsgründen sollte das SDK in einer Sandbox-Container-Umgebung ausgeführt werden. Dies bietet Prozessisolation, Ressourcenlimits, Netzwerksteuerung und ephemere Dateisysteme.
Das SDK unterstützt auch programmgesteuerte Sandbox-Konfiguration für die Befehlsausführung.
Jede SDK-Instanz erfordert:
Laufzeit-Abhängigkeiten
npm install -g @anthropic-ai/claude-codeRessourcenallokation
Netzwerkzugriff
api.anthropic.comIm Gegensatz zu zustandslosen API-Aufrufen funktioniert das Claude Agent SDK als ein lang laufender Prozess, der:
Mehrere Provider spezialisieren sich auf sichere Container-Umgebungen für KI-Code-Ausführung:
Für selbst gehostete Optionen (Docker, gVisor, Firecracker) und detaillierte Isolationskonfiguration siehe Isolationstechnologien.
Erstellen Sie einen neuen Container für jede Benutzeraufgabe und zerstören Sie ihn nach Abschluss.
Am besten für einmalige Aufgaben, der Benutzer kann möglicherweise immer noch mit der KI interagieren, während die Aufgabe abgeschlossen wird, aber nach Abschluss wird der Container zerstört.
Beispiele:
Behalten Sie persistente Container-Instanzen für lang laufende Aufgaben bei. Oft laufen mehrere Claude Agent-Prozesse im Container basierend auf Bedarf.
Am besten für proaktive Agenten, die ohne Benutzereingabe handeln, Agenten, die Inhalte bereitstellen, oder Agenten, die große Mengen an Nachrichten verarbeiten.
Beispiele:
Ephemere Container, die mit Verlauf und Zustand hydratisiert werden, möglicherweise aus einer Datenbank oder aus den Sitzungswiederaufnahmefunktionen des SDK.
Am besten für Container mit intermittierender Benutzerinteraktion, die Arbeit startet und herunterfährt, wenn die Arbeit abgeschlossen ist, aber fortgesetzt werden kann.
Beispiele:
Führen Sie mehrere Claude Agent SDK-Prozesse in einem globalen Container aus.
Am besten für Agenten, die eng zusammenarbeiten müssen. Dies ist wahrscheinlich das am wenigsten beliebte Muster, da Sie verhindern müssen, dass Agenten sich gegenseitig überschreiben.
Beispiele:
Beim Hosting in Containern exponieren Sie Ports, um mit Ihren SDK-Instanzen zu kommunizieren. Ihre Anwendung kann HTTP/WebSocket-Endpunkte für externe Clients exponieren, während das SDK intern im Container ausgeführt wird.
Wir haben festgestellt, dass die dominanten Kosten für die Bereitstellung von Agenten die Token sind, Container variieren je nachdem, was Sie bereitstellen, aber die Mindestkosten liegen bei etwa 5 Cent pro Stunde Laufzeit.
Dies ist wahrscheinlich anbieterabhängig, verschiedene Sandbox-Provider ermöglichen es Ihnen, unterschiedliche Kriterien für Leerlauf-Timeouts festzulegen, nach denen eine Sandbox möglicherweise heruntergefahren wird. Sie sollten diesen Timeout basierend darauf abstimmen, wie häufig Sie denken, dass eine Benutzerantwort erfolgen könnte.
Die Claude Code CLI wird mit Semver versioniert, daher werden alle Breaking Changes versioniert.
Da Container nur Server sind, funktioniert die gleiche Logging-Infrastruktur, die Sie für das Backend verwenden, auch für Container.
Eine Agent-Sitzung wird nicht ausfallen, aber wir empfehlen, eine 'maxTurns'-Eigenschaft festzulegen, um zu verhindern, dass Claude in einer Schleife stecken bleibt.
Was this page helpful?