Das Claude Agent SDK unterscheidet sich von herkömmlichen zustandslosen LLM-APIs dadurch, dass es den Konversationszustand aufrechterhält und Befehle in einer persistenten Umgebung ausführt. Dieser Leitfaden behandelt die Architektur, Hosting-Überlegungen und bewährte Praktiken für die Bereitstellung SDK-basierter Agenten in der Produktion.
Im Gegensatz zu zustandslosen API-Aufrufen funktioniert das Claude Agent SDK als langlebiger Prozess, der:
Für Sicherheit und Isolation sollte das SDK innerhalb einer sandboxed Container-Umgebung laufen. Dies bietet:
Jede SDK-Instanz benötigt:
Laufzeit-Abhängigkeiten
npm install -g @anthropic-ai/claude-codeRessourcenzuteilung
Netzwerkzugang
api.anthropic.comMehrere Anbieter spezialisieren sich auf sichere Container-Umgebungen für AI-Code-Ausführung:
Erstellen Sie einen neuen Container für jede Benutzeraufgabe und zerstören Sie ihn dann, wenn er abgeschlossen ist.
Am besten für einmalige Aufgaben, der Benutzer kann immer noch mit der AI interagieren, während die Aufgabe abgeschlossen wird, aber sobald sie abgeschlossen ist, wird der Container zerstört.
Beispiele:
Aufrechterhalten persistenter Container-Instanzen für langlebige Aufgaben. Oft laufen mehrere Claude Agent-Prozesse innerhalb des Containers basierend auf der Nachfrage.
Am besten für proaktive Agenten, die Aktionen ohne Benutzereingabe durchführen, Agenten, die Inhalte bereitstellen, oder Agenten, die große Mengen von Nachrichten verarbeiten.
Beispiele:
Ephemere Container, die mit Historie und Zustand hydratisiert werden, möglicherweise aus einer Datenbank oder aus den Sitzungswiederaufnahme-Features des SDK.
Am besten für Container mit intermittierender Benutzerinteraktion, die Arbeit startet und herunterfährt, wenn die Arbeit abgeschlossen ist, aber fortgesetzt werden kann.
Beispiele:
Führen Sie mehrere Claude Agent SDK-Prozesse in einem globalen Container aus.
Am besten für Agenten, die eng zusammenarbeiten müssen. Dies ist wahrscheinlich das am wenigsten beliebte Muster, da Sie verhindern müssen, dass sich Agenten gegenseitig überschreiben.
Beispiele:
Beim Hosting in Containern exponieren Sie Ports, um mit Ihren SDK-Instanzen zu kommunizieren. Ihre Anwendung kann HTTP/WebSocket-Endpunkte für externe Clients exponieren, während das SDK intern innerhalb des Containers läuft.
Wir haben festgestellt, dass die dominierenden Kosten beim Bereitstellen von Agenten die Tokens sind, Container variieren basierend auf dem, was Sie bereitstellen, aber Mindestkosten betragen etwa 5 Cent pro Stunde Laufzeit.
Dies ist wahrscheinlich anbieterabhängig, verschiedene Sandbox-Anbieter lassen Sie verschiedene Kriterien für Leerlauf-Timeouts festlegen, nach denen eine Sandbox herunterfahren könnte. Sie werden dieses Timeout basierend darauf abstimmen wollen, wie häufig Sie denken, dass Benutzerantworten auftreten könnten.
Die Claude Code CLI ist mit semver versioniert, sodass alle breaking changes versioniert werden.
Da Container nur Server sind, funktioniert die gleiche Logging-Infrastruktur, die Sie für das Backend verwenden, auch für Container.
Eine Agent-Sitzung wird kein Timeout erreichen, aber wir empfehlen, eine 'maxTurns'-Eigenschaft zu setzen, um zu verhindern, dass Claude in einer Schleife stecken bleibt.