Loading...
    • Entwicklerleitfaden
    • API-Referenz
    • MCP
    • Ressourcen
    • Versionshinweise
    Search...
    ⌘K
    Erste Schritte
    Einführung in ClaudeSchnelleinstieg
    Modelle & Preise
    ModellübersichtModell auswählenNeuerungen in Claude 4.6MigrationsleitfadenModellabschreibungenPreise
    Mit Claude entwickeln
    FunktionsübersichtMessages API verwendenStop-Gründe verarbeitenBest Practices für Prompts
    Modellfähigkeiten
    Extended ThinkingAdaptive ThinkingAufwandFast Mode (Research Preview)Strukturierte AusgabenZitateStreaming MessagesBatch-VerarbeitungPDF-UnterstützungSuchergebnisseMehrsprachige UnterstützungEmbeddingsVision
    Tools
    ÜbersichtTool-Nutzung implementierenWeb-Such-ToolWeb-Abruf-ToolCode-Ausführungs-ToolMemory-ToolBash-ToolComputer-Use-ToolText-Editor-Tool
    Tool-Infrastruktur
    Tool-SucheProgrammgesteuerte Tool-AufrufeFeingranulares Tool-Streaming
    Kontextverwaltung
    KontextfensterKomprimierungKontextbearbeitungPrompt CachingToken-Zählung
    Dateien & Assets
    Files API
    Agent Skills
    ÜbersichtSchnelleinstiegBest PracticesSkills für UnternehmenSkills mit der API verwenden
    Agent SDK
    ÜbersichtSchnelleinstiegTypeScript SDKTypeScript V2 (Preview)Python SDKMigrationsleitfaden
    Streaming-EingabeAntworten in Echtzeit streamenStop-Gründe verarbeitenBerechtigungen verarbeitenBenutzergenehmigungen und EingabeAusführung mit Hooks steuernSitzungsverwaltungDatei-CheckpointingStrukturierte Ausgaben im SDKAgent SDK hostenKI-Agenten sicher bereitstellenSystem-Prompts ändernMCP im SDKBenutzerdefinierte ToolsSubagents im SDKSlash-Befehle im SDKAgent Skills im SDKKosten und Nutzung verfolgenTodo-ListenPlugins im SDK
    MCP in der API
    MCP-ConnectorRemote MCP-Server
    Claude auf Plattformen von Drittanbietern
    Amazon BedrockMicrosoft FoundryVertex AI
    Prompt Engineering
    ÜbersichtPrompt-GeneratorPrompt-Vorlagen verwendenPrompt-VerbessererKlar und direkt seinBeispiele verwenden (Multishot Prompting)Claude denken lassen (CoT)XML-Tags verwendenClaude eine Rolle geben (System Prompts)Komplexe Prompts verkettenTipps für lange KontexteTipps für Extended Thinking
    Testen & Evaluieren
    Erfolgskriterien definierenTestfälle entwickelnEvaluierungstool verwendenLatenz reduzieren
    Schutzmaßnahmen verstärken
    Halluzinationen reduzierenAusgabekonsistenz erhöhenJailbreaks abschwächenStreaming-AblehnungenPrompt-Lecks reduzierenClaude im Charakter halten
    Verwaltung und Überwachung
    Admin API ÜbersichtDatenspeicherortArbeitsbereicheUsage and Cost APIClaude Code Analytics APIZero Data Retention
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Leitfäden

    Hosting des Agent SDK

    Bereitstellung und Hosting des Claude Agent SDK in Produktionsumgebungen

    Das Claude Agent SDK unterscheidet sich von traditionellen zustandslosen LLM-APIs dadurch, dass es den Konversationszustand beibehält und Befehle in einer persistenten Umgebung ausführt. Dieses Handbuch behandelt die Architektur, Hosting-Überlegungen und Best Practices für die Bereitstellung von SDK-basierten Agenten in der Produktion.

    Für Sicherheitshärtung über grundlegende Sandboxing hinaus – einschließlich Netzwerkkontrollen, Credential-Management und Isolationsoptionen – siehe Sichere Bereitstellung.

    Hosting-Anforderungen

    Container-basiertes Sandboxing

    Aus Sicherheits- und Isolationsgründen sollte das SDK in einer Sandbox-Container-Umgebung ausgeführt werden. Dies bietet Prozessisolation, Ressourcenlimits, Netzwerksteuerung und ephemere Dateisysteme.

    Das SDK unterstützt auch programmgesteuerte Sandbox-Konfiguration für die Befehlsausführung.

    Systemanforderungen

    Jede SDK-Instanz erfordert:

    • Laufzeit-Abhängigkeiten

      • Python 3.10+ (für Python SDK) oder Node.js 18+ (für TypeScript SDK)
      • Node.js (erforderlich von Claude Code CLI)
      • Claude Code CLI: npm install -g @anthropic-ai/claude-code
    • Ressourcenallokation

      • Empfohlen: 1GiB RAM, 5GiB Festplatte und 1 CPU (variieren Sie dies je nach Aufgabe nach Bedarf)
    • Netzwerkzugriff

      • Ausgehend HTTPS zu api.anthropic.com
      • Optional: Zugriff auf MCP-Server oder externe Tools

    Verständnis der SDK-Architektur

    Im Gegensatz zu zustandslosen API-Aufrufen funktioniert das Claude Agent SDK als ein lang laufender Prozess, der:

    • Befehle ausführt in einer persistenten Shell-Umgebung
    • Dateivorgänge verwaltet innerhalb eines Arbeitsverzeichnisses
    • Tool-Ausführung handhabt mit Kontext aus vorherigen Interaktionen

    Sandbox-Provider-Optionen

    Mehrere Provider spezialisieren sich auf sichere Container-Umgebungen für KI-Code-Ausführung:

    • Modal Sandbox - Demo-Implementierung
    • Cloudflare Sandboxes
    • Daytona
    • E2B
    • Fly Machines
    • Vercel Sandbox

    Für selbst gehostete Optionen (Docker, gVisor, Firecracker) und detaillierte Isolationskonfiguration siehe Isolationstechnologien.

    Produktions-Bereitstellungsmuster

    Muster 1: Ephemere Sitzungen

    Erstellen Sie einen neuen Container für jede Benutzeraufgabe und zerstören Sie ihn nach Abschluss.

    Am besten für einmalige Aufgaben, der Benutzer kann möglicherweise immer noch mit der KI interagieren, während die Aufgabe abgeschlossen wird, aber nach Abschluss wird der Container zerstört.

    Beispiele:

    • Bug-Untersuchung & Behebung: Debuggen und Beheben eines spezifischen Problems mit relevantem Kontext
    • Rechnungsverarbeitung: Extrahieren und Strukturieren von Daten aus Quittungen/Rechnungen für Buchhaltungssysteme
    • Übersetzungsaufgaben: Übersetzen von Dokumenten oder Inhaltschargen zwischen Sprachen
    • Bild-/Videobearbeitung: Anwenden von Transformationen, Optimierungen oder Extrahieren von Metadaten aus Mediendateien

    Muster 2: Lang laufende Sitzungen

    Behalten Sie persistente Container-Instanzen für lang laufende Aufgaben bei. Oft laufen mehrere Claude Agent-Prozesse im Container basierend auf Bedarf.

    Am besten für proaktive Agenten, die ohne Benutzereingabe handeln, Agenten, die Inhalte bereitstellen, oder Agenten, die große Mengen an Nachrichten verarbeiten.

    Beispiele:

    • E-Mail-Agent: Überwacht eingehende E-Mails und sortiert, antwortet oder ergreift Maßnahmen basierend auf Inhalten autonom
    • Website-Builder: Hostet benutzerdefinierte Websites pro Benutzer mit Live-Bearbeitungsfunktionen, die über Container-Ports bereitgestellt werden
    • Hochfrequente Chat-Bots: Verarbeitet kontinuierliche Nachrichtenströme von Plattformen wie Slack, wo schnelle Antwortzeiten entscheidend sind

    Muster 3: Hybrid-Sitzungen

    Ephemere Container, die mit Verlauf und Zustand hydratisiert werden, möglicherweise aus einer Datenbank oder aus den Sitzungswiederaufnahmefunktionen des SDK.

    Am besten für Container mit intermittierender Benutzerinteraktion, die Arbeit startet und herunterfährt, wenn die Arbeit abgeschlossen ist, aber fortgesetzt werden kann.

    Beispiele:

    • Persönlicher Projektmanager: Hilft bei der Verwaltung laufender Projekte mit intermittierenden Check-ins, behält den Kontext von Aufgaben, Entscheidungen und Fortschritt
    • Tiefgreifende Recherche: Führt mehrstündige Recherchaufgaben durch, speichert Erkenntnisse und setzt die Untersuchung fort, wenn der Benutzer zurückkehrt
    • Kundenservice-Agent: Verarbeitet Support-Tickets, die mehrere Interaktionen umfassen, lädt Ticket-Verlauf und Kundenkontext

    Muster 4: Einzelne Container

    Führen Sie mehrere Claude Agent SDK-Prozesse in einem globalen Container aus.

    Am besten für Agenten, die eng zusammenarbeiten müssen. Dies ist wahrscheinlich das am wenigsten beliebte Muster, da Sie verhindern müssen, dass Agenten sich gegenseitig überschreiben.

    Beispiele:

    • Simulationen: Agenten, die in Simulationen wie Videospielen miteinander interagieren.

    FAQ

    Wie kommuniziere ich mit meinen Sandboxes?

    Beim Hosting in Containern exponieren Sie Ports, um mit Ihren SDK-Instanzen zu kommunizieren. Ihre Anwendung kann HTTP/WebSocket-Endpunkte für externe Clients exponieren, während das SDK intern im Container ausgeführt wird.

    Was kostet das Hosting eines Containers?

    Wir haben festgestellt, dass die dominanten Kosten für die Bereitstellung von Agenten die Token sind, Container variieren je nachdem, was Sie bereitstellen, aber die Mindestkosten liegen bei etwa 5 Cent pro Stunde Laufzeit.

    Wann sollte ich untätige Container herunterfahren und wann sollte ich sie warm halten?

    Dies ist wahrscheinlich anbieterabhängig, verschiedene Sandbox-Provider ermöglichen es Ihnen, unterschiedliche Kriterien für Leerlauf-Timeouts festzulegen, nach denen eine Sandbox möglicherweise heruntergefahren wird. Sie sollten diesen Timeout basierend darauf abstimmen, wie häufig Sie denken, dass eine Benutzerantwort erfolgen könnte.

    Wie oft sollte ich die Claude Code CLI aktualisieren?

    Die Claude Code CLI wird mit Semver versioniert, daher werden alle Breaking Changes versioniert.

    Wie überwache ich die Container-Gesundheit und die Agent-Leistung?

    Da Container nur Server sind, funktioniert die gleiche Logging-Infrastruktur, die Sie für das Backend verwenden, auch für Container.

    Wie lange kann eine Agent-Sitzung laufen, bevor sie ausfällt?

    Eine Agent-Sitzung wird nicht ausfallen, aber wir empfehlen, eine 'maxTurns'-Eigenschaft festzulegen, um zu verhindern, dass Claude in einer Schleife stecken bleibt.

    Nächste Schritte

    • Sichere Bereitstellung - Netzwerkkontrollen, Credential-Management und Isolationshärtung
    • TypeScript SDK - Sandbox-Einstellungen - Konfigurieren Sie Sandbox programmgesteuert
    • Sitzungshandbuch - Erfahren Sie mehr über Sitzungsverwaltung
    • Berechtigungen - Konfigurieren Sie Tool-Berechtigungen
    • Kostentracking - Überwachen Sie die API-Nutzung
    • MCP-Integration - Erweitern Sie mit benutzerdefinierten Tools

    Was this page helpful?

    • Hosting-Anforderungen
    • Container-basiertes Sandboxing
    • Systemanforderungen
    • Verständnis der SDK-Architektur
    • Sandbox-Provider-Optionen
    • Produktions-Bereitstellungsmuster
    • Muster 1: Ephemere Sitzungen
    • Muster 2: Lang laufende Sitzungen
    • Muster 3: Hybrid-Sitzungen
    • Muster 4: Einzelne Container
    • Wie kommuniziere ich mit meinen Sandboxes?
    • Was kostet das Hosting eines Containers?
    • Wann sollte ich untätige Container herunterfahren und wann sollte ich sie warm halten?
    • Wie oft sollte ich die Claude Code CLI aktualisieren?
    • Wie überwache ich die Container-Gesundheit und die Agent-Leistung?
    • Wie lange kann eine Agent-Sitzung laufen, bevor sie ausfällt?
    • Nächste Schritte