Loading...
    • Guide du développeur
    • Référence API
    • MCP
    • Ressources
    • Notes de version
    Search...
    ⌘K
    Premiers pas
    Introduction à ClaudeDémarrage rapide
    Modèles et tarification
    Aperçu des modèlesChoisir un modèleNouveautés dans Claude 4.5Migration vers Claude 4.5Dépréciations de modèlesTarification
    Créer avec Claude
    Aperçu des fonctionnalitésUtiliser l'API MessagesFenêtres de contexteBonnes pratiques de prompting
    Capacités
    Mise en cache des promptsÉdition de contexteRéflexion étendueEffortStreaming de messagesTraitement par lotsCitationsSupport multilingueComptage de tokensEmbeddingsVisionSupport PDFAPI FilesRésultats de rechercheSorties structuréesComplément Google Sheets
    Outils
    AperçuComment implémenter l'utilisation d'outilsUtilisation d'outils efficace en tokensStreaming d'outils granulaireOutil BashOutil d'exécution de codeAppel d'outils programmatiqueOutil Computer useOutil Éditeur de texteOutil Web fetchOutil Recherche webOutil MémoireOutil Recherche d'outils
    Compétences d'agent
    AperçuDémarrage rapideBonnes pratiquesUtiliser les compétences avec l'API
    SDK Agent
    AperçuSDK TypeScriptSDK PythonGuide de migration
    Guides
    Streaming d'entréeGestion des permissionsGestion de sessionSorties structurées dans le SDKHébergement du SDK AgentModification des prompts systèmeMCP dans le SDKOutils personnalisésSous-agents dans le SDKCommandes slash dans le SDKCompétences d'agent dans le SDKSuivi des coûts et de l'utilisationListes de tâchesPlugins dans le SDK
    MCP dans l'API
    Connecteur MCPServeurs MCP distants
    Claude sur des plateformes tierces
    Amazon BedrockMicrosoft FoundryVertex AI
    Ingénierie des prompts
    AperçuGénérateur de promptsUtiliser des modèles de promptsAméliorateur de promptsÊtre clair et directUtiliser des exemples (prompting multi-shots)Laisser Claude réfléchir (CoT)Utiliser des balises XMLDonner un rôle à Claude (prompts système)Pré-remplir la réponse de ClaudeChaîner des prompts complexesConseils pour le contexte longConseils pour la réflexion étendue
    Tester et évaluer
    Définir les critères de succèsDévelopper des cas de testUtiliser l'outil d'évaluationRéduire la latence
    Renforcer les garde-fous
    Réduire les hallucinationsAugmenter la cohérence des résultatsAtténuer les jailbreaksRefus en streamingRéduire les fuites de promptsGarder Claude dans le rôle
    Administration et surveillance
    Aperçu de l'API AdminAPI Utilisation et coûtsAPI Claude Code Analytics
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Guides

    Hébergement du SDK Agent

    Déployez et hébergez le SDK Claude Agent dans des environnements de production
    • Exigences d'hébergement
    • Sandboxing basé sur des conteneurs
    • Configuration système requise
    • Comprendre l'architecture du SDK
    • Options de fournisseur de sandbox
    • Modèles de déploiement en production
    • Modèle 1 : Sessions éphémères
    • Modèle 2 : Sessions long terme
    • Modèle 3 : Sessions hybrides
    • Modèle 4 : Conteneurs uniques
    • Comment communiquer avec mes sandboxes ?
    • Quel est le coût d'hébergement d'un conteneur ?
    • Quand dois-je arrêter les conteneurs inactifs par rapport à les garder actifs ?
    • À quelle fréquence dois-je mettre à jour Claude Code CLI ?
    • Comment surveiller la santé des conteneurs et les performances des agents ?
    • Combien de temps une session d'agent peut-elle s'exécuter avant expiration ?
    • Étapes suivantes

    Le SDK Claude Agent diffère des API LLM sans état traditionnelles en ce qu'il maintient l'état conversationnel et exécute des commandes dans un environnement persistant. Ce guide couvre l'architecture, les considérations d'hébergement et les meilleures pratiques pour déployer des agents basés sur le SDK en production.

    Exigences d'hébergement

    Sandboxing basé sur des conteneurs

    Pour la sécurité et l'isolation, le SDK doit s'exécuter à l'intérieur d'un environnement de conteneur en sandbox. Cela fournit :

    • Isolation des processus - Environnement d'exécution séparé par session
    • Limites de ressources - Contraintes de CPU, mémoire et stockage
    • Contrôle réseau - Restreindre les connexions sortantes
    • Systèmes de fichiers éphémères - État propre pour chaque session

    Configuration système requise

    Chaque instance du SDK nécessite :

    • Dépendances d'exécution

      • Python 3.10+ (pour le SDK Python) ou Node.js 18+ (pour le SDK TypeScript)
      • Node.js (requis par Claude Code CLI)
      • Claude Code CLI : npm install -g @anthropic-ai/claude-code
    • Allocation de ressources

      • Recommandé : 1 GiB de RAM, 5 GiB de disque et 1 CPU (ajustez cela en fonction de votre tâche selon les besoins)
    • Accès réseau

      • HTTPS sortant vers api.anthropic.com
      • Optionnel : Accès aux serveurs MCP ou outils externes

    Comprendre l'architecture du SDK

    Contrairement aux appels API sans état, le SDK Claude Agent fonctionne comme un processus long terme qui :

    • Exécute des commandes dans un environnement shell persistant
    • Gère les opérations de fichiers dans un répertoire de travail
    • Gère l'exécution des outils avec le contexte des interactions précédentes

    Options de fournisseur de sandbox

    Plusieurs fournisseurs se spécialisent dans les environnements de conteneurs sécurisés pour l'exécution de code IA :

    • Cloudflare Sandboxes
    • Modal Sandboxes
    • Daytona
    • E2B
    • Fly Machines
    • Vercel Sandbox

    Modèles de déploiement en production

    Modèle 1 : Sessions éphémères

    Créez un nouveau conteneur pour chaque tâche utilisateur, puis détruisez-le une fois terminé.

    Idéal pour les tâches ponctuelles, l'utilisateur peut toujours interagir avec l'IA pendant que la tâche se termine, mais une fois terminée, le conteneur est détruit.

    Exemples :

    • Enquête et correction de bogues : Déboguer et résoudre un problème spécifique avec le contexte pertinent
    • Traitement des factures : Extraire et structurer les données des reçus/factures pour les systèmes comptables
    • Tâches de traduction : Traduire des documents ou des lots de contenu entre les langues
    • Traitement d'images/vidéos : Appliquer des transformations, des optimisations ou extraire des métadonnées à partir de fichiers médias

    Modèle 2 : Sessions long terme

    Maintenir des instances de conteneurs persistantes pour les tâches long terme. Souvent, exécuter plusieurs processus Claude Agent à l'intérieur du conteneur en fonction de la demande.

    Idéal pour les agents proactifs qui agissent sans l'entrée de l'utilisateur, les agents qui servent du contenu ou les agents qui traitent de grandes quantités de messages.

    Exemples :

    • Agent de messagerie : Surveille les e-mails entrants et trie, répond ou prend des mesures de manière autonome en fonction du contenu
    • Constructeur de sites : Héberge des sites Web personnalisés par utilisateur avec des capacités d'édition en direct servies via les ports du conteneur
    • Chatbots haute fréquence : Gère les flux de messages continus à partir de plateformes comme Slack où les temps de réponse rapides sont critiques

    Modèle 3 : Sessions hybrides

    Conteneurs éphémères qui sont hydratés avec l'historique et l'état, possiblement à partir d'une base de données ou des fonctionnalités de reprise de session du SDK.

    Idéal pour les conteneurs avec une interaction intermittente de l'utilisateur qui lance le travail et s'arrête lorsque le travail est terminé mais peut être continué.

    Exemples :

    • Gestionnaire de projets personnels : Aide à gérer les projets en cours avec des vérifications intermittentes, maintient le contexte des tâches, des décisions et de la progression
    • Recherche approfondie : Mène des tâches de recherche de plusieurs heures, enregistre les résultats et reprend l'enquête lorsque l'utilisateur revient
    • Agent de support client : Gère les tickets de support qui s'étendent sur plusieurs interactions, charge l'historique des tickets et le contexte client

    Modèle 4 : Conteneurs uniques

    Exécutez plusieurs processus du SDK Claude Agent dans un conteneur global unique.

    Idéal pour les agents qui doivent collaborer étroitement. C'est probablement le modèle le moins populaire car vous devrez empêcher les agents de se réécrire mutuellement.

    Exemples :

    • Simulations : Agents qui interagissent les uns avec les autres dans des simulations telles que des jeux vidéo.

    FAQ

    Comment communiquer avec mes sandboxes ?

    Lors de l'hébergement dans des conteneurs, exposez les ports pour communiquer avec vos instances du SDK. Votre application peut exposer des points de terminaison HTTP/WebSocket pour les clients externes tandis que le SDK s'exécute en interne dans le conteneur.

    Quel est le coût d'hébergement d'un conteneur ?

    Nous avons constaté que le coût dominant de la fourniture d'agents est les jetons, les conteneurs varient en fonction de ce que vous provisionnez, mais un coût minimum est d'environ 5 cents par heure d'exécution.

    Quand dois-je arrêter les conteneurs inactifs par rapport à les garder actifs ?

    Cela dépend probablement du fournisseur, différents fournisseurs de sandbox vous permettront de définir différents critères pour les délais d'inactivité après lesquels un sandbox pourrait s'arrêter. Vous voudrez ajuster ce délai d'expiration en fonction de la fréquence à laquelle vous pensez que la réponse de l'utilisateur pourrait se produire.

    À quelle fréquence dois-je mettre à jour Claude Code CLI ?

    Claude Code CLI est versionné avec semver, donc tout changement de rupture sera versionné.

    Comment surveiller la santé des conteneurs et les performances des agents ?

    Puisque les conteneurs sont simplement des serveurs, la même infrastructure de journalisation que vous utilisez pour le backend fonctionnera pour les conteneurs.

    Combien de temps une session d'agent peut-elle s'exécuter avant expiration ?

    Une session d'agent n'expirera pas, mais nous recommandons de définir une propriété 'maxTurns' pour empêcher Claude de se retrouver bloqué dans une boucle.

    Étapes suivantes

    • Guide des sessions - En savoir plus sur la gestion des sessions
    • Permissions - Configurer les permissions des outils
    • Suivi des coûts - Surveiller l'utilisation de l'API
    • Intégration MCP - Étendre avec des outils personnalisés