Loading...
    • Guide du développeur
    • Référence API
    • MCP
    • Ressources
    • Notes de version
    Search...
    ⌘K
    Premiers pas
    Introduction à ClaudeDémarrage rapide
    Modèles et tarification
    Aperçu des modèlesChoisir un modèleNouveautés dans Claude 4.5Migration vers Claude 4.5Dépréciation des modèlesTarification
    Créer avec Claude
    Aperçu des fonctionnalitésUtiliser l'API MessagesFenêtres de contexteMeilleures pratiques de prompting
    Capacités
    Mise en cache des promptsÉdition de contexteRéflexion étendueEffortStreaming de messagesTraitement par lotsCitationsSupport multilingueComptage de tokensEmbeddingsVisionSupport PDFAPI FilesRésultats de rechercheSorties structuréesComplément Google Sheets
    Outils
    AperçuComment implémenter l'utilisation d'outilsUtilisation d'outils efficace en tokensStreaming d'outils granulaireOutil BashOutil d'exécution de codeAppel d'outils programmatiqueOutil Computer useOutil Éditeur de texteOutil Web fetchOutil Web searchOutil MemoryOutil Tool search
    Compétences d'agent
    AperçuDémarrage rapideMeilleures pratiquesUtiliser les compétences avec l'API
    Agent SDK
    AperçuSDK TypeScriptSDK PythonGuide de migration
    Guides
    Streaming d'entréeGestion des permissionsGestion des sessionsSorties structurées dans le SDKHébergement de l'Agent SDKModification des prompts systèmeMCP dans le SDKOutils personnalisésSous-agents dans le SDKCommandes slash dans le SDKCompétences d'agent dans le SDKSuivi des coûts et de l'utilisationListes de tâchesPlugins dans le SDK
    MCP dans l'API
    Connecteur MCPServeurs MCP distants
    Claude sur les plateformes tierces
    Amazon BedrockMicrosoft FoundryVertex AI
    Ingénierie des prompts
    AperçuGénérateur de promptsUtiliser les modèles de promptsAméliorateur de promptsÊtre clair et directUtiliser des exemples (prompting multi-shots)Laisser Claude réfléchir (CoT)Utiliser les balises XMLDonner un rôle à Claude (prompts système)Pré-remplir la réponse de ClaudeEnchaîner les prompts complexesConseils pour le contexte longConseils pour la réflexion étendue
    Tester et évaluer
    Définir les critères de succèsDévelopper des cas de testUtiliser l'outil d'évaluationRéduire la latence
    Renforcer les garde-fous
    Réduire les hallucinationsAugmenter la cohérence des résultatsAtténuer les jailbreaksRefus en streamingRéduire les fuites de promptsGarder Claude dans le rôle
    Administration et surveillance
    Aperçu de l'API AdminAPI d'utilisation et de coûtsAPI Claude Code Analytics
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Outils

    Outil d'utilisation de l'ordinateur

    Claude peut interagir avec les environnements informatiques grâce à l'outil d'utilisation de l'ordinateur, qui fournit des capacités de capture d'écran et de contrôle de la souris/clavier pour l'interaction autonome du bureau.
    • Aperçu
    • Compatibilité des modèles
    • Considérations de sécurité
    • Démarrage rapide
    • Comment fonctionne l'utilisation de l'ordinateur
    • Aperçu
    • Compatibilité des modèles
    • Considérations de sécurité
    • Démarrage rapide
    • Comment fonctionne le contrôle informatique
    • L'environnement informatique
    • Comment implémenter le contrôle informatique
    • Commencez par notre implémentation de référence
    • Comprendre la boucle multi-agent
    • Optimiser les performances du modèle avec les invites
    • Invites système
    • Comment implémenter l'utilisation d'ordinateur
    • Commencez par notre implémentation de référence
    • Comprendre la boucle multi-agent
    • Optimiser les performances du modèle avec les invites
    • Invites système
    • Actions disponibles
    • Paramètres de l'outil
    • Paramètres de l'outil
    • Activer la capacité de réflexion dans les modèles Claude 4 et Claude Sonnet 3.7
    • Paramètres de l'outil
    • Activer la capacité de réflexion dans les modèles Claude 4 et Claude Sonnet 3.7
    • Augmenter l'utilisation d'ordinateur avec d'autres outils
    • Paramètres de l'outil
    • Activer la capacité de réflexion dans les modèles Claude 4 et Claude Sonnet 3.7
    • Augmenter l'utilisation d'ordinateur avec d'autres outils
    • Construire un environnement d'utilisation d'ordinateur personnalisé
    • Comprendre les limitations de l'utilisation d'ordinateur
    • Comprendre les limitations de l'utilisation d'ordinateur
    • Tarification
    • Comprendre les limitations de l'utilisation d'ordinateur
    • Tarification
    • Étapes suivantes

    Claude peut interagir avec les environnements informatiques grâce à l'outil d'utilisation de l'ordinateur, qui fournit des capacités de capture d'écran et de contrôle de la souris/clavier pour l'interaction autonome du bureau.

    L'utilisation de l'ordinateur est actuellement en version bêta et nécessite un en-tête bêta :

    • "computer-use-2025-11-24" (Claude Opus 4.5)
    • "computer-use-2025-01-24" (Claude 4 models et Claude Sonnet 3.7 (obsolète))

    Aperçu

    L'utilisation de l'ordinateur est une fonctionnalité bêta qui permet à Claude d'interagir avec les environnements de bureau. Cet outil fournit :

    • Capture d'écran : Voir ce qui est actuellement affiché à l'écran
    • Contrôle de la souris : Cliquer, faire glisser et déplacer le curseur
    • Entrée au clavier : Taper du texte et utiliser les raccourcis clavier
    • Automatisation du bureau : Interagir avec n'importe quelle application ou interface

    Bien que l'utilisation de l'ordinateur puisse être augmentée avec d'autres outils comme bash et l'éditeur de texte pour des flux de travail d'automatisation plus complets, l'utilisation de l'ordinateur fait spécifiquement référence à la capacité de l'outil d'utilisation de l'ordinateur à voir et contrôler les environnements de bureau.

    Compatibilité des modèles

    L'utilisation de l'ordinateur est disponible pour les modèles Claude suivants :

    ModèleVersion de l'outilDrapeau bêta
    Claude Opus 4.5computer_20251124computer-use-2025-11-24
    Claude 4 modelscomputer_20250124computer-use-2025-01-24
    Claude Sonnet 3.7 (obsolète)computer_20250124computer-use-2025-01-24

    Claude Opus 4.5 introduit la version d'outil computer_20251124 avec de nouvelles capacités incluant l'action de zoom pour l'inspection détaillée de régions d'écran. Claude 4 models utilise des versions d'outil mises à jour optimisées pour la nouvelle architecture. Claude Sonnet 3.7 (obsolète) introduit des capacités supplémentaires incluant la fonctionnalité de réflexion pour plus d'aperçu du processus de raisonnement du modèle.

    Les versions d'outil plus anciennes ne sont pas garanties d'être rétro-compatibles avec les modèles plus récents. Utilisez toujours la version d'outil qui correspond à votre version de modèle.

    Considérations de sécurité

    L'utilisation de l'ordinateur est une fonctionnalité bêta avec des risques uniques distincts des fonctionnalités API standard. Ces risques sont amplifiés lors de l'interaction avec Internet. Pour minimiser les risques, envisagez de prendre des précautions telles que :

    1. Utilisez une machine virtuelle ou un conteneur dédié avec des privilèges minimaux pour prévenir les attaques système directes ou les accidents.
    2. Évitez de donner au modèle accès à des données sensibles, telles que les informations de connexion de compte, pour prévenir le vol d'informations.
    3. Limitez l'accès à Internet à une liste blanche de domaines pour réduire l'exposition au contenu malveillant.
    4. Demandez à un humain de confirmer les décisions qui pourraient avoir des conséquences réelles significatives ainsi que toute tâche nécessitant un consentement affirmatif, comme accepter les cookies, exécuter des transactions financières ou accepter les conditions de service.

    Dans certaines circonstances, Claude suivra les commandes trouvées dans le contenu même si cela entre en conflit avec les instructions de l'utilisateur. Par exemple, les instructions Claude sur les pages Web ou contenues dans les images peuvent remplacer les instructions ou faire commettre des erreurs à Claude. Nous suggérons de prendre des précautions pour isoler Claude des données et actions sensibles afin d'éviter les risques liés à l'injection de prompt.

    Nous avons entraîné le modèle à résister à ces injections de prompt et avons ajouté une couche supplémentaire de défense. Si vous utilisez nos outils d'utilisation de l'ordinateur, nous exécuterons automatiquement des classificateurs sur vos prompts pour signaler les instances potentielles d'injections de prompt. Lorsque ces classificateurs identifient des injections de prompt potentielles dans les captures d'écran, ils dirigeront automatiquement le modèle pour demander la confirmation de l'utilisateur avant de procéder à l'action suivante. Nous reconnaissons que cette protection supplémentaire ne sera pas idéale pour tous les cas d'utilisation (par exemple, les cas d'utilisation sans humain dans la boucle), donc si vous souhaitez refuser et l'désactiver, veuillez .

    Implémentation de référence de l'utilisation de l'ordinateur

    Commencez rapidement avec notre implémentation de référence de l'utilisation de l'ordinateur qui inclut une interface Web, un conteneur Docker, des implémentations d'outils d'exemple et une boucle d'agent.

    Remarque : L'implémentation a été mise à jour pour inclure de nouveaux outils pour Claude 4 models et Claude Sonnet 3.7. Assurez-vous de récupérer la dernière version du référentiel pour accéder à ces nouvelles fonctionnalités.

    Veuillez utiliser ce formulaire pour fournir des commentaires sur la qualité des réponses du modèle, l'API elle-même ou la qualité de la documentation - nous avons hâte de vous entendre !

    Démarrage rapide

    Voici comment commencer avec l'utilisation de l'ordinateur :

    Un en-tête bêta n'est requis que pour l'outil d'utilisation de l'ordinateur.

    L'exemple ci-dessus montre les trois outils utilisés ensemble, ce qui nécessite l'en-tête bêta car il inclut l'outil d'utilisation de l'ordinateur.


    Comment fonctionne l'utilisation de l'ordinateur

    Nous appelons la répétition des étapes 3 et 4 sans entrée utilisateur la « boucle d'agent » - c'est-à-dire Claude répondant avec une demande d'utilisation d'outil et votre application répondant à Claude avec les résultats de l'évaluation de cette demande.

    Claude peut interagir avec des environnements informatiques via l'outil de contrôle informatique, qui fournit des capacités de capture d'écran et un contrôle de la souris/clavier pour l'interaction autonome du bureau.

    Le contrôle informatique est actuellement en version bêta et nécessite un en-tête bêta :

    • "computer-use-2025-11-24" (Claude Opus 4.5)
    • "computer-use-2025-01-24" (Claude 4 models et Claude Sonnet 3.7 (obsolète))

    Aperçu

    Le contrôle informatique est une fonctionnalité bêta qui permet à Claude d'interagir avec des environnements de bureau. Cet outil fournit :

    • Capture d'écran : Voir ce qui s'affiche actuellement à l'écran
    • Contrôle de la souris : Cliquer, faire glisser et déplacer le curseur
    • Entrée au clavier : Taper du texte et utiliser les raccourcis clavier
    • Automatisation du bureau : Interagir avec n'importe quelle application ou interface

    Bien que le contrôle informatique puisse être augmenté avec d'autres outils comme bash et l'éditeur de texte pour des flux de travail d'automatisation plus complets, le contrôle informatique fait spécifiquement référence à la capacité de l'outil de contrôle informatique à voir et contrôler les environnements de bureau.

    Compatibilité des modèles

    Le contrôle informatique est disponible pour les modèles Claude suivants :

    ModèleVersion de l'outilDrapeau bêta
    Claude Opus 4.5computer_20251124computer-use-2025-11-24
    Claude 4 modelscomputer_20250124computer-use-2025-01-24
    Claude Sonnet 3.7 (obsolète)computer_20250124computer-use-2025-01-24

    Claude Opus 4.5 introduit la version d'outil computer_20251124 avec de nouvelles capacités incluant l'action de zoom pour l'inspection détaillée des régions d'écran. Claude 4 models utilise des versions d'outil mises à jour optimisées pour la nouvelle architecture. Claude Sonnet 3.7 (obsolète) introduit des capacités supplémentaires incluant la fonctionnalité de réflexion pour plus de perspicacité dans le processus de raisonnement du modèle.

    Les versions d'outil plus anciennes ne sont pas garanties d'être rétro-compatibles avec les modèles plus récents. Utilisez toujours la version d'outil qui correspond à votre version de modèle.

    Considérations de sécurité

    Le contrôle informatique est une fonctionnalité bêta avec des risques uniques distincts des fonctionnalités API standard. Ces risques sont amplifiés lors de l'interaction avec Internet. Pour minimiser les risques, envisagez de prendre des précautions telles que :

    1. Utilisez une machine virtuelle ou un conteneur dédié avec des privilèges minimaux pour prévenir les attaques système directes ou les accidents.
    2. Évitez de donner au modèle accès à des données sensibles, telles que les informations de connexion du compte, pour prévenir le vol d'informations.
    3. Limitez l'accès à Internet à une liste blanche de domaines pour réduire l'exposition au contenu malveillant.
    4. Demandez à un humain de confirmer les décisions qui pourraient avoir des conséquences réelles significatives ainsi que toute tâche nécessitant un consentement affirmatif, comme accepter les cookies, exécuter des transactions financières ou accepter les conditions de service.

    Dans certaines circonstances, Claude suivra les commandes trouvées dans le contenu même si cela entre en conflit avec les instructions de l'utilisateur. Par exemple, les instructions Claude sur les pages Web ou contenues dans les images peuvent remplacer les instructions ou amener Claude à faire des erreurs. Nous suggérons de prendre des précautions pour isoler Claude des données sensibles et des actions pour éviter les risques liés à l'injection de prompt.

    Nous avons entraîné le modèle à résister à ces injections de prompt et avons ajouté une couche de défense supplémentaire. Si vous utilisez nos outils de contrôle informatique, nous exécuterons automatiquement des classificateurs sur vos prompts pour signaler les instances potentielles d'injections de prompt. Lorsque ces classificateurs identifient des injections de prompt potentielles dans les captures d'écran, ils orienteront automatiquement le modèle à demander la confirmation de l'utilisateur avant de procéder à l'action suivante. Nous reconnaissons que cette protection supplémentaire ne sera pas idéale pour tous les cas d'usage (par exemple, les cas d'usage sans humain dans la boucle), donc si vous souhaitez refuser et la désactiver, veuillez .

    Implémentation de référence du contrôle informatique

    Commencez rapidement avec notre implémentation de référence du contrôle informatique qui inclut une interface Web, un conteneur Docker, des implémentations d'outils d'exemple et une boucle d'agent.

    Remarque : L'implémentation a été mise à jour pour inclure de nouveaux outils pour Claude 4 models et Claude Sonnet 3.7. Assurez-vous de récupérer la dernière version du référentiel pour accéder à ces nouvelles fonctionnalités.

    Veuillez utiliser ce formulaire pour fournir des commentaires sur la qualité des réponses du modèle, l'API elle-même ou la qualité de la documentation - nous avons hâte de vous entendre !

    Démarrage rapide

    Voici comment commencer avec le contrôle informatique :

    Un en-tête bêta n'est requis que pour l'outil de contrôle informatique.

    L'exemple ci-dessus montre les trois outils utilisés ensemble, ce qui nécessite l'en-tête bêta car il inclut l'outil de contrôle informatique.


    Comment fonctionne le contrôle informatique

    Nous nous référons à la répétition des étapes 3 et 4 sans entrée utilisateur comme la « boucle d'agent » - c'est-à-dire Claude répondant avec une demande d'utilisation d'outil et votre application répondant à Claude avec les résultats de l'évaluation de cette demande.

    L'environnement informatique

    Le contrôle informatique nécessite un environnement informatique en bac à sable où Claude peut interagir en toute sécurité avec les applications et le Web. Cet environnement inclut :

    1. Affichage virtuel : Un serveur d'affichage X11 virtuel (utilisant Xvfb) qui rend l'interface de bureau que Claude verra via des captures d'écran et contrôlera avec des actions de souris/clavier.

    2. Environnement de bureau : Une interface utilisateur légère avec gestionnaire de fenêtres (Mutter) et panneau (Tint2) s'exécutant sur Linux, qui fournit une interface graphique cohérente pour que Claude interagisse.

    3. Applications : Applications Linux pré-installées comme Firefox, LibreOffice, éditeurs de texte et gestionnaires de fichiers que Claude peut utiliser pour accomplir des tâches.

    4. Implémentations d'outils : Code d'intégration qui traduit les demandes d'outils abstraits de Claude (comme « déplacer la souris » ou « prendre une capture d'écran ») en opérations réelles dans l'environnement virtuel.

    5. Boucle d'agent : Un programme qui gère la communication entre Claude et l'environnement, envoyant les actions de Claude à l'environnement et retournant les résultats (captures d'écran, sorties de commande) à Claude.

    Lorsque vous utilisez le contrôle informatique, Claude ne se connecte pas directement à cet environnement. Au lieu de cela, votre application :

    1. Reçoit les demandes d'utilisation d'outil de Claude
    2. Les traduit en actions dans votre environnement informatique
    3. Capture les résultats (captures d'écran, sorties de commande, etc.)
    4. Retourne ces résultats à Claude

    Pour la sécurité et l'isolation, l'implémentation de référence exécute tout cela à l'intérieur d'un conteneur Docker avec des mappages de ports appropriés pour visualiser et interagir avec l'environnement.


    Comment implémenter le contrôle informatique

    Commencez par notre implémentation de référence

    Nous avons construit une implémentation de référence qui inclut tout ce dont vous avez besoin pour commencer rapidement avec le contrôle informatique :

    • Un environnement conteneurisé adapté au contrôle informatique avec Claude
    • Implémentations des outils de contrôle informatique
    • Une boucle d'agent qui interagit avec l'API Claude et exécute les outils de contrôle informatique
    • Une interface Web pour interagir avec le conteneur, la boucle d'agent et les outils.

    Comprendre la boucle multi-agent

    Le cœur du contrôle informatique est la « boucle d'agent » - un cycle où Claude demande des actions d'outil, votre application les exécute et retourne les résultats à Claude. Voici un exemple simplifié :

    async def sampling_loop(
        *,
        model: str,
        messages: list[dict],
        api_key: str,
        max_tokens: int = 4096,
        tool_version: str,
        thinking_budget: int | None = None,
        max_iterations: int = 10,  # Add iteration limit to prevent infinite loops
    ):
        """
        A simple agent loop for Claude computer use interactions.
    
        This function handles the back-and-forth between:
        1. Sending user messages to Claude
        2. Claude requesting to use tools
        3. Your app executing those tools
        4. Sending tool results back to Claude
        """
        # Set up tools and API parameters
        client = Anthropic(api_key=api_key)
        beta_flag = "computer-use-2025-01-24" if "20250124" in tool_version else "computer-use-2024-10-22"
    
        # Configure tools - you should already have these initialized elsewhere
        tools = [
            {"type": f"computer_{tool_version}", "name": "computer", "display_width_px": 1024, "display_height_px": 768},
            {"type": f"text_editor_{tool_version}", "name": "str_replace_editor"},
            {"type": f"bash_{tool_version}", "name": "bash"}
        ]
    
        # Main agent loop (with iteration limit to prevent runaway API costs)
        iterations = 0
        while True and iterations < max_iterations:
            iterations += 1
            # Set up optional thinking parameter (for Claude Sonnet 3.7)
            thinking = None
            if thinking_budget:
                thinking = {"type": "enabled", "budget_tokens": thinking_budget}
    
            # Call the Claude API
            response = client.beta.messages.create(
                model=model,
                max_tokens=max_tokens,
                messages=messages,
                tools=tools,
                betas=[beta_flag],
                thinking=thinking
            )
    
            # Add Claude's response to the conversation history
            response_content = response.content
            messages.append({"role": "assistant", "content": response_content})
    
            # Check if Claude used any tools
            tool_results = []
            for block in response_content:
                if block.type == "tool_use":
                    # In a real app, you would execute the tool here
                    # For example: result = run_tool(block.name, block.input)
                    result = {"result": "Tool executed successfully"}
    
                    # Format the result for Claude
                    tool_results.append({
                        "type": "tool_result",
                        "tool_use_id": block.id,
                        "content": result
                    })
    
            # If no tools were used, Claude is done - return the final messages
            if not tool_results:
                return messages
    
            # Add tool results to messages for the next iteration with Claude
            messages.append({"role": "user", "content": tool_results})

    La boucle continue jusqu'à ce que Claude réponde sans demander d'outils (achèvement de la tâche) ou que la limite d'itération maximale soit atteinte. Cette protection empêche les boucles infinies potentielles qui pourraient entraîner des coûts API inattendus.

    Lors de l'utilisation de l'outil de contrôle informatique, vous devez inclure le drapeau bêta approprié pour votre version de modèle :

    Nous vous recommandons d'essayer l'implémentation de référence avant de lire le reste de cette documentation.

    Optimiser les performances du modèle avec les invites

    Voici quelques conseils sur comment obtenir les meilleures sorties de qualité :

    1. Spécifiez des tâches simples et bien définies et fournissez des instructions explicites pour chaque étape.
    2. Claude suppose parfois les résultats de ses actions sans vérifier explicitement leurs résultats. Pour éviter cela, vous pouvez inviter Claude avec After each step, take a screenshot and carefully evaluate if you have achieved the right outcome. Explicitly show your thinking: "I have evaluated step X..." If not correct, try again. Only when you confirm a step was executed correctly should you move on to the next one.
    3. Certains éléments d'interface utilisateur (comme les listes déroulantes et les barres de défilement) pourraient être délicats pour Claude à manipuler à l'aide de mouvements de souris. Si vous rencontrez cela, essayez d'inviter le modèle à utiliser des raccourcis clavier.
    4. Pour les tâches répétables ou les interactions d'interface utilisateur, incluez des captures d'écran d'exemple et des appels d'outil de résultats réussis dans votre invite.
    5. Si vous avez besoin que le modèle se connecte, fournissez-lui le nom d'utilisateur et le mot de passe dans votre invite à l'intérieur de balises xml comme <robot_credentials>. L'utilisation du contrôle informatique dans les applications qui nécessitent une connexion augmente le risque de mauvais résultats en raison de l'injection de prompt. Veuillez consulter notre guide sur l'atténuation des injections de prompt avant de fournir au modèle les identifiants de connexion.

    Si vous rencontrez à plusieurs reprises un ensemble clair de problèmes ou si vous savez à l'avance les tâches que Claude devra accomplir, utilisez l'invite système pour fournir à Claude des conseils ou des instructions explicites sur comment accomplir les tâches avec succès.

    Invites système

    Lorsqu'un des outils définis par Anthropic est demandé via l'API Claude, une invite système spécifique au contrôle informatique est générée. Elle est similaire à l'invite système d'utilisation d'outil mais commence par :

    You have access to a set of functions you can use to answer the user's question. This includes access to a sandboxed computing environment. You do NOT currently have the ability to inspect files or interact with external resources, except by invoking the below functions.

    Comme pour l'utilisation régulière d'outils, le champ system_prompt fourni par l'utilisateur est toujours respecté et utilisé dans la construction de l'invite système combinée.

    Comment implémenter l'utilisation d'ordinateur

    Commencez par notre implémentation de référence

    Nous avons construit une implémentation de référence qui contient tout ce dont vous avez besoin pour commencer rapidement avec l'utilisation d'ordinateur :

    • Un environnement conteneurisé adapté à l'utilisation d'ordinateur avec Claude
    • Des implémentations des outils d'utilisation d'ordinateur
    • Une boucle d'agent qui interagit avec l'API Claude et exécute les outils d'utilisation d'ordinateur
    • Une interface web pour interagir avec le conteneur, la boucle d'agent et les outils.

    Comprendre la boucle multi-agent

    Le cœur de l'utilisation d'ordinateur est la « boucle d'agent » - un cycle où Claude demande des actions d'outils, votre application les exécute et retourne les résultats à Claude. Voici un exemple simplifié :

    async def sampling_loop(
        *,
        model: str,
        messages: list[dict],
        api_key: str,
        max_tokens: int = 4096,
        tool_version: str,
        thinking_budget: int | None = None,
        max_iterations: int = 10,  # Add iteration limit to prevent infinite loops
    ):
        """
        A simple agent loop for Claude computer use interactions.
    
        This function handles the back-and-forth between:
        1. Sending user messages to Claude
        2. Claude requesting to use tools
        3. Your app executing those tools
        4. Sending tool results back to Claude
        """
        # Set up tools and API parameters
        client = Anthropic(api_key=api_key)
        beta_flag = "computer-use-2025-01-24" if "20250124" in tool_version else "computer-use-2024-10-22"
    
        # Configure tools - you should already have these initialized elsewhere
        tools = [
            {"type": f"computer_{tool_version}", "name": "computer", "display_width_px": 1024, "display_height_px": 768},
            {"type": f"text_editor_{tool_version}", "name": "str_replace_editor"},
            {"type": f"bash_{tool_version}", "name": "bash"}
        ]
    
        # Main agent loop (with iteration limit to prevent runaway API costs)
        iterations = 0
        while True and iterations < max_iterations:
            iterations += 1
            # Set up optional thinking parameter (for Claude Sonnet 3.7)
            thinking = None
            if thinking_budget:
                thinking = {"type": "enabled", "budget_tokens": thinking_budget}
    
            # Call the Claude API
            response = client.beta.messages.create(
                model=model,
                max_tokens=max_tokens,
                messages=messages,
                tools=tools,
                betas=[beta_flag],
                thinking=thinking
            )
    
            # Add Claude's response to the conversation history
            response_content = response.content
            messages.append({"role": "assistant", "content": response_content})
    
            # Check if Claude used any tools
            tool_results = []
            for block in response_content:
                if block.type == "tool_use":
                    # In a real app, you would execute the tool here
                    # For example: result = run_tool(block.name, block.input)
                    result = {"result": "Tool executed successfully"}
    
                    # Format the result for Claude
                    tool_results.append({
                        "type": "tool_result",
                        "tool_use_id": block.id,
                        "content": result
                    })
    
            # If no tools were used, Claude is done - return the final messages
            if not tool_results:
                return messages
    
            # Add tool results to messages for the next iteration with Claude
            messages.append({"role": "user", "content": tool_results})

    La boucle continue jusqu'à ce que Claude réponde sans demander d'outils (fin de tâche) ou que la limite d'itération maximale soit atteinte. Cette protection empêche les boucles infinies potentielles qui pourraient entraîner des coûts d'API inattendus.

    Lors de l'utilisation de l'outil d'utilisation d'ordinateur, vous devez inclure le drapeau bêta approprié pour votre version de modèle :

    Nous vous recommandons d'essayer l'implémentation de référence avant de lire le reste de cette documentation.

    Optimiser les performances du modèle avec les invites

    Voici quelques conseils sur la façon d'obtenir les meilleures sorties de qualité :

    1. Spécifiez des tâches simples et bien définies et fournissez des instructions explicites pour chaque étape.
    2. Claude suppose parfois les résultats de ses actions sans vérifier explicitement leurs résultats. Pour éviter cela, vous pouvez inviter Claude avec After each step, take a screenshot and carefully evaluate if you have achieved the right outcome. Explicitly show your thinking: "I have evaluated step X..." If not correct, try again. Only when you confirm a step was executed correctly should you move on to the next one.
    3. Certains éléments d'interface utilisateur (comme les listes déroulantes et les barres de défilement) pourraient être délicats pour Claude à manipuler à l'aide de mouvements de souris. Si vous rencontrez ce problème, essayez d'inviter le modèle à utiliser des raccourcis clavier.
    4. Pour les tâches répétables ou les interactions d'interface utilisateur, incluez des captures d'écran d'exemple et des appels d'outils de résultats réussis dans votre invite.
    5. Si vous avez besoin que le modèle se connecte, fournissez-lui le nom d'utilisateur et le mot de passe dans votre invite à l'intérieur de balises xml comme <robot_credentials>. L'utilisation de l'utilisation d'ordinateur dans les applications qui nécessitent une connexion augmente le risque de mauvais résultats en raison de l'injection d'invite. Veuillez consulter notre guide sur l'atténuation des injections d'invite avant de fournir au modèle les identifiants de connexion.

    Si vous rencontrez à plusieurs reprises un ensemble clair de problèmes ou si vous connaissez à l'avance les tâches que Claude devra accomplir, utilisez l'invite système pour fournir à Claude des conseils ou des instructions explicites sur la façon d'accomplir les tâches avec succès.

    Invites système

    Lorsqu'un des outils définis par Anthropic est demandé via l'API Claude, une invite système spécifique à l'utilisation d'ordinateur est générée. Elle est similaire à l'invite système d'utilisation d'outils mais commence par :

    You have access to a set of functions you can use to answer the user's question. This includes access to a sandboxed computing environment. You do NOT currently have the ability to inspect files or interact with external resources, except by invoking the below functions.

    Comme pour l'utilisation régulière d'outils, le champ system_prompt fourni par l'utilisateur est toujours respecté et utilisé dans la construction de l'invite système combinée.

    Actions disponibles

    L'outil d'utilisation d'ordinateur prend en charge ces actions :

    Actions de base (toutes les versions)

    • screenshot - Capturer l'affichage actuel
    • left_click - Cliquer aux coordonnées [x, y]
    • type - Taper une chaîne de texte
    • key - Appuyer sur une touche ou une combinaison de touches (par exemple, « ctrl+s »)
    • mouse_move - Déplacer le curseur vers les coordonnées

    Actions améliorées (computer_20250124) Disponible dans les modèles Claude 4 et Claude Sonnet 3.7 :

    • scroll - Faire défiler dans n'importe quelle direction avec contrôle du montant
    • left_click_drag - Cliquer et faire glisser entre les coordonnées
    • right_click, middle_click - Boutons de souris supplémentaires
    • double_click, triple_click - Clics multiples
    • left_mouse_down, left_mouse_up - Contrôle de clic granulaire
    • hold_key - Maintenir une touche enfoncée tout en effectuant d'autres actions
    • wait - Pause entre les actions

    Actions améliorées (computer_20251124) Disponible dans Claude Opus 4.5 :

    • Toutes les actions de computer_20250124
    • zoom - Afficher une région spécifique de l'écran à pleine résolution. Nécessite enable_zoom: true dans la définition de l'outil. Prend un paramètre region avec les coordonnées [x1, y1, x2, y2] définissant les coins supérieur gauche et inférieur droit de la zone à inspecter.

    Paramètres de l'outil

    ParamètreRequisDescription
    typeOuiVersion de l'outil (computer_20251124, computer_20250124, ou computer_20241022)
    nameOuiDoit être « computer »
    display_width_pxOuiLargeur d'affichage en pixels
    display_height_pxOuiHauteur d'affichage en pixels
    display_numberNonNuméro d'affichage pour les environnements X11

    Gardez la résolution d'affichage à ou en dessous de 1280x800 (WXGA) pour les meilleures performances. Les résolutions plus élevées peuvent causer des problèmes de précision en raison du redimensionnement d'image.

    Important : L'outil d'utilisation d'ordinateur doit être explicitement exécuté par votre application - Claude ne peut pas l'exécuter directement. Vous êtes responsable de l'implémentation de la capture d'écran, des mouvements de souris, des entrées au clavier et d'autres actions en fonction des demandes de Claude.

    Paramètres de l'outil

    ParamètreRequisDescription
    typeOuiVersion de l'outil (computer_20251124, computer_20250124, ou computer_20241022)
    nameOuiDoit être « computer »
    display_width_pxOuiLargeur d'affichage en pixels
    display_height_pxOuiHauteur d'affichage en pixels
    display_numberNonNuméro d'affichage pour les environnements X11

    Gardez la résolution d'affichage à ou en dessous de 1280x800 (WXGA) pour les meilleures performances. Les résolutions plus élevées peuvent causer des problèmes de précision en raison du redimensionnement d'image.

    Important : L'outil d'utilisation d'ordinateur doit être explicitement exécuté par votre application - Claude ne peut pas l'exécuter directement. Vous êtes responsable de l'implémentation de la capture d'écran, des mouvements de souris, des entrées au clavier et d'autres actions en fonction des demandes de Claude.

    Activer la capacité de réflexion dans les modèles Claude 4 et Claude Sonnet 3.7

    Claude Sonnet 3.7 a introduit une nouvelle capacité de « réflexion » qui vous permet de voir le processus de raisonnement du modèle alors qu'il travaille sur des tâches complexes. Cette fonctionnalité vous aide à comprendre comment Claude aborde un problème et peut être particulièrement précieuse à des fins de débogage ou éducatives.

    Pour activer la réflexion, ajoutez un paramètre thinking à votre demande d'API :

    "thinking": {
      "type": "enabled",
      "budget_tokens": 1024
    }

    Le paramètre budget_tokens spécifie combien de jetons Claude peut utiliser pour la réflexion. Ceci est soustrait de votre budget global max_tokens.

    Lorsque la réflexion est activée, Claude retournera son processus de raisonnement dans le cadre de la réponse, ce qui peut vous aider à :

    1. Comprendre le processus de prise de décision du modèle
    2. Identifier les problèmes ou les idées fausses potentiels
    3. Apprendre de l'approche de Claude à la résolution de problèmes
    4. Obtenir plus de visibilité sur les opérations complexes multi-étapes

    Voici un exemple de ce à quoi la sortie de réflexion pourrait ressembler :

    [Thinking]
    I need to save a picture of a cat to the desktop. Let me break this down into steps:
    
    1. First, I'll take a screenshot to see what's on the desktop
    2. Then I'll look for a web browser to search for cat images
    3. After finding a suitable image, I'll need to save it to the desktop
    
    Let me start by taking a screenshot to see what's available...

    Paramètres de l'outil

    ParamètreRequisDescription
    typeOuiVersion de l'outil (computer_20251124, computer_20250124, ou computer_20241022)
    nameOuiDoit être « computer »
    display_width_pxOuiLargeur d'affichage en pixels
    display_height_pxOuiHauteur d'affichage en pixels
    display_numberNonNuméro d'affichage pour les environnements X11

    Gardez la résolution d'affichage à ou en dessous de 1280x800 (WXGA) pour les meilleures performances. Les résolutions plus élevées peuvent causer des problèmes de précision en raison du redimensionnement d'image.

    Important : L'outil d'utilisation d'ordinateur doit être explicitement exécuté par votre application - Claude ne peut pas l'exécuter directement. Vous êtes responsable de l'implémentation de la capture d'écran, des mouvements de souris, des entrées au clavier et d'autres actions en fonction des demandes de Claude.

    Activer la capacité de réflexion dans les modèles Claude 4 et Claude Sonnet 3.7

    Claude Sonnet 3.7 a introduit une nouvelle capacité de « réflexion » qui vous permet de voir le processus de raisonnement du modèle alors qu'il travaille sur des tâches complexes. Cette fonctionnalité vous aide à comprendre comment Claude aborde un problème et peut être particulièrement précieuse à des fins de débogage ou éducatives.

    Pour activer la réflexion, ajoutez un paramètre thinking à votre demande d'API :

    "thinking": {
      "type": "enabled",
      "budget_tokens": 1024
    }

    Le paramètre budget_tokens spécifie combien de jetons Claude peut utiliser pour la réflexion. Ceci est soustrait de votre budget global max_tokens.

    Lorsque la réflexion est activée, Claude retournera son processus de raisonnement dans le cadre de la réponse, ce qui peut vous aider à :

    1. Comprendre le processus de prise de décision du modèle
    2. Identifier les problèmes ou les idées fausses potentiels
    3. Apprendre de l'approche de Claude à la résolution de problèmes
    4. Obtenir plus de visibilité sur les opérations complexes multi-étapes

    Voici un exemple de ce à quoi la sortie de réflexion pourrait ressembler :

    [Thinking]
    I need to save a picture of a cat to the desktop. Let me break this down into steps:
    
    1. First, I'll take a screenshot to see what's on the desktop
    2. Then I'll look for a web browser to search for cat images
    3. After finding a suitable image, I'll need to save it to the desktop
    
    Let me start by taking a screenshot to see what's available...

    Augmenter l'utilisation d'ordinateur avec d'autres outils

    L'outil d'utilisation d'ordinateur peut être combiné avec d'autres outils pour créer des flux de travail d'automatisation plus puissants. Ceci est particulièrement utile lorsque vous avez besoin de :

    • Exécuter des commandes système (outil bash)
    • Éditer des fichiers de configuration ou des scripts (outil d'éditeur de texte)
    • Intégrer avec des API personnalisées ou des services (outils personnalisés)

    Paramètres de l'outil

    ParamètreRequisDescription
    typeOuiVersion de l'outil (computer_20251124, computer_20250124, ou computer_20241022)
    nameOuiDoit être "computer"
    display_width_pxOuiLargeur d'affichage en pixels
    display_height_pxOuiHauteur d'affichage en pixels
    display_numberNonNuméro d'affichage pour les environnements X11

    Maintenez la résolution d'affichage à 1280x800 (WXGA) ou moins pour des performances optimales. Les résolutions plus élevées peuvent causer des problèmes de précision en raison du redimensionnement d'image.

    Important : L'outil d'utilisation d'ordinateur doit être explicitement exécuté par votre application - Claude ne peut pas l'exécuter directement. Vous êtes responsable de la mise en œuvre de la capture d'écran, des mouvements de souris, des entrées au clavier et d'autres actions en fonction des demandes de Claude.

    Activer la capacité de réflexion dans les modèles Claude 4 et Claude Sonnet 3.7

    Claude Sonnet 3.7 a introduit une nouvelle capacité de « réflexion » qui vous permet de voir le processus de raisonnement du modèle au fur et à mesure qu'il travaille sur des tâches complexes. Cette fonctionnalité vous aide à comprendre comment Claude aborde un problème et peut être particulièrement précieuse à des fins de débogage ou éducatives.

    Pour activer la réflexion, ajoutez un paramètre thinking à votre demande d'API :

    "thinking": {
      "type": "enabled",
      "budget_tokens": 1024
    }

    Le paramètre budget_tokens spécifie le nombre de jetons que Claude peut utiliser pour la réflexion. Ceci est soustrait de votre budget global max_tokens.

    Lorsque la réflexion est activée, Claude retournera son processus de raisonnement dans le cadre de la réponse, ce qui peut vous aider à :

    1. Comprendre le processus de prise de décision du modèle
    2. Identifier les problèmes potentiels ou les idées fausses
    3. Apprendre de l'approche de Claude pour la résolution de problèmes
    4. Obtenir plus de visibilité sur les opérations complexes multi-étapes

    Voici un exemple de ce à quoi la sortie de réflexion pourrait ressembler :

    [Thinking]
    Je dois enregistrer une photo d'un chat sur le bureau. Décomposons cela en étapes :
    
    1. D'abord, je vais prendre une capture d'écran pour voir ce qui se trouve sur le bureau
    2. Ensuite, je vais chercher un navigateur Web pour rechercher des images de chats
    3. Après avoir trouvé une image appropriée, je devrai l'enregistrer sur le bureau
    
    Commençons par prendre une capture d'écran pour voir ce qui est disponible...

    Augmenter l'utilisation d'ordinateur avec d'autres outils

    L'outil d'utilisation d'ordinateur peut être combiné avec d'autres outils pour créer des flux de travail d'automatisation plus puissants. Ceci est particulièrement utile lorsque vous avez besoin de :

    • Exécuter des commandes système (outil bash)
    • Modifier des fichiers de configuration ou des scripts (outil éditeur de texte)
    • Intégrer avec des API personnalisées ou des services (outils personnalisés)

    Construire un environnement d'utilisation d'ordinateur personnalisé

    L'implémentation de référence est destinée à vous aider à démarrer avec l'utilisation d'ordinateur. Elle inclut tous les composants nécessaires pour que Claude utilise un ordinateur. Cependant, vous pouvez construire votre propre environnement pour l'utilisation d'ordinateur selon vos besoins. Vous aurez besoin de :

    • Un environnement virtualisé ou conteneurisé adapté à l'utilisation d'ordinateur avec Claude
    • Une implémentation d'au moins un des outils d'utilisation d'ordinateur définis par Anthropic
    • Une boucle d'agent qui interagit avec l'API Claude et exécute les résultats tool_use en utilisant vos implémentations d'outils
    • Une API ou une interface utilisateur qui permet l'entrée de l'utilisateur pour démarrer la boucle d'agent

    Implémenter l'outil d'utilisation d'ordinateur

    L'outil d'utilisation d'ordinateur est implémenté comme un outil sans schéma. Lorsque vous utilisez cet outil, vous n'avez pas besoin de fournir un schéma d'entrée comme avec d'autres outils ; le schéma est intégré au modèle de Claude et ne peut pas être modifié.

    Gérer les erreurs

    Lors de l'implémentation de l'outil d'utilisation d'ordinateur, diverses erreurs peuvent survenir. Voici comment les gérer :

    Suivre les meilleures pratiques de mise en œuvre


    Comprendre les limitations de l'utilisation d'ordinateur

    La fonctionnalité d'utilisation d'ordinateur est en version bêta. Bien que les capacités de Claude soient à la pointe de la technologie, les développeurs doivent être conscients de ses limitations :

    1. Latence : la latence actuelle de l'utilisation d'ordinateur pour les interactions humain-IA peut être trop lente par rapport aux actions informatiques régulières dirigées par l'homme. Nous recommandons de nous concentrer sur les cas d'utilisation où la vitesse n'est pas critique (par exemple, la collecte d'informations en arrière-plan, les tests automatisés de logiciels) dans des environnements de confiance.
    2. Précision et fiabilité de la vision par ordinateur : Claude peut faire des erreurs ou halluciner lors de la sortie de coordonnées spécifiques lors de la génération d'actions. Claude Sonnet 3.7 introduit la capacité de réflexion qui peut vous aider à comprendre le raisonnement du modèle et à identifier les problèmes potentiels.
    3. Précision et fiabilité de la sélection d'outils : Claude peut faire des erreurs ou halluciner lors de la sélection d'outils lors de la génération d'actions ou prendre des actions inattendues pour résoudre les problèmes. De plus, la fiabilité peut être inférieure lors de l'interaction avec des applications de niche ou plusieurs applications à la fois. Nous recommandons aux utilisateurs de bien inviter le modèle lors de la demande de tâches complexes.
    4. Fiabilité du défilement : Claude Sonnet 3.7 a introduit des actions de défilement dédiées avec contrôle directionnel qui améliore la fiabilité. Le modèle peut maintenant faire défiler explicitement dans n'importe quelle direction (haut/bas/gauche/droite) d'une quantité spécifiée.
    5. Interaction avec des feuilles de calcul : Les clics de souris pour l'interaction avec des feuilles de calcul se sont améliorés dans Claude Sonnet 3.7 avec l'ajout d'actions de contrôle de souris plus précises comme left_mouse_down, et le nouveau support des touches de modification. La sélection de cellules peut être plus fiable en utilisant ces contrôles granulaires et en combinant les touches de modification avec les clics.

    Examinez et vérifiez toujours attentivement les actions et les journaux d'utilisation d'ordinateur de Claude. N'utilisez pas Claude pour les tâches nécessitant une précision parfaite ou des informations utilisateur sensibles sans surveillance humaine.


    Comprendre les limitations de l'utilisation d'ordinateur

    La fonctionnalité d'utilisation d'ordinateur est en version bêta. Bien que les capacités de Claude soient à la pointe de la technologie, les développeurs doivent être conscients de ses limitations :

    1. Latence : la latence actuelle de l'utilisation d'ordinateur pour les interactions humain-IA peut être trop lente par rapport aux actions informatiques régulières dirigées par l'homme. Nous recommandons de nous concentrer sur les cas d'utilisation où la vitesse n'est pas critique (par exemple, la collecte d'informations en arrière-plan, les tests automatisés de logiciels) dans des environnements de confiance.
    2. Précision et fiabilité de la vision par ordinateur : Claude peut faire des erreurs ou halluciner lors de la sortie de coordonnées spécifiques lors de la génération d'actions. Claude Sonnet 3.7 introduit la capacité de réflexion qui peut vous aider à comprendre le raisonnement du modèle et à identifier les problèmes potentiels.
    3. Précision et fiabilité de la sélection d'outils : Claude peut faire des erreurs ou halluciner lors de la sélection d'outils lors de la génération d'actions ou prendre des actions inattendues pour résoudre les problèmes. De plus, la fiabilité peut être inférieure lors de l'interaction avec des applications de niche ou plusieurs applications à la fois. Nous recommandons aux utilisateurs de bien inviter le modèle lors de la demande de tâches complexes.
    4. Fiabilité du défilement : Claude Sonnet 3.7 a introduit des actions de défilement dédiées avec contrôle directionnel qui améliore la fiabilité. Le modèle peut maintenant faire défiler explicitement dans n'importe quelle direction (haut/bas/gauche/droite) d'une quantité spécifiée.
    5. Interaction avec des feuilles de calcul : Les clics de souris pour l'interaction avec des feuilles de calcul se sont améliorés dans Claude Sonnet 3.7 avec l'ajout d'actions de contrôle de souris plus précises comme left_mouse_down, et le nouveau support des touches de modification. La sélection de cellules peut être plus fiable en utilisant ces contrôles granulaires et en combinant les touches de modification avec les clics.

    Examinez et vérifiez toujours attentivement les actions et les journaux d'utilisation d'ordinateur de Claude. N'utilisez pas Claude pour les tâches nécessitant une précision parfaite ou des informations utilisateur sensibles sans surveillance humaine.


    Tarification

    Computer use follows the standard tool use pricing. When using the computer use tool:

    System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

    Computer use tool token usage:

    ModelInput tokens per tool definition
    Claude 4.x models735 tokens
    Claude Sonnet 3.7 (deprecated)735 tokens

    Additional token consumption:

    • Screenshot images (see Vision pricing)
    • Tool execution results returned to Claude

    If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

    Comprendre les limitations de l'utilisation d'ordinateur

    La fonctionnalité d'utilisation d'ordinateur est en version bêta. Bien que les capacités de Claude soient à la pointe de la technologie, les développeurs doivent être conscients de ses limitations :

    1. Latence : la latence actuelle de l'utilisation d'ordinateur pour les interactions humain-IA peut être trop lente par rapport aux actions informatiques régulières dirigées par l'homme. Nous recommandons de nous concentrer sur les cas d'utilisation où la vitesse n'est pas critique (par exemple, la collecte d'informations en arrière-plan, les tests automatisés de logiciels) dans des environnements de confiance.
    2. Précision et fiabilité de la vision par ordinateur : Claude peut faire des erreurs ou halluciner lors de la sortie de coordonnées spécifiques lors de la génération d'actions. Claude Sonnet 3.7 introduit la capacité de réflexion qui peut vous aider à comprendre le raisonnement du modèle et à identifier les problèmes potentiels.
    3. Précision et fiabilité de la sélection d'outils : Claude peut faire des erreurs ou halluciner lors de la sélection d'outils lors de la génération d'actions ou prendre des actions inattendues pour résoudre les problèmes. De plus, la fiabilité peut être inférieure lors de l'interaction avec des applications de niche ou plusieurs applications à la fois. Nous recommandons aux utilisateurs de bien inviter le modèle lors de la demande de tâches complexes.
    4. Fiabilité du défilement : Claude Sonnet 3.7 a introduit des actions de défilement dédiées avec contrôle directionnel qui améliore la fiabilité. Le modèle peut maintenant faire défiler explicitement dans n'importe quelle direction (haut/bas/gauche/droite) d'une quantité spécifiée.
    5. Interaction avec des feuilles de calcul : Les clics de souris pour l'interaction avec des feuilles de calcul se sont améliorés dans Claude Sonnet 3.7 avec l'ajout d'actions de contrôle de souris plus précises comme left_mouse_down, et le nouveau support des touches de modification. La sélection de cellules peut être plus fiable en utilisant ces contrôles granulaires et en combinant les touches de modification avec les clics.

    Examinez et vérifiez toujours attentivement les actions et les journaux d'utilisation d'ordinateur de Claude. N'utilisez pas Claude pour les tâches nécessitant une précision parfaite ou des informations utilisateur sensibles sans surveillance humaine.


    Tarification

    Computer use follows the standard tool use pricing. When using the computer use tool:

    System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

    Computer use tool token usage:

    ModelInput tokens per tool definition
    Claude 4.x models735 tokens
    Claude Sonnet 3.7 (deprecated)735 tokens

    Additional token consumption:

    • Screenshot images (see Vision pricing)
    • Tool execution results returned to Claude

    If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

    Étapes suivantes

    Implémentation de référence

    Démarrez rapidement avec notre implémentation complète basée sur Docker

    nous contacter

    Nous suggérons toujours de prendre des précautions pour isoler Claude des données et actions sensibles afin d'éviter les risques liés à l'injection de prompt.

    Enfin, veuillez informer les utilisateurs finaux des risques pertinents et obtenir leur consentement avant d'activer l'utilisation de l'ordinateur dans vos propres produits.

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.beta.messages.create(
        model="claude-sonnet-4-5",  # or another compatible model
        max_tokens=1024,
        tools=[
            {
              "type": "computer_20250124",
              "name": "computer",
              "display_width_px": 1024,
              "display_height_px": 768,
              "display_number": 1,
            },
            {
              "type": "text_editor_20250728",
              "name": "str_replace_based_edit_tool"
            },
            {
              "type": "bash_20250124",
              "name": "bash"
            }
        ],
        messages=[{"role": "user", "content": "Save a picture of a cat to my desktop."}],
        betas=["computer-use-2025-01-24"]
    )
    print(response)
    1. 1

      1. Fournir à Claude l'outil d'utilisation de l'ordinateur et une invite utilisateur

      • Ajoutez l'outil d'utilisation de l'ordinateur (et éventuellement d'autres outils) à votre demande API.
      • Incluez une invite utilisateur qui nécessite une interaction de bureau, par exemple « Enregistrez une image d'un chat sur mon bureau ».
    2. 2

      2. Claude décide d'utiliser l'outil d'utilisation de l'ordinateur

      • Claude évalue si l'outil d'utilisation de l'ordinateur peut aider à la requête de l'utilisateur.
      • Si oui, Claude construit une demande d'utilisation d'outil correctement formatée.
      • La réponse API a un stop_reason de tool_use, signalant l'intention de Claude.
    3. 3

      3. Extraire l'entrée de l'outil, évaluer l'outil sur un ordinateur et retourner les résultats

      • De votre côté, extrayez le nom de l'outil et l'entrée de la demande de Claude.
      • Utilisez l'outil sur un conteneur ou une machine virtuelle.
      • Continuez la conversation avec un nouveau message user contenant un bloc de contenu tool_result.
    4. 4

      4. Claude continue d'appeler les outils d'utilisation de l'ordinateur jusqu'à ce qu'il ait complété la tâche

      • Claude analyse les résultats de l'outil pour déterminer si plus d'utilisation d'outil est nécessaire ou si la tâche a été complétée.
      • Si Claude décide qu'il a besoin d'un autre outil, il répond avec un autre stop_reason de tool_use et vous devriez revenir à l'étape 3.
      • Sinon, il formule une réponse textuelle à l'utilisateur.
    nous contacter

    Nous suggérons toujours de prendre des précautions pour isoler Claude des données sensibles et des actions pour éviter les risques liés à l'injection de prompt.

    Enfin, veuillez informer les utilisateurs finaux des risques pertinents et obtenir leur consentement avant d'activer le contrôle informatique dans vos propres produits.

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.beta.messages.create(
        model="claude-sonnet-4-5",  # or another compatible model
        max_tokens=1024,
        tools=[
            {
              "type": "computer_20250124",
              "name": "computer",
              "display_width_px": 1024,
              "display_height_px": 768,
              "display_number": 1,
            },
            {
              "type": "text_editor_20250728",
              "name": "str_replace_based_edit_tool"
            },
            {
              "type": "bash_20250124",
              "name": "bash"
            }
        ],
        messages=[{"role": "user", "content": "Save a picture of a cat to my desktop."}],
        betas=["computer-use-2025-01-24"]
    )
    print(response)
    1. 1

      1. Fournir à Claude l'outil de contrôle informatique et une invite utilisateur

      • Ajoutez l'outil de contrôle informatique (et éventuellement d'autres outils) à votre demande API.
      • Incluez une invite utilisateur qui nécessite une interaction de bureau, par exemple, « Enregistrez une image d'un chat sur mon bureau ».
    2. 2

      2. Claude décide d'utiliser l'outil de contrôle informatique

      • Claude évalue si l'outil de contrôle informatique peut aider à la requête de l'utilisateur.
      • Si oui, Claude construit une demande d'utilisation d'outil correctement formatée.
      • La réponse API a un stop_reason de tool_use, signalant l'intention de Claude.
    3. 3

      3. Extraire l'entrée de l'outil, évaluer l'outil sur un ordinateur et retourner les résultats

      • De votre côté, extrayez le nom et l'entrée de l'outil de la demande de Claude.
      • Utilisez l'outil sur un conteneur ou une machine virtuelle.
      • Continuez la conversation avec un nouveau message user contenant un bloc de contenu tool_result.
    4. 4

      4. Claude continue à appeler les outils de contrôle informatique jusqu'à ce qu'il ait terminé la tâche

      • Claude analyse les résultats de l'outil pour déterminer si plus d'utilisation d'outil est nécessaire ou si la tâche a été complétée.
      • Si Claude décide qu'il a besoin d'un autre outil, il répond avec un autre stop_reason de tool_use et vous devriez revenir à l'étape 3.
      • Sinon, il élabore une réponse textuelle à l'utilisateur.
    enable_zoom
    Non
    Activer l'action de zoom (computer_20251124 uniquement). Définissez sur true pour permettre à Claude de zoomer sur des régions d'écran spécifiques. Par défaut : false
    enable_zoom
    Non
    Activer l'action de zoom (computer_20251124 uniquement). Définissez sur true pour permettre à Claude de zoomer sur des régions d'écran spécifiques. Par défaut : false
    enable_zoom
    Non
    Activer l'action de zoom (computer_20251124 uniquement). Définissez sur true pour permettre à Claude de zoomer sur des régions d'écran spécifiques. Par défaut : false
    curl https://api.anthropic.com/v1/messages \
      -H "content-type: application/json" \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: computer-use-2025-01-24" \
      -d '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 2000,
        "tools": [
          {
            "type": "computer_20250124",
            "name": "computer",
            "display_width_px": 1024,
            "display_height_px": 768,
            "display_number": 1
          },
          {
            "type": "text_editor_20250728",
            "name": "str_replace_based_edit_tool"
          },
          {
            "type": "bash_20250124",
            "name": "bash"
          },
          {
            "name": "get_weather",
            "description": "Get the current weather in a given location",
            "input_schema": {
              "type": "object",
              "properties": {
                "location": {
                  "type": "string",
                  "description": "The city and state, e.g. San Francisco, CA"
                },
                "unit": {
                  "type": "string",
                  "enum": ["celsius", "fahrenheit"],
                  "description": "The unit of temperature, either 'celsius' or 'fahrenheit'"
                }
              },
              "required": ["location"]
            }
          }
        ],
        "messages": [
          {
            "role": "user",
            "content": "Find flights from San Francisco to a place with warmer weather."
          }
        ],
        "thinking": {
          "type": "enabled",
          "budget_tokens": 1024
        }
      }'
    enable_zoom
    Non
    Activer l'action de zoom (computer_20251124 uniquement). Définir sur true pour permettre à Claude de zoomer sur des régions d'écran spécifiques. Par défaut : false
    curl https://api.anthropic.com/v1/messages \
      -H "content-type: application/json" \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: computer-use-2025-01-24" \
      -d '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 2000,
        "tools": [
          {
            "type": "computer_20250124",
            "name": "computer",
            "display_width_px": 1024,
            "display_height_px": 768,
            "display_number": 1
          },
          {
            "type": "text_editor_20250728",
            "name": "str_replace_based_edit_tool"
          },
          {
            "type": "bash_20250124",
            "name": "bash"
          },
          {
            "name": "get_weather",
            "description": "Get the current weather in a given location",
            "input_schema": {
              "type": "object",
              "properties": {
                "location": {
                  "type": "string",
                  "description": "The city and state, e.g. San Francisco, CA"
                },
                "unit": {
                  "type": "string",
                  "enum": ["celsius", "fahrenheit"],
                  "description": "The unit of temperature, either 'celsius' or 'fahrenheit'"
                }
              },
              "required": ["location"]
            }
          }
        ],
        "messages": [
          {
            "role": "user",
            "content": "Find flights from San Francisco to a place with warmer weather."
          }
        ],
        "thinking": {
          "type": "enabled",
          "budget_tokens": 1024
        }
      }'
    1. 1

      Configurer votre environnement informatique

      Créez un affichage virtuel ou connectez-vous à un affichage existant avec lequel Claude interagira. Cela implique généralement de configurer Xvfb (X Virtual Framebuffer) ou une technologie similaire.

    2. 2

      Implémenter les gestionnaires d'actions

      Créez des fonctions pour gérer chaque type d'action que Claude pourrait demander :

      def handle_computer_action(action_type, params):
          if action_type == "screenshot":
              return capture_screenshot()
          elif action_type == "left_click":
              x, y = params["coordinate"]
              return click_at(x, y)
          elif action_type == "type":
              return type_text(params["text"])
          # ... handle other actions
    3. 3

      Traiter les appels d'outils de Claude

      Extrayez et exécutez les appels d'outils des réponses de Claude :

      for content in response.content:
          if content.type == "tool_use":
              action = content.input["action"]
              result = handle_computer_action(action, content.input)
              
              # Return result to Claude
              tool_result = {
                  "type": "tool_result",
                  "tool_use_id": content.id,
                  "content": result
              }
    4. 4

      Implémenter la boucle d'agent

      Créez une boucle qui continue jusqu'à ce que Claude termine la tâche :

      while True:
          response = client.beta.messages.create(...)
          
          # Check if Claude used any tools
          tool_results = process_tool_calls(response)
          
          if not tool_results:
              # No more tool use, task complete
              break
              
          # Continue conversation with tool results
          messages.append({"role": "user", "content": tool_results})

    left_mouse_up
  1. Création de compte et génération de contenu sur les plateformes sociales et de communication : Bien que Claude visitera les sites Web, nous limitons sa capacité à créer des comptes ou à générer et partager du contenu ou à autrement s'engager dans l'usurpation d'identité humaine sur les sites Web et plateformes de médias sociaux. Nous pouvons mettre à jour cette capacité à l'avenir.
  2. Vulnérabilités : Les vulnérabilités telles que le jailbreaking ou l'injection de requête peuvent persister dans les systèmes d'IA de pointe, y compris l'API bêta d'utilisation d'ordinateur. Dans certaines circonstances, Claude suivra les commandes trouvées dans le contenu, parfois même en conflit avec les instructions de l'utilisateur. Par exemple, les instructions Claude sur les pages Web ou contenues dans les images peuvent remplacer les instructions ou faire commettre des erreurs à Claude. Nous recommandons : a. Limiter l'utilisation d'ordinateur aux environnements de confiance tels que les machines virtuelles ou les conteneurs avec des privilèges minimaux b. Éviter de donner l'accès à l'utilisation d'ordinateur à des comptes ou des données sensibles sans surveillance stricte c. Informer les utilisateurs finaux des risques pertinents et obtenir leur consentement avant d'activer ou de demander les autorisations nécessaires pour les fonctionnalités d'utilisation d'ordinateur dans vos applications
  3. Actions inappropriées ou illégales : Selon les conditions de service d'Anthropic, vous ne devez pas utiliser l'utilisation d'ordinateur pour violer les lois ou notre Politique d'utilisation acceptable.
  4. left_mouse_up
  5. Création de compte et génération de contenu sur les plateformes sociales et de communication : Bien que Claude visitera les sites Web, nous limitons sa capacité à créer des comptes ou à générer et partager du contenu ou à autrement s'engager dans l'usurpation d'identité humaine sur les sites Web et plateformes de médias sociaux. Nous pouvons mettre à jour cette capacité à l'avenir.
  6. Vulnérabilités : Les vulnérabilités telles que le jailbreaking ou l'injection de requête peuvent persister dans les systèmes d'IA de pointe, y compris l'API bêta d'utilisation d'ordinateur. Dans certaines circonstances, Claude suivra les commandes trouvées dans le contenu, parfois même en conflit avec les instructions de l'utilisateur. Par exemple, les instructions Claude sur les pages Web ou contenues dans les images peuvent remplacer les instructions ou faire commettre des erreurs à Claude. Nous recommandons : a. Limiter l'utilisation d'ordinateur aux environnements de confiance tels que les machines virtuelles ou les conteneurs avec des privilèges minimaux b. Éviter de donner l'accès à l'utilisation d'ordinateur à des comptes ou des données sensibles sans surveillance stricte c. Informer les utilisateurs finaux des risques pertinents et obtenir leur consentement avant d'activer ou de demander les autorisations nécessaires pour les fonctionnalités d'utilisation d'ordinateur dans vos applications
  7. Actions inappropriées ou illégales : Selon les conditions de service d'Anthropic, vous ne devez pas utiliser l'utilisation d'ordinateur pour violer les lois ou notre Politique d'utilisation acceptable.
  8. left_mouse_up
  9. Création de compte et génération de contenu sur les plateformes sociales et de communication : Bien que Claude visitera les sites Web, nous limitons sa capacité à créer des comptes ou à générer et partager du contenu ou à autrement s'engager dans l'usurpation d'identité humaine sur les sites Web et plateformes de médias sociaux. Nous pouvons mettre à jour cette capacité à l'avenir.
  10. Vulnérabilités : Les vulnérabilités telles que le jailbreaking ou l'injection de requête peuvent persister dans les systèmes d'IA de pointe, y compris l'API bêta d'utilisation d'ordinateur. Dans certaines circonstances, Claude suivra les commandes trouvées dans le contenu, parfois même en conflit avec les instructions de l'utilisateur. Par exemple, les instructions Claude sur les pages Web ou contenues dans les images peuvent remplacer les instructions ou faire commettre des erreurs à Claude. Nous recommandons : a. Limiter l'utilisation d'ordinateur aux environnements de confiance tels que les machines virtuelles ou les conteneurs avec des privilèges minimaux b. Éviter de donner l'accès à l'utilisation d'ordinateur à des comptes ou des données sensibles sans surveillance stricte c. Informer les utilisateurs finaux des risques pertinents et obtenir leur consentement avant d'activer ou de demander les autorisations nécessaires pour les fonctionnalités d'utilisation d'ordinateur dans vos applications
  11. Actions inappropriées ou illégales : Selon les conditions de service d'Anthropic, vous ne devez pas utiliser l'utilisation d'ordinateur pour violer les lois ou notre Politique d'utilisation acceptable.
  12. Documentation de l'outil

    En savoir plus sur l'utilisation d'outils et la création d'outils personnalisés