Loading...
    • Guía del Desarrollador
    • Referencia de API
    • MCP
    • Recursos
    • Notas de la versión
    Search...
    ⌘K

    Primeros pasos

    Introducción a ClaudeInicio rápido

    Modelos y precios

    Descripción general de modelosElegir un modeloNovedades en Claude 4.5Migración a Claude 4.5Deprecaciones de modelosPrecios

    Crear con Claude

    Descripción general de característicasTrabajar con la API de MessagesVentanas de contextoMejores prácticas de prompting

    Capacidades

    Almacenamiento en caché de promptsEdición de contextoPensamiento extendidoTransmisión de MensajesProcesamiento por lotesCitasSoporte multilingüeConteo de tokensEmbeddingsVisiónSoporte para PDFAPI de ArchivosResultados de búsquedaComplemento de Google Sheets

    Herramientas

    Descripción generalCómo implementar el uso de herramientasUso de herramientas eficiente en tokensStreaming de herramientas de grano finoHerramienta BashHerramienta de ejecución de códigoHerramienta de uso de computadoraHerramienta de editor de textoHerramienta de obtención webHerramienta de búsqueda webHerramienta de memoria

    Habilidades del Agente

    Habilidades del AgenteComenzar con Agent Skills en la APIMejores prácticas para la creación de SkillsUso de Agent Skills con la API

    SDK de Agente

    Descripción general del Agent SDKReferencia del SDK del Agente - TypeScriptReferencia del SDK de Agent - Python

    Guías

    Entrada de StreamingManejo de PermisosGestión de SesionesAlojamiento del Agent SDKModificación de prompts del sistemaMCP en el SDKHerramientas PersonalizadasSubagentes en el SDKComandos Slash en el SDKHabilidades de Agente en el SDKSeguimiento de Costos y UsoListas de TareasPlugins en el SDK

    MCP en la API

    Conector MCPServidores MCP remotos

    Claude en plataformas de terceros

    Amazon BedrockVertex AI

    Ingeniería de prompts

    ResumenGenerador de promptsUsar plantillas de promptsMejorador de promptsSé claro y directoUsar ejemplos (prompting multishot)Deja que Claude piense (CoT)Usar etiquetas XMLDarle un rol a Claude (avisos del sistema)Prefill de la respuesta de ClaudeEncadena prompts complejosConsejos para contexto largoConsejos de pensamiento extendido

    Probar y evaluar

    Definir criterios de éxitoDesarrollar casos de pruebaUsando la Herramienta de EvaluaciónReducir la latencia

    Fortalecer protecciones

    Reducir las alucinacionesAumentar la consistencia de la salidaMitigar jailbreakshandle-streaming-refusalsReducir la filtración de promptsMantener a Claude en personaje

    Administración y monitoreo

    Descripción general de la API de administraciónAPI de Uso y CostoAPI de Análisis de Claude Code
    Console
    Herramientas

    Herramienta de uso de computadora

    Claude puede interactuar con entornos de computadora a través de la herramienta de uso de computadora, que proporciona capacidades de captura de pantalla y control de ratón/teclado para interacción autónoma de escritorio.

    Claude puede interactuar con entornos de computadora a través de la herramienta de uso de computadora, que proporciona capacidades de captura de pantalla y control de ratón/teclado para interacción autónoma de escritorio.

    El uso de computadora está actualmente en beta y requiere un encabezado beta:

    • "computer-use-2025-01-24" (modelos Claude 4 y Claude Sonnet 3.7 (deprecado))

    Descripción general

    El uso de computadora es una característica beta que permite a Claude interactuar con entornos de escritorio. Esta herramienta proporciona:

    • Captura de pantalla: Ver lo que se muestra actualmente en la pantalla
    • Control del ratón: Hacer clic, arrastrar y mover el cursor
    • Entrada de teclado: Escribir texto y usar atajos de teclado
    • Automatización de escritorio: Interactuar con cualquier aplicación o interfaz

    Aunque el uso de computadora puede aumentarse con otras herramientas como bash y editor de texto para flujos de trabajo de automatización más completos, el uso de computadora se refiere específicamente a la capacidad de la herramienta de uso de computadora de ver y controlar entornos de escritorio.

    Compatibilidad de modelos

    El uso de computadora está disponible para los siguientes modelos de Claude:

    ModeloVersión de herramientaBandera Beta
    Modelos Claude 4computer_20250124computer-use-2025-01-24
    Claude Sonnet 3.7 (deprecado)computer_20250124computer-use-2025-01-24

    Los modelos Claude 4 utilizan versiones de herramienta actualizadas optimizadas para la nueva arquitectura. Claude Sonnet 3.7 (deprecado) introduce capacidades adicionales incluyendo la característica de pensamiento para más información sobre el proceso de razonamiento del modelo.

    Las versiones de herramienta más antiguas no se garantiza que sean compatibles hacia atrás con modelos más nuevos. Siempre use la versión de herramienta que corresponda a su versión de modelo.

    Consideraciones de seguridad

    El uso de computadora es una característica beta con riesgos únicos distintos de las características estándar de API. Estos riesgos se intensifican cuando se interactúa con internet. Para minimizar riesgos, considere tomar precauciones tales como:

    1. Usar una máquina virtual dedicada o contenedor con privilegios mínimos para prevenir ataques directos del sistema o accidentes.
    2. Evitar dar al modelo acceso a datos sensibles, como información de inicio de sesión de cuenta, para prevenir robo de información.
    3. Limitar el acceso a internet a una lista blanca de dominios para reducir la exposición a contenido malicioso.
    4. Pedir a un humano que confirme decisiones que puedan resultar en consecuencias significativas en el mundo real, así como cualquier tarea que requiera consentimiento afirmativo, como aceptar cookies, ejecutar transacciones financieras o aceptar términos de servicio.

    En algunas circunstancias, Claude seguirá comandos encontrados en contenido incluso si entra en conflicto con las instrucciones del usuario. Por ejemplo, las instrucciones de Claude en páginas web o contenidas en imágenes pueden anular instrucciones o causar que Claude cometa errores. Sugerimos tomar precauciones para aislar a Claude de datos sensibles y acciones para evitar riesgos relacionados con inyección de indicaciones.

    Hemos entrenado el modelo para resistir estas inyecciones de indicaciones y hemos añadido una capa adicional de defensa. Si usa nuestras herramientas de uso de computadora, ejecutaremos automáticamente clasificadores en sus indicaciones para marcar posibles instancias de inyecciones de indicaciones. Cuando estos clasificadores identifiquen posibles inyecciones de indicaciones en capturas de pantalla, automáticamente dirigirán el modelo a pedir confirmación del usuario antes de proceder con la siguiente acción. Reconocemos que esta protección adicional no será ideal para todos los casos de uso (por ejemplo, casos de uso sin un humano en el bucle), así que si desea optar por no participar y desactivarlo, por favor contáctenos.

    Aún sugerimos tomar precauciones para aislar a Claude de datos sensibles y acciones para evitar riesgos relacionados con inyección de indicaciones.

    Finalmente, por favor informe a los usuarios finales de los riesgos relevantes y obtenga su consentimiento antes de habilitar el uso de computadora en sus propios productos.

    Implementación de referencia de uso de computadora

    Comience rápidamente con nuestra implementación de referencia de uso de computadora que incluye una interfaz web, contenedor Docker, implementaciones de herramientas de ejemplo y un bucle de agente.

    Nota: La implementación ha sido actualizada para incluir nuevas herramientas tanto para modelos Claude 4 como para Claude Sonnet 3.7. Asegúrese de extraer la última versión del repositorio para acceder a estas nuevas características.

    Por favor use este formulario para proporcionar retroalimentación sobre la calidad de las respuestas del modelo, la API en sí, o la calidad de la documentación - ¡no podemos esperar a escuchar de usted!

    Inicio rápido

    Así es cómo comenzar con el uso de computadora:

    Python
    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.beta.messages.create(
        model="claude-sonnet-4-5",  # o otro modelo compatible
        max_tokens=1024,
        tools=[
            {
              "type": "computer_20250124",
              "name": "computer",
              "display_width_px": 1024,
              "display_height_px": 768,
              "display_number": 1,
            },
            {
              "type": "text_editor_20250124",
              "name": "str_replace_editor"
            },
            {
              "type": "bash_20250124",
              "name": "bash"
            }
        ],
        messages=[{"role": "user", "content": "Save a picture of a cat to my desktop."}],
        betas=["computer-use-2025-01-24"]
    )
    print(response)
    Shell
    curl https://api.anthropic.com/v1/messages \
      -H "content-type: application/json" \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: computer-use-2025-01-24" \
      -d '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 1024,
        "tools": [
          {
            "type": "computer_20250124",
            "name": "computer",
            "display_width_px": 1024,
            "display_height_px": 768,
            "display_number": 1
          },
          {
            "type": "text_editor_20250124",
            "name": "str_replace_editor"
          },
          {
            "type": "bash_20250124",
            "name": "bash"
          }
        ],
        "messages": [
          {
            "role": "user",
            "content": "Save a picture of a cat to my desktop."
          }
        ]
      }'

    Un encabezado beta solo es requerido para la herramienta de uso de computadora.

    El ejemplo anterior muestra las tres herramientas siendo usadas juntas, lo que requiere el encabezado beta porque incluye la herramienta de uso de computadora.


    Cómo funciona el uso de computadora

    1. 1

      1. Proporcione a Claude la herramienta de uso de computadora y un indicador del usuario

      • Agregue la herramienta de uso de computadora (y opcionalmente otras herramientas) a su solicitud de API.
      • Incluya un indicador del usuario que requiera interacción de escritorio, por ejemplo, "Guarde una imagen de un gato en mi escritorio."
    2. 2

      2. Claude decide usar la herramienta de uso de computadora

      • Claude evalúa si la herramienta de uso de computadora puede ayudar con la consulta del usuario.
      • Si es así, Claude construye una solicitud de uso de herramienta correctamente formateada.
      • La respuesta de API tiene un stop_reason de tool_use, señalando la intención de Claude.
    3. 3

      3. Extraiga la entrada de herramienta, evalúe la herramienta en una computadora y devuelva resultados

      • De su parte, extraiga el nombre de la herramienta y la entrada de la solicitud de Claude.
      • Use la herramienta en un contenedor o Máquina Virtual.
      • Continúe la conversación con un nuevo mensaje user que contenga un bloque de contenido tool_result.
    4. 4

      4. Claude continúa llamando herramientas de uso de computadora hasta que haya completado la tarea

      • Claude analiza los resultados de la herramienta para determinar si se necesita más uso de herramienta o la tarea ha sido completada.
      • Si Claude decide que necesita otra herramienta, responde con otro stop_reason de tool_use y debe volver al paso 3.
      • De lo contrario, elabora una respuesta de texto al usuario.

    Nos referimos a la repetición de los pasos 3 y 4 sin entrada del usuario como el "bucle de agente" - es decir, Claude respondiendo con una solicitud de uso de herramienta y su aplicación respondiendo a Claude con los resultados de evaluar esa solicitud.

    El entorno informático

    El uso de computadora requiere un entorno informático aislado donde Claude pueda interactuar de forma segura con aplicaciones e internet. Este entorno incluye:

    1. Pantalla virtual: Un servidor de pantalla X11 virtual (usando Xvfb) que renderiza la interfaz de escritorio que Claude verá a través de capturas de pantalla y controlará con acciones de ratón/teclado.

    2. Entorno de escritorio: Una interfaz de usuario ligera con gestor de ventanas (Mutter) y panel (Tint2) ejecutándose en Linux, que proporciona una interfaz gráfica consistente para que Claude interactúe.

    3. Aplicaciones: Aplicaciones Linux preinstaladas como Firefox, LibreOffice, editores de texto y gestores de archivos que Claude puede usar para completar tareas.

    4. Implementaciones de herramientas: Código de integración que traduce las solicitudes de herramientas abstractas de Claude (como "mover ratón" o "tomar captura de pantalla") en operaciones reales en el entorno virtual.

    5. Bucle de agente: Un programa que maneja la comunicación entre Claude y el entorno, enviando las acciones de Claude al entorno y devolviendo los resultados (capturas de pantalla, salidas de comandos) a Claude.

    Cuando usa el uso de computadora, Claude no se conecta directamente a este entorno. En su lugar, su aplicación:

    1. Recibe las solicitudes de uso de herramienta de Claude
    2. Las traduce en acciones en su entorno informático
    3. Captura los resultados (capturas de pantalla, salidas de comandos, etc.)
    4. Devuelve estos resultados a Claude

    Por seguridad y aislamiento, la implementación de referencia ejecuta todo esto dentro de un contenedor Docker con asignaciones de puerto apropiadas para ver e interactuar con el entorno.


    Cómo implementar el uso de computadora

    Comience con nuestra implementación de referencia

    Hemos construido una implementación de referencia que incluye todo lo que necesita para comenzar rápidamente con el uso de computadora:

    • Un entorno containerizado adecuado para el uso de computadora con Claude
    • Implementaciones de las herramientas de uso de computadora
    • Un bucle de agente que interactúa con la API de Claude y ejecuta las herramientas de uso de computadora
    • Una interfaz web para interactuar con el contenedor, bucle de agente y herramientas.

    Entender el bucle de múltiples agentes

    El núcleo del uso de computadora es el "bucle de agente" - un ciclo donde Claude solicita acciones de herramienta, su aplicación las ejecuta y devuelve resultados a Claude. Aquí hay un ejemplo simplificado:

    async def sampling_loop(
        *,
        model: str,
        messages: list[dict],
        api_key: str,
        max_tokens: int = 4096,
        tool_version: str,
        thinking_budget: int | None = None,
        max_iterations: int = 10,  # Agregue límite de iteración para prevenir bucles infinitos
    ):
        """
        Un bucle de agente simple para interacciones de uso de computadora de Claude.
    
        Esta función maneja la ida y vuelta entre:
        1. Enviar mensajes del usuario a Claude
        2. Claude solicitando usar herramientas
        3. Su aplicación ejecutando esas herramientas
        4. Enviando resultados de herramientas de vuelta a Claude
        """
        # Configurar herramientas y parámetros de API
        client = Anthropic(api_key=api_key)
        beta_flag = "computer-use-2025-01-24" if "20250124" in tool_version else "computer-use-2024-10-22"
    
        # Configurar herramientas - ya debería tenerlas inicializadas en otro lugar
        tools = [
            {"type": f"computer_{tool_version}", "name": "computer", "display_width_px": 1024, "display_height_px": 768},
            {"type": f"text_editor_{tool_version}", "name": "str_replace_editor"},
            {"type": f"bash_{tool_version}", "name": "bash"}
        ]
    
        # Bucle de agente principal (con límite de iteración para prevenir costos de API desbocados)
        iterations = 0
        while True and iterations < max_iterations:
            iterations += 1
            # Configurar parámetro de pensamiento opcional (para Claude Sonnet 3.7)
            thinking = None
            if thinking_budget:
                thinking = {"type": "enabled", "budget_tokens": thinking_budget}
    
            # Llamar a la API de Claude
            response = client.beta.messages.create(
                model=model,
                max_tokens=max_tokens,
                messages=messages,
                tools=tools,
                betas=[beta_flag],
                thinking=thinking
            )
    
            # Agregar la respuesta de Claude al historial de conversación
            response_content = response.content
            messages.append({"role": "assistant", "content": response_content})
    
            # Verificar si Claude usó alguna herramienta
            tool_results = []
            for block in response_content:
                if block.type == "tool_use":
                    # En una aplicación real, ejecutaría la herramienta aquí
                    # Por ejemplo: result = run_tool(block.name, block.input)
                    result = {"result": "Tool executed successfully"}
    
                    # Formatear el resultado para Claude
                    tool_results.append({
                        "type": "tool_result",
                        "tool_use_id": block.id,
                        "content": result
                    })
    
            # Si no se usaron herramientas, Claude ha terminado - devuelva los mensajes finales
            if not tool_results:
                return messages
    
            # Agregar resultados de herramientas a mensajes para la siguiente iteración con Claude
            messages.append({"role": "user", "content": tool_results})

    El bucle continúa hasta que Claude responda sin solicitar ninguna herramienta (finalización de tarea) o se alcance el límite máximo de iteración. Esta salvaguarda previene posibles bucles infinitos que podrían resultar en costos de API inesperados.

    Cuando use la herramienta de uso de computadora, debe incluir la bandera beta apropiada para su versión de modelo:

    Recomendamos probar la implementación de referencia antes de leer el resto de esta documentación.

    Optimizar el rendimiento del modelo con indicaciones

    Aquí hay algunos consejos sobre cómo obtener la mejor calidad de salida:

    1. Especifique tareas simples y bien definidas y proporcione instrucciones explícitas para cada paso.
    2. Claude a veces asume resultados de sus acciones sin verificar explícitamente sus resultados. Para prevenir esto, puede indicar a Claude con Después de cada paso, tome una captura de pantalla y evalúe cuidadosamente si ha logrado el resultado correcto. Muestre explícitamente su pensamiento: "He evaluado el paso X..." Si no es correcto, intente de nuevo. Solo cuando confirme que un paso fue ejecutado correctamente debe pasar al siguiente.
    3. Algunos elementos de interfaz de usuario (como menús desplegables y barras de desplazamiento) pueden ser complicados para que Claude los manipule usando movimientos del ratón. Si experimenta esto, intente indicar al modelo que use atajos de teclado.
    4. Para tareas repetibles o interacciones de interfaz de usuario, incluya capturas de pantalla de ejemplo y llamadas de herramientas de resultados exitosos en su indicación.
    5. Si necesita que el modelo inicie sesión, proporciónele el nombre de usuario y contraseña en su indicación dentro de etiquetas xml como <robot_credentials>. Usar el uso de computadora dentro de aplicaciones que requieren inicio de sesión aumenta el riesgo de malos resultados como resultado de inyección de indicaciones. Por favor revise nuestra guía sobre mitigación de inyecciones de indicaciones antes de proporcionar al modelo credenciales de inicio de sesión.

    Si encuentra repetidamente un conjunto claro de problemas o sabe de antemano las tareas que Claude necesitará completar, use el indicador del sistema para proporcionar a Claude consejos explícitos o instrucciones sobre cómo hacer las tareas exitosamente.

    Indicadores del sistema

    Cuando se solicita una de las herramientas definidas por Anthropic a través de la API de Claude, se genera un indicador del sistema específico para el uso de computadora. Es similar al indicador del sistema de uso de herramienta pero comienza con:

    Tiene acceso a un conjunto de funciones que puede usar para responder la pregunta del usuario. Esto incluye acceso a un entorno informático aislado. Actualmente NO tiene la capacidad de inspeccionar archivos o interactuar con recursos externos, excepto invocando las siguientes funciones.

    Como con el uso de herramienta regular, el campo system_prompt proporcionado por el usuario aún se respeta y se usa en la construcción del indicador del sistema combinado.

    Acciones disponibles

    La herramienta de uso de computadora admite estas acciones:

    Acciones básicas (todas las versiones)

    • screenshot - Capturar la pantalla actual
    • left_click - Hacer clic en coordenadas [x, y]
    • type - Escribir cadena de texto
    • key - Presionar tecla o combinación de teclas (por ejemplo, "ctrl+s")
    • mouse_move - Mover cursor a coordenadas

    Acciones mejoradas (computer_20250124) Disponible en modelos Claude 4 y Claude Sonnet 3.7:

    • scroll - Desplazarse en cualquier dirección con control de cantidad
    • left_click_drag - Hacer clic y arrastrar entre coordenadas
    • right_click, middle_click - Botones de ratón adicionales
    • double_click, triple_click - Múltiples clics
    • left_mouse_down, left_mouse_up - Control de clic de grano fino
    • hold_key - Mantener una tecla mientras se realizan otras acciones
    • wait - Pausar entre acciones

    Parámetros de herramienta

    ParámetroRequeridoDescripción
    typeSíVersión de herramienta (computer_20250124 o computer_20241022)
    nameSíDebe ser "computer"
    display_width_pxSíAncho de pantalla en píxeles
    display_height_pxSíAlto de pantalla en píxeles
    display_numberNoNúmero de pantalla para entornos X11

    Mantenga la resolución de pantalla en o por debajo de 1280x800 (WXGA) para mejor rendimiento. Las resoluciones más altas pueden causar problemas de precisión debido a cambio de tamaño de imagen.

    Importante: La herramienta de uso de computadora debe ser ejecutada explícitamente por su aplicación - Claude no puede ejecutarla directamente. Usted es responsable de implementar la captura de pantalla, movimientos del ratón, entradas de teclado y otras acciones basadas en las solicitudes de Claude.

    Habilitar capacidad de pensamiento en modelos Claude 4 y Claude Sonnet 3.7

    Claude Sonnet 3.7 introdujo una nueva capacidad de "pensamiento" que le permite ver el proceso de razonamiento del modelo mientras trabaja en tareas complejas. Esta característica le ayuda a entender cómo Claude está abordando un problema y puede ser particularmente valiosa para depuración o propósitos educativos.

    Para habilitar el pensamiento, agregue un parámetro thinking a su solicitud de API:

    "thinking": {
      "type": "enabled",
      "budget_tokens": 1024
    }

    El parámetro budget_tokens especifica cuántos tokens puede usar Claude para pensar. Esto se resta de su presupuesto general de max_tokens.

    Cuando el pensamiento está habilitado, Claude devolverá su proceso de razonamiento como parte de la respuesta, lo que puede ayudarle a:

    1. Entender el proceso de toma de decisiones del modelo
    2. Identificar posibles problemas o conceptos erróneos
    3. Aprender del enfoque de Claude para la resolución de problemas
    4. Obtener más visibilidad en operaciones complejas de múltiples pasos

    Aquí hay un ejemplo de cómo podría verse la salida de pensamiento:

    [Pensamiento]
    Necesito guardar una imagen de un gato en el escritorio. Déjame desglosar esto en pasos:
    
    1. Primero, tomaré una captura de pantalla para ver qué hay en el escritorio
    2. Luego buscaré un navegador web para buscar imágenes de gatos
    3. Después de encontrar una imagen adecuada, necesitaré guardarla en el escritorio
    
    Déjame comenzar tomando una captura de pantalla para ver qué está disponible...

    Aumentar el uso de computadora con otras herramientas

    La herramienta de uso de computadora se puede combinar con otras herramientas para crear flujos de trabajo de automatización más poderosos. Esto es particularmente útil cuando necesita:

    • Ejecutar comandos del sistema (herramienta bash)
    • Editar archivos de configuración o scripts (herramienta editor de texto)
    • Integrar con APIs personalizadas o servicios (herramientas personalizadas)
    curl https://api.anthropic.com/v1/messages \
      -H "content-type: application/json" \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: computer-use-2025-01-24" \
      -d '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 2000,
        "tools": [
          {
            "type": "computer_20250124",
            "name": "computer",
            "display_width_px": 1024,
            "display_height_px": 768,
            "display_number": 1
          },
          {
            "type": "text_editor_20250124",
            "name": "str_replace_editor"
          },
          {
            "type": "bash_20250124",
            "name": "bash"
          },
          {
            "name": "get_weather",
            "description": "Get the current weather in a given location",
            "input_schema": {
              "type": "object",
              "properties": {
                "location": {
                  "type": "string",
                  "description": "The city and state, e.g. San Francisco, CA"
                },
                "unit": {
                  "type": "string",
                  "enum": ["celsius", "fahrenheit"],
                  "description": "The unit of temperature, either 'celsius' or 'fahrenheit'"
                }
              },
              "required": ["location"]
            }
          }
        ],
        "messages": [
          {
            "role": "user",
            "content": "Find flights from San Francisco to a place with warmer weather."
          }
        ],
        "thinking": {
          "type": "enabled",
          "budget_tokens": 1024
        }
      }'

    Construir un entorno de uso de computadora personalizado

    La implementación de referencia está destinada a ayudarle a comenzar con el uso de computadora. Incluye todos los componentes necesarios para que Claude use una computadora. Sin embargo, puede construir su propio entorno para el uso de computadora para adaptarse a sus necesidades. Necesitará:

    • Un entorno virtualizado o containerizado adecuado para el uso de computadora con Claude
    • Una implementación de al menos una de las herramientas de uso de computadora definidas por Anthropic
    • Un bucle de agente que interactúe con la API de Claude y ejecute los resultados de tool_use usando sus implementaciones de herramientas
    • Una API o interfaz de usuario que permita entrada del usuario para iniciar el bucle de agente

    Implementar la herramienta de uso de computadora

    La herramienta de uso de computadora se implementa como una herramienta sin esquema. Cuando usa esta herramienta, no necesita proporcionar un esquema de entrada como con otras herramientas; el esquema está integrado en el modelo de Claude y no se puede modificar.

    1. 1

      Configurar su entorno informático

      Cree una pantalla virtual o conéctese a una pantalla existente con la que Claude interactuará. Esto típicamente implica configurar Xvfb (X Virtual Framebuffer) o tecnología similar.

    2. 2

      Implementar manejadores de acciones

      Cree funciones para manejar cada tipo de acción que Claude podría solicitar:

      def handle_computer_action(action_type, params):
          if action_type == "screenshot":
              return capture_screenshot()
          elif action_type == "left_click":
              x, y = params["coordinate"]
              return click_at(x, y)
          elif action_type == "type":
              return type_text(params["text"])
          # ... manejar otras acciones
    3. 3

      Procesar llamadas de herramientas de Claude

      Extraiga y ejecute llamadas de herramientas de las respuestas de Claude:

      for content in response.content:
          if content.type == "tool_use":
              action = content.input["action"]
              result = handle_computer_action(action, content.input)
              
              # Devolver resultado a Claude
              tool_result = {
                  "type": "tool_result",
                  "tool_use_id": content.id,
                  "content": result
              }
    4. 4

      Implementar el bucle de agente

      Cree un bucle que continúe hasta que Claude complete la tarea:

      while True:
          response = client.beta.messages.create(...)
          
          # Verificar si Claude usó alguna herramienta
          tool_results = process_tool_calls(response)
          
          if not tool_results:
              # Sin más uso de herramienta, tarea completada
              break
              
          # Continuar conversación con resultados de herramientas
          messages.append({"role": "user", "content": tool_results})

    Manejar errores

    Al implementar la herramienta de uso de computadora, pueden ocurrir varios errores. Así es cómo manejarlos:

    Seguir mejores prácticas de implementación


    Entender las limitaciones del uso de computadora

    La funcionalidad de uso de computadora está en beta. Aunque las capacidades de Claude son de vanguardia, los desarrolladores deben ser conscientes de sus limitaciones:

    1. Latencia: la latencia actual del uso de computadora para interacciones humano-IA puede ser demasiado lenta en comparación con acciones de computadora dirigidas por humanos regulares. Recomendamos enfocarse en casos de uso donde la velocidad no es crítica (por ejemplo, recopilación de información de fondo, pruebas automatizadas de software) en entornos confiables.
    2. Precisión y confiabilidad de visión por computadora: Claude puede cometer errores o alucinar al generar coordenadas específicas mientras genera acciones. Claude Sonnet 3.7 introduce la capacidad de pensamiento que puede ayudarle a entender el razonamiento del modelo e identificar posibles problemas.
    3. Precisión y confiabilidad de selección de herramientas: Claude puede cometer errores o alucinar al seleccionar herramientas mientras genera acciones o tomar acciones inesperadas para resolver problemas. Además, la confiabilidad puede ser menor cuando se interactúa con aplicaciones de nicho o múltiples aplicaciones a la vez. Recomendamos que los usuarios indiquen al modelo cuidadosamente cuando soliciten tareas complejas.
    4. Confiabilidad de desplazamiento: Claude Sonnet 3.7 introdujo acciones de desplazamiento dedicadas con control de dirección que mejora la confiabilidad. El modelo ahora puede desplazarse explícitamente en cualquier dirección (arriba/abajo/izquierda/derecha) por una cantidad especificada.
    5. Interacción con hojas de cálculo: Los clics del ratón para interacción con hojas de cálculo han mejorado en Claude Sonnet 3.7 con la adición de acciones de control del ratón más precisas como left_mouse_down, left_mouse_up y nuevo soporte de teclas modificadoras. La selección de celdas puede ser más confiable usando estos controles de grano fino y combinando teclas modificadoras con clics.
    6. Creación de cuentas y generación de contenido en plataformas sociales y de comunicaciones: Aunque Claude visitará sitios web, estamos limitando su capacidad para crear cuentas o generar y compartir contenido u otro compromiso en suplantación de identidad humana en sitios web y plataformas de redes sociales. Podemos actualizar esta capacidad en el futuro.
    7. Vulnerabilidades: Las vulnerabilidades como jailbreaking o inyección de indicaciones pueden persistir en sistemas de IA fronteriza, incluyendo la API beta de uso de computadora. En algunas circunstancias, Claude seguirá comandos encontrados en contenido, a veces incluso en conflicto con las instrucciones del usuario. Por ejemplo, las instrucciones de Claude en páginas web o contenidas en imágenes pueden anular instrucciones o causar que Claude cometa errores. Recomendamos: a. Limitar el uso de computadora a entornos confiables como máquinas virtuales o contenedores con privilegios mínimos b. Evitar dar acceso de uso de computadora a cuentas sensibles o datos sin supervisión estricta c. Informar a los usuarios finales de los riesgos relevantes y obtener su consentimiento antes de habilitar o solicitar permisos necesarios para características de uso de computadora en sus aplicaciones
    8. Acciones inapropiadas o ilegales: Según los términos de servicio de Anthropic, no debe usar el uso de computadora para violar ninguna ley o nuestra Política de Uso Aceptable.

    Siempre revise y verifique cuidadosamente las acciones y registros de uso de computadora de Claude. No use Claude para tareas que requieran precisión perfecta o información de usuario sensible sin supervisión humana.


    Precios

    Computer use follows the standard tool use pricing. When using the computer use tool:

    System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

    Computer use tool token usage:

    ModelInput tokens per tool definition
    Claude 4.x models735 tokens
    Claude Sonnet 3.7 (deprecated)735 tokens

    Additional token consumption:

    • Screenshot images (see Vision pricing)
    • Tool execution results returned to Claude

    If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

    Próximos pasos

    Implementación de referencia

    Comience rápidamente con nuestra implementación completa basada en Docker

    Documentación de herramientas

    Aprenda más sobre el uso de herramientas y la creación de herramientas personalizadas

    • Descripción general
    • Compatibilidad de modelos
    • Consideraciones de seguridad
    • Inicio rápido
    • Cómo funciona el uso de computadora
    • El entorno informático
    • Cómo implementar el uso de computadora
    • Comience con nuestra implementación de referencia
    • Entender el bucle de múltiples agentes
    • Optimizar el rendimiento del modelo con indicaciones
    • Indicadores del sistema
    • Acciones disponibles
    • Aumentar el uso de computadora con otras herramientas
    • Construir un entorno de uso de computadora personalizado
    © 2025 ANTHROPIC PBC

    Products

    • Claude
    • Claude Code
    • Max plan
    • Team plan
    • Enterprise plan
    • Download app
    • Pricing
    • Log in

    Features

    • Claude and Slack
    • Claude in Excel

    Models

    • Opus
    • Sonnet
    • Haiku

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Claude Developer Platform

    • Overview
    • Developer docs
    • Pricing
    • Amazon Bedrock
    • Google Cloud’s Vertex AI
    • Console login

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Help and security

    • Availability
    • Status
    • Support center

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy

    Products

    • Claude
    • Claude Code
    • Max plan
    • Team plan
    • Enterprise plan
    • Download app
    • Pricing
    • Log in

    Features

    • Claude and Slack
    • Claude in Excel

    Models

    • Opus
    • Sonnet
    • Haiku

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Claude Developer Platform

    • Overview
    • Developer docs
    • Pricing
    • Amazon Bedrock
    • Google Cloud’s Vertex AI
    • Console login

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Help and security

    • Availability
    • Status
    • Support center

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    © 2025 ANTHROPIC PBC