Loading...
    • Guía para desarrolladores
    • Referencia de API
    • MCP
    • Recursos
    • Notas de la versión
    Search...
    ⌘K
    Primeros pasos
    Introducción a ClaudeInicio rápido
    Modelos y precios
    Descripción general de modelosElegir un modeloNovedades en Claude 4.5Migración a Claude 4.5Deprecación de modelosPrecios
    Construir con Claude
    Descripción general de característicasUsar la API de MessagesVentanas de contextoMejores prácticas de prompting
    Capacidades
    Almacenamiento en caché de promptsEdición de contextoPensamiento extendidoEsfuerzoStreaming de MessagesProcesamiento por lotesCitasSoporte multilingüeConteo de tokensEmbeddingsVisiónSoporte de PDFAPI de FilesResultados de búsquedaSalidas estructuradas
    Herramientas
    Descripción generalCómo implementar el uso de herramientasStreaming de herramientas de grano finoHerramienta BashHerramienta de ejecución de códigoLlamada de herramientas programáticaHerramienta de uso de computadoraHerramienta de editor de textoHerramienta de búsqueda webHerramienta de búsqueda webHerramienta de memoriaHerramienta de búsqueda de herramientas
    Agent Skills
    Descripción generalInicio rápidoMejores prácticasUsar Skills con la API
    Agent SDK
    Descripción generalInicio rápidoSDK de TypeScriptTypeScript V2 (vista previa)SDK de PythonGuía de migración
    MCP en la API
    Conector MCPServidores MCP remotos
    Claude en plataformas de terceros
    Amazon BedrockMicrosoft FoundryVertex AI
    Ingeniería de prompts
    Descripción generalGenerador de promptsUsar plantillas de promptsMejorador de promptsSer claro y directoUsar ejemplos (prompting multishot)Dejar que Claude piense (CoT)Usar etiquetas XMLDar un rol a Claude (prompts del sistema)Rellenar la respuesta de ClaudeEncadenar prompts complejosConsejos de contexto largoConsejos de pensamiento extendido
    Probar y evaluar
    Definir criterios de éxitoDesarrollar casos de pruebaUsar la herramienta de evaluaciónReducir latencia
    Fortalecer protecciones
    Reducir alucinacionesAumentar consistencia de salidaMitigar ataques de jailbreakRechazos de streamingReducir fuga de promptsMantener a Claude en personaje
    Administración y monitoreo
    Descripción general de Admin APIAPI de uso y costoAPI de Claude Code Analytics
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Capacidades

    Esfuerzo

    Controla cuántos tokens usa Claude al responder con el parámetro effort, equilibrando entre la exhaustividad de la respuesta y la eficiencia de tokens.

    El parámetro effort te permite controlar cuán dispuesto está Claude a gastar tokens al responder a solicitudes. Esto te da la capacidad de equilibrar entre la exhaustividad de la respuesta y la eficiencia de tokens, todo con un único modelo.

    El parámetro effort está actualmente en beta y solo es compatible con Claude Opus 4.5.

    Debes incluir el encabezado beta effort-2025-11-24 al usar esta función.

    Cómo funciona el esfuerzo

    Por defecto, Claude usa el máximo esfuerzo, gastando tantos tokens como sea necesario para el mejor resultado posible. Al reducir el nivel de esfuerzo, puedes instruir a Claude para que sea más conservador con el uso de tokens, optimizando para velocidad y costo mientras aceptas una reducción en la capacidad.

    Establecer effort a "high" produce exactamente el mismo comportamiento que omitir el parámetro effort por completo.

    El parámetro effort afecta todos los tokens en la respuesta, incluyendo:

    • Respuestas de texto y explicaciones
    • Llamadas a herramientas y argumentos de funciones
    • Pensamiento extendido (cuando está habilitado)

    Este enfoque tiene dos ventajas principales:

    1. No requiere que el pensamiento esté habilitado para usarlo.
    2. Puede afectar todo el gasto de tokens incluyendo llamadas a herramientas. Por ejemplo, un esfuerzo menor significaría que Claude hace menos llamadas a herramientas. Esto proporciona un grado mucho mayor de control sobre la eficiencia.

    Niveles de esfuerzo

    NivelDescripciónCaso de uso típico
    highMáxima capacidad. Claude usa tantos tokens como sea necesario para el mejor resultado posible. Equivalente a no establecer el parámetro.Razonamiento complejo, problemas de codificación difíciles, tareas agentivas
    mediumEnfoque equilibrado con ahorros de tokens moderados.Tareas agentivas que requieren un equilibrio entre velocidad, costo y rendimiento
    lowMás eficiente. Ahorros significativos de tokens con alguna reducción de capacidad.Tareas más simples que necesitan la mejor velocidad y los costos más bajos, como subagentos

    Uso básico

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.beta.messages.create(
        model="claude-opus-4-5-20251101",
        betas=["effort-2025-11-24"],
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    ¿Cuándo debo ajustar el parámetro effort?

    • Usa high effort (el predeterminado) cuando necesites el mejor trabajo de Claude: razonamiento complejo, análisis matizado, problemas de codificación difíciles, o cualquier tarea donde la calidad sea la prioridad principal.
    • Usa medium effort como una opción equilibrada cuando quieras un rendimiento sólido sin el gasto completo de tokens del high effort.
    • Usa low effort cuando estés optimizando para velocidad (porque Claude responde con menos tokens) o costo, por ejemplo, tareas simples de clasificación, búsquedas rápidas, o casos de uso de alto volumen donde las mejoras marginales de calidad no justifican latencia adicional o gasto.

    Esfuerzo con uso de herramientas

    Al usar herramientas, el parámetro effort afecta tanto las explicaciones alrededor de las llamadas a herramientas como las llamadas a herramientas en sí. Los niveles de esfuerzo más bajos tienden a:

    • Combinar múltiples operaciones en menos llamadas a herramientas
    • Hacer menos llamadas a herramientas
    • Proceder directamente a la acción sin preámbulo
    • Usar mensajes de confirmación concisos después de la finalización

    Los niveles de esfuerzo más altos pueden:

    • Hacer más llamadas a herramientas
    • Explicar el plan antes de tomar acción
    • Proporcionar resúmenes detallados de cambios
    • Incluir comentarios de código más completos

    Esfuerzo con pensamiento extendido

    El parámetro effort funciona junto con el presupuesto de tokens de pensamiento cuando el pensamiento extendido está habilitado. Estos dos controles sirven propósitos diferentes:

    • Parámetro effort: Controla cómo Claude gasta todos los tokens, incluyendo tokens de pensamiento, respuestas de texto y llamadas a herramientas
    • Presupuesto de tokens de pensamiento: Establece un límite máximo en tokens de pensamiento específicamente

    El parámetro effort puede usarse con o sin pensamiento extendido habilitado. Cuando ambos están configurados:

    1. Primero determina el nivel de esfuerzo apropiado para tu tarea
    2. Luego establece el presupuesto de tokens de pensamiento basado en la complejidad de la tarea

    Para el mejor rendimiento en tareas de razonamiento complejo, usa high effort (el predeterminado) con un presupuesto de tokens de pensamiento alto. Esto permite a Claude pensar a fondo y proporcionar respuestas completas.

    Mejores prácticas

    1. Comienza con high: Usa niveles de esfuerzo más bajos para equilibrar rendimiento con eficiencia de tokens.
    2. Usa low para tareas sensibles a la velocidad o simples: Cuando la latencia importa o las tareas son directas, low effort puede reducir significativamente los tiempos de respuesta y los costos.
    3. Prueba tu caso de uso: El impacto de los niveles de esfuerzo varía según el tipo de tarea. Evalúa el rendimiento en tus casos de uso específicos antes de implementar.
    4. Considera esfuerzo dinámico: Ajusta el esfuerzo basado en la complejidad de la tarea. Las consultas simples pueden justificar low effort mientras que la codificación agentiva y el razonamiento complejo se benefician de high effort.
    • Cómo funciona el esfuerzo
    • Niveles de esfuerzo
    • Uso básico
    • ¿Cuándo debo ajustar el parámetro effort?
    • Esfuerzo con uso de herramientas
    • Esfuerzo con pensamiento extendido
    • Mejores prácticas