Loading...
    • Guía para desarrolladores
    • Referencia de API
    • MCP
    • Recursos
    • Notas de la versión
    Search...
    ⌘K
    Primeros pasos
    Introducción a ClaudeInicio rápido
    Modelos y precios
    Descripción general de modelosElegir un modeloNovedades en Claude 4.5Migración a Claude 4.5Deprecación de modelosPrecios
    Construir con Claude
    Descripción general de característicasUsar la API de MessagesVentanas de contextoMejores prácticas de prompting
    Capacidades
    Almacenamiento en caché de promptsEdición de contextoPensamiento extendidoEsfuerzoStreaming de MessagesProcesamiento por lotesCitasSoporte multilingüeConteo de tokensEmbeddingsVisiónSoporte de PDFAPI de FilesResultados de búsquedaSalidas estructuradas
    Herramientas
    Descripción generalCómo implementar el uso de herramientasUso eficiente de herramientas en tokensStreaming de herramientas de grano finoHerramienta BashHerramienta de ejecución de códigoLlamada de herramientas programáticaHerramienta de uso de computadoraHerramienta de editor de textoHerramienta de búsqueda webHerramienta de búsqueda webHerramienta de memoriaHerramienta de búsqueda de herramientas
    Habilidades del agente
    Descripción generalInicio rápidoMejores prácticasUsar habilidades con la API
    SDK del agente
    Descripción generalSDK de TypeScriptSDK de PythonGuía de migración
    MCP en la API
    Conector MCPServidores MCP remotos
    Claude en plataformas de terceros
    Amazon BedrockMicrosoft FoundryVertex AI
    Ingeniería de prompts
    Descripción generalGenerador de promptsUsar plantillas de promptsMejorador de promptsSé claro y directoUsar ejemplos (prompting multishot)Dejar pensar a Claude (CoT)Usar etiquetas XMLDale un rol a Claude (prompts del sistema)Rellenar la respuesta de ClaudeEncadenar prompts complejosConsejos de contexto largoConsejos de pensamiento extendido
    Probar y evaluar
    Definir criterios de éxitoDesarrollar casos de pruebaUsar la herramienta de evaluaciónReducir latencia
    Fortalecer protecciones
    Reducir alucinacionesAumentar consistencia de salidaMitigar ataques de jailbreakRechazos de streamingReducir fuga de promptsMantener a Claude en personaje
    Administración y monitoreo
    Descripción general de Admin APIAPI de uso y costosAPI de análisis de Claude Code
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Capacidades

    Esfuerzo

    Controla cuántos tokens utiliza Claude al responder con el parámetro effort, equilibrando entre la exhaustividad de la respuesta y la eficiencia de tokens.

    El parámetro effort te permite controlar cuán dispuesto está Claude a gastar tokens al responder a solicitudes. Esto te da la capacidad de equilibrar entre la exhaustividad de la respuesta y la eficiencia de tokens, todo con un único modelo.

    El parámetro effort está actualmente en beta y solo es compatible con Claude Opus 4.5.

    Debes incluir el encabezado beta effort-2025-11-24 al usar esta función.

    Cómo funciona effort

    Por defecto, Claude utiliza el máximo esfuerzo, gastando tantos tokens como sea necesario para el mejor resultado posible. Al reducir el nivel de esfuerzo, puedes instruir a Claude para que sea más conservador con el uso de tokens, optimizando para velocidad y costo mientras aceptas una reducción en la capacidad.

    Establecer effort a "high" produce exactamente el mismo comportamiento que omitir el parámetro effort por completo.

    El parámetro effort afecta todos los tokens en la respuesta, incluyendo:

    • Respuestas de texto y explicaciones
    • Llamadas a herramientas y argumentos de funciones
    • Pensamiento extendido (cuando está habilitado)

    Este enfoque tiene dos ventajas principales:

    1. No requiere que el pensamiento esté habilitado para usarlo.
    2. Puede afectar todo el gasto de tokens incluyendo llamadas a herramientas. Por ejemplo, un esfuerzo menor significaría que Claude realiza menos llamadas a herramientas. Esto proporciona un grado mucho mayor de control sobre la eficiencia.

    Niveles de esfuerzo

    NivelDescripciónCaso de uso típico
    highCapacidad máxima—Claude utiliza tantos tokens como sea necesario para el mejor resultado posible. Equivalente a no establecer el parámetro.Razonamiento complejo, problemas de codificación difíciles, tareas de agentes
    mediumEnfoque equilibrado con ahorros de tokens moderados.Tareas de agentes que requieren un equilibrio entre velocidad, costo y rendimiento
    lowMás eficiente—ahorros significativos de tokens con alguna reducción de capacidad.Tareas más simples que necesitan la mejor velocidad y los costos más bajos, como subagentos

    Uso básico

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.beta.messages.create(
        model="claude-opus-4-5-20251101",
        betas=["effort-2025-11-24"],
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    ¿Cuándo debo ajustar el parámetro effort?

    • Usa high effort (el predeterminado) cuando necesites el mejor trabajo de Claude—razonamiento complejo, análisis matizado, problemas de codificación difíciles, o cualquier tarea donde la calidad sea la prioridad principal.
    • Usa medium effort como una opción equilibrada cuando quieras un rendimiento sólido sin el gasto completo de tokens del esfuerzo alto.
    • Usa low effort cuando estés optimizando para velocidad (porque Claude responde con menos tokens) o costo—por ejemplo, tareas simples de clasificación, búsquedas rápidas, o casos de uso de alto volumen donde las mejoras marginales de calidad no justifican latencia adicional o gasto.

    Effort con uso de herramientas

    Cuando uses herramientas, el parámetro effort afecta tanto las explicaciones alrededor de las llamadas a herramientas como las llamadas a herramientas en sí. Los niveles de esfuerzo más bajos tienden a:

    • Combinar múltiples operaciones en menos llamadas a herramientas
    • Realizar menos llamadas a herramientas
    • Proceder directamente a la acción sin preámbulo
    • Usar mensajes de confirmación concisos después de la finalización

    Los niveles de esfuerzo más altos pueden:

    • Realizar más llamadas a herramientas
    • Explicar el plan antes de tomar acción
    • Proporcionar resúmenes detallados de cambios
    • Incluir comentarios de código más completos

    Effort con pensamiento extendido

    El parámetro effort funciona junto con el presupuesto de tokens de pensamiento cuando el pensamiento extendido está habilitado. Estos dos controles sirven propósitos diferentes:

    • Parámetro effort: Controla cómo Claude gasta todos los tokens—incluyendo tokens de pensamiento, respuestas de texto y llamadas a herramientas
    • Presupuesto de tokens de pensamiento: Establece un límite máximo en tokens de pensamiento específicamente

    El parámetro effort puede usarse con o sin pensamiento extendido habilitado. Cuando ambos están configurados:

    1. Primero determina el nivel de esfuerzo apropiado para tu tarea
    2. Luego establece el presupuesto de tokens de pensamiento basado en la complejidad de la tarea

    Para el mejor rendimiento en tareas de razonamiento complejo, usa high effort (el predeterminado) con un presupuesto de tokens de pensamiento alto. Esto permite que Claude piense a fondo y proporcione respuestas completas.

    Mejores prácticas

    1. Comienza con high: Usa niveles de esfuerzo más bajos para equilibrar rendimiento por eficiencia de tokens.
    2. Usa low para tareas sensibles a la velocidad o simples: Cuando la latencia importa o las tareas son directas, el esfuerzo bajo puede reducir significativamente los tiempos de respuesta y los costos.
    3. Prueba tu caso de uso: El impacto de los niveles de esfuerzo varía según el tipo de tarea. Evalúa el rendimiento en tus casos de uso específicos antes de implementar.
    4. Considera esfuerzo dinámico: Ajusta el esfuerzo basado en la complejidad de la tarea. Las consultas simples pueden justificar esfuerzo bajo mientras que la codificación de agentes y el razonamiento complejo se benefician del esfuerzo alto.
    • Cómo funciona effort
    • Niveles de esfuerzo
    • Uso básico
    • ¿Cuándo debo ajustar el parámetro effort?
    • Effort con uso de herramientas
    • Effort con pensamiento extendido
    • Mejores prácticas