Loading...
    • Guía para desarrolladores
    • Referencia de API
    • MCP
    • Recursos
    • Notas de la versión
    Search...
    ⌘K
    Primeros pasos
    Introducción a ClaudeInicio rápido
    Modelos y precios
    Descripción general de modelosElegir un modeloNovedades en Claude 4.6Guía de migraciónModelos deprecadosPrecios
    Crear con Claude
    Descripción general de característicasUsar la API de MessagesManejar razones de paradaMejores prácticas de prompting
    Capacidades del modelo
    Extended thinkingAdaptive thinkingEsfuerzoModo rápido (vista previa de investigación)Salidas estructuradasCitasStreaming de MessagesProcesamiento por lotesSoporte de PDFResultados de búsquedaSoporte multilingüeEmbeddingsVisión
    Herramientas
    Descripción generalCómo implementar el uso de herramientasHerramienta de búsqueda webHerramienta de obtención webHerramienta de ejecución de códigoHerramienta de memoriaHerramienta BashHerramienta de uso de computadoraHerramienta de editor de texto
    Infraestructura de herramientas
    Búsqueda de herramientasLlamada de herramientas programáticaStreaming de herramientas de grano fino
    Gestión de contexto
    Ventanas de contextoCompactaciónEdición de contextoAlmacenamiento en caché de promptsConteo de tokens
    Archivos y activos
    API de archivos
    Agent Skills
    Descripción generalInicio rápidoMejores prácticasSkills para empresasUsar Skills con la API
    Agent SDK
    Descripción generalInicio rápidoTypeScript SDKTypeScript V2 (vista previa)Python SDKGuía de migración
    MCP en la API
    Conector MCPServidores MCP remotos
    Claude en plataformas de terceros
    Amazon BedrockMicrosoft FoundryVertex AI
    Ingeniería de prompts
    Descripción generalGenerador de promptsUsar plantillas de promptsMejorador de promptsSer claro y directoUsar ejemplos (prompting multishot)Dejar que Claude piense (CoT)Usar etiquetas XMLDar a Claude un rol (prompts del sistema)Encadenar prompts complejosConsejos de contexto largoConsejos de extended thinking
    Probar y evaluar
    Definir criterios de éxitoDesarrollar casos de pruebaUsar la herramienta de evaluaciónReducir latencia
    Fortalecer guardarraíles
    Reducir alucinacionesAumentar consistencia de salidaMitigar jailbreaksRechazos de streamingReducir fuga de promptsMantener a Claude en personaje
    Administración y monitoreo
    Descripción general de Admin APIResidencia de datosEspacios de trabajoAPI de uso y costosAPI de análisis de Claude CodeRetención de datos cero
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Capacidades del modelo

    Esfuerzo

    Controla cuántos tokens utiliza Claude al responder con el parámetro effort, equilibrando entre la exhaustividad de la respuesta y la eficiencia de tokens.

    El parámetro effort te permite controlar cuán dispuesto está Claude a gastar tokens al responder a solicitudes. Esto te da la capacidad de equilibrar entre la exhaustividad de la respuesta y la eficiencia de tokens, todo con un único modelo. El parámetro effort está generalmente disponible en todos los modelos compatibles sin requerir un encabezado beta.

    El parámetro effort es compatible con Claude Opus 4.6 y Claude Opus 4.5.

    Para Claude Opus 4.6, effort reemplaza budget_tokens como la forma recomendada de controlar la profundidad del pensamiento. Combina effort con adaptive thinking (thinking: {type: "adaptive"}) para la mejor experiencia. Aunque budget_tokens sigue siendo aceptado en Opus 4.6, está deprecado y será eliminado en un lanzamiento de modelo futuro. En effort high (predeterminado) y max, Claude casi siempre pensará. En niveles de effort más bajos, puede omitir el pensamiento para problemas más simples.

    Cómo funciona el esfuerzo

    Por defecto, Claude utiliza alto esfuerzo, gastando tantos tokens como sea necesario para obtener excelentes resultados. Puedes aumentar el nivel de esfuerzo a max para la máxima capacidad absoluta, o reducirlo para ser más conservador con el uso de tokens, optimizando para velocidad y costo mientras aceptas una reducción en la capacidad.

    Establecer effort a "high" produce exactamente el mismo comportamiento que omitir el parámetro effort por completo.

    El parámetro effort afecta todos los tokens en la respuesta, incluyendo:

    • Respuestas de texto y explicaciones
    • Llamadas a herramientas y argumentos de funciones
    • Pensamiento extendido (cuando está habilitado)

    Este enfoque tiene dos ventajas principales:

    1. No requiere que el pensamiento esté habilitado para usarlo.
    2. Puede afectar todo el gasto de tokens incluyendo llamadas a herramientas. Por ejemplo, un esfuerzo más bajo significaría que Claude hace menos llamadas a herramientas. Esto proporciona un grado mucho mayor de control sobre la eficiencia.

    Niveles de esfuerzo

    NivelDescripciónCaso de uso típico
    maxCapacidad máxima absoluta sin restricciones en el gasto de tokens. Solo Opus 4.6 — las solicitudes que usan max en otros modelos devolverán un error.Tareas que requieren el razonamiento más profundo posible y el análisis más exhaustivo
    highAlta capacidad. Equivalente a no establecer el parámetro.Razonamiento complejo, problemas de codificación difíciles, tareas agentivas
    mediumEnfoque equilibrado con ahorros de tokens moderados.Tareas agentivas que requieren un equilibrio de velocidad, costo y rendimiento
    lowMás eficiente. Ahorros de tokens significativos con alguna reducción de capacidad.Tareas más simples que necesitan la mejor velocidad y los costos más bajos, como subagentos

    El esfuerzo es una señal de comportamiento, no un presupuesto de tokens estricto. En niveles de esfuerzo más bajos, Claude seguirá pensando en problemas suficientemente difíciles — simplemente pensará menos de lo que lo haría en niveles de esfuerzo más altos para el mismo problema.

    Uso básico

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    ¿Cuándo debo ajustar el parámetro effort?

    • Usa max effort cuando necesites la capacidad absoluta más alta sin restricciones — el razonamiento más exhaustivo y el análisis más profundo. Solo disponible en Opus 4.6; las solicitudes que usan max en otros modelos devolverán un error.
    • Usa high effort (el predeterminado) cuando necesites el mejor trabajo de Claude — razonamiento complejo, análisis matizado, problemas de codificación difíciles, o cualquier tarea donde la calidad sea la prioridad principal.
    • Usa medium effort como una opción equilibrada cuando quieras un rendimiento sólido sin el gasto de tokens completo del esfuerzo alto.
    • Usa low effort cuando estés optimizando para velocidad (porque Claude responde con menos tokens) o costo — por ejemplo, tareas de clasificación simples, búsquedas rápidas, o casos de uso de alto volumen donde las mejoras de calidad marginales no justifican latencia adicional o gasto.

    Esfuerzo con uso de herramientas

    Cuando uses herramientas, el parámetro effort afecta tanto las explicaciones alrededor de las llamadas a herramientas como las llamadas a herramientas en sí. Los niveles de esfuerzo más bajos tienden a:

    • Combinar múltiples operaciones en menos llamadas a herramientas
    • Hacer menos llamadas a herramientas
    • Proceder directamente a la acción sin preámbulo
    • Usar mensajes de confirmación concisos después de la finalización

    Los niveles de esfuerzo más altos pueden:

    • Hacer más llamadas a herramientas
    • Explicar el plan antes de tomar acción
    • Proporcionar resúmenes detallados de cambios
    • Incluir comentarios de código más exhaustivos

    Esfuerzo con pensamiento extendido

    El parámetro effort funciona junto con el pensamiento extendido. Su comportamiento depende del modelo:

    • Claude Opus 4.6 utiliza adaptive thinking (thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. Aunque budget_tokens sigue siendo aceptado en Opus 4.6, está deprecado y será eliminado en un lanzamiento futuro. En effort high y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.
    • Claude Opus 4.5 utiliza pensamiento manual (thinking: {type: "enabled", budget_tokens: N}), donde effort funciona junto con el presupuesto de tokens de pensamiento. Establece el nivel de esfuerzo para tu tarea, luego establece el presupuesto de tokens de pensamiento basado en la complejidad de la tarea.

    El parámetro effort puede usarse con o sin pensamiento extendido habilitado. Cuando se usa sin pensamiento, sigue controlando el gasto total de tokens para respuestas de texto y llamadas a herramientas.

    Mejores prácticas

    1. Comienza con high: Usa niveles de esfuerzo más bajos para equilibrar el rendimiento con la eficiencia de tokens.
    2. Usa low para tareas sensibles a la velocidad o simples: Cuando la latencia importa o las tareas son directas, el esfuerzo bajo puede reducir significativamente los tiempos de respuesta y los costos.
    3. Prueba tu caso de uso: El impacto de los niveles de esfuerzo varía según el tipo de tarea. Evalúa el rendimiento en tus casos de uso específicos antes de implementar.
    4. Considera esfuerzo dinámico: Ajusta el esfuerzo basado en la complejidad de la tarea. Las consultas simples pueden justificar esfuerzo bajo mientras que la codificación agentiva y el razonamiento complejo se benefician del esfuerzo alto.

    Was this page helpful?

    • Cómo funciona el esfuerzo
    • Niveles de esfuerzo
    • Uso básico
    • ¿Cuándo debo ajustar el parámetro effort?
    • Esfuerzo con uso de herramientas
    • Esfuerzo con pensamiento extendido
    • Mejores prácticas