Loading...
    • Construir
    • Administración
    • Modelos y precios
    • SDKs de cliente
    • Referencia de la API
    Search...
    ⌘K
    Primeros pasos
    Introducción a ClaudeInicio rápido
    Construir con Claude
    Descripción general de funcionesUsar la API de mensajesGestionar razones de parada
    Capacidades del modelo
    Pensamiento extendidoPensamiento adaptativoEsfuerzoModo rápido (beta: vista previa de investigación)Salidas estructuradasCitasMensajes en streamingProcesamiento por lotesResultados de búsquedaRechazos en streamingSoporte multilingüeEmbeddings
    Herramientas
    Descripción generalCómo funciona el uso de herramientasHerramienta de búsqueda webHerramienta de recuperación webHerramienta de ejecución de códigoHerramienta de memoriaHerramienta BashHerramienta de uso del ordenadorHerramienta de edición de texto
    Infraestructura de herramientas
    Búsqueda de herramientasLlamada programática de herramientasStreaming detallado de herramientas
    Gestión del contexto
    Ventanas de contextoCompactaciónEdición de contextoCaché de promptsConteo de tokens
    Trabajar con archivos
    Files APISoporte de PDFImágenes y visión
    Skills
    Descripción generalInicio rápidoMejores prácticasSkills para empresasSkills en la API
    MCP
    Servidores MCP remotosConector MCP
    Ingeniería de prompts
    Descripción generalMejores prácticas de promptsHerramientas de prompts en Console
    Probar y evaluar
    Definir el éxito y crear evaluacionesUsar la herramienta de evaluación en ConsoleReducir la latencia
    Reforzar las barreras de seguridad
    Reducir alucinacionesAumentar la consistencia de salidaMitigar jailbreaksReducir la filtración de prompts
    Recursos
    Glosario
    Notas de versión
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Capacidades del modelo

    Esfuerzo

    Controla cuántos tokens utiliza Claude al responder con el parámetro effort, equilibrando entre la exhaustividad de la respuesta y la eficiencia de tokens.

    Was this page helpful?

    • Cómo funciona effort
    • Niveles de effort
    • Niveles de effort recomendados para Sonnet 4.6
    • Uso básico
    • Cuándo ajustar el parámetro effort
    • Effort con uso de herramientas
    • Effort con pensamiento extendido
    • Mejores prácticas

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    El parámetro effort te permite controlar cuán dispuesto está Claude a gastar tokens al responder a solicitudes. Esto te da la capacidad de equilibrar entre la exhaustividad de la respuesta y la eficiencia de tokens, todo con un único modelo. El parámetro effort está generalmente disponible en todos los modelos compatibles sin requerir un encabezado beta.

    El parámetro effort es compatible con Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6 y Claude Opus 4.5.

    Para Claude Opus 4.6 y Sonnet 4.6, effort reemplaza budget_tokens como la forma recomendada de controlar la profundidad del pensamiento. Combina effort con adaptive thinking (thinking: {type: "adaptive"}) para la mejor experiencia. Aunque budget_tokens sigue siendo aceptado en Opus 4.6 y Sonnet 4.6, está deprecado y será eliminado en una futura versión del modelo. Con effort high (predeterminado) y max, Claude casi siempre pensará. En niveles de effort más bajos, puede omitir el pensamiento para problemas más simples.

    Cómo funciona effort

    Por defecto, Claude utiliza high effort, gastando tantos tokens como sea necesario para obtener excelentes resultados. Puedes aumentar el nivel de effort a max para la máxima capacidad absoluta, o reducirlo para ser más conservador con el uso de tokens, optimizando para velocidad y costo mientras aceptas una reducción en la capacidad.

    Establecer effort a "high" produce exactamente el mismo comportamiento que omitir el parámetro effort completamente.

    El parámetro effort afecta todos los tokens en la respuesta, incluyendo:

    • Respuestas de texto y explicaciones
    • Llamadas a herramientas y argumentos de funciones
    • Pensamiento extendido (cuando está habilitado)

    Este enfoque tiene dos ventajas principales:

    1. No requiere que el pensamiento esté habilitado para usarlo.
    2. Puede afectar todo el gasto de tokens incluyendo llamadas a herramientas. Por ejemplo, un effort más bajo significaría que Claude hace menos llamadas a herramientas. Esto proporciona un grado mucho mayor de control sobre la eficiencia.

    Niveles de effort

    NivelDescripciónCaso de uso típico
    maxCapacidad máxima absoluta sin restricciones en el gasto de tokens. Disponible en Claude Mythos Preview, Claude Opus 4.6 y Claude Sonnet 4.6.Tareas que requieren el razonamiento más profundo posible y análisis más exhaustivo
    highAlta capacidad. Equivalente a no establecer el parámetro.Razonamiento complejo, problemas de codificación difíciles, tareas de agentes
    mediumEnfoque equilibrado con ahorros de tokens moderados.Tareas de agentes que requieren un equilibrio de velocidad, costo y rendimiento
    lowMás eficiente. Ahorros de tokens significativos con alguna reducción de capacidad.Tareas más simples que necesitan la mejor velocidad y los costos más bajos, como suagentes

    Effort es una señal de comportamiento, no un presupuesto de tokens estricto. En niveles de effort más bajos, Claude seguirá pensando en problemas suficientemente difíciles, pero pensará menos de lo que lo haría en niveles de effort más altos para el mismo problema.

    Niveles de effort recomendados para Sonnet 4.6

    Sonnet 4.6 tiene como predeterminado high effort. Establece explícitamente effort al usar Sonnet 4.6 para evitar latencia inesperada:

    • Medium effort (predeterminado recomendado): Mejor equilibrio de velocidad, costo y rendimiento para la mayoría de aplicaciones. Adecuado para codificación de agentes, flujos de trabajo con muchas herramientas y generación de código.
    • Low effort: Para cargas de trabajo de alto volumen o sensibles a la latencia. Adecuado para chat y casos de uso sin codificación donde se prioriza un tiempo de respuesta más rápido.
    • High effort: Para tareas que requieren inteligencia máxima de Sonnet 4.6.
    • Max effort: Para tareas que requieren la capacidad absoluta más alta sin restricciones en el gasto de tokens.

    Uso básico

    Cuándo ajustar el parámetro effort

    • Usa max effort cuando necesites la capacidad absoluta más alta sin restricciones: el razonamiento más exhaustivo y el análisis más profundo. Disponible en Claude Mythos Preview, Claude Opus 4.6 y Claude Sonnet 4.6.
    • Usa high effort (el predeterminado) cuando necesites el mejor trabajo de Claude: razonamiento complejo, análisis matizado, problemas de codificación difíciles, o cualquier tarea donde la calidad sea la prioridad principal.
    • Usa medium effort como una opción equilibrada cuando quieras un rendimiento sólido sin el gasto de tokens completo del high effort.
    • Usa low effort cuando estés optimizando para velocidad (porque Claude responde con menos tokens) o costo. Por ejemplo, tareas simples de clasificación, búsquedas rápidas, o casos de uso de alto volumen donde las mejoras marginales de calidad no justifican latencia adicional o gasto.

    Effort con uso de herramientas

    Al usar herramientas, el parámetro effort afecta tanto las explicaciones alrededor de las llamadas a herramientas como las llamadas a herramientas en sí. Los niveles de effort más bajos tienden a:

    • Combinar múltiples operaciones en menos llamadas a herramientas
    • Hacer menos llamadas a herramientas
    • Proceder directamente a la acción sin preámbulo
    • Usar mensajes de confirmación concisos después de la finalización

    Los niveles de effort más altos pueden:

    • Hacer más llamadas a herramientas
    • Explicar el plan antes de tomar acción
    • Proporcionar resúmenes detallados de cambios
    • Incluir comentarios de código más exhaustivos

    Effort con pensamiento extendido

    El parámetro effort funciona junto con el pensamiento extendido. Su comportamiento depende del modelo:

    • Claude Mythos Preview utiliza adaptive thinking por defecto (no se requiere configuración de thinking). thinking: {type: "disabled"} es rechazado. Effort controla la profundidad del pensamiento de la misma manera que en Opus 4.6.
    • Claude Opus 4.6 utiliza adaptive thinking (thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. Aunque budget_tokens sigue siendo aceptado en Opus 4.6, está deprecado y será eliminado en una futura versión. Con effort high y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.
    • Claude Sonnet 4.6 utiliza adaptive thinking (donde effort controla la profundidad del pensamiento). El pensamiento manual con interleaved mode (thinking: {type: "enabled", budget_tokens: N}) sigue siendo funcional pero está deprecado.
    • Claude Opus 4.5 y otros modelos Claude 4 utilizan pensamiento manual (), donde effort funciona junto con el presupuesto de tokens de pensamiento. Establece el nivel de effort para tu tarea, luego establece el presupuesto de tokens de pensamiento basado en la complejidad de la tarea.

    El parámetro effort puede ser utilizado con o sin pensamiento extendido habilitado. Cuando se usa sin pensamiento, sigue controlando el gasto total de tokens para respuestas de texto y llamadas a herramientas.

    Mejores prácticas

    1. Establece effort explícitamente: La API tiene como predeterminado high, pero el punto de partida correcto depende de tu modelo y carga de trabajo.
    2. Usa low para tareas sensibles a la velocidad o simples: Cuando la latencia importa o las tareas son directas, low effort puede reducir significativamente los tiempos de respuesta y los costos.
    3. Prueba tu caso de uso: El impacto de los niveles de effort varía según el tipo de tarea. Evalúa el rendimiento en tus casos de uso específicos antes de desplegar.
    4. Considera effort dinámico: Ajusta effort basado en la complejidad de la tarea. Las consultas simples pueden justificar low effort mientras que la codificación de agentes y el razonamiento complejo se benefician de high effort.
    curl https://api.anthropic.com/v1/messages \
        --header "x-api-key: $ANTHROPIC_API_KEY" \
        --header "anthropic-version: 2023-06-01" \
        --header "content-type: application/json" \
        --data '{
            "model": "claude-opus-4-6",
            "max_tokens": 4096,
            "messages": [{
                "role": "user",
                "content": "Analyze the trade-offs between microservices and monolithic architectures"
            }],
            "output_config": {
                "effort": "medium"
            }
        }'
    thinking: {type: "enabled", budget_tokens: N}