Loading...
  • Construir
  • Administración
  • Modelos y precios
  • SDKs de cliente
  • Referencia de API
Search...
⌘K
Log in
Esfuerzo
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Construir/Capacidades del modelo

Esfuerzo

Controla cuántos tokens usa Claude al responder con el parámetro effort, equilibrando entre la exhaustividad de la respuesta y la eficiencia de tokens.

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

El parámetro effort te permite controlar cuán dispuesto está Claude a gastar tokens al responder solicitudes. Esto te da la capacidad de equilibrar entre la exhaustividad de la respuesta y la eficiencia de tokens, todo con un único modelo. El parámetro effort está generalmente disponible en todos los modelos compatibles sin requerir un encabezado beta.

El parámetro effort es compatible con Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 y Claude Opus 4.5.

Para Claude Opus 4.6 y Sonnet 4.6, effort reemplaza budget_tokens como la forma recomendada de controlar la profundidad del pensamiento. Combina effort con adaptive thinking (thinking: {type: "adaptive"}) para la mejor experiencia. Aunque budget_tokens sigue siendo aceptado en Opus 4.6 y Sonnet 4.6, está deprecado y será eliminado en un lanzamiento de modelo futuro. Con effort high (predeterminado) y max, Claude casi siempre pensará. En niveles de effort más bajos, puede omitir el pensamiento para problemas más simples.

Cómo funciona effort

Por defecto, Claude usa high effort, gastando tantos tokens como sea necesario para obtener excelentes resultados. Puedes aumentar el nivel de effort a max para la máxima capacidad absoluta, o reducirlo para ser más conservador con el uso de tokens, optimizando para velocidad y costo mientras aceptas una reducción en la capacidad.

Establecer effort a "high" produce exactamente el mismo comportamiento que omitir el parámetro effort completamente.

El parámetro effort afecta todos los tokens en la respuesta, incluyendo:

  • Respuestas de texto y explicaciones
  • Llamadas a herramientas y argumentos de funciones
  • Pensamiento extendido (cuando está habilitado)

Este enfoque tiene dos ventajas principales:

  1. No requiere que el pensamiento esté habilitado para usarlo.
  2. Puede afectar todo el gasto de tokens incluyendo llamadas a herramientas. Por ejemplo, un effort más bajo significaría que Claude hace menos llamadas a herramientas. Esto proporciona un grado mucho mayor de control sobre la eficiencia.

Niveles de effort

NivelDescripciónCaso de uso típico
maxCapacidad máxima absoluta sin restricciones en el gasto de tokens. Disponible en Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 y Claude Sonnet 4.6.Tareas que requieren el razonamiento más profundo posible y análisis más exhaustivo
xhighCapacidad extendida para trabajo de largo horizonte. Disponible en Claude Opus 4.7.Tareas de codificación y agentes de larga duración (más de 30 minutos) con presupuestos de tokens en los millones
highCapacidad alta. Equivalente a no establecer el parámetro.Razonamiento complejo, problemas de codificación difíciles, tareas de agentes
mediumEnfoque equilibrado con ahorros de tokens moderados.Tareas de agentes que requieren un equilibrio de velocidad, costo y rendimiento
lowMás eficiente. Ahorros significativos de tokens con alguna reducción de capacidad.Tareas más simples que necesitan la mejor velocidad y costos más bajos, como suagentes

Effort es una señal de comportamiento, no un presupuesto de tokens estricto. En niveles de effort más bajos, Claude seguirá pensando en problemas suficientemente difíciles, pero pensará menos de lo que lo haría en niveles de effort más altos para el mismo problema.

Niveles de effort recomendados para Sonnet 4.6

Sonnet 4.6 tiene un valor predeterminado de high effort. Establece explícitamente effort al usar Sonnet 4.6 para evitar latencia inesperada:

  • Medium effort (predeterminado recomendado): Mejor equilibrio de velocidad, costo y rendimiento para la mayoría de aplicaciones. Adecuado para codificación de agentes, flujos de trabajo con muchas herramientas y generación de código.
  • Low effort: Para cargas de trabajo de alto volumen o sensibles a la latencia. Adecuado para chat y casos de uso sin codificación donde se prioriza un tiempo de respuesta más rápido.
  • High effort: Para tareas que requieren inteligencia máxima de Sonnet 4.6.
  • Max effort: Para tareas que requieren la capacidad absoluta más alta sin restricciones en el gasto de tokens.

Niveles de effort recomendados para Claude Opus 4.7

Comienza con xhigh para casos de uso de codificación y agentes, y usa high como el mínimo para la mayoría de cargas de trabajo sensibles a la inteligencia. Reduce a medium para cargas de trabajo sensibles al costo, o sube a max solo cuando tus evaluaciones muestren espacio medible en xhigh.

El valor predeterminado de la API es high. Para usar xhigh, establece effort explícitamente; el valor que pases anula el predeterminado.

EffortOrientación para Claude Opus 4.7
lowEficiente, pero mejor para tareas cortas y delimitadas. Empareja low con listas de verificación explícitas si tu tarea tiene múltiples secciones.
mediumEl reemplazo directo para el flujo de trabajo promedio donde quieres buenos resultados mientras reduces costos.
highCasos de uso avanzados que aún necesitan un equilibrio de inteligencia y consumo de tokens. Este es a menudo el punto óptimo equilibrando calidad y eficiencia de tokens.
xhighEl punto de partida recomendado para codificación y trabajo de agentes, y para tareas exploratorias como llamadas repetidas a herramientas, búsqueda web detallada y búsqueda de base de conocimientos. Espera un uso de tokens significativamente más alto que high.
maxReserva para problemas genuinamente fronterizos. En la mayoría de cargas de trabajo max añade costo significativo por ganancias de calidad relativamente pequeñas, y en algunas tareas de salida estructurada o menos sensibles a la inteligencia puede llevar a un exceso de pensamiento.

Claude Opus 4.7 también respeta los niveles de effort más estrictamente que Claude Opus 4.6, especialmente en low y medium. En niveles de effort más bajos, el modelo limita su trabajo a lo que se preguntó en lugar de ir más allá. Si observas razonamiento superficial en problemas complejos con Claude Opus 4.7, aumenta effort en lugar de intentar solucionarlo con prompts. Si debes mantener effort bajo por latencia, añade orientación dirigida como "Esta tarea implica razonamiento de múltiples pasos. Piensa cuidadosamente antes de responder."

Al ejecutar Claude Opus 4.7 con effort xhigh o max, establece un max_tokens grande para que el modelo tenga espacio para pensar y actuar en suagentes y llamadas a herramientas. Comenzar con 64k tokens y ajustar desde ahí es un valor predeterminado razonable.

Uso básico

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)

Cuándo ajustar el parámetro effort

  • Usa max effort cuando necesites la capacidad absoluta más alta sin restricciones: el razonamiento más exhaustivo y el análisis más profundo. Disponible en Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 y Claude Sonnet 4.6.
  • Usa xhigh effort para trabajo de codificación avanzada y trabajo de agentes complejos que requieren exploración extendida, como llamadas repetidas a herramientas y búsqueda detallada. Disponible en Claude Opus 4.7.
  • Usa high effort (el predeterminado) cuando necesites el mejor trabajo de Claude: razonamiento complejo, análisis matizado, problemas de codificación difíciles, o cualquier tarea donde la calidad sea la prioridad principal.
  • Usa medium effort como una opción equilibrada cuando quieras un rendimiento sólido sin el gasto completo de tokens de high effort.
  • Usa low effort cuando estés optimizando para velocidad (porque Claude responde con menos tokens) o costo. Por ejemplo, tareas simples de clasificación, búsquedas rápidas, o casos de uso de alto volumen donde mejoras marginales de calidad no justifiquen latencia adicional o gasto.

Effort con uso de herramientas

Al usar herramientas, el parámetro effort afecta tanto las explicaciones alrededor de las llamadas a herramientas como las llamadas a herramientas en sí. Los niveles de effort más bajos tienden a:

  • Combinar múltiples operaciones en menos llamadas a herramientas
  • Hacer menos llamadas a herramientas
  • Proceder directamente a la acción sin preámbulo
  • Usar mensajes de confirmación concisos después de la finalización

Los niveles de effort más altos pueden:

  • Hacer más llamadas a herramientas
  • Explicar el plan antes de tomar acción
  • Proporcionar resúmenes detallados de cambios
  • Incluir comentarios de código más exhaustivos

Effort con pensamiento extendido

El parámetro effort funciona junto con el pensamiento extendido. Su comportamiento depende del modelo:

  • Claude Mythos Preview usa adaptive thinking por defecto (no se requiere configuración de thinking). thinking: {type: "disabled"} es rechazado. Effort controla la profundidad del pensamiento de la misma manera que en Opus 4.7 y Opus 4.6.
  • Claude Opus 4.7 usa adaptive thinking (thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. El pensamiento extendido manual (thinking: {type: "enabled", budget_tokens: N}) ya no es compatible en Opus 4.7; usa adaptive thinking con effort en su lugar. Con effort high, xhigh y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.
  • Claude Opus 4.6 usa adaptive thinking (thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. Aunque budget_tokens sigue siendo aceptado en Opus 4.6, está deprecado y será eliminado en un lanzamiento futuro. Con effort high y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.
  • Claude Sonnet 4.6 usa adaptive thinking (donde effort controla la profundidad del pensamiento). El pensamiento manual con interleaved mode (thinking: {type: "enabled", budget_tokens: N}) sigue siendo funcional pero está deprecado.
  • Claude Opus 4.5 y otros modelos Claude 4 usan pensamiento manual (thinking: {type: "enabled", budget_tokens: N}), donde effort funciona junto con el presupuesto de tokens de pensamiento. Establece el nivel de effort para tu tarea, luego establece el presupuesto de tokens de pensamiento basado en la complejidad de la tarea.

El parámetro effort puede usarse con o sin pensamiento extendido habilitado. Cuando se usa sin pensamiento, sigue controlando el gasto total de tokens para respuestas de texto y llamadas a herramientas.

Mejores prácticas

  1. Establece effort explícitamente: La API tiene un valor predeterminado de high, pero el punto de partida correcto depende de tu modelo y carga de trabajo.
  2. Usa low para tareas sensibles a la velocidad o simples: Cuando la latencia importa o las tareas son directas, low effort puede reducir significativamente los tiempos de respuesta y costos.
  3. Prueba tu caso de uso: El impacto de los niveles de effort varía según el tipo de tarea. Evalúa el rendimiento en tus casos de uso específicos antes de desplegar.
  4. Considera effort dinámico: Ajusta effort basado en la complejidad de la tarea. Las consultas simples pueden justificar low effort mientras que la codificación de agentes y el razonamiento complejo se benefician de high effort.

Was this page helpful?

  • Cómo funciona effort
  • Niveles de effort
  • Niveles de effort recomendados para Sonnet 4.6
  • Niveles de effort recomendados para Claude Opus 4.7
  • Uso básico
  • Cuándo ajustar el parámetro effort
  • Effort con uso de herramientas
  • Effort con pensamiento extendido
  • Mejores prácticas