Esta función es elegible para Zero Data Retention (ZDR). Cuando tu organización tiene un acuerdo de ZDR, los datos enviados a través de esta función no se almacenan después de que se devuelve la respuesta de la API.
El parámetro "effort" (esfuerzo) te permite controlar qué tan dispuesto está Claude a gastar tokens al responder a las solicitudes. Esto te da la capacidad de equilibrar entre la exhaustividad de la respuesta y la eficiencia de tokens, todo con un solo modelo. El parámetro effort está disponible en todos los modelos compatibles sin necesidad de un encabezado beta.
El parámetro effort es compatible con Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 y Claude Opus 4.5.
Para Claude Opus 4.6 y Sonnet 4.6, effort reemplaza a budget_tokens como la forma recomendada de controlar la profundidad del pensamiento. Combina effort con adaptive thinking (pensamiento adaptativo) (thinking: {type: "adaptive"}) para obtener la mejor experiencia. Aunque budget_tokens todavía se acepta en Opus 4.6 y Sonnet 4.6, está obsoleto y se eliminará en una versión futura del modelo. Con effort high (predeterminado) y max, Claude casi siempre pensará. En niveles de effort más bajos, puede omitir el pensamiento para problemas más simples.
De forma predeterminada, Claude usa effort alto, gastando tantos tokens como sea necesario para obtener excelentes resultados. Puedes aumentar el nivel de effort a max para obtener la capacidad más alta absoluta, o reducirlo para ser más conservador con el uso de tokens, optimizando la velocidad y el costo mientras aceptas cierta reducción en la capacidad.
Establecer effort en "high" produce exactamente el mismo comportamiento que omitir el parámetro effort por completo.
El parámetro effort afecta a todos los tokens en la respuesta, incluyendo:
Este enfoque tiene dos ventajas principales:
| Nivel | Descripción | Caso de uso típico |
|---|---|---|
max | Capacidad máxima absoluta sin restricciones en el gasto de tokens. Disponible en Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 y Claude Sonnet 4.6. | Tareas que requieren el razonamiento más profundo posible y el análisis más exhaustivo |
xhigh | Capacidad extendida para trabajo de largo horizonte. Disponible en Claude Fable 5, Claude Mythos 5, Claude Opus 4.8 y Claude Opus 4.7. | Tareas agénticas y de programación de larga duración (más de 30 minutos) con presupuestos de tokens en millones |
high | Capacidad alta. Equivalente a no establecer el parámetro. | Razonamiento complejo, problemas de programación difíciles, tareas agénticas |
medium | Enfoque equilibrado con ahorro moderado de tokens. | Tareas agénticas que requieren un equilibrio entre velocidad, costo y rendimiento |
low | El más eficiente. Ahorro significativo de tokens con cierta reducción de capacidad. | Tareas más simples que necesitan la mejor velocidad y los costos más bajos, como subagentes |
Effort es una señal de comportamiento, no un presupuesto estricto de tokens. En niveles de effort más bajos, Claude seguirá pensando en problemas suficientemente difíciles, pero pensará menos de lo que lo haría en niveles de effort más altos para el mismo problema.
Sonnet 4.6 usa effort high de forma predeterminada. Establece effort explícitamente al usar Sonnet 4.6 para evitar latencia inesperada:
Comienza con xhigh para casos de uso de programación y agénticos, y usa high como mínimo para la mayoría de las cargas de trabajo sensibles a la inteligencia. Baja a medium para cargas de trabajo sensibles al costo, o sube a max solo cuando tus evaluaciones muestren margen de mejora medible en xhigh.
El valor predeterminado de la API es high. Para usar xhigh, establece effort explícitamente; el valor que pases anula el predeterminado.
| Effort | Orientación para Claude Opus 4.7 |
|---|---|
low | Eficiente, pero mejor para tareas cortas y acotadas. Combina low con listas de verificación explícitas si tu tarea tiene múltiples secciones. |
medium | La opción directa para el flujo de trabajo promedio donde quieres buenos resultados mientras reduces costos. |
high | Casos de uso avanzados que aún necesitan un equilibrio entre inteligencia y consumo de tokens. Este suele ser el punto óptimo que equilibra calidad y eficiencia de tokens. |
xhigh | El punto de partida recomendado para trabajo de programación y agéntico, y para tareas exploratorias como llamadas repetidas a herramientas, búsqueda web detallada y búsqueda en bases de conocimiento. Espera un uso de tokens significativamente mayor que con high. |
max | Resérvalo para problemas genuinamente de frontera. En la mayoría de las cargas de trabajo, max agrega un costo significativo a cambio de ganancias de calidad relativamente pequeñas, y en algunas tareas de salida estructurada o menos sensibles a la inteligencia puede llevar a pensar en exceso. |
Claude Opus 4.7 también respeta los niveles de effort de manera más estricta que Claude Opus 4.6, especialmente en low y medium. En niveles de effort más bajos, el modelo limita su trabajo a lo que se le pidió en lugar de ir más allá. Si observas razonamiento superficial en problemas complejos con Claude Opus 4.7, aumenta el effort en lugar de intentar compensarlo con el prompt. Si debes mantener el effort bajo por latencia, agrega orientación específica como "Esta tarea implica razonamiento de múltiples pasos. Piensa cuidadosamente antes de responder."
Al ejecutar Claude Opus 4.7 con effort xhigh o max, establece un max_tokens grande para que el modelo tenga espacio para pensar y actuar a través de subagentes y llamadas a herramientas. Comenzar con 64k tokens y ajustar desde ahí es un valor predeterminado razonable.
La orientación anterior para Claude Opus 4.7 también aplica a Claude Opus 4.8. Comienza con xhigh para casos de uso de programación y agénticos, usa high para la mayoría de las demás cargas de trabajo sensibles a la inteligencia, y baja a medium o low solo cuando hayas medido que el nivel más bajo mantiene la calidad en tus evaluaciones.
El valor predeterminado es high en todas las superficies, incluyendo la API de Claude y Claude Code. Establece effort explícitamente para usar un nivel diferente; el valor que pases anula el predeterminado.
Al ejecutar Claude Opus 4.8 con effort xhigh o max, establece un max_tokens grande para que el modelo tenga espacio para pensar y actuar a través de subagentes y llamadas a herramientas. Comenzar con 64k tokens y ajustar desde ahí es un valor predeterminado razonable.
Effort es el control principal para equilibrar inteligencia, latencia y costo en Claude Fable 5. Comienza con high, el valor predeterminado, para la mayoría de las tareas, usa xhigh para las cargas de trabajo más sensibles a la capacidad, y baja a medium o low para trabajo rutinario. Las configuraciones de effort más bajas en Claude Fable 5 siguen funcionando bien y a menudo superan el rendimiento de xhigh en modelos anteriores. En high y xhigh, establece un max_tokens grande: es un límite estricto en la salida total, pensamiento más texto de respuesta. Consulta Control de costos.
Reduce el effort si una tarea se completa pero tarda más de lo necesario, o si quieres un estilo de trabajo más rápido e interactivo. Las mismas recomendaciones aplican a Claude Mythos 5. Para una orientación más completa, consulta Prompting para Claude Fable 5.
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=4096,
messages=[
{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures",
}
],
output_config={"effort": "medium"},
)
print(response.content[0].text)Modo ultracode de Claude Code: ultracode aparece en el menú de effort de Claude Code, pero no es un nivel de effort adicional de la API. Los valores documentados en esta página son el conjunto completo que acepta la API. Ultracode combina el nivel de effort xhigh con permiso permanente para que Claude Code lance flujos de trabajo multiagente, otorgado a través de Mensajes del sistema a mitad de conversación. Para construir un comportamiento similar con la API, consulta Construir un modo de orquestación.
Al usar herramientas, el parámetro effort afecta tanto las explicaciones alrededor de las llamadas a herramientas como las llamadas a herramientas en sí. Los niveles de effort más bajos tienden a:
Los niveles de effort más altos pueden:
El parámetro effort funciona junto con el pensamiento extendido. Su comportamiento depende del modelo:
thinking). thinking: {type: "disabled"} es rechazado. Effort controla la profundidad del pensamiento de la misma manera que en Opus 4.8 y Opus 4.7.thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. El pensamiento extendido manual (thinking: {type: "enabled", budget_tokens: N}) no es compatible y devuelve un error 400. El modelo decide cuándo y cuánto pensar según cada solicitud, por lo que activa el pensamiento solo cuando es necesario. Con effort high, xhigh y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples. Establece thinking: {type: "adaptive"} para habilitar el pensamiento; sin esto, las solicitudes se ejecutan sin pensamiento.thinking). thinking: {type: "disabled"} es rechazado. Effort controla la profundidad del pensamiento de la misma manera que en Opus 4.7 y Opus 4.6.thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. El pensamiento extendido manual (thinking: {type: "enabled", budget_tokens: N}) ya no es compatible en Opus 4.7; usa adaptive thinking con effort en su lugar. Con effort high, xhigh y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. Aunque budget_tokens todavía se acepta en Opus 4.6, está obsoleto y se eliminará en una versión futura. Con effort high y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.thinking: {type: "enabled", budget_tokens: N}) sigue siendo funcional pero está obsoleto.thinking: {type: "enabled", budget_tokens: N}), donde effort funciona junto con el presupuesto de tokens de pensamiento. Establece el nivel de effort para tu tarea, luego establece el presupuesto de tokens de pensamiento según la complejidad de la tarea.El parámetro effort se puede usar con o sin pensamiento extendido habilitado. Cuando se usa sin pensamiento, sigue controlando el gasto general de tokens para respuestas de texto y llamadas a herramientas.
high de forma predeterminada, pero el punto de partida correcto depende de tu modelo y carga de trabajo.Was this page helpful?