El parámetro effort te permite controlar cuán dispuesto está Claude a gastar tokens al responder a solicitudes. Esto te da la capacidad de equilibrar entre la exhaustividad de la respuesta y la eficiencia de tokens, todo con un único modelo. El parámetro effort está generalmente disponible en todos los modelos compatibles sin requerir un encabezado beta.
El parámetro effort es compatible con Claude Opus 4.6 y Claude Opus 4.5.
Para Claude Opus 4.6, effort reemplaza budget_tokens como la forma recomendada de controlar la profundidad del pensamiento. Combina effort con adaptive thinking (thinking: {type: "adaptive"}) para la mejor experiencia. Aunque budget_tokens sigue siendo aceptado en Opus 4.6, está deprecado y será eliminado en un lanzamiento de modelo futuro. En effort high (predeterminado) y max, Claude casi siempre pensará. En niveles de effort más bajos, puede omitir el pensamiento para problemas más simples.
Por defecto, Claude utiliza alto esfuerzo, gastando tantos tokens como sea necesario para obtener excelentes resultados. Puedes aumentar el nivel de esfuerzo a max para la máxima capacidad absoluta, o reducirlo para ser más conservador con el uso de tokens, optimizando para velocidad y costo mientras aceptas una reducción en la capacidad.
Establecer effort a "high" produce exactamente el mismo comportamiento que omitir el parámetro effort por completo.
El parámetro effort afecta todos los tokens en la respuesta, incluyendo:
Este enfoque tiene dos ventajas principales:
| Nivel | Descripción | Caso de uso típico |
|---|---|---|
max | Capacidad máxima absoluta sin restricciones en el gasto de tokens. Solo Opus 4.6 — las solicitudes que usan max en otros modelos devolverán un error. | Tareas que requieren el razonamiento más profundo posible y el análisis más exhaustivo |
high | Alta capacidad. Equivalente a no establecer el parámetro. | Razonamiento complejo, problemas de codificación difíciles, tareas agentivas |
medium | Enfoque equilibrado con ahorros de tokens moderados. | Tareas agentivas que requieren un equilibrio de velocidad, costo y rendimiento |
low | Más eficiente. Ahorros de tokens significativos con alguna reducción de capacidad. | Tareas más simples que necesitan la mejor velocidad y los costos más bajos, como subagentos |
El esfuerzo es una señal de comportamiento, no un presupuesto de tokens estricto. En niveles de esfuerzo más bajos, Claude seguirá pensando en problemas suficientemente difíciles — simplemente pensará menos de lo que lo haría en niveles de esfuerzo más altos para el mismo problema.
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)max en otros modelos devolverán un error.Cuando uses herramientas, el parámetro effort afecta tanto las explicaciones alrededor de las llamadas a herramientas como las llamadas a herramientas en sí. Los niveles de esfuerzo más bajos tienden a:
Los niveles de esfuerzo más altos pueden:
El parámetro effort funciona junto con el pensamiento extendido. Su comportamiento depende del modelo:
thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. Aunque budget_tokens sigue siendo aceptado en Opus 4.6, está deprecado y será eliminado en un lanzamiento futuro. En effort high y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.thinking: {type: "enabled", budget_tokens: N}), donde effort funciona junto con el presupuesto de tokens de pensamiento. Establece el nivel de esfuerzo para tu tarea, luego establece el presupuesto de tokens de pensamiento basado en la complejidad de la tarea.El parámetro effort puede usarse con o sin pensamiento extendido habilitado. Cuando se usa sin pensamiento, sigue controlando el gasto total de tokens para respuestas de texto y llamadas a herramientas.
Was this page helpful?