El parámetro effort te permite controlar cuán dispuesto está Claude a gastar tokens al responder a solicitudes. Esto te da la capacidad de equilibrar entre la exhaustividad de la respuesta y la eficiencia de tokens, todo con un único modelo.
El parámetro effort está actualmente en beta y solo es compatible con Claude Opus 4.5.
Debes incluir el encabezado beta effort-2025-11-24 al usar esta función.
Por defecto, Claude usa el máximo esfuerzo, gastando tantos tokens como sea necesario para el mejor resultado posible. Al reducir el nivel de esfuerzo, puedes instruir a Claude para que sea más conservador con el uso de tokens, optimizando para velocidad y costo mientras aceptas una reducción en la capacidad.
Establecer effort a "high" produce exactamente el mismo comportamiento que omitir el parámetro effort por completo.
El parámetro effort afecta todos los tokens en la respuesta, incluyendo:
Este enfoque tiene dos ventajas principales:
| Nivel | Descripción | Caso de uso típico |
|---|---|---|
high | Máxima capacidad. Claude usa tantos tokens como sea necesario para el mejor resultado posible. Equivalente a no establecer el parámetro. | Razonamiento complejo, problemas de codificación difíciles, tareas agentivas |
medium | Enfoque equilibrado con ahorros de tokens moderados. | Tareas agentivas que requieren un equilibrio entre velocidad, costo y rendimiento |
low | Más eficiente. Ahorros significativos de tokens con alguna reducción de capacidad. | Tareas más simples que necesitan la mejor velocidad y los costos más bajos, como subagentos |
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)Al usar herramientas, el parámetro effort afecta tanto las explicaciones alrededor de las llamadas a herramientas como las llamadas a herramientas en sí. Los niveles de esfuerzo más bajos tienden a:
Los niveles de esfuerzo más altos pueden:
El parámetro effort funciona junto con el presupuesto de tokens de pensamiento cuando el pensamiento extendido está habilitado. Estos dos controles sirven propósitos diferentes:
El parámetro effort puede usarse con o sin pensamiento extendido habilitado. Cuando ambos están configurados:
Para el mejor rendimiento en tareas de razonamiento complejo, usa high effort (el predeterminado) con un presupuesto de tokens de pensamiento alto. Esto permite a Claude pensar a fondo y proporcionar respuestas completas.