This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
El parámetro effort te permite controlar cuán dispuesto está Claude a gastar tokens al responder solicitudes. Esto te da la capacidad de equilibrar entre la exhaustividad de la respuesta y la eficiencia de tokens, todo con un único modelo. El parámetro effort está generalmente disponible en todos los modelos compatibles sin requerir un encabezado beta.
El parámetro effort es compatible con Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 y Claude Opus 4.5.
Para Claude Opus 4.6 y Sonnet 4.6, effort reemplaza budget_tokens como la forma recomendada de controlar la profundidad del pensamiento. Combina effort con adaptive thinking (thinking: {type: "adaptive"}) para la mejor experiencia. Aunque budget_tokens sigue siendo aceptado en Opus 4.6 y Sonnet 4.6, está deprecado y será eliminado en un lanzamiento de modelo futuro. Con effort high (predeterminado) y max, Claude casi siempre pensará. En niveles de effort más bajos, puede omitir el pensamiento para problemas más simples.
Por defecto, Claude usa high effort, gastando tantos tokens como sea necesario para obtener excelentes resultados. Puedes aumentar el nivel de effort a max para la máxima capacidad absoluta, o reducirlo para ser más conservador con el uso de tokens, optimizando para velocidad y costo mientras aceptas una reducción en la capacidad.
Establecer effort a "high" produce exactamente el mismo comportamiento que omitir el parámetro effort completamente.
El parámetro effort afecta todos los tokens en la respuesta, incluyendo:
Este enfoque tiene dos ventajas principales:
| Nivel | Descripción | Caso de uso típico |
|---|---|---|
max | Capacidad máxima absoluta sin restricciones en el gasto de tokens. Disponible en Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 y Claude Sonnet 4.6. | Tareas que requieren el razonamiento más profundo posible y análisis más exhaustivo |
xhigh | Capacidad extendida para trabajo de largo horizonte. Disponible en Claude Opus 4.7. | Tareas de codificación y agentes de larga duración (más de 30 minutos) con presupuestos de tokens en los millones |
high | Capacidad alta. Equivalente a no establecer el parámetro. | Razonamiento complejo, problemas de codificación difíciles, tareas de agentes |
medium | Enfoque equilibrado con ahorros de tokens moderados. | Tareas de agentes que requieren un equilibrio de velocidad, costo y rendimiento |
low | Más eficiente. Ahorros significativos de tokens con alguna reducción de capacidad. | Tareas más simples que necesitan la mejor velocidad y costos más bajos, como suagentes |
Effort es una señal de comportamiento, no un presupuesto de tokens estricto. En niveles de effort más bajos, Claude seguirá pensando en problemas suficientemente difíciles, pero pensará menos de lo que lo haría en niveles de effort más altos para el mismo problema.
Sonnet 4.6 tiene un valor predeterminado de high effort. Establece explícitamente effort al usar Sonnet 4.6 para evitar latencia inesperada:
Comienza con xhigh para casos de uso de codificación y agentes, y usa high como el mínimo para la mayoría de cargas de trabajo sensibles a la inteligencia. Reduce a medium para cargas de trabajo sensibles al costo, o sube a max solo cuando tus evaluaciones muestren espacio medible en xhigh.
El valor predeterminado de la API es high. Para usar xhigh, establece effort explícitamente; el valor que pases anula el predeterminado.
| Effort | Orientación para Claude Opus 4.7 |
|---|---|
low | Eficiente, pero mejor para tareas cortas y delimitadas. Empareja low con listas de verificación explícitas si tu tarea tiene múltiples secciones. |
medium | El reemplazo directo para el flujo de trabajo promedio donde quieres buenos resultados mientras reduces costos. |
high | Casos de uso avanzados que aún necesitan un equilibrio de inteligencia y consumo de tokens. Este es a menudo el punto óptimo equilibrando calidad y eficiencia de tokens. |
xhigh | El punto de partida recomendado para codificación y trabajo de agentes, y para tareas exploratorias como llamadas repetidas a herramientas, búsqueda web detallada y búsqueda de base de conocimientos. Espera un uso de tokens significativamente más alto que high. |
max | Reserva para problemas genuinamente fronterizos. En la mayoría de cargas de trabajo max añade costo significativo por ganancias de calidad relativamente pequeñas, y en algunas tareas de salida estructurada o menos sensibles a la inteligencia puede llevar a un exceso de pensamiento. |
Claude Opus 4.7 también respeta los niveles de effort más estrictamente que Claude Opus 4.6, especialmente en low y medium. En niveles de effort más bajos, el modelo limita su trabajo a lo que se preguntó en lugar de ir más allá. Si observas razonamiento superficial en problemas complejos con Claude Opus 4.7, aumenta effort en lugar de intentar solucionarlo con prompts. Si debes mantener effort bajo por latencia, añade orientación dirigida como "Esta tarea implica razonamiento de múltiples pasos. Piensa cuidadosamente antes de responder."
Al ejecutar Claude Opus 4.7 con effort xhigh o max, establece un max_tokens grande para que el modelo tenga espacio para pensar y actuar en suagentes y llamadas a herramientas. Comenzar con 64k tokens y ajustar desde ahí es un valor predeterminado razonable.
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=4096,
messages=[
{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures",
}
],
output_config={"effort": "medium"},
)
print(response.content[0].text)Al usar herramientas, el parámetro effort afecta tanto las explicaciones alrededor de las llamadas a herramientas como las llamadas a herramientas en sí. Los niveles de effort más bajos tienden a:
Los niveles de effort más altos pueden:
El parámetro effort funciona junto con el pensamiento extendido. Su comportamiento depende del modelo:
thinking). thinking: {type: "disabled"} es rechazado. Effort controla la profundidad del pensamiento de la misma manera que en Opus 4.7 y Opus 4.6.thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. El pensamiento extendido manual (thinking: {type: "enabled", budget_tokens: N}) ya no es compatible en Opus 4.7; usa adaptive thinking con effort en su lugar. Con effort high, xhigh y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. Aunque budget_tokens sigue siendo aceptado en Opus 4.6, está deprecado y será eliminado en un lanzamiento futuro. Con effort high y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.thinking: {type: "enabled", budget_tokens: N}) sigue siendo funcional pero está deprecado.thinking: {type: "enabled", budget_tokens: N}), donde effort funciona junto con el presupuesto de tokens de pensamiento. Establece el nivel de effort para tu tarea, luego establece el presupuesto de tokens de pensamiento basado en la complejidad de la tarea.El parámetro effort puede usarse con o sin pensamiento extendido habilitado. Cuando se usa sin pensamiento, sigue controlando el gasto total de tokens para respuestas de texto y llamadas a herramientas.
high, pero el punto de partida correcto depende de tu modelo y carga de trabajo.Was this page helpful?