Was this page helpful?
This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
El parámetro effort te permite controlar cuán dispuesto está Claude a gastar tokens al responder a solicitudes. Esto te da la capacidad de equilibrar entre la exhaustividad de la respuesta y la eficiencia de tokens, todo con un único modelo. El parámetro effort está generalmente disponible en todos los modelos compatibles sin requerir un encabezado beta.
El parámetro effort es compatible con Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6 y Claude Opus 4.5.
Para Claude Opus 4.6 y Sonnet 4.6, effort reemplaza budget_tokens como la forma recomendada de controlar la profundidad del pensamiento. Combina effort con adaptive thinking (thinking: {type: "adaptive"}) para la mejor experiencia. Aunque budget_tokens sigue siendo aceptado en Opus 4.6 y Sonnet 4.6, está deprecado y será eliminado en una futura versión del modelo. Con effort high (predeterminado) y max, Claude casi siempre pensará. En niveles de effort más bajos, puede omitir el pensamiento para problemas más simples.
Por defecto, Claude utiliza high effort, gastando tantos tokens como sea necesario para obtener excelentes resultados. Puedes aumentar el nivel de effort a max para la máxima capacidad absoluta, o reducirlo para ser más conservador con el uso de tokens, optimizando para velocidad y costo mientras aceptas una reducción en la capacidad.
Establecer effort a "high" produce exactamente el mismo comportamiento que omitir el parámetro effort completamente.
El parámetro effort afecta todos los tokens en la respuesta, incluyendo:
Este enfoque tiene dos ventajas principales:
| Nivel | Descripción | Caso de uso típico |
|---|---|---|
max | Capacidad máxima absoluta sin restricciones en el gasto de tokens. Disponible en Claude Mythos Preview, Claude Opus 4.6 y Claude Sonnet 4.6. | Tareas que requieren el razonamiento más profundo posible y análisis más exhaustivo |
high | Alta capacidad. Equivalente a no establecer el parámetro. | Razonamiento complejo, problemas de codificación difíciles, tareas de agentes |
medium | Enfoque equilibrado con ahorros de tokens moderados. | Tareas de agentes que requieren un equilibrio de velocidad, costo y rendimiento |
low | Más eficiente. Ahorros de tokens significativos con alguna reducción de capacidad. | Tareas más simples que necesitan la mejor velocidad y los costos más bajos, como suagentes |
Effort es una señal de comportamiento, no un presupuesto de tokens estricto. En niveles de effort más bajos, Claude seguirá pensando en problemas suficientemente difíciles, pero pensará menos de lo que lo haría en niveles de effort más altos para el mismo problema.
Sonnet 4.6 tiene como predeterminado high effort. Establece explícitamente effort al usar Sonnet 4.6 para evitar latencia inesperada:
Al usar herramientas, el parámetro effort afecta tanto las explicaciones alrededor de las llamadas a herramientas como las llamadas a herramientas en sí. Los niveles de effort más bajos tienden a:
Los niveles de effort más altos pueden:
El parámetro effort funciona junto con el pensamiento extendido. Su comportamiento depende del modelo:
thinking). thinking: {type: "disabled"} es rechazado. Effort controla la profundidad del pensamiento de la misma manera que en Opus 4.6.thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. Aunque budget_tokens sigue siendo aceptado en Opus 4.6, está deprecado y será eliminado en una futura versión. Con effort high y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.thinking: {type: "enabled", budget_tokens: N}) sigue siendo funcional pero está deprecado.El parámetro effort puede ser utilizado con o sin pensamiento extendido habilitado. Cuando se usa sin pensamiento, sigue controlando el gasto total de tokens para respuestas de texto y llamadas a herramientas.
high, pero el punto de partida correcto depende de tu modelo y carga de trabajo.curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-6",
"max_tokens": 4096,
"messages": [{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
"output_config": {
"effort": "medium"
}
}'thinking: {type: "enabled", budget_tokens: N}