MensajesCapacidades del modelo

Effort

Controla cuántos tokens usa Claude al responder con el parámetro effort, equilibrando la exhaustividad de la respuesta y la eficiencia de tokens.

Esta función es elegible para Zero Data Retention (ZDR). Cuando tu organización tiene un acuerdo de ZDR, los datos enviados a través de esta función no se almacenan después de que se devuelve la respuesta de la API.

El parámetro "effort" (esfuerzo) te permite controlar qué tan dispuesto está Claude a gastar tokens al responder a las solicitudes. Puedes equilibrar la exhaustividad de la respuesta y la eficiencia de tokens con un solo modelo. El parámetro effort está disponible en todos los modelos compatibles sin necesidad de un encabezado beta.

El parámetro effort es compatible con Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5, Claude Sonnet 4.6 y Claude Opus 4.5.

Para Claude Opus 4.6 y Sonnet 4.6, effort reemplaza a budget_tokens como la forma recomendada de controlar la profundidad del pensamiento. Combina effort con adaptive thinking (pensamiento adaptativo) (thinking: {type: "adaptive"}) para obtener la mejor experiencia. Aunque budget_tokens todavía se acepta en Opus 4.6 y Sonnet 4.6, está obsoleto y se eliminará en una versión futura del modelo. Con effort high (predeterminado) y max, Claude casi siempre pensará. En niveles de effort más bajos, puede omitir el pensamiento para problemas más simples.

Cómo funciona effort

De forma predeterminada, Claude usa effort alto, gastando tantos tokens como sea necesario para obtener resultados excelentes. Puedes aumentar el nivel de effort a max para obtener la capacidad más alta absoluta, o reducirlo para ser más conservador con el uso de tokens, optimizando la velocidad y el costo mientras aceptas cierta reducción en la capacidad.

Establecer effort en "high" produce exactamente el mismo comportamiento que omitir el parámetro effort por completo.

El parámetro effort afecta todos los tokens en la respuesta, incluyendo:

Respuestas de texto y explicaciones
Llamadas a herramientas y argumentos de funciones
Pensamiento extendido (cuando está habilitado)

Este enfoque tiene dos ventajas principales:

No requiere que el pensamiento esté habilitado.
Puede afectar todo el gasto de tokens, incluidas las llamadas a herramientas. Por ejemplo, un effort más bajo significaría que Claude hace menos llamadas a herramientas. Esto brinda un grado mucho mayor de control sobre la eficiencia.

Niveles de effort

Nivel	Descripción	Caso de uso típico
`max`	Capacidad máxima absoluta sin restricciones en el gasto de tokens. Disponible en Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5 y Claude Sonnet 4.6.	Tareas que requieren el razonamiento más profundo posible y el análisis más exhaustivo
`xhigh`	Capacidad extendida para trabajo de largo horizonte. Disponible en Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7 y Claude Sonnet 5.	Tareas agénticas y de programación de larga duración (más de 30 minutos) con presupuestos de tokens en millones
`high`	Capacidad alta. Equivalente a no establecer el parámetro.	Razonamiento complejo, problemas de programación difíciles, tareas agénticas
`medium`	Enfoque equilibrado con ahorro moderado de tokens.	Tareas agénticas que requieren un equilibrio entre velocidad, costo y rendimiento
`low`	El más eficiente. Ahorro significativo de tokens con cierta reducción de capacidad.	Tareas más simples que necesitan la mejor velocidad y los costos más bajos, como subagentes

Effort es una señal de comportamiento, no un presupuesto estricto de tokens. En niveles de effort más bajos, Claude seguirá pensando en problemas suficientemente difíciles, pero pensará menos de lo que lo haría en niveles de effort más altos para el mismo problema.

Niveles de effort recomendados para Claude Sonnet 5

Claude Sonnet 5 usa effort high de forma predeterminada.

Effort high (predeterminado): Adecuado para razonamiento complejo, programación y tareas agénticas donde la calidad importa más que la velocidad o el costo.
Effort xhigh: Para las tareas de programación y agénticas más difíciles. Consulta Prompting Claude Sonnet 5.
Effort medium: Reducción de costos respecto al valor predeterminado. Comparable a Claude Sonnet 4.6 con effort high.
Effort low: Para cargas de trabajo de alto volumen o sensibles a la latencia. Adecuado para chat y casos de uso que no son de programación donde se prioriza una respuesta más rápida.
Effort max: Para tareas que requieren la capacidad más alta absoluta sin restricciones en el gasto de tokens.

Niveles de effort recomendados para Sonnet 4.6

Sonnet 4.6 usa effort high de forma predeterminada. Establece effort explícitamente al usar Sonnet 4.6 para evitar latencia inesperada:

Effort medium (predeterminado recomendado): El mejor equilibrio entre velocidad, costo y rendimiento para la mayoría de las aplicaciones. Adecuado para programación agéntica, flujos de trabajo con uso intensivo de herramientas y generación de código.
Effort low: Para cargas de trabajo de alto volumen o sensibles a la latencia. Adecuado para chat y casos de uso que no son de programación donde se prioriza una respuesta más rápida.
Effort high: Para razonamiento complejo y tareas donde la calidad importa más que la velocidad o el costo.
Effort max: Para tareas que requieren la capacidad más alta absoluta sin restricciones en el gasto de tokens.

Niveles de effort recomendados para Claude Opus 4.7

Comienza con xhigh para casos de uso de programación y agénticos, y usa high como mínimo para la mayoría de las cargas de trabajo sensibles a la inteligencia. Baja a medium para cargas de trabajo sensibles al costo, o sube a max solo cuando tus evaluaciones muestren un margen de mejora medible en xhigh.

El valor predeterminado de la API es high. Para usar xhigh, establece effort explícitamente; el valor que pases anula el predeterminado.

Effort	Orientación para Claude Opus 4.7
`low`	Eficiente, pero mejor para tareas cortas y acotadas. Combina `low` con listas de verificación explícitas si tu tarea tiene varias secciones.
`medium`	La opción directa para el flujo de trabajo promedio donde quieres buenos resultados mientras reduces costos.
`high`	Casos de uso avanzados que aún necesitan un equilibrio entre inteligencia y consumo de tokens. Este suele ser el punto óptimo que equilibra calidad y eficiencia de tokens.
`xhigh`	El punto de partida recomendado para trabajo de programación y agéntico, y para tareas exploratorias como llamadas repetidas a herramientas, búsqueda web detallada y búsqueda en bases de conocimiento. Espera un uso de tokens significativamente mayor que con `high`.
`max`	Resérvalo para problemas genuinamente de frontera. En la mayoría de las cargas de trabajo, `max` agrega un costo significativo para ganancias de calidad relativamente pequeñas, y en algunas tareas de salida estructurada o menos sensibles a la inteligencia puede llevar a pensar en exceso.

Claude Opus 4.7 también respeta los niveles de effort de manera más estricta que Claude Opus 4.6, especialmente en low y medium. En niveles de effort más bajos, el modelo limita su trabajo a lo que se pidió en lugar de ir más allá. Si observas razonamiento superficial en problemas complejos con Claude Opus 4.7, aumenta el effort en lugar de intentar compensarlo con el prompt. Si debes mantener el effort bajo por latencia, agrega orientación específica como "Esta tarea implica razonamiento de varios pasos. Piensa cuidadosamente antes de responder."

Al ejecutar Claude Opus 4.7 con effort xhigh o max, establece un max_tokens grande para que el modelo tenga espacio para pensar y actuar a través de subagentes y llamadas a herramientas. Comenzar con 64k tokens y ajustar desde ahí es un valor predeterminado razonable.

Niveles de effort recomendados para Claude Opus 4.8

La orientación para Claude Opus 4.7 también aplica a Claude Opus 4.8. Comienza con xhigh para casos de uso de programación y agénticos, usa high para la mayoría de las demás cargas de trabajo sensibles a la inteligencia, y baja a medium o low solo cuando hayas medido que el nivel más bajo mantiene la calidad en tus evaluaciones.

El valor predeterminado de la API es high. Establece effort explícitamente para usar un nivel diferente; el valor que pases anula el predeterminado.

Al ejecutar Claude Opus 4.8 con effort xhigh o max, establece un max_tokens grande para que el modelo tenga espacio para pensar y actuar a través de subagentes y llamadas a herramientas. Comenzar con 64k tokens y ajustar desde ahí es un valor predeterminado razonable.

Niveles de effort recomendados para Claude Fable 5

Effort es el control principal para equilibrar inteligencia, latencia y costo en Claude Fable 5. Comienza con high, el valor predeterminado, para la mayoría de las tareas, usa xhigh para las cargas de trabajo más sensibles a la capacidad, y baja a medium o low para trabajo rutinario. Las configuraciones de effort más bajas en Claude Fable 5 siguen funcionando bien y a menudo superan el rendimiento de xhigh en modelos anteriores. En high y xhigh, establece un max_tokens grande: es un límite estricto sobre la salida total, pensamiento más texto de respuesta. Consulta Control de costos.

Reduce el effort si una tarea se completa pero tarda más de lo necesario, o si quieres un estilo de trabajo más rápido e interactivo. Las mismas recomendaciones aplican a Claude Mythos 5. Para una orientación más completa, consulta Prompting Claude Fable 5.

Uso básico

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)

Cuándo ajustar el parámetro effort

Usa effort max cuando necesites la capacidad más alta absoluta sin restricciones: el razonamiento más exhaustivo y el análisis más profundo. Disponible en Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5 y Claude Sonnet 4.6.
Usa effort xhigh para programación avanzada y trabajo agéntico complejo que requiera exploración extendida, como llamadas repetidas a herramientas y búsqueda detallada. Disponible en Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7 y Claude Sonnet 5.
Usa effort high (el predeterminado) para razonamiento complejo, análisis matizado, problemas de programación difíciles o cualquier tarea donde la calidad importe más que la velocidad o el costo.
Usa effort medium como una opción equilibrada cuando quieras un rendimiento sólido sin el gasto completo de tokens del effort high.
Usa effort low cuando estés optimizando para velocidad (porque Claude responde con menos tokens) o costo. Por ejemplo, tareas simples de clasificación, búsquedas rápidas o casos de uso de alto volumen donde las mejoras marginales de calidad no justifican latencia o gasto adicional.

Modo ultracode de Claude Code: ultracode aparece en el menú de effort de Claude Code, pero no es un nivel de effort adicional de la API. Los valores documentados en esta página son el conjunto completo que acepta la API. Ultracode combina el nivel de effort xhigh con permiso permanente para que Claude Code lance flujos de trabajo multiagente, otorgado a través de Mensajes del sistema a mitad de conversación. Para construir un comportamiento similar con la API, consulta Construir un modo de orquestación.

Effort con uso de herramientas

Al usar herramientas, el parámetro effort afecta tanto las explicaciones alrededor de las llamadas a herramientas como las llamadas a herramientas en sí. Los niveles de effort más bajos tienden a:

Combinar múltiples operaciones en menos llamadas a herramientas
Hacer menos llamadas a herramientas
Proceder directamente a la acción sin preámbulo
Usar mensajes de confirmación concisos después de completar

Los niveles de effort más altos pueden:

Hacer más llamadas a herramientas
Explicar el plan antes de tomar acción
Proporcionar resúmenes detallados de los cambios
Incluir comentarios de código más completos

Effort con pensamiento extendido

El parámetro effort funciona junto con el pensamiento extendido. Su comportamiento depende del modelo:

Claude Fable 5 y Claude Mythos 5 usan adaptive thinking (pensamiento adaptativo), que siempre está activado (no se requiere configuración de thinking). thinking: {type: "disabled"} es rechazado. Effort controla la profundidad del pensamiento de la misma manera que en Opus 4.8 y Opus 4.7.
Claude Opus 4.8 usa adaptive thinking (thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. El pensamiento extendido manual (thinking: {type: "enabled", budget_tokens: N}) no es compatible y devuelve un error 400. El modelo decide cuándo y cuánto pensar según cada solicitud, por lo que activa el pensamiento solo cuando es necesario. Con effort high, xhigh y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples. Establece thinking: {type: "adaptive"} para habilitar el pensamiento; sin esto, las solicitudes se ejecutan sin pensamiento.
Claude Mythos Preview usa adaptive thinking de forma predeterminada (no se requiere configuración de thinking). thinking: {type: "disabled"} es rechazado. Effort controla la profundidad del pensamiento de la misma manera que en Opus 4.7 y Opus 4.6.
Claude Opus 4.7 usa adaptive thinking (thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. El pensamiento extendido manual (thinking: {type: "enabled", budget_tokens: N}) ya no es compatible en Opus 4.7; usa adaptive thinking con effort en su lugar. Con effort high, xhigh y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.
Claude Opus 4.6 usa adaptive thinking (thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. Aunque budget_tokens todavía se acepta en Opus 4.6, está obsoleto y se eliminará en una versión futura. Con effort high y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.
Claude Sonnet 5 usa adaptive thinking, que está activado de forma predeterminada (no se requiere configuración de thinking), y effort es el control recomendado para la profundidad del pensamiento. El pensamiento extendido manual (thinking: {type: "enabled", budget_tokens: N}) no es compatible y devuelve un error 400. Pasa thinking: {type: "disabled"} para desactivar el pensamiento. Con effort high (predeterminado), xhigh y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.
Claude Sonnet 4.6 usa adaptive thinking (donde effort controla la profundidad del pensamiento). El pensamiento manual con modo intercalado (thinking: {type: "enabled", budget_tokens: N}) sigue siendo funcional pero está obsoleto.
Claude Opus 4.5 usa pensamiento manual (thinking: {type: "enabled", budget_tokens: N}), donde effort funciona junto con el presupuesto de tokens de pensamiento. Establece el nivel de effort para tu tarea, luego establece el presupuesto de tokens de pensamiento según la complejidad de la tarea.

El parámetro effort se puede usar con o sin pensamiento extendido habilitado. Cuando se usa sin pensamiento, aún controla el gasto general de tokens para respuestas de texto y llamadas a herramientas.

Mejores prácticas

Establece effort explícitamente: El valor predeterminado de la API es high, pero el punto de partida correcto depende de tu modelo y carga de trabajo.
Usa low para tareas sensibles a la velocidad o simples: Cuando la latencia importa o las tareas son sencillas, el effort low puede reducir significativamente los tiempos de respuesta y los costos.
Prueba tu caso de uso: El impacto de los niveles de effort varía según el tipo de tarea. Evalúa el rendimiento en tus casos de uso específicos antes de implementar.
Considera effort dinámico: Ajusta el effort según la complejidad de la tarea. Las consultas simples pueden justificar effort low, mientras que la programación agéntica y el razonamiento complejo se benefician del effort high.

Próximos pasos

Presupuestos de tareas

Dale a Claude un presupuesto de tokens orientativo para el ciclo agéntico completo para ayudar al modelo a autorregularse en tareas agénticas largas.

Adaptive thinking

Permite que Claude determine dinámicamente cuándo y cuánto usar el pensamiento extendido con el modo de pensamiento adaptativo.

Construir con pensamiento extendido

Dale a Claude razonamiento mejorado para tareas complejas con presupuestos de pensamiento manuales, uso de herramientas y almacenamiento en caché de prompts.

Was this page helpful?

MensajesCapacidades del modelo

Effort

Controla cuántos tokens usa Claude al responder con el parámetro effort, equilibrando la exhaustividad de la respuesta y la eficiencia de tokens.

El parámetro effort es compatible con Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5, Claude Sonnet 4.6 y Claude Opus 4.5.

Cómo funciona effort

Establecer effort en "high" produce exactamente el mismo comportamiento que omitir el parámetro effort por completo.

El parámetro effort afecta todos los tokens en la respuesta, incluyendo:

Respuestas de texto y explicaciones
Llamadas a herramientas y argumentos de funciones
Pensamiento extendido (cuando está habilitado)

Este enfoque tiene dos ventajas principales:

No requiere que el pensamiento esté habilitado.
Puede afectar todo el gasto de tokens, incluidas las llamadas a herramientas. Por ejemplo, un effort más bajo significaría que Claude hace menos llamadas a herramientas. Esto brinda un grado mucho mayor de control sobre la eficiencia.

Niveles de effort

Nivel	Descripción	Caso de uso típico
`max`	Capacidad máxima absoluta sin restricciones en el gasto de tokens. Disponible en Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5 y Claude Sonnet 4.6.	Tareas que requieren el razonamiento más profundo posible y el análisis más exhaustivo
`xhigh`	Capacidad extendida para trabajo de largo horizonte. Disponible en Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7 y Claude Sonnet 5.	Tareas agénticas y de programación de larga duración (más de 30 minutos) con presupuestos de tokens en millones
`high`	Capacidad alta. Equivalente a no establecer el parámetro.	Razonamiento complejo, problemas de programación difíciles, tareas agénticas
`medium`	Enfoque equilibrado con ahorro moderado de tokens.	Tareas agénticas que requieren un equilibrio entre velocidad, costo y rendimiento
`low`	El más eficiente. Ahorro significativo de tokens con cierta reducción de capacidad.	Tareas más simples que necesitan la mejor velocidad y los costos más bajos, como subagentes

Niveles de effort recomendados para Claude Sonnet 5

Claude Sonnet 5 usa effort high de forma predeterminada.

Effort high (predeterminado): Adecuado para razonamiento complejo, programación y tareas agénticas donde la calidad importa más que la velocidad o el costo.
Effort xhigh: Para las tareas de programación y agénticas más difíciles. Consulta Prompting Claude Sonnet 5.
Effort medium: Reducción de costos respecto al valor predeterminado. Comparable a Claude Sonnet 4.6 con effort high.
Effort low: Para cargas de trabajo de alto volumen o sensibles a la latencia. Adecuado para chat y casos de uso que no son de programación donde se prioriza una respuesta más rápida.
Effort max: Para tareas que requieren la capacidad más alta absoluta sin restricciones en el gasto de tokens.

Niveles de effort recomendados para Sonnet 4.6

Sonnet 4.6 usa effort high de forma predeterminada. Establece effort explícitamente al usar Sonnet 4.6 para evitar latencia inesperada:

Effort medium (predeterminado recomendado): El mejor equilibrio entre velocidad, costo y rendimiento para la mayoría de las aplicaciones. Adecuado para programación agéntica, flujos de trabajo con uso intensivo de herramientas y generación de código.
Effort low: Para cargas de trabajo de alto volumen o sensibles a la latencia. Adecuado para chat y casos de uso que no son de programación donde se prioriza una respuesta más rápida.
Effort high: Para razonamiento complejo y tareas donde la calidad importa más que la velocidad o el costo.
Effort max: Para tareas que requieren la capacidad más alta absoluta sin restricciones en el gasto de tokens.

Niveles de effort recomendados para Claude Opus 4.7

El valor predeterminado de la API es high. Para usar xhigh, establece effort explícitamente; el valor que pases anula el predeterminado.

Effort	Orientación para Claude Opus 4.7
`low`	Eficiente, pero mejor para tareas cortas y acotadas. Combina `low` con listas de verificación explícitas si tu tarea tiene varias secciones.
`medium`	La opción directa para el flujo de trabajo promedio donde quieres buenos resultados mientras reduces costos.
`high`	Casos de uso avanzados que aún necesitan un equilibrio entre inteligencia y consumo de tokens. Este suele ser el punto óptimo que equilibra calidad y eficiencia de tokens.
`xhigh`	El punto de partida recomendado para trabajo de programación y agéntico, y para tareas exploratorias como llamadas repetidas a herramientas, búsqueda web detallada y búsqueda en bases de conocimiento. Espera un uso de tokens significativamente mayor que con `high`.
`max`	Resérvalo para problemas genuinamente de frontera. En la mayoría de las cargas de trabajo, `max` agrega un costo significativo para ganancias de calidad relativamente pequeñas, y en algunas tareas de salida estructurada o menos sensibles a la inteligencia puede llevar a pensar en exceso.

Niveles de effort recomendados para Claude Opus 4.8

El valor predeterminado de la API es high. Establece effort explícitamente para usar un nivel diferente; el valor que pases anula el predeterminado.

Niveles de effort recomendados para Claude Fable 5

Uso básico

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)

Cuándo ajustar el parámetro effort

Usa effort max cuando necesites la capacidad más alta absoluta sin restricciones: el razonamiento más exhaustivo y el análisis más profundo. Disponible en Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5 y Claude Sonnet 4.6.
Usa effort xhigh para programación avanzada y trabajo agéntico complejo que requiera exploración extendida, como llamadas repetidas a herramientas y búsqueda detallada. Disponible en Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7 y Claude Sonnet 5.
Usa effort high (el predeterminado) para razonamiento complejo, análisis matizado, problemas de programación difíciles o cualquier tarea donde la calidad importe más que la velocidad o el costo.
Usa effort medium como una opción equilibrada cuando quieras un rendimiento sólido sin el gasto completo de tokens del effort high.
Usa effort low cuando estés optimizando para velocidad (porque Claude responde con menos tokens) o costo. Por ejemplo, tareas simples de clasificación, búsquedas rápidas o casos de uso de alto volumen donde las mejoras marginales de calidad no justifican latencia o gasto adicional.

Effort con uso de herramientas

Al usar herramientas, el parámetro effort afecta tanto las explicaciones alrededor de las llamadas a herramientas como las llamadas a herramientas en sí. Los niveles de effort más bajos tienden a:

Combinar múltiples operaciones en menos llamadas a herramientas
Hacer menos llamadas a herramientas
Proceder directamente a la acción sin preámbulo
Usar mensajes de confirmación concisos después de completar

Los niveles de effort más altos pueden:

Hacer más llamadas a herramientas
Explicar el plan antes de tomar acción
Proporcionar resúmenes detallados de los cambios
Incluir comentarios de código más completos

Effort con pensamiento extendido

El parámetro effort funciona junto con el pensamiento extendido. Su comportamiento depende del modelo:

Claude Fable 5 y Claude Mythos 5 usan adaptive thinking (pensamiento adaptativo), que siempre está activado (no se requiere configuración de thinking). thinking: {type: "disabled"} es rechazado. Effort controla la profundidad del pensamiento de la misma manera que en Opus 4.8 y Opus 4.7.
Claude Opus 4.8 usa adaptive thinking (thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. El pensamiento extendido manual (thinking: {type: "enabled", budget_tokens: N}) no es compatible y devuelve un error 400. El modelo decide cuándo y cuánto pensar según cada solicitud, por lo que activa el pensamiento solo cuando es necesario. Con effort high, xhigh y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples. Establece thinking: {type: "adaptive"} para habilitar el pensamiento; sin esto, las solicitudes se ejecutan sin pensamiento.
Claude Mythos Preview usa adaptive thinking de forma predeterminada (no se requiere configuración de thinking). thinking: {type: "disabled"} es rechazado. Effort controla la profundidad del pensamiento de la misma manera que en Opus 4.7 y Opus 4.6.
Claude Opus 4.7 usa adaptive thinking (thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. El pensamiento extendido manual (thinking: {type: "enabled", budget_tokens: N}) ya no es compatible en Opus 4.7; usa adaptive thinking con effort en su lugar. Con effort high, xhigh y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.
Claude Opus 4.6 usa adaptive thinking (thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. Aunque budget_tokens todavía se acepta en Opus 4.6, está obsoleto y se eliminará en una versión futura. Con effort high y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.
Claude Sonnet 5 usa adaptive thinking, que está activado de forma predeterminada (no se requiere configuración de thinking), y effort es el control recomendado para la profundidad del pensamiento. El pensamiento extendido manual (thinking: {type: "enabled", budget_tokens: N}) no es compatible y devuelve un error 400. Pasa thinking: {type: "disabled"} para desactivar el pensamiento. Con effort high (predeterminado), xhigh y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.
Claude Sonnet 4.6 usa adaptive thinking (donde effort controla la profundidad del pensamiento). El pensamiento manual con modo intercalado (thinking: {type: "enabled", budget_tokens: N}) sigue siendo funcional pero está obsoleto.
Claude Opus 4.5 usa pensamiento manual (thinking: {type: "enabled", budget_tokens: N}), donde effort funciona junto con el presupuesto de tokens de pensamiento. Establece el nivel de effort para tu tarea, luego establece el presupuesto de tokens de pensamiento según la complejidad de la tarea.

Mejores prácticas

Establece effort explícitamente: El valor predeterminado de la API es high, pero el punto de partida correcto depende de tu modelo y carga de trabajo.
Usa low para tareas sensibles a la velocidad o simples: Cuando la latencia importa o las tareas son sencillas, el effort low puede reducir significativamente los tiempos de respuesta y los costos.
Prueba tu caso de uso: El impacto de los niveles de effort varía según el tipo de tarea. Evalúa el rendimiento en tus casos de uso específicos antes de implementar.
Considera effort dinámico: Ajusta el effort según la complejidad de la tarea. Las consultas simples pueden justificar effort low, mientras que la programación agéntica y el razonamiento complejo se benefician del effort high.

Próximos pasos

Presupuestos de tareas

Dale a Claude un presupuesto de tokens orientativo para el ciclo agéntico completo para ayudar al modelo a autorregularse en tareas agénticas largas.

Adaptive thinking

Permite que Claude determine dinámicamente cuándo y cuánto usar el pensamiento extendido con el modo de pensamiento adaptativo.

Construir con pensamiento extendido

Dale a Claude razonamiento mejorado para tareas complejas con presupuestos de pensamiento manuales, uso de herramientas y almacenamiento en caché de prompts.

Was this page helpful?

Cómo funciona effort

Niveles de effort

Niveles de effort recomendados para Claude Sonnet 5

Niveles de effort recomendados para Sonnet 4.6

Niveles de effort recomendados para Claude Opus 4.7

Niveles de effort recomendados para Claude Opus 4.8

Niveles de effort recomendados para Claude Fable 5

Uso básico

Cuándo ajustar el parámetro effort

Effort con uso de herramientas

Effort con pensamiento extendido

Mejores prácticas

Próximos pasos

Cómo funciona effort

Niveles de effort

Niveles de effort recomendados para Claude Sonnet 5

Niveles de effort recomendados para Sonnet 4.6

Niveles de effort recomendados para Claude Opus 4.7

Niveles de effort recomendados para Claude Opus 4.8

Niveles de effort recomendados para Claude Fable 5

Uso básico

Cuándo ajustar el parámetro effort

Effort con uso de herramientas

Effort con pensamiento extendido

Mejores prácticas

Próximos pasos

Cómo funciona effort

Niveles de effort

Niveles de effort recomendados para Claude Sonnet 5

Niveles de effort recomendados para Sonnet 4.6

Niveles de effort recomendados para Claude Opus 4.7

Niveles de effort recomendados para Claude Opus 4.8

Niveles de effort recomendados para Claude Fable 5

Uso básico

Cuándo ajustar el parámetro effort

Effort con uso de herramientas

Effort con pensamiento extendido

Mejores prácticas

Próximos pasos

Cómo funciona effort

Niveles de effort

Niveles de effort recomendados para Claude Sonnet 5

Niveles de effort recomendados para Sonnet 4.6

Niveles de effort recomendados para Claude Opus 4.7

Niveles de effort recomendados para Claude Opus 4.8

Niveles de effort recomendados para Claude Fable 5

Uso básico

Cuándo ajustar el parámetro effort

Effort con uso de herramientas

Effort con pensamiento extendido

Mejores prácticas

Próximos pasos