• Mensajes
  • Agentes gestionados
  • Administración

Search...
⌘K
Primeros pasos
Introducción a ClaudeInicio rápido
Desarrollar con Claude
Descripción general de funcionesUso de la API de MensajesMotivos de detención y respaldoRechazos y respaldoCrédito de respaldo
Capacidades del modelo
Pensamiento extendidoPensamiento adaptativoEsfuerzoPresupuestos de tareas (beta)Modo rápido (vista previa de investigación)Salidas estructuradasCitasStreaming de mensajesProcesamiento por lotesResultados de búsquedaStreaming de rechazosSoporte multilingüeEmbeddings
Herramientas
Descripción generalCómo funciona el uso de herramientasTutorial: Crear un agente que usa herramientasDefinir herramientasGestionar llamadas a herramientasUso de herramientas en paraleloTool Runner (SDK)Uso de herramientas estrictoUso de herramientas con almacenamiento en caché de promptsHerramientas de servidorSolución de problemasHerramienta de búsqueda webHerramienta de obtención webHerramienta de ejecución de códigoHerramienta de asesorHerramienta de memoriaHerramienta BashHerramienta de uso de computadoraHerramienta de editor de texto
Infraestructura de herramientas
Referencia de herramientasGestionar contexto de herramientasCombinaciones de herramientasBúsqueda de herramientasLlamadas programáticas a herramientasStreaming detallado de herramientas
Gestión de contexto
Ventanas de contextoCompactaciónEdición de contextoAlmacenamiento en caché de promptsMensajes del sistema en mitad de conversaciónCrear un modo de orquestaciónDiagnóstico de caché (beta)Conteo de tokens
Trabajar con archivos
API de archivosCompatibilidad con PDFImágenes y visión
Habilidades
Descripción generalInicio rápidoMejores prácticasHabilidades para empresasHabilidades en la API
MCP
Servidores MCP remotosConector MCP
Claude en plataformas en la nube
Amazon BedrockAmazon Bedrock (heredado)Claude Platform en AWSMicrosoft FoundryVertex AI

Log in
Esfuerzo
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Mensajes/Capacidades del modelo

Effort

Controla cuántos tokens usa Claude al responder con el parámetro effort, equilibrando la exhaustividad de la respuesta y la eficiencia de tokens.


Esta función es elegible para Zero Data Retention (ZDR). Cuando tu organización tiene un acuerdo de ZDR, los datos enviados a través de esta función no se almacenan después de que se devuelve la respuesta de la API.

El parámetro "effort" (esfuerzo) te permite controlar qué tan dispuesto está Claude a gastar tokens al responder a las solicitudes. Esto te da la capacidad de equilibrar entre la exhaustividad de la respuesta y la eficiencia de tokens, todo con un solo modelo. El parámetro effort está disponible en todos los modelos compatibles sin necesidad de un encabezado beta.



El parámetro effort es compatible con Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 y Claude Opus 4.5.



Para Claude Opus 4.6 y Sonnet 4.6, effort reemplaza a budget_tokens como la forma recomendada de controlar la profundidad del pensamiento. Combina effort con adaptive thinking (pensamiento adaptativo) (thinking: {type: "adaptive"}) para obtener la mejor experiencia. Aunque budget_tokens todavía se acepta en Opus 4.6 y Sonnet 4.6, está obsoleto y se eliminará en una versión futura del modelo. Con effort high (predeterminado) y max, Claude casi siempre pensará. En niveles de effort más bajos, puede omitir el pensamiento para problemas más simples.

Cómo funciona effort

De forma predeterminada, Claude usa effort alto, gastando tantos tokens como sea necesario para obtener excelentes resultados. Puedes aumentar el nivel de effort a max para obtener la capacidad más alta absoluta, o reducirlo para ser más conservador con el uso de tokens, optimizando la velocidad y el costo mientras aceptas cierta reducción en la capacidad.



Establecer effort en "high" produce exactamente el mismo comportamiento que omitir el parámetro effort por completo.

El parámetro effort afecta a todos los tokens en la respuesta, incluyendo:

  • Respuestas de texto y explicaciones
  • Llamadas a herramientas y argumentos de funciones
  • Pensamiento extendido (cuando está habilitado)

Este enfoque tiene dos ventajas principales:

  1. No requiere que el pensamiento esté habilitado para poder usarlo.
  2. Puede afectar todo el gasto de tokens, incluidas las llamadas a herramientas. Por ejemplo, un effort más bajo significaría que Claude hace menos llamadas a herramientas. Esto proporciona un grado mucho mayor de control sobre la eficiencia.

Niveles de effort

NivelDescripciónCaso de uso típico
maxCapacidad máxima absoluta sin restricciones en el gasto de tokens. Disponible en Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 y Claude Sonnet 4.6.Tareas que requieren el razonamiento más profundo posible y el análisis más exhaustivo
xhighCapacidad extendida para trabajo de largo horizonte. Disponible en Claude Fable 5, Claude Mythos 5, Claude Opus 4.8 y Claude Opus 4.7.Tareas agénticas y de programación de larga duración (más de 30 minutos) con presupuestos de tokens en millones
highCapacidad alta. Equivalente a no establecer el parámetro.Razonamiento complejo, problemas de programación difíciles, tareas agénticas
mediumEnfoque equilibrado con ahorro moderado de tokens.Tareas agénticas que requieren un equilibrio entre velocidad, costo y rendimiento
lowEl más eficiente. Ahorro significativo de tokens con cierta reducción de capacidad.Tareas más simples que necesitan la mejor velocidad y los costos más bajos, como subagentes


Effort es una señal de comportamiento, no un presupuesto estricto de tokens. En niveles de effort más bajos, Claude seguirá pensando en problemas suficientemente difíciles, pero pensará menos de lo que lo haría en niveles de effort más altos para el mismo problema.

Niveles de effort recomendados para Sonnet 4.6

Sonnet 4.6 usa effort high de forma predeterminada. Establece effort explícitamente al usar Sonnet 4.6 para evitar latencia inesperada:

  • Effort medium (predeterminado recomendado): El mejor equilibrio entre velocidad, costo y rendimiento para la mayoría de las aplicaciones. Adecuado para programación agéntica, flujos de trabajo con uso intensivo de herramientas y generación de código.
  • Effort low: Para cargas de trabajo de alto volumen o sensibles a la latencia. Adecuado para chat y casos de uso que no son de programación donde se prioriza una respuesta más rápida.
  • Effort high: Para razonamiento complejo y tareas donde la calidad importa más que la velocidad o el costo.
  • Effort max: Para tareas que requieren la capacidad más alta absoluta sin restricciones en el gasto de tokens.

Niveles de effort recomendados para Claude Opus 4.7

Comienza con xhigh para casos de uso de programación y agénticos, y usa high como mínimo para la mayoría de las cargas de trabajo sensibles a la inteligencia. Baja a medium para cargas de trabajo sensibles al costo, o sube a max solo cuando tus evaluaciones muestren margen de mejora medible en xhigh.

El valor predeterminado de la API es high. Para usar xhigh, establece effort explícitamente; el valor que pases anula el predeterminado.

EffortOrientación para Claude Opus 4.7
lowEficiente, pero mejor para tareas cortas y acotadas. Combina low con listas de verificación explícitas si tu tarea tiene múltiples secciones.
mediumLa opción directa para el flujo de trabajo promedio donde quieres buenos resultados mientras reduces costos.
highCasos de uso avanzados que aún necesitan un equilibrio entre inteligencia y consumo de tokens. Este suele ser el punto óptimo que equilibra calidad y eficiencia de tokens.
xhighEl punto de partida recomendado para trabajo de programación y agéntico, y para tareas exploratorias como llamadas repetidas a herramientas, búsqueda web detallada y búsqueda en bases de conocimiento. Espera un uso de tokens significativamente mayor que con high.
maxResérvalo para problemas genuinamente de frontera. En la mayoría de las cargas de trabajo, max agrega un costo significativo a cambio de ganancias de calidad relativamente pequeñas, y en algunas tareas de salida estructurada o menos sensibles a la inteligencia puede llevar a pensar en exceso.

Claude Opus 4.7 también respeta los niveles de effort de manera más estricta que Claude Opus 4.6, especialmente en low y medium. En niveles de effort más bajos, el modelo limita su trabajo a lo que se le pidió en lugar de ir más allá. Si observas razonamiento superficial en problemas complejos con Claude Opus 4.7, aumenta el effort en lugar de intentar compensarlo con el prompt. Si debes mantener el effort bajo por latencia, agrega orientación específica como "Esta tarea implica razonamiento de múltiples pasos. Piensa cuidadosamente antes de responder."

Al ejecutar Claude Opus 4.7 con effort xhigh o max, establece un max_tokens grande para que el modelo tenga espacio para pensar y actuar a través de subagentes y llamadas a herramientas. Comenzar con 64k tokens y ajustar desde ahí es un valor predeterminado razonable.

Niveles de effort recomendados para Claude Opus 4.8

La orientación anterior para Claude Opus 4.7 también aplica a Claude Opus 4.8. Comienza con xhigh para casos de uso de programación y agénticos, usa high para la mayoría de las demás cargas de trabajo sensibles a la inteligencia, y baja a medium o low solo cuando hayas medido que el nivel más bajo mantiene la calidad en tus evaluaciones.

El valor predeterminado es high en todas las superficies, incluyendo la API de Claude y Claude Code. Establece effort explícitamente para usar un nivel diferente; el valor que pases anula el predeterminado.

Al ejecutar Claude Opus 4.8 con effort xhigh o max, establece un max_tokens grande para que el modelo tenga espacio para pensar y actuar a través de subagentes y llamadas a herramientas. Comenzar con 64k tokens y ajustar desde ahí es un valor predeterminado razonable.

Niveles de effort recomendados para Claude Fable 5

Effort es el control principal para equilibrar inteligencia, latencia y costo en Claude Fable 5. Comienza con high, el valor predeterminado, para la mayoría de las tareas, usa xhigh para las cargas de trabajo más sensibles a la capacidad, y baja a medium o low para trabajo rutinario. Las configuraciones de effort más bajas en Claude Fable 5 siguen funcionando bien y a menudo superan el rendimiento de xhigh en modelos anteriores. En high y xhigh, establece un max_tokens grande: es un límite estricto en la salida total, pensamiento más texto de respuesta. Consulta Control de costos.

Reduce el effort si una tarea se completa pero tarda más de lo necesario, o si quieres un estilo de trabajo más rápido e interactivo. Las mismas recomendaciones aplican a Claude Mythos 5. Para una orientación más completa, consulta Prompting para Claude Fable 5.

Uso básico

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)

Cuándo ajustar el parámetro effort

  • Usa effort max cuando necesites la capacidad más alta absoluta sin restricciones: el razonamiento más exhaustivo y el análisis más profundo. Disponible en Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 y Claude Sonnet 4.6.
  • Usa effort xhigh para programación avanzada y trabajo agéntico complejo que requiere exploración extendida, como llamadas repetidas a herramientas y búsqueda detallada. Disponible en Claude Fable 5, Claude Mythos 5, Claude Opus 4.8 y Claude Opus 4.7.
  • Usa effort high (el predeterminado) para razonamiento complejo, análisis matizado, problemas de programación difíciles o cualquier tarea donde la calidad importe más que la velocidad o el costo.
  • Usa effort medium como una opción equilibrada cuando quieras un rendimiento sólido sin el gasto completo de tokens del effort alto.
  • Usa effort low cuando estés optimizando para velocidad (porque Claude responde con menos tokens) o costo. Por ejemplo, tareas simples de clasificación, búsquedas rápidas o casos de uso de alto volumen donde las mejoras marginales de calidad no justifican latencia o gasto adicional.


Modo ultracode de Claude Code: ultracode aparece en el menú de effort de Claude Code, pero no es un nivel de effort adicional de la API. Los valores documentados en esta página son el conjunto completo que acepta la API. Ultracode combina el nivel de effort xhigh con permiso permanente para que Claude Code lance flujos de trabajo multiagente, otorgado a través de Mensajes del sistema a mitad de conversación. Para construir un comportamiento similar con la API, consulta Construir un modo de orquestación.

Effort con uso de herramientas

Al usar herramientas, el parámetro effort afecta tanto las explicaciones alrededor de las llamadas a herramientas como las llamadas a herramientas en sí. Los niveles de effort más bajos tienden a:

  • Combinar múltiples operaciones en menos llamadas a herramientas
  • Hacer menos llamadas a herramientas
  • Proceder directamente a la acción sin preámbulo
  • Usar mensajes de confirmación concisos después de completar

Los niveles de effort más altos pueden:

  • Hacer más llamadas a herramientas
  • Explicar el plan antes de tomar acción
  • Proporcionar resúmenes detallados de los cambios
  • Incluir comentarios de código más completos

Effort con pensamiento extendido

El parámetro effort funciona junto con el pensamiento extendido. Su comportamiento depende del modelo:

  • Claude Fable 5 y Claude Mythos 5 usan adaptive thinking, que siempre está activado (no se requiere configuración de thinking). thinking: {type: "disabled"} es rechazado. Effort controla la profundidad del pensamiento de la misma manera que en Opus 4.8 y Opus 4.7.
  • Claude Opus 4.8 usa adaptive thinking (thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. El pensamiento extendido manual (thinking: {type: "enabled", budget_tokens: N}) no es compatible y devuelve un error 400. El modelo decide cuándo y cuánto pensar según cada solicitud, por lo que activa el pensamiento solo cuando es necesario. Con effort high, xhigh y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples. Establece thinking: {type: "adaptive"} para habilitar el pensamiento; sin esto, las solicitudes se ejecutan sin pensamiento.
  • Claude Mythos Preview usa adaptive thinking de forma predeterminada (no se requiere configuración de thinking). thinking: {type: "disabled"} es rechazado. Effort controla la profundidad del pensamiento de la misma manera que en Opus 4.7 y Opus 4.6.
  • Claude Opus 4.7 usa adaptive thinking (thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. El pensamiento extendido manual (thinking: {type: "enabled", budget_tokens: N}) ya no es compatible en Opus 4.7; usa adaptive thinking con effort en su lugar. Con effort high, xhigh y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.
  • Claude Opus 4.6 usa adaptive thinking (thinking: {type: "adaptive"}), donde effort es el control recomendado para la profundidad del pensamiento. Aunque budget_tokens todavía se acepta en Opus 4.6, está obsoleto y se eliminará en una versión futura. Con effort high y max, Claude casi siempre piensa profundamente. En niveles más bajos, puede omitir el pensamiento para problemas más simples.
  • Claude Sonnet 4.6 usa adaptive thinking (donde effort controla la profundidad del pensamiento). El pensamiento manual con modo intercalado (thinking: {type: "enabled", budget_tokens: N}) sigue siendo funcional pero está obsoleto.
  • Claude Opus 4.5 usa pensamiento manual (thinking: {type: "enabled", budget_tokens: N}), donde effort funciona junto con el presupuesto de tokens de pensamiento. Establece el nivel de effort para tu tarea, luego establece el presupuesto de tokens de pensamiento según la complejidad de la tarea.

El parámetro effort se puede usar con o sin pensamiento extendido habilitado. Cuando se usa sin pensamiento, sigue controlando el gasto general de tokens para respuestas de texto y llamadas a herramientas.

Mejores prácticas

  1. Establece effort explícitamente: La API usa high de forma predeterminada, pero el punto de partida correcto depende de tu modelo y carga de trabajo.
  2. Usa low para tareas sensibles a la velocidad o simples: Cuando la latencia importa o las tareas son sencillas, el effort bajo puede reducir significativamente los tiempos de respuesta y los costos.
  3. Prueba tu caso de uso: El impacto de los niveles de effort varía según el tipo de tarea. Evalúa el rendimiento en tus casos de uso específicos antes de implementar.
  4. Considera effort dinámico: Ajusta el effort según la complejidad de la tarea. Las consultas simples pueden justificar effort bajo, mientras que la programación agéntica y el razonamiento complejo se benefician de effort alto.

Was this page helpful?

  • Cómo funciona effort
  • Niveles de effort
  • Niveles de effort recomendados para Sonnet 4.6
  • Niveles de effort recomendados para Claude Opus 4.7
  • Niveles de effort recomendados para Claude Opus 4.8
  • Niveles de effort recomendados para Claude Fable 5
  • Uso básico
  • Cuándo ajustar el parámetro effort
  • Effort con uso de herramientas
  • Effort con pensamiento extendido
  • Mejores prácticas