Esfuerzo
El parámetro effort te permite controlar cuán dispuesto está Claude a gastar tokens al responder a solicitudes. Esto te da la capacidad de equilibrar entre la exhaustividad de la respuesta y la eficiencia de tokens, todo con un único modelo.
El parámetro effort está actualmente en beta y solo es compatible con Claude Opus 4.5.
Debes incluir el encabezado beta effort-2025-11-24 al usar esta función.
Cómo funciona effort
Por defecto, Claude utiliza el máximo esfuerzo, gastando tantos tokens como sea necesario para proporcionar respuestas exhaustivas. Al reducir el nivel de esfuerzo, puedes instruir a Claude para que sea más conservador con el uso de tokens, tratando los tokens como un recurso más costoso.
Establecer effort a "high" produce exactamente el mismo comportamiento que omitir el parámetro effort por completo.
El parámetro effort afecta todos los tokens en la respuesta, incluyendo:
- Respuestas de texto y explicaciones
- Llamadas a herramientas y argumentos de funciones
- Pensamiento extendido (cuando está habilitado)
Niveles de esfuerzo
| Nivel | Descripción | Caso de uso típico |
|---|---|---|
high | Máxima exhaustividad—Claude utiliza tantos tokens como sea necesario. Equivalente a no establecer el parámetro. | Análisis complejo, explicaciones detalladas, contenido educativo |
medium | Enfoque equilibrado con ahorros moderados de tokens. | La mayoría de casos de uso en producción, aplicaciones conscientes del costo |
low | Respuestas más eficientes en tokens. | Automatización de alto volumen, consultas simples, cuando las respuestas se procesan programáticamente |
Uso básico
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)Comportamiento por nivel de esfuerzo
El parámetro effort controla principalmente la verbosidad de la salida y la profundidad de la explicación, no la corrección de la respuesta. Claude realiza un razonamiento interno similar independientemente del nivel de esfuerzo, pero ajusta cuánto de ese razonamiento aparece en la salida.
Respuestas de bajo esfuerzo
- Respuesta establecida directamente con explicación mínima
- Respuestas concisas y eficientes (1-2 oraciones de contexto)
- Fórmulas mostradas pero no derivadas
- Asume que el lector puede verificar la respuesta
- Confirmaciones tersas para el uso de herramientas ("Hecho.", "Arreglado.")
Respuestas de esfuerzo medio
- Contexto breve antes de la respuesta
- Justificación concisa con pasos intermedios clave
- Puede incluir un ejemplo trabajado
- Aún enfocado en la eficiencia
Respuestas de alto esfuerzo
- Estructurado con encabezados de sección
- Configuración del problema y definiciones de variables
- Proceso de solución paso a paso
- Verificación y comprobaciones de cordura
- Formato markdown enriquecido
Casos de uso
Cuándo usar bajo esfuerzo
- Optimización de velocidad: Conteos de tokens más bajos significan tiempos de respuesta más rápidos, beneficioso para aplicaciones sensibles a la latencia
- Tuberías automatizadas: Cuando las respuestas son procesadas por código en lugar de ser leídas por humanos
- Aplicaciones de alto volumen: Reduce costos en consultas rutinarias y simples
- Usuarios experimentados: Cuando los usuarios no necesitan explicaciones detalladas
- Confirmaciones rápidas: Respuestas simples de sí/no o de estado
Cuándo usar esfuerzo medio
- APIs de producción: Balance de claridad y eficiencia de costos
- Aplicaciones orientadas al usuario: Suficiente contexto sin verbosidad excesiva
- Implementaciones conscientes del costo: Ahorros significativos con impacto mínimo en la calidad
Cuándo usar alto esfuerzo (o sin parámetro effort)
- Análisis complejo: Cuando la exhaustividad es crítica
- Contenido educativo: Cuando los usuarios necesitan entender el razonamiento
- Documentación: Cuando las respuestas sirven como material de referencia
- Depuración: Cuando las explicaciones detalladas ayudan a identificar problemas
Esfuerzo con uso de herramientas
Al usar herramientas, el parámetro effort afecta tanto las explicaciones alrededor de las llamadas a herramientas como las llamadas a herramientas en sí. Los niveles de esfuerzo más bajos tienden a:
- Combinar múltiples operaciones en menos llamadas a herramientas
- Proceder directamente a la acción sin preámbulo
- Usar mensajes de confirmación tersos después de la finalización
Los niveles de esfuerzo más altos pueden:
- Explicar el plan antes de tomar acción
- Proporcionar resúmenes detallados de cambios
- Incluir comentarios de código más completos
Esfuerzo con pensamiento extendido
El parámetro effort funciona junto con el presupuesto de tokens de pensamiento cuando el pensamiento extendido está habilitado. Estos dos controles sirven propósitos diferentes:
- Parámetro effort: Controla cómo Claude gasta todos los tokens—incluyendo tokens de pensamiento, respuestas de texto y llamadas a herramientas
- Presupuesto de tokens de pensamiento: Establece un límite máximo en tokens de pensamiento específicamente
El parámetro effort se puede usar con o sin pensamiento extendido habilitado. Cuando ambos están configurados:
- Primero determina el nivel de esfuerzo apropiado para tu tarea
- Luego establece el presupuesto de tokens de pensamiento basado en la complejidad de la tarea
Para el mejor rendimiento en tareas de razonamiento complejo, usa alto esfuerzo (el predeterminado) con un presupuesto de tokens de pensamiento alto. Esto permite que Claude piense a fondo y proporcione respuestas completas.
Mejores prácticas
-
Comienza con medio: Para la mayoría de aplicaciones, el esfuerzo medio proporciona un buen balance de calidad y eficiencia.
-
Usa bajo para automatización: Cuando las respuestas son consumidas por código en lugar de humanos, el esfuerzo bajo puede reducir significativamente los costos sin afectar la corrección.
-
Prueba tu caso de uso: El impacto de los niveles de esfuerzo varía según el tipo de tarea. Evalúa el rendimiento en tus casos de uso específicos antes de implementar.
-
Monitorea la calidad: Aunque la corrección se preserva generalmente en todos los niveles de esfuerzo, la calidad de la explicación varía. Asegúrate de que el nivel que elijas cumpla con las necesidades de tus usuarios.
-
Considera esfuerzo dinámico: Ajusta el esfuerzo basado en la complejidad de la tarea o la preferencia del usuario. Las consultas simples pueden justificar esfuerzo bajo mientras que el análisis complejo se beneficia del esfuerzo alto.