Le paramètre effort vous permet de contrôler l'empressement de Claude à dépenser des tokens lors de la réponse aux demandes. Cela vous donne la possibilité de trouver un équilibre entre la complétude de la réponse et l'efficacité des tokens, le tout avec un seul modèle.
Le paramètre effort est actuellement en bêta et n'est pris en charge que par Claude Opus 4.5.
Vous devez inclure l'en-tête bêta effort-2025-11-24 lors de l'utilisation de cette fonctionnalité.
Par défaut, Claude utilise l'effort maximum—en dépensant autant de tokens que nécessaire pour le meilleur résultat possible. En abaissant le niveau d'effort, vous pouvez demander à Claude d'être plus conservateur avec l'utilisation des tokens, en optimisant pour la vitesse et le coût tout en acceptant une réduction de capacité.
Définir effort à "high" produit exactement le même comportement que d'omettre le paramètre effort entièrement.
Le paramètre effort affecte tous les tokens dans la réponse, y compris :
Cette approche présente deux avantages majeurs :
| Niveau | Description | Cas d'usage typique |
|---|---|---|
high | Capacité maximale. Claude utilise autant de tokens que nécessaire pour le meilleur résultat possible. Équivalent à ne pas définir le paramètre. | Raisonnement complexe, problèmes de codage difficiles, tâches agentiques |
medium | Approche équilibrée avec des économies de tokens modérées. | Tâches agentiques qui nécessitent un équilibre entre la vitesse, le coût et les performances |
low | Plus efficace. Économies de tokens importantes avec une réduction de capacité. | Tâches plus simples qui nécessitent la meilleure vitesse et les coûts les plus bas, comme les sous-agents |
Lors de l'utilisation d'outils, le paramètre effort affecte à la fois les explications autour des appels d'outils et les appels d'outils eux-mêmes. Les niveaux d'effort inférieur ont tendance à :
Les niveaux d'effort supérieur peuvent :
Le paramètre effort fonctionne aux côtés du budget de tokens de réflexion lorsque la réflexion étendue est activée. Ces deux contrôles servent des objectifs différents :
Le paramètre effort peut être utilisé avec ou sans la réflexion étendue activée. Lorsque les deux sont configurés :
Pour les meilleures performances sur les tâches de raisonnement complexe, utilisez l'effort élevé (la valeur par défaut) avec un budget de tokens de réflexion élevé. Cela permet à Claude de réfléchir en profondeur et de fournir des réponses complètes.
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)