Was this page helpful?
This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
Le paramètre effort vous permet de contrôler l'empressement de Claude à dépenser des tokens lors de la réponse aux demandes. Cela vous donne la possibilité de trouver un équilibre entre la complétude de la réponse et l'efficacité des tokens, le tout avec un seul modèle. Le paramètre effort est généralement disponible sur tous les modèles pris en charge sans en-tête bêta requis.
Le paramètre effort est pris en charge par Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6, et Claude Opus 4.5.
Pour Claude Opus 4.6 et Sonnet 4.6, effort remplace budget_tokens comme méthode recommandée pour contrôler la profondeur de la réflexion. Combinez effort avec adaptive thinking (thinking: {type: "adaptive"}) pour la meilleure expérience. Bien que budget_tokens soit toujours accepté sur Opus 4.6 et Sonnet 4.6, il est déprécié et sera supprimé dans une future version du modèle. À un effort high (par défaut) et max, Claude réfléchira presque toujours. À des niveaux d'effort inférieur, il peut ignorer la réflexion pour les problèmes plus simples.
Par défaut, Claude utilise un effort élevé, dépensant autant de tokens que nécessaire pour d'excellents résultats. Vous pouvez augmenter le niveau d'effort à max pour la capacité absolue la plus élevée, ou le réduire pour être plus conservateur avec l'utilisation des tokens, en optimisant pour la vitesse et le coût tout en acceptant une certaine réduction de capacité.
Définir effort à "high" produit exactement le même comportement que d'omettre entièrement le paramètre effort.
Le paramètre effort affecte tous les tokens dans la réponse, y compris :
Cette approche a deux avantages majeurs :
| Niveau | Description | Cas d'usage typique |
|---|---|---|
max | Capacité maximale absolue sans contraintes sur la dépense de tokens. Disponible sur Claude Mythos Preview, Claude Opus 4.6, et Claude Sonnet 4.6. | Tâches nécessitant le raisonnement le plus profond possible et l'analyse la plus complète |
high | Capacité élevée. Équivalent à ne pas définir le paramètre. | Raisonnement complexe, problèmes de codage difficiles, tâches agentiques |
medium | Approche équilibrée avec des économies de tokens modérées. | Tâches agentiques qui nécessitent un équilibre entre la vitesse, le coût et les performances |
low | Plus efficace. Économies de tokens significatives avec une certaine réduction de capacité. | Tâches plus simples qui ont besoin de la meilleure vitesse et des coûts les plus bas, comme les sous-agents |
L'effort est un signal comportemental, pas un budget de tokens strict. À des niveaux d'effort inférieur, Claude réfléchira toujours sur les problèmes suffisamment difficiles, mais il réfléchira moins qu'il ne le ferait à des niveaux d'effort supérieur pour le même problème.
Sonnet 4.6 utilise par défaut un effort high. Définissez explicitement l'effort lors de l'utilisation de Sonnet 4.6 pour éviter une latence inattendue :
Lors de l'utilisation d'outils, le paramètre effort affecte à la fois les explications autour des appels d'outils et les appels d'outils eux-mêmes. Les niveaux d'effort inférieur ont tendance à :
Les niveaux d'effort supérieur peuvent :
Le paramètre effort fonctionne aux côtés de la réflexion étendue. Son comportement dépend du modèle :
thinking requise). thinking: {type: "disabled"} est rejeté. L'effort contrôle la profondeur de la réflexion de la même manière que sur Opus 4.6.thinking: {type: "adaptive"}), où l'effort est le contrôle recommandé pour la profondeur de la réflexion. Bien que budget_tokens soit toujours accepté sur Opus 4.6, il est déprécié et sera supprimé dans une future version. À un effort high et max, Claude réfléchit presque toujours profondément. À des niveaux inférieur, il peut ignorer la réflexion pour les problèmes plus simples.thinking: {type: "enabled", budget_tokens: N}) est toujours fonctionnelle mais dépréciée.Le paramètre effort peut être utilisé avec ou sans réflexion étendue activée. Lorsqu'il est utilisé sans réflexion, il contrôle toujours la dépense globale de tokens pour les réponses texte et les appels d'outils.
high, mais le bon point de départ dépend de votre modèle et de votre charge de travail.curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-6",
"max_tokens": 4096,
"messages": [{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
"output_config": {
"effort": "medium"
}
}'thinking: {type: "enabled", budget_tokens: N}