MessagesCapacités du modèle

Effort

Contrôlez le nombre de tokens que Claude utilise lors de ses réponses grâce au paramètre effort, en arbitrant entre l'exhaustivité des réponses et l'efficacité en tokens.

Cette fonctionnalité est éligible à la Zero Data Retention (ZDR). Lorsque votre organisation dispose d'un accord ZDR, les données envoyées via cette fonctionnalité ne sont pas stockées après le retour de la réponse de l'API.

Le paramètre effort vous permet de contrôler la propension de Claude à dépenser des tokens lorsqu'il répond aux requêtes. Vous pouvez arbitrer entre l'exhaustivité des réponses et l'efficacité en tokens avec un seul modèle. Le paramètre effort est disponible sur tous les modèles pris en charge sans nécessiter d'en-tête bêta.

Le paramètre effort est pris en charge par Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5, Claude Sonnet 4.6 et Claude Opus 4.5.

Pour Claude Opus 4.6 et Sonnet 4.6, effort remplace budget_tokens comme méthode recommandée pour contrôler la profondeur de réflexion. Combinez effort avec la réflexion adaptative (thinking: {type: "adaptive"}) pour une expérience optimale. Bien que budget_tokens soit toujours accepté sur Opus 4.6 et Sonnet 4.6, il est déprécié et sera supprimé dans une future version du modèle. Aux niveaux d'effort high (par défaut) et max, Claude réfléchira presque toujours. Aux niveaux d'effort inférieurs, il peut ignorer la réflexion pour les problèmes plus simples.

Fonctionnement du paramètre effort

Par défaut, Claude utilise un effort élevé, dépensant autant de tokens que nécessaire pour obtenir d'excellents résultats. Vous pouvez augmenter le niveau d'effort à max pour obtenir la capacité maximale absolue, ou le réduire pour être plus économe en tokens, en optimisant la vitesse et le coût tout en acceptant une certaine réduction de capacité.

Définir effort sur "high" produit exactement le même comportement que d'omettre entièrement le paramètre effort.

Le paramètre effort affecte tous les tokens de la réponse, notamment :

Les réponses textuelles et les explications
Les appels d'outils et les arguments de fonction
La réflexion étendue (lorsqu'elle est activée)

Cette approche présente deux avantages majeurs :

Elle ne nécessite pas l'activation de la réflexion.
Elle peut affecter toute la dépense de tokens, y compris les appels d'outils. Par exemple, un effort plus faible signifierait que Claude effectue moins d'appels d'outils. Cela offre un degré de contrôle beaucoup plus important sur l'efficacité.

Niveaux d'effort

Niveau	Description	Cas d'usage typique
`max`	Capacité maximale absolue sans contrainte sur la dépense de tokens. Disponible sur Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5 et Claude Sonnet 4.6.	Tâches nécessitant le raisonnement le plus approfondi possible et l'analyse la plus exhaustive
`xhigh`	Capacité étendue pour les travaux à long horizon. Disponible sur Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7 et Claude Sonnet 5.	Tâches agentiques et de programmation de longue durée (plus de 30 minutes) avec des budgets de tokens de l'ordre de plusieurs millions
`high`	Capacité élevée. Équivalent à ne pas définir le paramètre.	Raisonnement complexe, problèmes de programmation difficiles, tâches agentiques
`medium`	Approche équilibrée avec des économies de tokens modérées.	Tâches agentiques nécessitant un équilibre entre vitesse, coût et performance
`low`	Le plus efficace. Économies de tokens significatives avec une certaine réduction de capacité.	Tâches plus simples nécessitant la meilleure vitesse et les coûts les plus bas, comme les sous-agents

L'effort est un signal comportemental, pas un budget de tokens strict. Aux niveaux d'effort inférieurs, Claude réfléchira tout de même sur des problèmes suffisamment difficiles, mais il réfléchira moins qu'il ne le ferait aux niveaux d'effort supérieurs pour le même problème.

Niveaux d'effort recommandés pour Claude Sonnet 5

Claude Sonnet 5 utilise par défaut l'effort high.

Effort high (par défaut) : Adapté au raisonnement complexe, à la programmation et aux tâches agentiques où la qualité prime sur la vitesse ou le coût.
Effort xhigh : Pour les tâches de programmation et agentiques les plus difficiles. Consultez Rédiger des prompts pour Claude Sonnet 5.
Effort medium : Réduction économique par rapport au niveau par défaut. Comparable à Claude Sonnet 4.6 avec un effort high.
Effort low : Pour les charges de travail à volume élevé ou sensibles à la latence. Adapté aux cas d'usage de chat et hors programmation où un délai de réponse plus rapide est prioritaire.
Effort max : Pour les tâches nécessitant la capacité maximale absolue sans contrainte sur la dépense de tokens.

Niveaux d'effort recommandés pour Sonnet 4.6

Sonnet 4.6 utilise par défaut l'effort high. Définissez explicitement l'effort lorsque vous utilisez Sonnet 4.6 pour éviter une latence inattendue :

Effort medium (valeur par défaut recommandée) : Meilleur équilibre entre vitesse, coût et performance pour la plupart des applications. Adapté à la programmation agentique, aux flux de travail intensifs en outils et à la génération de code.
Effort low : Pour les charges de travail à volume élevé ou sensibles à la latence. Adapté aux cas d'usage de chat et hors programmation où un délai de réponse plus rapide est prioritaire.
Effort high : Pour le raisonnement complexe et les tâches où la qualité prime sur la vitesse ou le coût.
Effort max : Pour les tâches nécessitant la capacité maximale absolue sans contrainte sur la dépense de tokens.

Niveaux d'effort recommandés pour Claude Opus 4.7

Commencez par xhigh pour les cas d'usage de programmation et agentiques, et utilisez high comme minimum pour la plupart des charges de travail sensibles à l'intelligence. Descendez à medium pour les charges de travail sensibles au coût, ou montez à max uniquement lorsque vos évaluations montrent une marge de progression mesurable à xhigh.

La valeur par défaut de l'API est high. Pour utiliser xhigh, définissez effort explicitement ; la valeur que vous passez remplace la valeur par défaut.

Effort	Recommandations pour Claude Opus 4.7
`low`	Efficace, mais idéal pour les tâches courtes et bien délimitées. Associez `low` à des listes de contrôle explicites si votre tâche comporte plusieurs sections.
`medium`	Le choix par défaut pour le flux de travail moyen où vous souhaitez de bons résultats tout en réduisant les coûts.
`high`	Cas d'usage avancés qui nécessitent tout de même un équilibre entre intelligence et consommation de tokens. C'est souvent le point idéal équilibrant qualité et efficacité en tokens.
`xhigh`	Le point de départ recommandé pour le travail de programmation et agentique, ainsi que pour les tâches exploratoires comme les appels d'outils répétés, la recherche web détaillée et la recherche dans des bases de connaissances. Attendez-vous à une utilisation de tokens nettement plus élevée qu'avec `high`.
`max`	À réserver aux problèmes véritablement à la frontière des capacités. Sur la plupart des charges de travail, `max` ajoute un coût significatif pour des gains de qualité relativement faibles, et sur certaines tâches à sortie structurée ou moins sensibles à l'intelligence, il peut conduire à une sur-réflexion.

Claude Opus 4.7 respecte également les niveaux d'effort plus strictement que Claude Opus 4.6, en particulier à low et medium. Aux niveaux d'effort inférieurs, le modèle limite son travail à ce qui a été demandé plutôt que d'aller au-delà. Si vous observez un raisonnement superficiel sur des problèmes complexes avec Claude Opus 4.7, augmentez l'effort plutôt que de contourner le problème par le prompt. Si vous devez maintenir un effort faible pour des raisons de latence, ajoutez des indications ciblées comme « Cette tâche implique un raisonnement en plusieurs étapes. Réfléchissez attentivement avant de répondre. »

Lorsque vous exécutez Claude Opus 4.7 avec un effort xhigh ou max, définissez un max_tokens élevé afin que le modèle dispose de suffisamment d'espace pour réfléchir et agir à travers les sous-agents et les appels d'outils. Commencer à 64k tokens et ajuster à partir de là constitue une valeur par défaut raisonnable.

Niveaux d'effort recommandés pour Claude Opus 4.8

Les recommandations pour Claude Opus 4.7 s'appliquent également à Claude Opus 4.8. Commencez par xhigh pour les cas d'usage de programmation et agentiques, utilisez high pour la plupart des autres charges de travail sensibles à l'intelligence, et descendez à medium ou low uniquement lorsque vous avez mesuré que le niveau inférieur maintient la qualité sur vos évaluations.

La valeur par défaut de l'API est high. Définissez effort explicitement pour utiliser un niveau différent ; la valeur que vous passez remplace la valeur par défaut.

Lorsque vous exécutez Claude Opus 4.8 avec un effort xhigh ou max, définissez un max_tokens élevé afin que le modèle dispose de suffisamment d'espace pour réfléchir et agir à travers les sous-agents et les appels d'outils. Commencer à 64k tokens et ajuster à partir de là constitue une valeur par défaut raisonnable.

Niveaux d'effort recommandés pour Claude Fable 5

L'effort est le contrôle principal pour arbitrer entre intelligence, latence et coût sur Claude Fable 5. Commencez par high, la valeur par défaut, pour la plupart des tâches, utilisez xhigh pour les charges de travail les plus sensibles à la capacité, et descendez à medium ou low pour le travail de routine. Les réglages d'effort inférieurs sur Claude Fable 5 restent performants et dépassent souvent les performances de xhigh sur les modèles précédents. À high et xhigh, définissez un max_tokens élevé : il s'agit d'une limite stricte sur la sortie totale, réflexion plus texte de réponse. Consultez Contrôle des coûts.

Réduisez l'effort si une tâche se termine mais prend plus de temps que nécessaire, ou si vous souhaitez un style de travail plus rapide et plus interactif. Les mêmes recommandations s'appliquent à Claude Mythos 5. Pour des conseils plus complets, consultez Rédiger des prompts pour Claude Fable 5.

Utilisation de base

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)

Quand ajuster le paramètre effort

Utilisez l'effort max lorsque vous avez besoin de la capacité maximale absolue sans contrainte : le raisonnement le plus exhaustif et l'analyse la plus approfondie. Disponible sur Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5 et Claude Sonnet 4.6.
Utilisez l'effort xhigh pour la programmation avancée et le travail agentique complexe nécessitant une exploration étendue, comme les appels d'outils répétés et la recherche détaillée. Disponible sur Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7 et Claude Sonnet 5.
Utilisez l'effort high (la valeur par défaut) pour le raisonnement complexe, l'analyse nuancée, les problèmes de programmation difficiles ou toute tâche où la qualité prime sur la vitesse ou le coût.
Utilisez l'effort medium comme option équilibrée lorsque vous souhaitez une performance solide sans la dépense complète de tokens de l'effort high.
Utilisez l'effort low lorsque vous optimisez la vitesse (car Claude répond avec moins de tokens) ou le coût. Par exemple, pour des tâches de classification simples, des recherches rapides ou des cas d'usage à volume élevé où les améliorations marginales de qualité ne justifient pas une latence ou une dépense supplémentaire.

Mode ultracode de Claude Code : ultracode apparaît dans le menu d'effort de Claude Code, mais il ne s'agit pas d'un niveau d'effort supplémentaire de l'API. Les valeurs documentées sur cette page constituent l'ensemble complet accepté par l'API. Ultracode associe le niveau d'effort xhigh à une autorisation permanente pour Claude Code de lancer des flux de travail multi-agents, accordée via les messages système en cours de conversation. Pour créer un comportement similaire avec l'API, consultez Créer un mode d'orchestration.

Effort avec l'utilisation d'outils

Lors de l'utilisation d'outils, le paramètre effort affecte à la fois les explications autour des appels d'outils et les appels d'outils eux-mêmes. Les niveaux d'effort inférieurs ont tendance à :

Combiner plusieurs opérations en moins d'appels d'outils
Effectuer moins d'appels d'outils
Passer directement à l'action sans préambule
Utiliser des messages de confirmation concis après l'achèvement

Les niveaux d'effort supérieurs peuvent :

Effectuer plus d'appels d'outils
Expliquer le plan avant de passer à l'action
Fournir des résumés détaillés des modifications
Inclure des commentaires de code plus complets

Effort avec la réflexion étendue

Le paramètre effort fonctionne conjointement avec la réflexion étendue. Son comportement dépend du modèle :

Claude Fable 5 et Claude Mythos 5 utilisent la réflexion adaptative, qui est toujours activée (aucune configuration thinking requise). thinking: {type: "disabled"} est rejeté. L'effort contrôle la profondeur de réflexion de la même manière que sur Opus 4.8 et Opus 4.7.
Claude Opus 4.8 utilise la réflexion adaptative (thinking: {type: "adaptive"}), où l'effort est le contrôle recommandé pour la profondeur de réflexion. La réflexion étendue manuelle (thinking: {type: "enabled", budget_tokens: N}) n'est pas prise en charge et renvoie une erreur 400. Le modèle décide quand et combien réfléchir en fonction de chaque requête, il ne déclenche donc la réflexion que lorsque nécessaire. Aux niveaux d'effort high, xhigh et max, Claude réfléchit presque toujours en profondeur. Aux niveaux inférieurs, il peut ignorer la réflexion pour les problèmes plus simples. Définissez thinking: {type: "adaptive"} pour activer la réflexion ; sans cela, les requêtes s'exécutent sans réflexion.
Claude Mythos Preview utilise la réflexion adaptative par défaut (aucune configuration thinking requise). thinking: {type: "disabled"} est rejeté. L'effort contrôle la profondeur de réflexion de la même manière que sur Opus 4.7 et Opus 4.6.
Claude Opus 4.7 utilise la réflexion adaptative (thinking: {type: "adaptive"}), où l'effort est le contrôle recommandé pour la profondeur de réflexion. La réflexion étendue manuelle (thinking: {type: "enabled", budget_tokens: N}) n'est plus prise en charge sur Opus 4.7 ; utilisez plutôt la réflexion adaptative avec effort. Aux niveaux d'effort high, xhigh et max, Claude réfléchit presque toujours en profondeur. Aux niveaux inférieurs, il peut ignorer la réflexion pour les problèmes plus simples.
Claude Opus 4.6 utilise la réflexion adaptative (thinking: {type: "adaptive"}), où l'effort est le contrôle recommandé pour la profondeur de réflexion. Bien que budget_tokens soit toujours accepté sur Opus 4.6, il est déprécié et sera supprimé dans une future version. Aux niveaux d'effort high et max, Claude réfléchit presque toujours en profondeur. Aux niveaux inférieurs, il peut ignorer la réflexion pour les problèmes plus simples.
Claude Sonnet 5 utilise la réflexion adaptative, qui est activée par défaut (aucune configuration thinking requise), et l'effort est le contrôle recommandé pour la profondeur de réflexion. La réflexion étendue manuelle (thinking: {type: "enabled", budget_tokens: N}) n'est pas prise en charge et renvoie une erreur 400. Passez thinking: {type: "disabled"} pour désactiver la réflexion. Aux niveaux d'effort high (par défaut), xhigh et max, Claude réfléchit presque toujours en profondeur. Aux niveaux inférieurs, il peut ignorer la réflexion pour les problèmes plus simples.
Claude Sonnet 4.6 utilise la réflexion adaptative (où l'effort contrôle la profondeur de réflexion). La réflexion manuelle avec le mode entrelacé (thinking: {type: "enabled", budget_tokens: N}) est toujours fonctionnelle mais dépréciée.
Claude Opus 4.5 utilise la réflexion manuelle (thinking: {type: "enabled", budget_tokens: N}), où l'effort fonctionne conjointement avec le budget de tokens de réflexion. Définissez le niveau d'effort pour votre tâche, puis définissez le budget de tokens de réflexion en fonction de la complexité de la tâche.

Le paramètre effort peut être utilisé avec ou sans la réflexion étendue activée. Lorsqu'il est utilisé sans réflexion, il contrôle tout de même la dépense globale de tokens pour les réponses textuelles et les appels d'outils.

Bonnes pratiques

Définissez l'effort explicitement : L'API utilise high par défaut, mais le bon point de départ dépend de votre modèle et de votre charge de travail.
Utilisez low pour les tâches sensibles à la vitesse ou simples : Lorsque la latence est importante ou que les tâches sont simples, un effort faible peut réduire considérablement les temps de réponse et les coûts.
Testez votre cas d'usage : L'impact des niveaux d'effort varie selon le type de tâche. Évaluez les performances sur vos cas d'usage spécifiques avant le déploiement.
Envisagez un effort dynamique : Ajustez l'effort en fonction de la complexité de la tâche. Les requêtes simples peuvent justifier un effort faible tandis que la programmation agentique et le raisonnement complexe bénéficient d'un effort élevé.

Étapes suivantes

Budgets de tâche

Donnez à Claude un budget de tokens indicatif pour la boucle agentique complète afin d'aider le modèle à s'autoréguler sur les tâches agentiques longues.

Réflexion adaptative

Laissez Claude déterminer dynamiquement quand et dans quelle mesure utiliser la réflexion étendue avec le mode de réflexion adaptative.

Développer avec la réflexion étendue

Offrez à Claude un raisonnement amélioré pour les tâches complexes avec des budgets de réflexion manuels, l'utilisation d'outils et la mise en cache des prompts.

Was this page helpful?

MessagesCapacités du modèle

Effort

Contrôlez le nombre de tokens que Claude utilise lors de ses réponses grâce au paramètre effort, en arbitrant entre l'exhaustivité des réponses et l'efficacité en tokens.

Fonctionnement du paramètre effort

Définir effort sur "high" produit exactement le même comportement que d'omettre entièrement le paramètre effort.

Le paramètre effort affecte tous les tokens de la réponse, notamment :

Les réponses textuelles et les explications
Les appels d'outils et les arguments de fonction
La réflexion étendue (lorsqu'elle est activée)

Cette approche présente deux avantages majeurs :

Elle ne nécessite pas l'activation de la réflexion.
Elle peut affecter toute la dépense de tokens, y compris les appels d'outils. Par exemple, un effort plus faible signifierait que Claude effectue moins d'appels d'outils. Cela offre un degré de contrôle beaucoup plus important sur l'efficacité.

Niveaux d'effort

Niveau	Description	Cas d'usage typique
`max`	Capacité maximale absolue sans contrainte sur la dépense de tokens. Disponible sur Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5 et Claude Sonnet 4.6.	Tâches nécessitant le raisonnement le plus approfondi possible et l'analyse la plus exhaustive
`xhigh`	Capacité étendue pour les travaux à long horizon. Disponible sur Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7 et Claude Sonnet 5.	Tâches agentiques et de programmation de longue durée (plus de 30 minutes) avec des budgets de tokens de l'ordre de plusieurs millions
`high`	Capacité élevée. Équivalent à ne pas définir le paramètre.	Raisonnement complexe, problèmes de programmation difficiles, tâches agentiques
`medium`	Approche équilibrée avec des économies de tokens modérées.	Tâches agentiques nécessitant un équilibre entre vitesse, coût et performance
`low`	Le plus efficace. Économies de tokens significatives avec une certaine réduction de capacité.	Tâches plus simples nécessitant la meilleure vitesse et les coûts les plus bas, comme les sous-agents

Niveaux d'effort recommandés pour Claude Sonnet 5

Claude Sonnet 5 utilise par défaut l'effort high.

Effort high (par défaut) : Adapté au raisonnement complexe, à la programmation et aux tâches agentiques où la qualité prime sur la vitesse ou le coût.
Effort xhigh : Pour les tâches de programmation et agentiques les plus difficiles. Consultez Rédiger des prompts pour Claude Sonnet 5.
Effort medium : Réduction économique par rapport au niveau par défaut. Comparable à Claude Sonnet 4.6 avec un effort high.
Effort low : Pour les charges de travail à volume élevé ou sensibles à la latence. Adapté aux cas d'usage de chat et hors programmation où un délai de réponse plus rapide est prioritaire.
Effort max : Pour les tâches nécessitant la capacité maximale absolue sans contrainte sur la dépense de tokens.

Niveaux d'effort recommandés pour Sonnet 4.6

Sonnet 4.6 utilise par défaut l'effort high. Définissez explicitement l'effort lorsque vous utilisez Sonnet 4.6 pour éviter une latence inattendue :

Effort medium (valeur par défaut recommandée) : Meilleur équilibre entre vitesse, coût et performance pour la plupart des applications. Adapté à la programmation agentique, aux flux de travail intensifs en outils et à la génération de code.
Effort low : Pour les charges de travail à volume élevé ou sensibles à la latence. Adapté aux cas d'usage de chat et hors programmation où un délai de réponse plus rapide est prioritaire.
Effort high : Pour le raisonnement complexe et les tâches où la qualité prime sur la vitesse ou le coût.
Effort max : Pour les tâches nécessitant la capacité maximale absolue sans contrainte sur la dépense de tokens.

Niveaux d'effort recommandés pour Claude Opus 4.7

La valeur par défaut de l'API est high. Pour utiliser xhigh, définissez effort explicitement ; la valeur que vous passez remplace la valeur par défaut.

Effort	Recommandations pour Claude Opus 4.7
`low`	Efficace, mais idéal pour les tâches courtes et bien délimitées. Associez `low` à des listes de contrôle explicites si votre tâche comporte plusieurs sections.
`medium`	Le choix par défaut pour le flux de travail moyen où vous souhaitez de bons résultats tout en réduisant les coûts.
`high`	Cas d'usage avancés qui nécessitent tout de même un équilibre entre intelligence et consommation de tokens. C'est souvent le point idéal équilibrant qualité et efficacité en tokens.
`xhigh`	Le point de départ recommandé pour le travail de programmation et agentique, ainsi que pour les tâches exploratoires comme les appels d'outils répétés, la recherche web détaillée et la recherche dans des bases de connaissances. Attendez-vous à une utilisation de tokens nettement plus élevée qu'avec `high`.
`max`	À réserver aux problèmes véritablement à la frontière des capacités. Sur la plupart des charges de travail, `max` ajoute un coût significatif pour des gains de qualité relativement faibles, et sur certaines tâches à sortie structurée ou moins sensibles à l'intelligence, il peut conduire à une sur-réflexion.

Niveaux d'effort recommandés pour Claude Opus 4.8

La valeur par défaut de l'API est high. Définissez effort explicitement pour utiliser un niveau différent ; la valeur que vous passez remplace la valeur par défaut.

Niveaux d'effort recommandés pour Claude Fable 5

Utilisation de base

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)

Quand ajuster le paramètre effort

Utilisez l'effort max lorsque vous avez besoin de la capacité maximale absolue sans contrainte : le raisonnement le plus exhaustif et l'analyse la plus approfondie. Disponible sur Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5 et Claude Sonnet 4.6.
Utilisez l'effort xhigh pour la programmation avancée et le travail agentique complexe nécessitant une exploration étendue, comme les appels d'outils répétés et la recherche détaillée. Disponible sur Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7 et Claude Sonnet 5.
Utilisez l'effort high (la valeur par défaut) pour le raisonnement complexe, l'analyse nuancée, les problèmes de programmation difficiles ou toute tâche où la qualité prime sur la vitesse ou le coût.
Utilisez l'effort medium comme option équilibrée lorsque vous souhaitez une performance solide sans la dépense complète de tokens de l'effort high.
Utilisez l'effort low lorsque vous optimisez la vitesse (car Claude répond avec moins de tokens) ou le coût. Par exemple, pour des tâches de classification simples, des recherches rapides ou des cas d'usage à volume élevé où les améliorations marginales de qualité ne justifient pas une latence ou une dépense supplémentaire.

Effort avec l'utilisation d'outils

Combiner plusieurs opérations en moins d'appels d'outils
Effectuer moins d'appels d'outils
Passer directement à l'action sans préambule
Utiliser des messages de confirmation concis après l'achèvement

Les niveaux d'effort supérieurs peuvent :

Effectuer plus d'appels d'outils
Expliquer le plan avant de passer à l'action
Fournir des résumés détaillés des modifications
Inclure des commentaires de code plus complets

Effort avec la réflexion étendue

Le paramètre effort fonctionne conjointement avec la réflexion étendue. Son comportement dépend du modèle :

Claude Fable 5 et Claude Mythos 5 utilisent la réflexion adaptative, qui est toujours activée (aucune configuration thinking requise). thinking: {type: "disabled"} est rejeté. L'effort contrôle la profondeur de réflexion de la même manière que sur Opus 4.8 et Opus 4.7.
Claude Opus 4.8 utilise la réflexion adaptative (thinking: {type: "adaptive"}), où l'effort est le contrôle recommandé pour la profondeur de réflexion. La réflexion étendue manuelle (thinking: {type: "enabled", budget_tokens: N}) n'est pas prise en charge et renvoie une erreur 400. Le modèle décide quand et combien réfléchir en fonction de chaque requête, il ne déclenche donc la réflexion que lorsque nécessaire. Aux niveaux d'effort high, xhigh et max, Claude réfléchit presque toujours en profondeur. Aux niveaux inférieurs, il peut ignorer la réflexion pour les problèmes plus simples. Définissez thinking: {type: "adaptive"} pour activer la réflexion ; sans cela, les requêtes s'exécutent sans réflexion.
Claude Mythos Preview utilise la réflexion adaptative par défaut (aucune configuration thinking requise). thinking: {type: "disabled"} est rejeté. L'effort contrôle la profondeur de réflexion de la même manière que sur Opus 4.7 et Opus 4.6.
Claude Opus 4.7 utilise la réflexion adaptative (thinking: {type: "adaptive"}), où l'effort est le contrôle recommandé pour la profondeur de réflexion. La réflexion étendue manuelle (thinking: {type: "enabled", budget_tokens: N}) n'est plus prise en charge sur Opus 4.7 ; utilisez plutôt la réflexion adaptative avec effort. Aux niveaux d'effort high, xhigh et max, Claude réfléchit presque toujours en profondeur. Aux niveaux inférieurs, il peut ignorer la réflexion pour les problèmes plus simples.
Claude Opus 4.6 utilise la réflexion adaptative (thinking: {type: "adaptive"}), où l'effort est le contrôle recommandé pour la profondeur de réflexion. Bien que budget_tokens soit toujours accepté sur Opus 4.6, il est déprécié et sera supprimé dans une future version. Aux niveaux d'effort high et max, Claude réfléchit presque toujours en profondeur. Aux niveaux inférieurs, il peut ignorer la réflexion pour les problèmes plus simples.
Claude Sonnet 5 utilise la réflexion adaptative, qui est activée par défaut (aucune configuration thinking requise), et l'effort est le contrôle recommandé pour la profondeur de réflexion. La réflexion étendue manuelle (thinking: {type: "enabled", budget_tokens: N}) n'est pas prise en charge et renvoie une erreur 400. Passez thinking: {type: "disabled"} pour désactiver la réflexion. Aux niveaux d'effort high (par défaut), xhigh et max, Claude réfléchit presque toujours en profondeur. Aux niveaux inférieurs, il peut ignorer la réflexion pour les problèmes plus simples.
Claude Sonnet 4.6 utilise la réflexion adaptative (où l'effort contrôle la profondeur de réflexion). La réflexion manuelle avec le mode entrelacé (thinking: {type: "enabled", budget_tokens: N}) est toujours fonctionnelle mais dépréciée.
Claude Opus 4.5 utilise la réflexion manuelle (thinking: {type: "enabled", budget_tokens: N}), où l'effort fonctionne conjointement avec le budget de tokens de réflexion. Définissez le niveau d'effort pour votre tâche, puis définissez le budget de tokens de réflexion en fonction de la complexité de la tâche.

Bonnes pratiques

Définissez l'effort explicitement : L'API utilise high par défaut, mais le bon point de départ dépend de votre modèle et de votre charge de travail.
Utilisez low pour les tâches sensibles à la vitesse ou simples : Lorsque la latence est importante ou que les tâches sont simples, un effort faible peut réduire considérablement les temps de réponse et les coûts.
Testez votre cas d'usage : L'impact des niveaux d'effort varie selon le type de tâche. Évaluez les performances sur vos cas d'usage spécifiques avant le déploiement.
Envisagez un effort dynamique : Ajustez l'effort en fonction de la complexité de la tâche. Les requêtes simples peuvent justifier un effort faible tandis que la programmation agentique et le raisonnement complexe bénéficient d'un effort élevé.

Étapes suivantes

Budgets de tâche

Donnez à Claude un budget de tokens indicatif pour la boucle agentique complète afin d'aider le modèle à s'autoréguler sur les tâches agentiques longues.

Réflexion adaptative

Laissez Claude déterminer dynamiquement quand et dans quelle mesure utiliser la réflexion étendue avec le mode de réflexion adaptative.

Développer avec la réflexion étendue

Offrez à Claude un raisonnement amélioré pour les tâches complexes avec des budgets de réflexion manuels, l'utilisation d'outils et la mise en cache des prompts.

Was this page helpful?

Fonctionnement du paramètre effort

Niveaux d'effort

Niveaux d'effort recommandés pour Claude Sonnet 5

Niveaux d'effort recommandés pour Sonnet 4.6

Niveaux d'effort recommandés pour Claude Opus 4.7

Niveaux d'effort recommandés pour Claude Opus 4.8

Niveaux d'effort recommandés pour Claude Fable 5

Utilisation de base

Quand ajuster le paramètre effort

Effort avec l'utilisation d'outils

Effort avec la réflexion étendue

Bonnes pratiques

Étapes suivantes

Fonctionnement du paramètre effort

Niveaux d'effort

Niveaux d'effort recommandés pour Claude Sonnet 5

Niveaux d'effort recommandés pour Sonnet 4.6

Niveaux d'effort recommandés pour Claude Opus 4.7

Niveaux d'effort recommandés pour Claude Opus 4.8

Niveaux d'effort recommandés pour Claude Fable 5

Utilisation de base

Quand ajuster le paramètre effort

Effort avec l'utilisation d'outils

Effort avec la réflexion étendue

Bonnes pratiques

Étapes suivantes

Fonctionnement du paramètre effort

Niveaux d'effort

Niveaux d'effort recommandés pour Claude Sonnet 5

Niveaux d'effort recommandés pour Sonnet 4.6

Niveaux d'effort recommandés pour Claude Opus 4.7

Niveaux d'effort recommandés pour Claude Opus 4.8

Niveaux d'effort recommandés pour Claude Fable 5

Utilisation de base

Quand ajuster le paramètre effort

Effort avec l'utilisation d'outils

Effort avec la réflexion étendue

Bonnes pratiques

Étapes suivantes

Fonctionnement du paramètre effort

Niveaux d'effort

Niveaux d'effort recommandés pour Claude Sonnet 5

Niveaux d'effort recommandés pour Sonnet 4.6

Niveaux d'effort recommandés pour Claude Opus 4.7

Niveaux d'effort recommandés pour Claude Opus 4.8

Niveaux d'effort recommandés pour Claude Fable 5

Utilisation de base

Quand ajuster le paramètre effort

Effort avec l'utilisation d'outils

Effort avec la réflexion étendue

Bonnes pratiques

Étapes suivantes