Loading...
  • Construire
  • Admin
  • Modèles & tarification
  • SDKs clients
  • Référence API
Search...
⌘K
Log in
Effort
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Construire/Capacités du modèle

Effort

Contrôlez le nombre de tokens que Claude utilise lors de la réponse avec le paramètre effort, en trouvant un équilibre entre la complétude de la réponse et l'efficacité des tokens.

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Le paramètre effort vous permet de contrôler la propension de Claude à dépenser des tokens lors de la réponse aux demandes. Cela vous donne la possibilité de trouver un équilibre entre la complétude de la réponse et l'efficacité des tokens, le tout avec un seul modèle. Le paramètre effort est généralement disponible sur tous les modèles supportés sans en-tête bêta requis.

Le paramètre effort est supporté par Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6, et Claude Opus 4.5.

Pour Claude Opus 4.6 et Sonnet 4.6, effort remplace budget_tokens comme méthode recommandée pour contrôler la profondeur de la réflexion. Combinez effort avec adaptive thinking (thinking: {type: "adaptive"}) pour la meilleure expérience. Bien que budget_tokens soit toujours accepté sur Opus 4.6 et Sonnet 4.6, il est déprécié et sera supprimé dans une future version du modèle. À effort high (par défaut) et max, Claude pensera presque toujours. À des niveaux d'effort inférieur, il peut ignorer la réflexion pour les problèmes plus simples.

Comment fonctionne l'effort

Par défaut, Claude utilise un effort élevé, dépensant autant de tokens que nécessaire pour d'excellents résultats. Vous pouvez augmenter le niveau d'effort à max pour la capacité absolue la plus élevée, ou le réduire pour être plus conservateur avec l'utilisation des tokens, en optimisant pour la vitesse et le coût tout en acceptant une certaine réduction de capacité.

Définir effort à "high" produit exactement le même comportement que d'omettre entièrement le paramètre effort.

Le paramètre effort affecte tous les tokens dans la réponse, y compris :

  • Les réponses textuelles et les explications
  • Les appels d'outils et les arguments de fonction
  • La réflexion étendue (lorsqu'elle est activée)

Cette approche présente deux avantages majeurs :

  1. Elle ne nécessite pas que la réflexion soit activée pour l'utiliser.
  2. Elle peut affecter toute la dépense de tokens, y compris les appels d'outils. Par exemple, un effort inférieur signifierait que Claude fait moins d'appels d'outils. Cela donne un degré de contrôle beaucoup plus grand sur l'efficacité.

Niveaux d'effort

NiveauDescriptionCas d'usage typique
maxCapacité absolue maximale sans contraintes sur la dépense de tokens. Disponible sur Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, et Claude Sonnet 4.6.Tâches nécessitant le raisonnement le plus profond possible et l'analyse la plus complète
xhighCapacité étendue pour les travaux à long terme. Disponible sur Claude Opus 4.7.Tâches de codage et agentic longues (plus de 30 minutes) avec des budgets de tokens en millions
highCapacité élevée. Équivalent à ne pas définir le paramètre.Raisonnement complexe, problèmes de codage difficiles, tâches agentic
mediumApproche équilibrée avec des économies de tokens modérées.Tâches agentic qui nécessitent un équilibre entre la vitesse, le coût et les performances
lowPlus efficace. Économies de tokens significatives avec une certaine réduction de capacité.Tâches plus simples qui ont besoin de la meilleure vitesse et des coûts les plus bas, comme les sous-agents

L'effort est un signal comportemental, pas un budget de tokens strict. À des niveaux d'effort inférieur, Claude pensera toujours sur les problèmes suffisamment difficiles, mais il pensera moins qu'il ne le ferait à des niveaux d'effort supérieur pour le même problème.

Niveaux d'effort recommandés pour Sonnet 4.6

Sonnet 4.6 utilise par défaut un effort high. Définissez explicitement l'effort lors de l'utilisation de Sonnet 4.6 pour éviter une latence inattendue :

  • Effort moyen (par défaut recommandé) : Meilleur équilibre entre la vitesse, le coût et les performances pour la plupart des applications. Convient au codage agentic, aux flux de travail lourds en outils et à la génération de code.
  • Effort faible : Pour les charges de travail à haut volume ou sensibles à la latence. Convient au chat et aux cas d'usage non-codage où un délai d'exécution plus rapide est prioritaire.
  • Effort élevé : Pour les tâches nécessitant l'intelligence maximale de Sonnet 4.6.
  • Effort maximal : Pour les tâches nécessitant la capacité absolue la plus élevée sans contraintes sur la dépense de tokens.

Niveaux d'effort recommandés pour Claude Opus 4.7

Commencez par xhigh pour les cas d'usage de codage et agentic, et utilisez high comme minimum pour la plupart des charges de travail sensibles à l'intelligence. Réduisez à medium pour les charges de travail sensibles aux coûts, ou augmentez à max uniquement lorsque vos évaluations montrent une marge de manœuvre mesurable à xhigh.

La valeur par défaut de l'API est high. Pour utiliser xhigh, définissez effort explicitement ; la valeur que vous transmettez remplace la valeur par défaut.

EffortConseils pour Claude Opus 4.7
lowEfficace, mais meilleur pour les tâches courtes et délimitées. Associez low à des listes de contrôle explicites si votre tâche a plusieurs sections.
mediumLe remplacement pour le flux de travail moyen où vous voulez de bons résultats tout en réduisant les coûts.
highCas d'usage avancés qui ont toujours besoin d'un équilibre entre l'intelligence et la consommation de tokens. C'est souvent le point idéal équilibrant la qualité et l'efficacité des tokens.
xhighLe point de départ recommandé pour le codage et le travail agentic, et pour les tâches exploratoires telles que les appels d'outils répétés, la recherche Web détaillée et la recherche de base de connaissances. Attendez-vous à une utilisation de tokens significativement plus élevée que high.
maxRéservé aux problèmes véritablement frontière. Sur la plupart des charges de travail, max ajoute un coût significatif pour des gains de qualité relativement petits, et sur certaines tâches de sortie structurée ou moins sensibles à l'intelligence, cela peut conduire à une surréflexion.

Claude Opus 4.7 respecte également les niveaux d'effort plus strictement que Claude Opus 4.6, en particulier à low et medium. À des niveaux d'effort inférieur, le modèle limite son travail à ce qui a été demandé plutôt que d'aller au-delà. Si vous observez un raisonnement superficiel sur des problèmes complexes avec Claude Opus 4.7, augmentez l'effort plutôt que de contourner le problème avec des invites. Si vous devez maintenir l'effort faible pour la latence, ajoutez des conseils ciblés comme « Cette tâche implique un raisonnement multi-étapes. Réfléchissez attentivement avant de répondre. »

Lors de l'exécution de Claude Opus 4.7 à effort xhigh ou max, définissez un grand max_tokens pour que le modèle ait de la place pour penser et agir sur les sous-agents et les appels d'outils. Commencer à 64k tokens et ajuster à partir de là est une valeur par défaut raisonnable.

Utilisation de base

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)

Quand ajuster le paramètre effort

  • Utilisez effort maximal lorsque vous avez besoin de la capacité absolue la plus élevée sans contraintes : le raisonnement le plus complet et l'analyse la plus profonde. Disponible sur Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, et Claude Sonnet 4.6.
  • Utilisez effort xhigh pour le codage avancé et le travail agentic complexe nécessitant une exploration étendue, comme les appels d'outils répétés et la recherche détaillée. Disponible sur Claude Opus 4.7.
  • Utilisez effort élevé (la valeur par défaut) lorsque vous avez besoin du meilleur travail de Claude : raisonnement complexe, analyse nuancée, problèmes de codage difficiles, ou toute tâche où la qualité est la priorité absolue.
  • Utilisez effort moyen comme option équilibrée lorsque vous voulez une performance solide sans la dépense complète de tokens de l'effort élevé.
  • Utilisez effort faible lorsque vous optimisez pour la vitesse (parce que Claude répond avec moins de tokens) ou le coût. Par exemple, les tâches de classification simples, les recherches rapides, ou les cas d'usage à haut volume où les améliorations marginales de qualité ne justifient pas une latence ou une dépense supplémentaire.

Effort avec l'utilisation d'outils

Lors de l'utilisation d'outils, le paramètre effort affecte à la fois les explications autour des appels d'outils et les appels d'outils eux-mêmes. Les niveaux d'effort inférieur tendent à :

  • Combiner plusieurs opérations en moins d'appels d'outils
  • Faire moins d'appels d'outils
  • Procéder directement à l'action sans préambule
  • Utiliser des messages de confirmation tersifiés après l'achèvement

Les niveaux d'effort supérieur peuvent :

  • Faire plus d'appels d'outils
  • Expliquer le plan avant de prendre des mesures
  • Fournir des résumés détaillés des modifications
  • Inclure des commentaires de code plus complets

Effort avec la réflexion étendue

Le paramètre effort fonctionne aux côtés de la réflexion étendue. Son comportement dépend du modèle :

  • Claude Mythos Preview utilise adaptive thinking par défaut (aucune configuration thinking requise). thinking: {type: "disabled"} est rejeté. L'effort contrôle la profondeur de la réflexion de la même manière que sur Opus 4.7 et Opus 4.6.
  • Claude Opus 4.7 utilise adaptive thinking (thinking: {type: "adaptive"}), où l'effort est le contrôle recommandé pour la profondeur de la réflexion. La réflexion étendue manuelle (thinking: {type: "enabled", budget_tokens: N}) n'est plus supportée sur Opus 4.7 ; utilisez plutôt la réflexion adaptative avec l'effort. À effort high, xhigh, et max, Claude pense presque toujours profondément. À des niveaux inférieur, il peut ignorer la réflexion pour les problèmes plus simples.
  • Claude Opus 4.6 utilise adaptive thinking (thinking: {type: "adaptive"}), où l'effort est le contrôle recommandé pour la profondeur de la réflexion. Bien que budget_tokens soit toujours accepté sur Opus 4.6, il est déprécié et sera supprimé dans une future version. À effort high et max, Claude pense presque toujours profondément. À des niveaux inférieur, il peut ignorer la réflexion pour les problèmes plus simples.
  • Claude Sonnet 4.6 utilise adaptive thinking (où l'effort contrôle la profondeur de la réflexion). La réflexion manuelle avec mode entrelacé (thinking: {type: "enabled", budget_tokens: N}) est toujours fonctionnelle mais dépréciée.
  • Claude Opus 4.5 et autres modèles Claude 4 utilisent la réflexion manuelle (thinking: {type: "enabled", budget_tokens: N}), où l'effort fonctionne aux côtés du budget de tokens de réflexion. Définissez le niveau d'effort pour votre tâche, puis définissez le budget de tokens de réflexion en fonction de la complexité de la tâche.

Le paramètre effort peut être utilisé avec ou sans réflexion étendue activée. Lorsqu'il est utilisé sans réflexion, il contrôle toujours la dépense globale de tokens pour les réponses textuelles et les appels d'outils.

Meilleures pratiques

  1. Définissez l'effort explicitement : L'API utilise par défaut high, mais le point de départ correct dépend de votre modèle et de votre charge de travail.
  2. Utilisez low pour les tâches sensibles à la vitesse ou simples : Lorsque la latence est importante ou que les tâches sont simples, un effort faible peut réduire considérablement les temps de réponse et les coûts.
  3. Testez votre cas d'usage : L'impact des niveaux d'effort varie selon le type de tâche. Évaluez les performances sur vos cas d'usage spécifiques avant de déployer.
  4. Envisagez un effort dynamique : Ajustez l'effort en fonction de la complexité de la tâche. Les requêtes simples peuvent justifier un effort faible tandis que le codage agentic et le raisonnement complexe bénéficient d'un effort élevé.

Was this page helpful?

  • Comment fonctionne l'effort
  • Niveaux d'effort
  • Niveaux d'effort recommandés pour Sonnet 4.6
  • Niveaux d'effort recommandés pour Claude Opus 4.7
  • Utilisation de base
  • Quand ajuster le paramètre effort
  • Effort avec l'utilisation d'outils
  • Effort avec la réflexion étendue
  • Meilleures pratiques