Loading...
    0
    • Guide du développeur
    • Référence API
    • MCP
    • Ressources
    • Notes de version
    Search...
    ⌘K
    Premiers pas
    Introduction à ClaudeDémarrage rapide
    Modèles et tarification
    Aperçu des modèlesChoisir un modèleNouveautés dans Claude 4.5Migration vers Claude 4.5Dépréciations de modèlesTarification
    Créer avec Claude
    Aperçu des fonctionnalitésUtiliser l'API MessagesFenêtres de contexteBonnes pratiques de prompting
    Capacités
    Mise en cache des promptsÉdition de contexteRéflexion étendueEffortStreaming de messagesTraitement par lotsCitationsSupport multilingueComptage de tokensEmbeddingsVisionSupport PDFAPI FilesRésultats de rechercheSorties structuréesComplément Google Sheets
    Outils
    AperçuComment implémenter l'utilisation d'outilsUtilisation d'outils efficace en tokensStreaming d'outils granulaireOutil BashOutil d'exécution de codeAppel d'outils programmatiqueOutil Computer useOutil Éditeur de texteOutil Web fetchOutil Recherche webOutil MémoireOutil Recherche d'outils
    Compétences d'agent
    AperçuDémarrage rapideBonnes pratiquesUtiliser les compétences avec l'API
    SDK Agent
    AperçuSDK TypeScriptSDK PythonGuide de migration
    Guides
    Streaming d'entréeGestion des permissionsGestion de sessionSorties structurées dans le SDKHébergement du SDK AgentModification des prompts systèmeMCP dans le SDKOutils personnalisésSous-agents dans le SDKCommandes slash dans le SDKCompétences d'agent dans le SDKSuivi des coûts et de l'utilisationListes de tâchesPlugins dans le SDK
    MCP dans l'API
    Connecteur MCPServeurs MCP distants
    Claude sur des plateformes tierces
    Amazon BedrockMicrosoft FoundryVertex AI
    Ingénierie des prompts
    AperçuGénérateur de promptsUtiliser des modèles de promptsAméliorateur de promptsÊtre clair et directUtiliser des exemples (prompting multi-shots)Laisser Claude réfléchir (CoT)Utiliser des balises XMLDonner un rôle à Claude (prompts système)Pré-remplir la réponse de ClaudeChaîner des prompts complexesConseils pour le contexte longConseils pour la réflexion étendue
    Tester et évaluer
    Définir les critères de succèsDévelopper des cas de testUtiliser l'outil d'évaluationRéduire la latence
    Renforcer les garde-fous
    Réduire les hallucinationsAugmenter la cohérence des résultatsAtténuer les jailbreaksRefus en streamingRéduire les fuites de promptsGarder Claude dans le rôle
    Administration et surveillance
    Aperçu de l'API AdminAPI Utilisation et coûtsAPI Claude Code Analytics
    Console
    Capacités

    Effort

    Contrôlez le nombre de jetons que Claude utilise lors de la réponse avec le paramètre effort, en trouvant un équilibre entre la complétude de la réponse et l'efficacité des jetons.

    Le paramètre effort vous permet de contrôler l'empressement de Claude à dépenser des jetons lors de la réponse aux demandes. Cela vous donne la possibilité de trouver un équilibre entre la complétude de la réponse et l'efficacité des jetons, tout avec un seul modèle.

    Le paramètre effort est actuellement en bêta et n'est pris en charge que par Claude Opus 4.5.

    Vous devez inclure l'en-tête bêta effort-2025-11-24 lors de l'utilisation de cette fonctionnalité.

    Comment fonctionne l'effort

    Par défaut, Claude utilise un effort maximal, en dépensant autant de jetons que nécessaire pour fournir des réponses complètes. En réduisant le niveau d'effort, vous pouvez demander à Claude d'être plus conservateur avec l'utilisation des jetons, en traitant les jetons comme une ressource plus coûteuse.

    Définir effort à "high" produit exactement le même comportement que d'omettre entièrement le paramètre effort.

    Le paramètre effort affecte tous les jetons dans la réponse, y compris :

    • Les réponses textuelles et les explications
    • Les appels d'outils et les arguments de fonction
    • La réflexion étendue (si activée)

    Niveaux d'effort

    NiveauDescriptionCas d'utilisation typique
    highComplétude maximale—Claude utilise autant de jetons que nécessaire. Équivalent à ne pas définir le paramètre.Analyse complexe, explications détaillées, contenu éducatif
    mediumApproche équilibrée avec des économies de jetons modérées.La plupart des cas d'utilisation en production, applications conscientes des coûts
    lowRéponses les plus efficaces en jetons.Automatisation à haut volume, requêtes simples, lorsque les réponses sont traitées par programmation

    Utilisation de base

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.beta.messages.create(
        model="claude-opus-4-5-20251101",
        betas=["effort-2025-11-24"],
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    Comportement selon le niveau d'effort

    Le paramètre effort contrôle principalement la verbosité de la sortie et la profondeur des explications, pas la correction de la réponse. Claude effectue un raisonnement interne similaire quel que soit le niveau d'effort, mais ajuste la quantité de ce raisonnement qui apparaît dans la sortie.

    Réponses à faible effort

    • Réponse énoncée directement avec une explication minimale
    • Réponses concises et efficaces (1-2 phrases de contexte)
    • Formules affichées mais non dérivées
    • Suppose que le lecteur peut vérifier la réponse
    • Confirmations laconiques pour l'utilisation d'outils (« Fait. », « Corrigé. »)

    Réponses à effort moyen

    • Contexte bref avant la réponse
    • Justification concise avec les étapes intermédiaires clés
    • Peut inclure un exemple travaillé
    • Toujours axé sur l'efficacité

    Réponses à effort élevé

    • Structuré avec des en-têtes de section
    • Configuration du problème et définitions des variables
    • Processus de solution étape par étape
    • Vérification et contrôles de cohérence
    • Formatage riche en markdown

    Cas d'utilisation

    Quand utiliser un effort faible

    • Optimisation de la vitesse : Les nombres de jetons inférieurs signifient des temps de réponse plus rapides, bénéfiques pour les applications sensibles à la latence
    • Pipelines automatisés : Lorsque les réponses sont traitées par du code plutôt que lues par des humains
    • Applications à haut volume : Réduisez les coûts sur les requêtes simples et routinières
    • Utilisateurs expérimentés : Lorsque les utilisateurs n'ont pas besoin d'explications détaillées
    • Confirmations rapides : Réponses simples oui/non ou de statut

    Quand utiliser un effort moyen

    • API de production : Équilibre entre la clarté et l'efficacité des coûts
    • Applications orientées utilisateur : Suffisamment de contexte sans verbosité excessive
    • Déploiements conscients des coûts : Économies significatives avec un impact minimal sur la qualité

    Quand utiliser un effort élevé (ou aucun paramètre d'effort)

    • Analyse complexe : Lorsque la complétude est critique
    • Contenu éducatif : Lorsque les utilisateurs ont besoin de comprendre le raisonnement
    • Documentation : Lorsque les réponses servent de matériel de référence
    • Débogage : Lorsque les explications détaillées aident à identifier les problèmes

    Effort avec l'utilisation d'outils

    Lors de l'utilisation d'outils, le paramètre effort affecte à la fois les explications autour des appels d'outils et les appels d'outils eux-mêmes. Les niveaux d'effort inférieurs ont tendance à :

    • Combiner plusieurs opérations en moins d'appels d'outils
    • Procéder directement à l'action sans préambule
    • Utiliser des messages de confirmation laconiques après l'achèvement

    Les niveaux d'effort supérieurs peuvent :

    • Expliquer le plan avant d'agir
    • Fournir des résumés détaillés des modifications
    • Inclure des commentaires de code plus complets

    Effort avec la réflexion étendue

    Le paramètre effort fonctionne aux côtés du budget de jetons de réflexion lorsque la réflexion étendue est activée. Ces deux contrôles servent des objectifs différents :

    • Paramètre effort : Contrôle la façon dont Claude dépense tous les jetons—y compris les jetons de réflexion, les réponses textuelles et les appels d'outils
    • Budget de jetons de réflexion : Définit une limite maximale sur les jetons de réflexion spécifiquement

    Le paramètre effort peut être utilisé avec ou sans réflexion étendue activée. Lorsque les deux sont configurés :

    1. Déterminez d'abord le niveau d'effort approprié pour votre tâche
    2. Ensuite, définissez le budget de jetons de réflexion en fonction de la complexité de la tâche

    Pour les meilleures performances sur les tâches de raisonnement complexe, utilisez un effort élevé (la valeur par défaut) avec un budget de jetons de réflexion élevé. Cela permet à Claude de réfléchir en profondeur et de fournir des réponses complètes.

    Meilleures pratiques

    1. Commencez par le moyen : Pour la plupart des applications, un effort moyen offre un bon équilibre entre la qualité et l'efficacité.

    2. Utilisez un effort faible pour l'automatisation : Lorsque les réponses sont consommées par du code plutôt que par des humains, un effort faible peut réduire considérablement les coûts sans affecter la correction.

    3. Testez votre cas d'utilisation : L'impact des niveaux d'effort varie selon le type de tâche. Évaluez les performances sur vos cas d'utilisation spécifiques avant de déployer.

    4. Surveillez la qualité : Bien que la correction soit généralement préservée entre les niveaux d'effort, la qualité des explications varie. Assurez-vous que le niveau que vous choisissez répond aux besoins de vos utilisateurs.

    5. Envisagez un effort dynamique : Ajustez l'effort en fonction de la complexité de la tâche ou de la préférence de l'utilisateur. Les requêtes simples peuvent justifier un effort faible tandis que l'analyse complexe bénéficie d'un effort élevé.

    • Comment fonctionne l'effort
    • Niveaux d'effort
    • Utilisation de base
    • Comportement selon le niveau d'effort
    • Réponses à faible effort
    • Réponses à effort moyen
    • Réponses à effort élevé
    • Cas d'utilisation
    • Quand utiliser un effort faible
    • Quand utiliser un effort moyen
    • Quand utiliser un effort élevé (ou aucun paramètre d'effort)
    • Effort avec l'utilisation d'outils
    • Effort avec la réflexion étendue
    • Meilleures pratiques

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy