Loading...
    • Créer
    • Admin
    • Modèles et tarification
    • SDK clients
    • Référence API
    Search...
    ⌘K
    Premiers pas
    Introduction à ClaudeDémarrage rapide
    Créer avec Claude
    Aperçu des fonctionnalitésUtiliser l'API MessagesCompétence Claude APIGérer les raisons d'arrêt
    Capacités du modèle
    Extended thinkingAdaptive thinkingEffortBudgets de tâches (bêta)Mode rapide (bêta : aperçu de recherche)Sorties structuréesCitationsMessages en continuTraitement par lotsRésultats de rechercheRefus en continuSupport multilingueEmbeddings
    Outils
    AperçuFonctionnement de l'utilisation des outilsOutil de recherche webOutil de récupération webOutil d'exécution de codeOutil AdvisorOutil MemoryOutil BashOutil Computer useOutil Éditeur de texte
    Infrastructure des outils
    Référence des outilsRecherche d'outilsAppel programmatique des outilsStreaming granulaire des outils
    Gestion du contexte
    Fenêtres de contexteCompactionÉdition du contexteMise en cache des invitesComptage des tokens
    Travailler avec des fichiers
    API FilesSupport PDFImages et vision
    Compétences
    AperçuDémarrage rapideMeilleures pratiquesCompétences pour l'entrepriseCompétences dans l'API
    MCP
    Serveurs MCP distantsConnecteur MCP
    Ingénierie des invites
    AperçuMeilleures pratiques d'invitesOutils d'invites Console
    Tester et évaluer
    Définir le succès et créer des évaluationsUtiliser l'outil d'évaluation dans ConsoleRéduire la latence
    Renforcer les garde-fous
    Réduire les hallucinationsAugmenter la cohérence des résultatsAtténuer les jailbreaksRéduire les fuites d'invites
    Ressources
    Glossaire
    Notes de version
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Ingénierie des invites

    Meilleures pratiques de prompting

    Guide complet des techniques d'ingénierie des prompts pour les derniers modèles de Claude, couvrant la clarté, les exemples, la structuration XML, la réflexion et les systèmes agentiques.

    Was this page helpful?

    • Prompting Claude Opus 4.7
    • Longueur des réponses et verbosité
    • Calibrage de l'effort et de la profondeur de réflexion
    • Déclenchement de l'utilisation d'outils
    • Mises à jour de progression visibles par l'utilisateur
    • Suivi d'instructions plus littéral
    • Ton et style d'écriture
    • Contrôle de la génération de sous-agents
    • Valeurs par défaut de conception et frontend
    • Produits de codage interactifs
    • Harnais d'examen de code
    • Utilisation d'ordinateur
    • Principes généraux
    • Soyez clair et direct
    • Ajoutez du contexte pour améliorer les performances
    • Utilisez les exemples efficacement
    • Structurez les prompts avec des balises XML
    • Donnez un rôle à Claude
    • Prompting avec contexte long
    • Connaissance de soi du modèle
    • Sortie et formatage
    • Style de communication et verbosité
    • Contrôlez le format des réponses
    • Sortie LaTeX
    • Création de documents
    • Migration loin des réponses préremplies
    • Utilisation d'outils
    • Utilisation d'outils
    • Optimiser l'appel parallèle d'outils
    • Réflexion et raisonnement
    • Surréflexion et exhaustivité excessive
    • Exploiter les capacités de réflexion et de réflexion entrelacée
    • Systèmes d'agent
    • Raisonnement à long terme et suivi d'état
    • Équilibrer l'autonomie et la sécurité
    • Recherche et collecte d'informations
    • Orchestration de sous-agents
    • Chaîner les invites complexes
    • Réduire la création de fichiers dans le codage d'agent
    • Surempressement
    • Éviter de se concentrer sur la réussite des tests et le codage en dur
    • Minimiser les hallucinations dans le codage d'agent
    • Conseils spécifiques aux capacités
    • Capacités de vision améliorées
    • Conception d'interface
    • Considérations de migration
    • Migration de Claude Sonnet 4.5 vers Claude Sonnet 4.6

    Ceci est la référence unique pour l'ingénierie des prompts avec les derniers modèles de Claude, y compris Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 et Claude Haiku 4.5. Elle couvre les techniques fondamentales, le contrôle des résultats, l'utilisation d'outils, la réflexion et les systèmes agentiques. Accédez à la section qui correspond à votre situation.

    Pour un aperçu des capacités des modèles, consultez la vue d'ensemble des modèles. Pour plus de détails sur les nouveautés de Claude Opus 4.7, consultez Nouveautés de Claude Opus 4.7. Pour des conseils de migration, consultez le guide de migration.

    Prompting Claude Opus 4.7

    Claude Opus 4.7 est notre modèle le plus capable disponible en général, avec des forces particulières dans les travaux agentiques à long terme, les travaux de connaissance, la vision et les tâches de mémoire. Il fonctionne bien directement sur les prompts existants de Claude Opus 4.6. Les modèles ci-dessous couvrent les comportements qui nécessitent le plus souvent un ajustement.

    Pour les modifications des paramètres API lors de la migration de Claude Opus 4.6 (niveaux d'effort, budgets de tâches, configuration de la réflexion, suppression des paramètres d'échantillonnage et tokenization), consultez le guide de migration.

    Longueur des réponses et verbosité

    Claude Opus 4.7 calibre la longueur des réponses en fonction de la complexité qu'il juge de la tâche, plutôt que de se conformer à une verbosité fixe. Cela signifie généralement des réponses plus courtes sur les recherches simples et beaucoup plus longues sur l'analyse ouverte.

    Si votre produit dépend d'un certain style ou d'une certaine verbosité de sortie, vous devrez peut-être ajuster vos prompts. Par exemple, pour diminuer la verbosité, vous pourriez ajouter :

    Fournissez des réponses concises et ciblées. Ignorez le contexte non essentiel et gardez les exemples minimes.

    Si vous voyez des exemples spécifiques de types de verbosité (c'est-à-dire sur-explication), vous pouvez ajouter des instructions supplémentaires dans votre prompt pour les prévenir. Les exemples positifs montrant comment Claude peut communiquer avec le niveau de concision approprié ont tendance à être plus efficaces que les exemples négatifs ou les instructions qui disent au modèle ce qu'il ne faut pas faire.

    Calibrage de l'effort et de la profondeur de réflexion

    Le paramètre d'effort vous permet d'ajuster l'intelligence de Claude par rapport aux dépenses en tokens, en échangeant la capacité pour une vitesse plus rapide et des coûts plus bas. Commencez par le nouveau niveau d'effort xhigh pour les cas d'usage de codage et agentiques, et utilisez un minimum d'effort high pour la plupart des cas d'usage sensibles à l'intelligence. Expérimentez avec d'autres niveaux d'effort pour affiner davantage l'utilisation des tokens et l'intelligence :

    • max : L'effort maximal peut offrir des gains de performance dans certains cas d'usage, mais peut montrer des rendements décroissants à partir de l'augmentation de l'utilisation des tokens. Ce paramètre peut aussi parfois être sujet à la sur-réflexion. Nous recommandons de tester l'effort maximal pour les tâches exigeant une intelligence élevée.
    • xhigh (nouveau) : L'effort très élevé est le meilleur paramètre pour la plupart des cas d'usage de codage et agentiques.
    • high : Ce paramètre équilibre l'utilisation des tokens et l'intelligence. Pour la plupart des cas d'usage sensibles à l'intelligence, nous recommandons un minimum d'effort high.
    • medium : Bon pour les cas d'usage sensibles aux coûts qui doivent réduire l'utilisation des tokens tout en échangeant l'intelligence.
    • low : Réservé aux tâches courtes et délimitées et aux charges de travail sensibles à la latence qui ne sont pas sensibles à l'intelligence.

    Changeant de manière significative par rapport à Claude Opus 4.6, Claude Opus 4.7 respecte strictement les niveaux d'effort, en particulier à l'extrémité inférieure. À low et medium, le modèle limite son travail à ce qui a été demandé plutôt que d'aller au-delà. C'est bon pour la latence et les coûts, mais sur les tâches modérément complexes s'exécutant à un effort low, il y a un certain risque de sous-réflexion.

    Si vous observez un raisonnement superficiel sur des problèmes complexes, augmentez l'effort à high ou xhigh plutôt que de contourner le problème par le prompting. Si vous devez maintenir l'effort à low pour la latence, ajoutez des conseils ciblés :

    Cette tâche implique un raisonnement multi-étapes. Réfléchissez attentivement au problème avant de répondre.

    Nous nous attendons à ce que l'effort soit plus important pour ce modèle que pour tout Opus antérieur, et nous recommandons d'expérimenter activement avec lui lors de votre mise à niveau.

    Le comportement de déclenchement de la réflexion adaptative est orientable. Si vous trouvez que le modèle réfléchit plus souvent que vous ne le souhaiteriez — ce qui peut se produire avec des prompts système volumineux ou complexes — ajoutez des conseils pour l'orienter. Comme toujours, mesurez l'effet de tout changement de prompting sur les performances. Exemple :

    La réflexion ajoute de la latence et ne doit être utilisée que lorsqu'elle améliorera de manière significative la qualité de la réponse — généralement pour les problèmes qui nécessitent un raisonnement multi-étapes. En cas de doute, répondez directement.

    Inversement, si vous exécutez des charges de travail difficiles à medium et que vous voyez une sous-réflexion, le premier levier est d'augmenter l'effort. Si vous avez besoin d'un contrôle plus fin, demandez-le directement.

    Si vous exécutez Claude Opus 4.7 à un effort max ou xhigh, définissez un grand budget de tokens de sortie maximale afin que le modèle ait de la place pour réfléchir et agir sur ses sous-agents et appels d'outils. Nous recommandons de commencer à 64k tokens et d'ajuster à partir de là.

    Déclenchement de l'utilisation d'outils

    Claude Opus 4.7 a tendance à utiliser les outils moins souvent que Claude Opus 4.6 et à utiliser davantage le raisonnement. Cela produit de meilleurs résultats dans la plupart des cas. Cependant, augmenter le paramètre d'effort est un levier utile pour augmenter le niveau d'utilisation des outils, en particulier dans les travaux de connaissance. Les paramètres d'effort high ou xhigh montrent une utilisation d'outils substantiellement plus importante dans la recherche agentique et le codage. Pour les scénarios où vous souhaitez plus d'utilisation d'outils, vous pouvez également ajuster votre prompt pour instruire explicitement le modèle sur quand et comment utiliser correctement ses outils. Par exemple, si vous trouvez que le modèle n'utilise pas vos outils de recherche web, décrivez clairement pourquoi et comment il devrait.

    Mises à jour de progression visibles par l'utilisateur

    Claude Opus 4.7 fournit des mises à jour plus régulières et de meilleure qualité à l'utilisateur tout au long des longues traces agentiques. Si vous avez ajouté un échafaudage pour forcer les messages de statut intérimaires (« Après tous les 3 appels d'outils, résumez la progression »), essayez de le supprimer. Si vous trouvez que la longueur ou le contenu des mises à jour visibles par l'utilisateur de Claude Opus 4.7 ne sont pas bien calibrés pour votre cas d'usage, décrivez explicitement à quoi ces mises à jour devraient ressembler dans le prompt et fournissez des exemples.

    Suivi d'instructions plus littéral

    Claude Opus 4.7 interprète les prompts de manière plus littérale et explicite que Claude Opus 4.6, en particulier aux niveaux d'effort inférieurs. Il ne généralisera pas silencieusement une instruction d'un élément à un autre, et il n'inférera pas les demandes que vous n'avez pas faites. L'avantage de ce littéralisme est la précision et moins de remous, et il fonctionne généralement mieux pour les cas d'usage API avec des prompts soigneusement ajustés, l'extraction structurée et les pipelines où vous souhaitez un comportement prévisible. Si vous avez besoin que Claude applique une instruction largement, énoncez explicitement la portée (par exemple, « Appliquez ce formatage à chaque section, pas seulement à la première »).

    Ton et style d'écriture

    Comme avec tout nouveau modèle, le style de prose sur l'écriture longue peut changer. Claude Opus 4.7 est plus direct et opinionné, avec moins de formulations orientées vers la validation et moins d'emoji que le style plus chaleureux de Claude Opus 4.6. Si votre produit repose sur une voix spécifique, réévaluez les prompts de style par rapport à la nouvelle ligne de base.

    Par exemple, si la voix de votre produit est plus chaleureuse ou plus conversationnelle, ajoutez :

    Utilisez un ton chaud et collaboratif. Reconnaissez le cadrage de l'utilisateur avant de répondre.

    Contrôle de la génération de sous-agents

    Claude Opus 4.7 a tendance à générer moins de sous-agents par défaut. Cependant, ce comportement est orientable par le prompting ; donnez à Claude Opus 4.7 des conseils explicites sur quand les sous-agents sont souhaitables. Un exemple jouet pour un cas d'usage de codage :

    Ne générez pas de sous-agent pour le travail que vous pouvez accomplir directement en une seule réponse (par exemple, refactoriser une fonction que vous pouvez déjà voir).
    
    Générez plusieurs sous-agents dans le même tour lors du déploiement sur plusieurs éléments ou de la lecture de plusieurs fichiers.

    Valeurs par défaut de conception et frontend

    Claude Opus 4.7 a des instincts de conception plus forts que Claude Opus 4.6, avec un style maison par défaut cohérent : arrière-plans crème/blanc cassé chauds (~#F4F1EA), type d'affichage serif (Georgia, Fraunces, Playfair), accents de mots en italique et un accent terracotta/ambre. Cela se lit bien pour l'éditorial, l'hospitalité et les briefs de portefeuille, mais semblera décalé pour les tableaux de bord, les outils de développement, la fintech, la santé ou les applications d'entreprise — et il apparaît dans les diaporamas ainsi que dans les interfaces web.

    Cette valeur par défaut est persistante. Les instructions génériques (« n'utilisez pas de crème », « rendez-le propre et minimaliste ») ont tendance à faire passer le modèle à une palette fixe différente plutôt que de produire de la variété. Deux approches fonctionnent de manière fiable :

    1. Spécifiez une alternative concrète. Le modèle suit les spécifications explicites avec précision :

    Concevez une page d'accueil de bureau pour une marque de suppléments appelée AEFRM.
    
    La direction visuelle devrait provenir d'une atmosphère monochrome froide utilisant des tons gris-argent pâles qui s'approfondissent progressivement en gris-bleu et quasi-noir, similaire à une surface métallique brumeuse.
    
    La page devrait se sentir nette et contrôlée, avec un fort sens de la structure et de la retenue.
    
    Utilisez ce système tonal sur la page entière au lieu d'introduire des couleurs d'accent vives.
    
    Utilisez l'image téléchargée sur la conception du héros en noir et blanc.
    
    La mise en page devrait être construite avec des sections horizontales claires et un conteneur centré de largeur maximale. Utilisez un rayon de coin de 4px de manière cohérente sur les cartes, les boutons, les entrées et les cadres multimédias. Les marges devraient se sentir généreuses, avec suffisamment d'espace vide autour de chaque section pour que la page respire.
    
    La typographie devrait utiliser une sans-serif carrée et anguleuse avec un espacement des lettres plus large que d'habitude, en particulier dans les titres et la navigation, pour que le texte se sente plus ingéniérisé et moins compressé. Le texte du titre peut être grand et en majuscules, tandis que le texte de soutien reste court et clairsemé. Les sous-textes devraient être écrits avec Alumni Sans SC en 4-6px comme de minuscules petits textes dans les coins en bas au centre comme ça.
    
    Pour la structure, commencez par une section héros contenant une déclaration de produit forte, un court paragraphe de soutien et un cadre de placeholder de produit propre ou un packshot. En dessous, ajoutez une grille d'avantages avec trois ou quatre blocs, puis une section de formulation ou d'ingrédients, et enfin un appel à l'action.
    
    Les boutons devraient être plats et précis, avec des changements de survol subtils utilisant transition: all 160ms ease out où la luminosité et le contraste des bordures changent légèrement plutôt que d'utiliser un mouvement dramatique.
    
    La palette de couleurs devrait rester dans cette plage :
    #E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.

    2. Demandez au modèle de proposer des options avant de construire. Cela rompt la valeur par défaut et donne aux utilisateurs le contrôle. Si vous aviez précédemment compté sur temperature pour la variété de conception, utilisez cette approche — elle produit des directions significativement différentes sur les exécutions. Exemple de prompt :

    Avant de construire, proposez 4 directions visuelles distinctes adaptées à ce brief (chacune comme : bg hex / accent hex / typeface — justification d'une ligne). Demandez à l'utilisateur d'en choisir une, puis implémentez uniquement cette direction.

    De plus, Claude Opus 4.7 nécessite moins de prompting de conception frontend que les modèles précédents pour éviter les modèles génériques que les utilisateurs appellent l'esthétique « AI slop ». Avec les modèles antérieurs, nous recommandions un extrait de prompt plus long dans notre compétence de conception frontend. Cependant, Claude Opus 4.7 génère des frontends distinctifs et créatifs avec des conseils de prompting plus minimes. Cet extrait de prompt fonctionne bien avec les conseils de prompting ci-dessus pour la variété :

    <frontend_aesthetics>
    N'UTILISEZ JAMAIS d'esthétiques génériques générées par l'IA comme des familles de polices surutilisées (Inter, Roboto, Arial, polices système), des schémas de couleurs clichés (en particulier des dégradés violets sur fond blanc ou sombre), des mises en page prévisibles et des modèles de composants, et une conception générique qui manque de caractère spécifique au contexte. Utilisez des polices uniques, des couleurs et des thèmes cohésifs, et des animations pour les effets et les micro-interactions.
    </frontend_aesthetics>

    Produits de codage interactifs

    L'utilisation des tokens et le comportement de Claude Opus 4.7 peuvent différer entre les agents de codage autonomes et asynchrones avec un seul tour d'utilisateur et les agents de codage interactifs et synchrones avec plusieurs tours d'utilisateur. Spécifiquement, il a tendance à utiliser plus de tokens dans les paramètres interactifs, principalement parce qu'il raisonne davantage après les tours d'utilisateur. Cela peut améliorer la cohérence à long terme, le suivi des instructions et les capacités de codage dans les longues sessions de codage interactives, mais s'accompagne également d'une utilisation plus importante des tokens. Pour maximiser à la fois les performances et l'efficacité des tokens dans les produits de codage, nous recommandons d'utiliser un effort xhigh ou high, d'ajouter des fonctionnalités autonomes comme un mode automatique et de réduire le nombre d'interactions humaines requises de vos utilisateurs.

    Bien sûr, lors de la limitation du nombre d'interactions requises, il est important de spécifier la tâche, l'intention et les contraintes pertinentes dès le départ dans le premier tour humain. Fournir des descriptions de tâches bien spécifiées, claires et précises dès le départ peut aider à maximiser l'autonomie et l'intelligence tout en minimisant l'utilisation supplémentaire des tokens après les tours d'utilisateur. Nous trouvons que parce que Claude Opus 4.7 est plus autonome que les modèles antérieurs, ce modèle d'utilisation aide à maximiser les performances. En contraste, les prompts ambigus ou sous-spécifiés transmis progressivement sur plusieurs tours d'utilisateur ont tendance à réduire relativement l'efficacité des tokens et parfois les performances.

    Harnais d'examen de code

    Claude Opus 4.7 est significativement meilleur pour trouver des bugs que les modèles antérieurs, et a à la fois un rappel plus élevé et une précision dans nos évaluations — 11pp de meilleur rappel dans l'une de nos évaluations les plus difficiles de recherche de bugs basées sur les véritables PRs d'Anthropic. Cependant, si votre harnais d'examen de code a été ajusté pour un modèle antérieur, vous pouvez initialement voir un rappel plus faible. C'est probablement un effet du harnais, pas une régression de capacité. Quand un prompt d'examen dit des choses comme « signalez uniquement les problèmes de haute sévérité », « soyez conservateur » ou « ne pointillez pas », Claude Opus 4.7 peut suivre cette instruction plus fidèlement que les modèles antérieurs ne l'ont fait — il peut enquêter sur le code tout aussi minutieusement, identifier les bugs, puis ne pas signaler les conclusions qu'il juge être en dessous de votre barre déclarée. Cela peut se manifester par le modèle faisant la même profondeur d'enquête mais convertissant moins d'enquêtes en conclusions signalées, en particulier sur les bugs de sévérité inférieure. La précision augmente généralement, mais le rappel mesuré peut chuter même si la capacité de recherche de bugs sous-jacente du modèle s'est améliorée.

    Langage de prompt recommandé :

    Signalez chaque problème que vous trouvez, y compris ceux dont vous êtes incertain ou que vous considérez comme de faible sévérité. Ne filtrez pas pour l'importance ou la confiance à ce stade - une étape de vérification séparée fera cela. Votre objectif ici est la couverture : il est préférable de surfacer une conclusion qui sera filtrée plus tard que de laisser silencieusement tomber un vrai bug. Pour chaque conclusion, incluez votre niveau de confiance et une sévérité estimée pour qu'un filtre en aval puisse les classer.

    Ce prompt peut être utilisé sans avoir une deuxième étape réelle, mais déplacer le filtrage de confiance hors de l'étape de conclusion aide souvent. Si votre harnais a une vérification séparée, une déduplication ou une étape de classement, dites explicitement au modèle que son travail à l'étape de conclusion est la couverture plutôt que le filtrage.

    Si vous voulez vraiment que le modèle s'auto-filtre en une seule passe, soyez concret sur où se situe la barre plutôt que d'utiliser des termes qualitatifs comme « important » — par exemple, « signalez tous les bugs qui pourraient causer un comportement incorrect, une défaillance de test ou un résultat trompeur ; omettez uniquement les nits comme les préférences pures de style ou de nommage ».

    Nous recommandons d'itérer sur les prompts par rapport à un sous-ensemble de vos évaluations ou cas de test pour valider les gains de rappel ou de score F1.

    Utilisation d'ordinateur

    La capacité d'utilisation d'ordinateur fonctionne sur les résolutions, jusqu'à une nouvelle résolution maximale de 2576px / 3,75MP. Dans nos tests d'utilisation d'ordinateur, nous trouvons que l'envoi d'images à 1080p offre un bon équilibre entre les performances et les coûts.

    Pour les charges de travail particulièrement sensibles aux coûts, nous recommandons 720p ou 1366×768 comme options moins coûteuses avec des performances solides. Nous recommandons que vous meniez vos propres tests pour trouver les paramètres idéaux pour votre cas d'usage ; expérimenter avec les paramètres d'effort peut également aider à affiner le comportement du modèle.

    Principes généraux

    Soyez clair et direct

    Claude répond bien aux instructions claires et explicites. Être spécifique sur votre résultat souhaité peut aider à améliorer les résultats. Si vous voulez un comportement « au-delà des attentes », demandez-le explicitement plutôt que de compter sur le modèle pour l'inférer à partir de prompts vagues.

    Pensez à Claude comme un employé brillant mais nouveau qui manque de contexte sur vos normes et flux de travail. Plus vous expliquez précisément ce que vous voulez, meilleur sera le résultat.

    Règle d'or : Montrez votre prompt à un collègue avec un contexte minimal sur la tâche et demandez-lui de le suivre. S'il serait confus, Claude le sera aussi.

    • Soyez spécifique sur le format de sortie souhaité et les contraintes.
    • Fournissez les instructions comme étapes séquentielles en utilisant des listes numérotées ou des puces lorsque l'ordre ou l'exhaustivité des étapes est important.

    Ajoutez du contexte pour améliorer les performances

    Fournir du contexte ou une motivation derrière vos instructions, comme expliquer à Claude pourquoi un tel comportement est important, peut aider Claude à mieux comprendre vos objectifs et à fournir des réponses plus ciblées.

    Claude est assez intelligent pour généraliser à partir de l'explication.

    Utilisez les exemples efficacement

    Les exemples sont l'un des moyens les plus fiables de diriger le format de sortie, le ton et la structure de Claude. Quelques exemples bien élaborés (connus sous le nom de prompting few-shot ou multishot) peuvent améliorer considérablement la précision et la cohérence.

    Lors de l'ajout d'exemples, rendez-les :

    • Pertinents : Reflétez étroitement votre cas d'usage réel.
    • Diversifiés : Couvrez les cas limites et varient suffisamment pour que Claude ne détecte pas les modèles involontaires.
    • Structurés : Enveloppez les exemples dans des balises <example> (plusieurs exemples dans des balises <examples>) pour que Claude puisse les distinguer des instructions.
    Incluez 3–5 exemples pour les meilleurs résultats. Vous pouvez également demander à Claude d'évaluer vos exemples pour la pertinence et la diversité, ou de générer des exemples supplémentaires basés sur votre ensemble initial.

    Structurez les prompts avec des balises XML

    Les balises XML aident Claude à analyser les prompts complexes sans ambiguïté, en particulier lorsque votre prompt mélange les instructions, le contexte, les exemples et les entrées variables. Envelopper chaque type de contenu dans sa propre balise (par exemple <instructions>, <context>, <input>) réduit les malentendus.

    Meilleures pratiques :

    • Utilisez des noms de balises cohérents et descriptifs dans vos prompts.
    • Imbriquez les balises lorsque le contenu a une hiérarchie naturelle (documents à l'intérieur de <documents>, chacun à l'intérieur de <document index="n">).

    Donnez un rôle à Claude

    Définir un rôle dans le prompt système concentre le comportement et le ton de Claude pour votre cas d'usage. Même une seule phrase fait une différence :

    Python
    import anthropic
    
    client = anthropic.Anthropic()
    
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        system="You are a helpful coding assistant specializing in Python.",
        messages=[
            {"role": "user", "content": "How do I sort a list of dictionaries by key?"}
        ],
    )
    print(message.content)

    Prompting avec contexte long

    Lorsque vous travaillez avec de grands documents ou des entrées riches en données (20k+ tokens), structurez votre prompt avec soin pour obtenir les meilleurs résultats :

    • Mettez les données longues en haut : Placez vos longs documents et entrées près du haut de votre prompt, au-dessus de votre requête, instructions et exemples. Cela peut améliorer considérablement les performances sur tous les modèles.

      Les requêtes à la fin peuvent améliorer la qualité des réponses jusqu'à 30% dans les tests, en particulier avec les entrées complexes et multi-documents.
    • Structurez le contenu et les métadonnées des documents avec des balises XML : Lorsque vous utilisez plusieurs documents, enveloppez chaque document dans des balises <document> avec des sous-balises <document_content> et <source> (et d'autres métadonnées) pour plus de clarté.

    Connaissance de soi du modèle

    Si vous souhaitez que Claude s'identifie correctement dans votre application ou utilise des chaînes API spécifiques :

    Exemple de prompt pour l'identité du modèle
    L'assistant est Claude, créé par Anthropic. Le modèle actuel est Claude Opus 4.7.

    Pour les applications alimentées par LLM qui doivent spécifier les chaînes de modèles :

    Exemple de prompt pour la chaîne de modèle
    Lorsqu'un LLM est nécessaire, veuillez utiliser par défaut Claude Opus 4.7 sauf si l'utilisateur demande autrement. La chaîne de modèle exacte pour Claude Opus 4.7 est claude-opus-4-7.

    Sortie et formatage

    Style de communication et verbosité

    Les derniers modèles de Claude ont un style de communication plus concis et naturel par rapport aux modèles précédents :

    • Plus direct et ancré : Fournit des rapports de progression basés sur les faits plutôt que des mises à jour auto-congratulatoires
    • Plus conversationnel : Légèrement plus fluide et colloquial, moins mécanique
    • Moins verbeux : Peut ignorer les résumés détaillés pour l'efficacité sauf indication contraire

    Cela signifie que Claude peut ignorer les résumés verbaux après les appels d'outils, passant directement à l'action suivante. Si vous préférez plus de visibilité sur son raisonnement :

    Exemple de prompt
    Après avoir complété une tâche qui implique l'utilisation d'outils, fournissez un résumé rapide du travail que vous avez effectué.

    Contrôlez le format des réponses

    Il y a quelques façons particulièrement efficaces de diriger le formatage des résultats :

    1. Dites à Claude ce qu'il faut faire au lieu de ce qu'il ne faut pas faire

      • Au lieu de : « N'utilisez pas de markdown dans votre réponse »
      • Essayez : « Votre réponse devrait être composée de paragraphes de prose fluides. »
    2. Utilisez les indicateurs de format XML

      • Essayez : « Écrivez les sections de prose de votre réponse dans des balises <smoothly_flowing_prose_paragraphs>. »
    3. Faites correspondre le style de votre prompt au style de sortie souhaité

      Le style de formatage utilisé dans votre prompt peut influencer le style de réponse de Claude. Si vous rencontrez toujours des problèmes de directivité avec le formatage des résultats, essayez de faire correspondre le style de votre prompt aussi étroitement que possible au style de sortie souhaité. Par exemple, supprimer le markdown de votre prompt peut réduire le volume de markdown dans la sortie.

    Exemple de prompt pour minimiser le markdown
    <avoid_excessive_markdown_and_bullet_points>
    Lors de la rédaction de rapports, de documents, d'explications techniques, d'analyses ou de tout contenu long, écrivez en prose claire et fluide en utilisant des paragraphes et des phrases complets. Utilisez les sauts de paragraphe standard pour l'organisation et réservez le markdown principalement pour le `code en ligne`, les blocs de code (```...```), et les titres simples (###, et ###). Évitez d'utiliser **gras** et *italiques*.
    
    NE PAS utiliser les listes ordonnées (1. ...) ou les listes non ordonnées (*) sauf : a) vous présentez des éléments véritablement discrets où un format de liste est la meilleure option, ou b) l'utilisateur demande explicitement une liste ou un classement
    
    Au lieu de lister les éléments avec des puces ou des numéros, incorporez-les naturellement dans les phrases. Ce conseil s'applique en particulier à la rédaction technique. Utiliser la prose au lieu du formatage excessif améliorera la satisfaction des utilisateurs. NE JAMAIS produire une série de puces excessivement courtes.
    
    Votre objectif est un texte lisible et fluide qui guide le lecteur naturellement à travers les idées plutôt que de fragmenter les informations en points isolés.
    </avoid_excessive_markdown_and_bullet_points>

    Sortie LaTeX

    Claude Opus 4.6 utilise par défaut LaTeX pour les expressions mathématiques, les équations et les explications techniques. Si vous préférez le texte brut, ajoutez les instructions suivantes à votre prompt :

    Exemple de prompt
    Formatez votre réponse en texte brut uniquement. N'utilisez pas LaTeX, MathJax ou toute notation de balisage telle que \( \), $, ou \frac{}{}. Écrivez toutes les expressions mathématiques en utilisant des caractères de texte standard (par exemple, « / » pour la division, « * » pour la multiplication et « ^ » pour les exposants).

    Création de documents

    Les derniers modèles de Claude excellent dans la création de présentations, d'animations et de documents visuels avec un flair créatif impressionnant et un suivi d'instructions solide. Les modèles produisent une sortie polie et utilisable du premier coup dans la plupart des cas.

    Pour les meilleurs résultats avec la création de documents :

    Exemple de prompt
    Créez une présentation professionnelle sur [sujet]. Incluez des éléments de conception réfléchis, une hiérarchie visuelle et des animations engageantes le cas échéant.

    Migration loin des réponses préremplies

    À partir des modèles Claude 4.6 et Claude Mythos Preview, les réponses préremplies au dernier tour d'assistant ne sont plus supportées. Sur Mythos Preview, les demandes avec des messages d'assistant préremplis retournent une erreur 400. L'intelligence du modèle et le suivi des instructions ont progressé de sorte que la plupart des cas d'usage du préremplissage ne le nécessitent plus. Les modèles existants continueront à supporter les préremplissages, et l'ajout de messages d'assistant ailleurs dans la conversation n'est pas affecté.

    Voici les scénarios de préremplissage courants et comment migrer loin d'eux :

    Utilisation d'outils

    Utilisation d'outils

    Les derniers modèles de Claude sont entraînés pour un suivi d'instructions précis et bénéficient d'une direction explicite pour utiliser des outils spécifiques. Si vous dites « pouvez-vous suggérer quelques changements », Claude fournira parfois des suggestions plutôt que de les implémenter, même si faire des changements pourrait être ce que vous aviez l'intention.

    Pour que Claude agisse, soyez plus explicite :

    Pour rendre Claude plus proactif dans la prise d'action par défaut, vous pouvez ajouter ceci à votre prompt système :

    Exemple de prompt pour une action proactive
    <default_to_action>
    Par défaut, implémentez les changements plutôt que de seulement les suggérer. Si l'intention de l'utilisateur n'est pas claire, inférez l'action probable la plus utile et procédez, en utilisant les outils pour découvrir tout détail manquant au lieu de deviner. Essayez d'inférer l'intention de l'utilisateur sur la question de savoir si un appel d'outil (par exemple, modification ou lecture de fichier) est prévu ou non, et agissez en conséquence.
    </default_to_action>

    D'autre part, si vous souhaitez que le modèle soit plus hésitant par défaut, moins enclin à sauter directement dans les implémentations et à agir uniquement si demandé, vous pouvez diriger ce comportement avec un prompt comme celui-ci :

    Exemple de prompt pour une action conservatrice
    <do_not_act_before_instructions>
    Ne sautez pas dans l'implémentation ou ne modifiez les fichiers que si clairement instructed de faire des changements. Lorsque l'intention de l'utilisateur est ambiguë, préférez fournir des informations, faire de la recherche et fournir des recommandations plutôt que de prendre des mesures. Procédez uniquement aux modifications, modifications ou implémentations lorsque l'utilisateur les demande explicitement.
    </do_not_act_before_instructions>

    Claude Opus 4.5 et Claude Opus 4.6 sont également plus réactifs au prompt système que les modèles précédents. Si vos prompts ont été conçus pour réduire le sous-déclenchement sur les outils ou les compétences, ces modèles peuvent maintenant sur-déclencher. La solution est de réduire tout langage agressif. Où vous auriez pu dire « CRITIQUE : Vous DEVEZ utiliser cet outil quand... », vous pouvez utiliser un prompting plus normal comme « Utilisez cet outil quand... ».

    Optimiser l'appel parallèle d'outils

    Les derniers modèles de Claude excellent dans l'exécution parallèle d'outils. Ces modèles vont :

    • Exécuter plusieurs recherches spéculatives lors de la recherche
    • Lire plusieurs fichiers à la fois pour construire le contexte plus rapidement
    • Exécuter les commandes bash en parallèle (ce qui peut même créer un goulot d'étranglement au niveau des performances du système)

    Ce comportement est facilement contrôlable. Bien que le modèle ait un taux de réussite élevé dans l'appel parallèle d'outils sans invite, vous pouvez augmenter cela à ~100% ou ajuster le niveau d'agressivité :

    Exemple d'invite pour une efficacité parallèle maximale
    <use_parallel_tool_calls>
    Si vous avez l'intention d'appeler plusieurs outils et qu'il n'y a pas de dépendances entre les appels d'outils, effectuez tous les appels d'outils indépendants en parallèle. Privilégiez l'appel simultané d'outils chaque fois que les actions peuvent être effectuées en parallèle plutôt que séquentiellement. Par exemple, lors de la lecture de 3 fichiers, exécutez 3 appels d'outils en parallèle pour lire les 3 fichiers dans le contexte en même temps. Maximisez l'utilisation des appels d'outils parallèles si possible pour augmenter la vitesse et l'efficacité. Cependant, si certains appels d'outils dépendent d'appels précédents pour informer les valeurs dépendantes comme les paramètres, N'appelez PAS ces outils en parallèle et appelez-les plutôt séquentiellement. Ne jamais utiliser de placeholders ou deviner les paramètres manquants dans les appels d'outils.
    </use_parallel_tool_calls>
    Exemple d'invite pour réduire l'exécution parallèle
    Exécutez les opérations séquentiellement avec de brèves pauses entre chaque étape pour assurer la stabilité.

    Réflexion et raisonnement

    Surréflexion et exhaustivité excessive

    Claude Opus 4.6 effectue une exploration initiale beaucoup plus importante que les modèles précédents, en particulier avec des paramètres effort plus élevés. Ce travail initial aide souvent à optimiser les résultats finaux, mais le modèle peut rassembler un contexte étendu ou poursuivre plusieurs fils de recherche sans être invité. Si vos invites encourageaient précédemment le modèle à être plus approfondi, vous devriez affiner ces conseils pour Claude Opus 4.6 :

    • Remplacez les paramètres par défaut génériques par des instructions plus ciblées. Au lieu de « Par défaut, utilisez [outil] », ajoutez des conseils comme « Utilisez [outil] quand cela améliorerait votre compréhension du problème. »
    • Supprimez le sur-invite. Les outils qui ont été sous-déclenchés dans les modèles précédents sont susceptibles de se déclencher correctement maintenant. Les instructions comme « En cas de doute, utilisez [outil] » causeront un sur-déclenchement.
    • Utilisez l'effort comme solution de secours. Si Claude continue à être trop agressif, utilisez un paramètre effort plus bas.

    Dans certains cas, Claude Opus 4.6 peut réfléchir longuement, ce qui peut augmenter les jetons de réflexion et ralentir les réponses. Si ce comportement est indésirable, vous pouvez ajouter des instructions explicites pour limiter son raisonnement, ou vous pouvez réduire le paramètre effort pour réduire la réflexion globale et l'utilisation des jetons.

    Exemple d'invite
    Lorsque vous décidez comment aborder un problème, choisissez une approche et engagez-vous à la suivre. Évitez de revisiter les décisions à moins que vous ne rencontriez de nouvelles informations qui contredisent directement votre raisonnement. Si vous pesez deux approches, choisissez-en une et menez-la à bien. Vous pouvez toujours corriger la trajectoire plus tard si l'approche choisie échoue.

    Si vous avez besoin d'un plafond strict sur les coûts de réflexion, la réflexion étendue avec un plafond budget_tokens est toujours fonctionnelle sur Opus 4.6 et Sonnet 4.6 mais est dépréciée. Préférez réduire le paramètre effort ou utiliser max_tokens comme limite stricte avec adaptive thinking.

    Exploiter les capacités de réflexion et de réflexion entrelacée

    Les derniers modèles de Claude offrent des capacités de réflexion qui peuvent être particulièrement utiles pour les tâches impliquant une réflexion après l'utilisation d'outils ou un raisonnement multi-étapes complexe. Vous pouvez guider sa réflexion initiale ou entrelacée pour de meilleurs résultats.

    Claude Opus 4.6 et Claude Sonnet 4.6 utilisent adaptive thinking (thinking: {type: "adaptive"}), où Claude décide dynamiquement quand et combien réfléchir. Claude calibre sa réflexion en fonction de deux facteurs : le paramètre effort et la complexité de la requête. Un effort plus élevé provoque plus de réflexion, et les requêtes plus complexes font de même. Sur les requêtes plus faciles qui ne nécessitent pas de réflexion, le modèle répond directement. Dans les évaluations internes, la réflexion adaptative produit de manière fiable de meilleures performances que la réflexion étendue. Envisagez de passer à la réflexion adaptative pour obtenir les réponses les plus intelligentes.

    Utilisez la réflexion adaptative pour les charges de travail qui nécessitent un comportement d'agent tel que l'utilisation d'outils multi-étapes, les tâches de codage complexes et les boucles d'agent à long terme. Les modèles plus anciens utilisent le mode de réflexion manuel avec budget_tokens.

    Vous pouvez guider le comportement de réflexion de Claude :

    Exemple d'invite
    Après avoir reçu les résultats des outils, réfléchissez attentivement à leur qualité et déterminez les étapes suivantes optimales avant de procéder. Utilisez votre réflexion pour planifier et itérer en fonction de ces nouvelles informations, puis prenez la meilleure action suivante.

    Le comportement de déclenchement de la réflexion adaptative est invitable. Si vous trouvez que le modèle réfléchit plus souvent que vous ne le souhaiteriez, ce qui peut se produire avec des invites système grandes ou complexes, ajoutez des conseils pour le diriger :

    Exemple d'invite
    La réflexion étendue ajoute de la latence et ne doit être utilisée que si elle améliorera de manière significative la qualité de la réponse - généralement pour les problèmes qui nécessitent un raisonnement multi-étapes. En cas de doute, répondez directement.

    Si vous migrez depuis extended thinking avec budget_tokens, remplacez votre configuration de réflexion et déplacez le contrôle du budget vers effort :

    Avant (réflexion étendue, modèles plus anciens) :

    Python
    client.messages.create(
        model="claude-sonnet-4-5-20250929",
        max_tokens=64000,
        thinking={"type": "enabled", "budget_tokens": 32000},
        messages=[{"role": "user", "content": "..."}],
    )

    Après (réflexion adaptative) :

    Python
    client.messages.create(
        model="claude-opus-4-7",
        max_tokens=64000,
        thinking={"type": "adaptive"},
        output_config={"effort": "high"},  # or "max", "xhigh", "medium", "low"
        messages=[{"role": "user", "content": "..."}],
    )

    Si vous n'utilisez pas la réflexion étendue, aucune modification n'est requise. La réflexion est désactivée par défaut lorsque vous omettez le paramètre thinking.

    • Préférez les instructions générales aux étapes prescriptives. Une invite comme « réfléchissez attentivement » produit souvent un meilleur raisonnement qu'un plan étape par étape écrit à la main. Le raisonnement de Claude dépasse souvent ce qu'un humain prescrirait.
    • Les exemples multishot fonctionnent avec la réflexion. Utilisez les balises <thinking> dans vos exemples few-shot pour montrer à Claude le modèle de raisonnement. Il généralisera ce style à ses propres blocs de réflexion étendue.
    • CoT manuel comme solution de secours. Lorsque la réflexion est désactivée, vous pouvez toujours encourager le raisonnement étape par étape en demandant à Claude de réfléchir au problème. Utilisez des balises structurées comme <thinking> et <answer> pour séparer clairement le raisonnement de la sortie finale.
    • Demandez à Claude de vérifier lui-même. Ajoutez quelque chose comme « Avant de terminer, vérifiez votre réponse par rapport à [critères de test]. » Cela détecte les erreurs de manière fiable, en particulier pour le codage et les mathématiques.
    Lorsque la réflexion étendue est désactivée, Claude Opus 4.5 est particulièrement sensible au mot « think » et ses variantes. Envisagez d'utiliser des alternatives comme « consider », « evaluate » ou « reason through » dans ces cas.

    Pour plus d'informations sur les capacités de réflexion, consultez Extended thinking et Adaptive thinking.

    Systèmes d'agent

    Raisonnement à long terme et suivi d'état

    Les derniers modèles de Claude excellent dans les tâches de raisonnement à long terme avec des capacités exceptionnelles de suivi d'état. Claude maintient son orientation sur des sessions étendues en se concentrant sur les progrès progressifs, en faisant des avancées régulières sur quelques choses à la fois plutôt que de tenter tout à la fois. Cette capacité émerge particulièrement sur plusieurs fenêtres de contexte ou itérations de tâches, où Claude peut travailler sur une tâche complexe, enregistrer l'état et continuer avec une fenêtre de contexte nouvelle.

    Sensibilisation au contexte et flux de travail multi-fenêtres

    Les modèles Claude 4.6 et Claude 4.5 disposent de context awareness, permettant au modèle de suivre sa fenêtre de contexte restante (c'est-à-dire « budget de jetons ») tout au long d'une conversation. Cela permet à Claude d'exécuter des tâches et de gérer le contexte plus efficacement en comprenant l'espace dont il dispose.

    Gestion des limites de contexte :

    Si vous utilisez Claude dans un harnais d'agent qui compacte le contexte ou permet d'enregistrer le contexte dans des fichiers externes (comme dans Claude Code), envisagez d'ajouter ces informations à votre invite afin que Claude puisse se comporter en conséquence. Sinon, Claude peut parfois essayer naturellement de terminer le travail à mesure qu'il approche de la limite de contexte. Voici un exemple d'invite :

    Exemple d'invite
    Votre fenêtre de contexte sera automatiquement compactée à mesure qu'elle approche de sa limite, ce qui vous permettra de continuer à travailler indéfiniment à partir de là où vous vous êtes arrêté. Par conséquent, n'arrêtez pas les tâches tôt en raison de préoccupations concernant le budget de jetons. À mesure que vous approchez de votre limite de budget de jetons, enregistrez votre progression et votre état actuels en mémoire avant que la fenêtre de contexte ne s'actualise. Soyez toujours aussi persistant et autonome que possible et complétez les tâches entièrement, même si la fin de votre budget approche. N'arrêtez jamais artificiellement une tâche tôt quel que soit le contexte restant.

    L'outil de mémoire s'associe naturellement à la sensibilisation au contexte pour des transitions de contexte transparentes.

    Flux de travail multi-fenêtres de contexte

    Pour les tâches s'étendant sur plusieurs fenêtres de contexte :

    1. Utilisez une invite différente pour la toute première fenêtre de contexte : Utilisez la première fenêtre de contexte pour mettre en place un cadre (écrire des tests, créer des scripts de configuration), puis utilisez les futures fenêtres de contexte pour itérer sur une liste de tâches.

    2. Demandez au modèle d'écrire des tests dans un format structuré : Demandez à Claude de créer des tests avant de commencer le travail et de les suivre dans un format structuré (par exemple, tests.json). Cela conduit à une meilleure capacité à long terme à itérer. Rappelez à Claude l'importance des tests : « Il est inacceptable de supprimer ou de modifier des tests car cela pourrait entraîner des fonctionnalités manquantes ou bogues. »

    3. Configurez des outils de qualité de vie : Encouragez Claude à créer des scripts de configuration (par exemple, init.sh) pour démarrer gracieusement les serveurs, exécuter les suites de tests et les linters. Cela évite les travaux répétés lors de la continuation à partir d'une fenêtre de contexte nouvelle.

    4. Commencer à zéro ou compacter : Lorsqu'une fenêtre de contexte est effacée, envisagez de commencer avec une toute nouvelle fenêtre de contexte plutôt que d'utiliser la compaction. Les derniers modèles de Claude sont extrêmement efficaces pour découvrir l'état à partir du système de fichiers local. Dans certains cas, vous pouvez vouloir tirer parti de cela plutôt que de la compaction. Soyez prescriptif sur la façon dont il doit commencer :

    Exemple d'invite
    C'est une tâche très longue, il peut donc être bénéfique de planifier clairement votre travail. Il est encouragé de dépenser tout votre contexte de sortie sur la tâche - assurez-vous simplement de ne pas manquer de contexte avec un travail important non validé. Continuez à travailler systématiquement jusqu'à ce que vous ayez terminé cette tâche.

    Meilleures pratiques de gestion d'état

    • Utilisez des formats structurés pour les données d'état : Lors du suivi des informations structurées (comme les résultats des tests ou l'état des tâches), utilisez JSON ou d'autres formats structurés pour aider Claude à comprendre les exigences de schéma
    • Utilisez du texte non structuré pour les notes de progression : Les notes de progression en texte libre fonctionnent bien pour suivre la progression générale et le contexte
    • Utilisez git pour le suivi d'état : Git fournit un journal de ce qui a été fait et des points de contrôle qui peuvent être restaurés. Les derniers modèles de Claude fonctionnent particulièrement bien en utilisant git pour suivre l'état sur plusieurs sessions.
    • Mettez l'accent sur la progression progressive : Demandez explicitement à Claude de suivre sa progression et de se concentrer sur le travail progressif

    Équilibrer l'autonomie et la sécurité

    Sans conseils, Claude Opus 4.6 peut prendre des mesures difficiles à inverser ou qui affectent les systèmes partagés, comme supprimer des fichiers, forcer un push ou publier sur des services externes. Si vous souhaitez que Claude Opus 4.6 confirme avant de prendre des mesures potentiellement risquées, ajoutez des conseils à votre invite :

    Exemple d'invite
    Considérez la réversibilité et l'impact potentiel de vos actions. Vous êtes encouragé à prendre des mesures locales et réversibles comme éditer des fichiers ou exécuter des tests, mais pour les actions difficiles à inverser, qui affectent les systèmes partagés ou qui pourraient être destructrices, demandez à l'utilisateur avant de procéder.
    
    Exemples d'actions qui justifient une confirmation :
    - Opérations destructrices : suppression de fichiers ou de branches, suppression de tables de base de données, rm -rf
    - Opérations difficiles à inverser : git push --force, git reset --hard, modification de commits publiés
    - Opérations visibles par d'autres : push de code, commentaires sur les PR/problèmes, envoi de messages, modification d'infrastructure partagée
    
    Lorsque vous rencontrez des obstacles, n'utilisez pas d'actions destructrices comme raccourci. Par exemple, ne contournez pas les vérifications de sécurité (par exemple --no-verify) ou ne supprimez pas les fichiers inconnus qui pourraient être un travail en cours.

    Recherche et collecte d'informations

    Les derniers modèles de Claude démontrent des capacités exceptionnelles de recherche d'agent et peuvent trouver et synthétiser efficacement les informations de plusieurs sources. Pour des résultats de recherche optimaux :

    1. Fournissez des critères de succès clairs : Définissez ce qui constitue une réponse réussie à votre question de recherche

    2. Encouragez la vérification des sources : Demandez à Claude de vérifier les informations sur plusieurs sources

    3. Pour les tâches de recherche complexes, utilisez une approche structurée :

    Exemple d'invite pour la recherche complexe
    Recherchez ces informations de manière structurée. À mesure que vous rassemblez les données, développez plusieurs hypothèses concurrentes. Suivez vos niveaux de confiance dans vos notes de progression pour améliorer l'étalonnage. Critiques régulièrement votre approche et votre plan. Mettez à jour un fichier d'arbre d'hypothèses ou de notes de recherche pour persister les informations et fournir la transparence. Décomposez cette tâche de recherche complexe systématiquement.

    Cette approche structurée permet à Claude de trouver et de synthétiser pratiquement n'importe quel élément d'information et de critiquer itérativement ses résultats, quelle que soit la taille du corpus.

    Orchestration de sous-agents

    Les derniers modèles de Claude démontrent des capacités d'orchestration de sous-agents natives considérablement améliorées. Ces modèles peuvent reconnaître quand les tâches bénéficieraient de la délégation du travail à des sous-agents spécialisés et le faire de manière proactive sans nécessiter d'instructions explicites.

    Pour tirer parti de ce comportement :

    1. Assurez-vous que les outils de sous-agents sont bien définis : Disposez d'outils de sous-agents disponibles et décrits dans les définitions d'outils
    2. Laissez Claude orchestrer naturellement : Claude déléguera de manière appropriée sans instructions explicites
    3. Surveillez l'utilisation excessive : Claude Opus 4.6 a une forte prédilection pour les sous-agents et peut les générer dans des situations où une approche plus simple et directe suffirait. Par exemple, le modèle peut générer des sous-agents pour l'exploration de code quand un appel grep direct est plus rapide et suffisant.

    Si vous voyez une utilisation excessive de sous-agents, ajoutez des conseils explicites sur quand les sous-agents sont et ne sont pas justifiés :

    Exemple d'invite pour l'utilisation de sous-agents
    Utilisez les sous-agents quand les tâches peuvent s'exécuter en parallèle, nécessitent un contexte isolé ou impliquent des flux de travail indépendants qui n'ont pas besoin de partager l'état. Pour les tâches simples, les opérations séquentielles, les modifications de fichiers uniques ou les tâches où vous devez maintenir le contexte entre les étapes, travaillez directement plutôt que de déléguer.

    Chaîner les invites complexes

    Avec la réflexion adaptative et l'orchestration de sous-agents, Claude gère la plupart des raisonnements multi-étapes en interne. Le chaînage explicite d'invites (diviser une tâche en appels API séquentiels) est toujours utile lorsque vous devez inspecter les sorties intermédiaires ou appliquer une structure de pipeline spécifique.

    Le modèle de chaînage le plus courant est l'auto-correction : générer un brouillon → demander à Claude de l'examiner par rapport aux critères → demander à Claude de l'affiner en fonction de l'examen. Chaque étape est un appel API séparé afin que vous puissiez enregistrer, évaluer ou brancher à tout moment.

    Réduire la création de fichiers dans le codage d'agent

    Les derniers modèles de Claude peuvent parfois créer de nouveaux fichiers à des fins de test et d'itération, en particulier lorsqu'ils travaillent avec du code. Cette approche permet à Claude d'utiliser des fichiers, en particulier des scripts python, comme un « bloc-notes temporaire » avant d'enregistrer sa sortie finale. L'utilisation de fichiers temporaires peut améliorer les résultats, en particulier pour les cas d'utilisation de codage d'agent.

    Si vous préférez minimiser la création nette de nouveaux fichiers, vous pouvez demander à Claude de nettoyer après lui :

    Exemple d'invite
    Si vous créez des fichiers temporaires, des scripts ou des fichiers d'aide pour l'itération, nettoyez ces fichiers en les supprimant à la fin de la tâche.

    Surempressement

    Claude Opus 4.5 et Claude Opus 4.6 ont tendance à sur-concevoir en créant des fichiers supplémentaires, en ajoutant des abstractions inutiles ou en construisant de la flexibilité qui n'a pas été demandée. Si vous voyez ce comportement indésirable, ajoutez des conseils spécifiques pour garder les solutions minimales.

    Par exemple :

    Exemple d'invite pour minimiser la sur-conception
    Évitez la sur-conception. Apportez uniquement les modifications directement demandées ou clairement nécessaires. Gardez les solutions simples et ciblées :
    
    - Portée : N'ajoutez pas de fonctionnalités, ne refactorisez pas le code ou ne faites pas « d'améliorations » au-delà de ce qui a été demandé. Une correction de bug n'a pas besoin de nettoyage du code environnant. Une fonctionnalité simple n'a pas besoin de configurabilité supplémentaire.
    
    - Documentation : N'ajoutez pas de docstrings, de commentaires ou d'annotations de type au code que vous n'avez pas modifié. Ajoutez uniquement des commentaires où la logique n'est pas évidente.
    
    - Codage défensif : N'ajoutez pas de gestion d'erreurs, de solutions de secours ou de validation pour les scénarios qui ne peuvent pas se produire. Faites confiance au code interne et aux garanties du framework. Validez uniquement aux limites du système (entrée utilisateur, API externes).
    
    - Abstractions : Ne créez pas d'aides, d'utilitaires ou d'abstractions pour les opérations ponctuelles. Ne concevez pas pour les exigences futures hypothétiques. La bonne quantité de complexité est le minimum nécessaire pour la tâche actuelle.

    Éviter de se concentrer sur la réussite des tests et le codage en dur

    Claude peut parfois se concentrer trop fortement sur la réussite des tests au détriment de solutions plus générales, ou peut utiliser des contournements comme des scripts d'aide pour la refactorisation complexe au lieu d'utiliser directement les outils standard. Pour éviter ce comportement et assurer des solutions robustes et généralisables :

    Exemple d'invite
    Veuillez écrire une solution de haute qualité et à usage général en utilisant les outils standard disponibles. Ne créez pas de scripts d'aide ou de contournements pour accomplir la tâche plus efficacement. Implémentez une solution qui fonctionne correctement pour toutes les entrées valides, pas seulement les cas de test. Ne codez pas en dur les valeurs ou ne créez pas de solutions qui ne fonctionnent que pour les entrées de test spécifiques. Au lieu de cela, implémentez la logique réelle qui résout le problème de manière générale.
    
    Concentrez-vous sur la compréhension des exigences du problème et l'implémentation de l'algorithme correct. Les tests sont là pour vérifier l'exactitude, pas pour définir la solution. Fournissez une implémentation fondée qui suit les meilleures pratiques et les principes de conception logicielle.
    
    Si la tâche est déraisonnable ou irréalisable, ou si l'un des tests est incorrect, veuillez m'en informer plutôt que de les contourner. La solution doit être robuste, maintenable et extensible.

    Minimiser les hallucinations dans le codage d'agent

    Les derniers modèles de Claude sont moins sujets aux hallucinations et donnent des réponses plus précises, fondées et intelligentes basées sur le code. Pour encourager ce comportement encore plus et minimiser les hallucinations :

    Exemple d'invite
    <investigate_before_answering>
    Ne spéculez jamais sur le code que vous n'avez pas ouvert. Si l'utilisateur référence un fichier spécifique, vous DEVEZ lire le fichier avant de répondre. Assurez-vous d'enquêter et de lire les fichiers pertinents AVANT de répondre aux questions sur la base de code. Ne faites jamais de réclamations sur le code avant d'enquêter à moins que vous ne soyez certain de la réponse correcte - donnez des réponses fondées et sans hallucinations.
    </investigate_before_answering>

    Conseils spécifiques aux capacités

    Capacités de vision améliorées

    Claude Opus 4.5 et Claude Opus 4.6 ont des capacités de vision améliorées par rapport aux modèles Claude précédents. Ils fonctionnent mieux sur les tâches de traitement d'images et d'extraction de données, en particulier lorsqu'il y a plusieurs images présentes dans le contexte. Ces améliorations s'étendent à l'utilisation informatique, où les modèles peuvent interpréter plus fiablement les captures d'écran et les éléments de l'interface utilisateur. Vous pouvez également utiliser ces modèles pour analyser des vidéos en les divisant en images.

    Une technique qui s'est avérée efficace pour améliorer davantage les performances est de donner à Claude un outil de recadrage ou une compétence. Les tests ont montré une amélioration constante des évaluations d'images lorsque Claude peut « zoomer » sur les régions pertinentes d'une image. Anthropic a créé un cookbook pour l'outil de recadrage.

    Conception d'interface

    Claude Opus 4.5 et Claude Opus 4.6 excellent dans la création d'applications web complexes et réelles avec une forte conception d'interface. Cependant, sans conseils, les modèles peuvent par défaut utiliser des modèles génériques qui créent ce que les utilisateurs appellent l'esthétique « AI slop ». Pour créer des interfaces distinctives et créatives qui surprennent et ravissent :

    Pour un guide détaillé sur l'amélioration de la conception d'interface, consultez le billet de blog sur l'amélioration de la conception d'interface par les compétences.

    Voici un extrait d'invite système que vous pouvez utiliser pour encourager une meilleure conception d'interface :

    Exemple d'invite pour l'esthétique d'interface
    <frontend_aesthetics>
    Vous avez tendance à converger vers des sorties génériques et « sur distribution ». Dans la conception d'interface, cela crée ce que les utilisateurs appellent l'esthétique « AI slop ». Évitez cela : créez des interfaces distinctives et créatives qui surprennent et ravissent.
    
    Concentrez-vous sur :
    - Typographie : Choisissez des polices belles, uniques et intéressantes. Évitez les polices génériques comme Arial et Inter ; optez plutôt pour des choix distinctifs qui élèvent l'esthétique de l'interface.
    - Couleur et thème : Engagez-vous dans une esthétique cohésive. Utilisez les variables CSS pour la cohérence. Les couleurs dominantes avec des accents nets surpassent les palettes timides et uniformément distribuées. Tirez inspiration des thèmes IDE et des esthétiques culturelles.
    - Mouvement : Utilisez les animations pour les effets et les micro-interactions. Privilégiez les solutions CSS uniquement pour HTML. Utilisez la bibliothèque Motion pour React si disponible. Concentrez-vous sur les moments à fort impact : un chargement de page bien orchestré avec des révélations échelonnées (animation-delay) crée plus de plaisir que les micro-interactions dispersées.
    - Arrière-plans : Créez une atmosphère et de la profondeur plutôt que de vous en tenir à des couleurs unies. Superposez les dégradés CSS, utilisez des motifs géométriques ou ajoutez des effets contextuels qui correspondent à l'esthétique globale.
    
    Évitez les esthétiques génériques générées par l'IA :
    - Familles de polices surutilisées (Inter, Roboto, Arial, polices système)
    - Schémas de couleurs clichés (en particulier les dégradés violets sur des arrière-plans blancs)
    - Mises en page et modèles de composants prévisibles
    - Conception générique qui manque de caractère spécifique au contexte
    
    Interprétez de manière créative et faites des choix inattendus qui semblent véritablement conçus pour le contexte. Variez entre les thèmes clairs et sombres, les différentes polices, les différentes esthétiques. Vous avez toujours tendance à converger vers des choix courants (Space Grotesk, par exemple) entre les générations. Évitez cela : il est critique que vous pensiez en dehors des sentiers battus !
    </frontend_aesthetics>

    Vous pouvez également consulter la définition complète de la compétence.

    Considérations de migration

    Lors de la migration vers les modèles Claude 4.6 à partir de générations antérieures :

    1. Soyez spécifique sur le comportement souhaité : Envisagez de décrire exactement ce que vous aimeriez voir dans la sortie.

    2. Encadrez vos instructions avec des modificateurs : L'ajout de modificateurs qui encouragent Claude à augmenter la qualité et le détail de sa sortie peut aider à mieux façonner les performances de Claude. Par exemple, au lieu de « Créer un tableau de bord d'analyse », utilisez « Créer un tableau de bord d'analyse. Incluez autant de fonctionnalités et d'interactions pertinentes que possible. Allez au-delà des bases pour créer une implémentation complète. »

    3. Demandez des fonctionnalités spécifiques explicitement : Les animations et les éléments interactifs doivent être demandés explicitement si souhaités.

    4. Mettez à jour la configuration de réflexion : Les modèles Claude 4.6 utilisent adaptive thinking (thinking: {type: "adaptive"}) au lieu de la réflexion manuelle avec budget_tokens. Utilisez le paramètre effort pour contrôler la profondeur de la réflexion.

    5. Migrez loin des réponses pré-remplies : Les réponses pré-remplies au dernier tour d'assistant sont dépréciées à partir des modèles Claude 4.6. Consultez pour des conseils détaillés sur les alternatives.

    Pour les étapes de migration détaillées, consultez le guide de migration.

    Migration de Claude Sonnet 4.5 vers Claude Sonnet 4.6

    Claude Sonnet 4.6 utilise par défaut un niveau d'effort de high, contrairement à Claude Sonnet 4.5 qui n'avait pas de paramètre effort. Envisagez d'ajuster le paramètre effort lors de la migration de Claude Sonnet 4.5 vers Claude Sonnet 4.6. S'il n'est pas explicitement défini, vous pouvez expérimenter une latence plus élevée avec le niveau d'effort par défaut.

    Paramètres d'effort recommandés :

    • Medium pour la plupart des applications
    • Low pour les charges de travail à haut volume ou sensibles à la latence
    • Définissez un grand budget de jetons de sortie maximale (64k jetons recommandés) à un effort moyen ou élevé pour donner au modèle de la place pour réfléchir et agir

    Quand utiliser Opus 4.7 à la place : Pour les problèmes les plus difficiles et à long terme (migrations de code à grande échelle, recherche approfondie, travail autonome étendu), Opus 4.7 reste le bon choix. Sonnet 4.6 est optimisé pour les charges de travail où le délai d'exécution rapide et l'efficacité des coûts sont les plus importants.

    Si vous n'utilisez pas la réflexion étendue

    Si vous n'utilisez pas la réflexion étendue sur Claude Sonnet 4.5, vous pouvez continuer sans elle sur Claude Sonnet 4.6. Vous devez explicitement définir l'effort au niveau approprié pour votre cas d'utilisation. À un effort low avec la réflexion désactivée, vous pouvez vous attendre à des performances similaires ou meilleures par rapport à Claude Sonnet 4.5 sans réflexion étendue.

    Python
    client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        thinking={"type": "disabled"},
        output_config={"effort": "low"},
        messages=[{"role": "user", "content": "..."}],
    )

    Si vous utilisez la réflexion étendue

    Si vous utilisez la réflexion étendue avec budget_tokens sur Claude Sonnet 4.5, elle est toujours fonctionnelle sur Claude Sonnet 4.6 mais est dépréciée. Migrez vers adaptive thinking avec le paramètre effort.

    Migration vers la réflexion adaptative

    La réflexion adaptative est particulièrement bien adaptée aux modèles de charge de travail suivants :

    • Agents multi-étapes autonomes : agents de codage qui transforment les exigences en logiciels fonctionnels, pipelines d'analyse de données et recherche de bugs où le modèle s'exécute indépendamment sur plusieurs étapes. La réflexion adaptative permet au modèle de calibrer son raisonnement par étape, restant sur la bonne voie sur des trajectoires plus longues. Pour ces charges de travail, commencez à un effort high. Si la latence ou l'utilisation des jetons est une préoccupation, réduisez à medium.
    • Agents d'utilisation informatique : Claude Sonnet 4.6 a atteint la meilleure précision de sa catégorie sur les évaluations d'utilisation informatique en utilisant le mode adaptatif.
    • Charges de travail bimodales : un mélange de tâches faciles et difficiles où l'adaptation ignore la réflexion sur les requêtes simples et raisonne profondément sur les requêtes complexes.

    Lors de l'utilisation de la réflexion adaptative, évaluez les efforts medium et high sur vos tâches. Le bon niveau dépend du compromis de votre charge de travail entre la qualité, la latence et l'utilisation des jetons.

    Python
    client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=64000,
        thinking={"type": "adaptive"},
        output_config={"effort": "high"},
        messages=[{"role": "user", "content": "..."}],
    )
    Garder budget_tokens pendant la migration

    Si vous devez garder budget_tokens temporairement pendant la migration, un budget autour de 16k jetons fournit de la marge pour les problèmes plus difficiles sans risque d'utilisation de jetons incontrôlée. Cette configuration est dépréciée et sera supprimée dans une future version du modèle.

    Pour les cas d'utilisation de codage (codage d'agent, flux de travail lourds en outils, génération de code), commencez avec un effort medium :

    Python
    client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=16384,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "medium"},
        messages=[{"role": "user", "content": "..."}],
    )

    Pour les cas d'utilisation de chat et non-codage (chat, génération de contenu, recherche, classification), commencez avec un effort low :

    Python
    client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "low"},
        messages=[{"role": "user", "content": "..."}],
    )
  1. Ancrez les réponses dans les citations : Pour les tâches de documents longs, demandez à Claude de citer d'abord les parties pertinentes des documents avant d'effectuer sa tâche. Cela aide Claude à couper à travers le bruit du reste du contenu du document.

  2. Utilisez des prompts détaillés pour les préférences de formatage spécifiques

    Pour plus de contrôle sur l'utilisation du markdown et du formatage, fournissez des conseils explicites :

    • « Appelez pwd ; vous ne pouvez lire et écrire des fichiers que dans ce répertoire. »
    • « Examinez progress.txt, tests.json et les journaux git. »
    • « Exécutez manuellement un test d'intégration fondamental avant de passer à l'implémentation de nouvelles fonctionnalités. »
  3. Fournissez des outils de vérification : À mesure que la durée des tâches autonomes augmente, Claude doit vérifier l'exactitude sans retours continus des humains. Des outils comme le serveur Playwright MCP ou les capacités d'utilisation informatique pour tester les interfaces utilisateur sont utiles.

  4. Encouragez l'utilisation complète du contexte : Invitez Claude à compléter efficacement les composants avant de passer à autre chose :

  5. Migrating away from prefilled responses
  6. Affinez l'invite anti-paresse : Si vos invites encourageaient précédemment le modèle à être plus approfondi ou à utiliser les outils de manière plus agressive, réduisez ces conseils. Les modèles Claude 4.6 sont considérablement plus proactifs et peuvent sur-déclencher les instructions qui étaient nécessaires pour les modèles précédents.