Bonnes pratiquesIngénierie de prompts

Prompting pour Claude Opus 4.8

Différences comportementales et modèles de prompting pour Claude Opus 4.8, couvrant la verbosité, le calibrage de l'effort, l'utilisation d'outils, les sous-agents et les paramètres par défaut du frontend.

Ce guide couvre les modèles de prompting spécifiques à Claude Opus 4.8. Pour les changements d'API impliqués dans le passage de Claude Opus 4.8 au dernier modèle Opus, consultez Migration vers Claude Opus 5 depuis Claude Opus 4.8. Pour les techniques qui s'appliquent à tous les modèles Claude actuels, consultez Meilleures pratiques de prompting.

Claude Opus 4.8 possède des atouts particuliers dans le travail agentique à long terme, le travail de connaissance, la vision et les tâches de mémoire. Il fonctionne bien dès le départ sur les prompts existants de Claude Opus 4.7. Les modèles suivants couvrent les comportements qui nécessitent le plus souvent un ajustement.

Pour les changements de paramètres d'API depuis Claude Opus 4.7 (paramètres d'échantillonnage, effort par défaut, fenêtre de contexte de 1M par défaut, messages système en milieu de conversation et détails d'arrêt de refus), consultez Migration vers Claude Opus 5 depuis Claude Opus 4.7, qui couvre les mêmes changements en route vers le dernier modèle Opus ; Claude Opus 4.8 partage ces comportements.

Longueur de réponse et verbosité

Claude Opus 4.8 calibre la longueur de la réponse en fonction de la complexité qu'il attribue à la tâche, plutôt que d'adopter par défaut une verbosité fixe. Cela signifie généralement des réponses plus courtes pour les recherches simples et beaucoup plus longues pour les analyses ouvertes.

Si votre produit dépend d'un certain style ou d'une certaine verbosité de sortie, vous devrez peut-être ajuster vos prompts. Par exemple, pour diminuer la verbosité, vous pourriez ajouter :

Provide concise, focused responses. Skip non-essential context, and keep examples minimal.

Si vous observez des exemples spécifiques de types de verbosité (comme la sur-explication), vous pouvez ajouter des instructions supplémentaires dans votre prompt pour les éviter. Les exemples positifs montrant comment Claude peut communiquer avec le niveau de concision approprié ont tendance à être plus efficaces que les exemples négatifs ou les instructions qui indiquent au modèle ce qu'il ne doit pas faire.

Calibrage de l'effort et de la profondeur de réflexion

Le paramètre effort vous permet d'ajuster l'intelligence de Claude par rapport à la dépense en tokens, en échangeant de la capacité contre une vitesse plus rapide et des coûts plus faibles. Commencez avec le niveau d'effort xhigh pour les cas d'usage de codage et agentiques, et utilisez un minimum d'effort high pour la plupart des cas d'usage sensibles à l'intelligence. Expérimentez avec d'autres niveaux d'effort pour affiner davantage l'utilisation des tokens et l'intelligence :

max : L'effort maximal peut apporter des gains de performance dans certains cas d'usage, mais peut montrer des rendements décroissants par rapport à l'augmentation de l'utilisation des tokens. Ce réglage peut aussi parfois être sujet à une réflexion excessive. Testez l'effort maximal pour les tâches exigeantes en intelligence.
xhigh : L'effort extra élevé est le meilleur réglage pour la plupart des cas d'usage de codage et agentiques.
high : Ce réglage équilibre l'utilisation des tokens et l'intelligence. Pour la plupart des cas d'usage sensibles à l'intelligence, utilisez un minimum d'effort high.
medium : Bon pour les cas d'usage sensibles aux coûts qui doivent réduire l'utilisation des tokens en échange d'une intelligence moindre.
low : À réserver aux tâches courtes et délimitées et aux charges de travail sensibles à la latence qui ne sont pas sensibles à l'intelligence.

Claude Opus 4.8 respecte strictement les niveaux d'effort, en particulier dans le bas de l'échelle. À low et medium, le modèle limite son travail à ce qui a été demandé plutôt que d'aller au-delà. C'est bon pour la latence et le coût, mais sur des tâches modérément complexes exécutées à l'effort low, il existe un certain risque de sous-réflexion.

Si vous observez un raisonnement superficiel sur des problèmes complexes, augmentez l'effort à high ou xhigh plutôt que de contourner le problème par le prompting. Si vous devez maintenir l'effort à low pour la latence, ajoutez des directives ciblées :

This task involves multistep reasoning. Think carefully through the problem before responding.

L'effort est susceptible d'être plus important pour ce modèle que pour tout Opus précédent, alors expérimentez activement avec lui lors de votre mise à niveau.

Sur Claude Opus 4.8, la réflexion est désactivée sauf si vous définissez explicitement thinking: {type: "adaptive"}. Le comportement de déclenchement de la réflexion adaptative est orientable. Si vous constatez que le modèle réfléchit plus souvent que vous ne le souhaitez, ce qui peut arriver avec des invites système volumineuses ou complexes, ajoutez des directives pour l'orienter. Comme toujours, mesurez l'effet de tout changement de prompting sur les performances. Exemple :

Thinking adds latency and should only be used when it will meaningfully improve answer quality — typically for problems that require multistep reasoning. When in doubt, respond directly.

Inversement, si vous exécutez des charges de travail difficiles à medium et observez une sous-réflexion, le premier levier est d'augmenter l'effort. Si vous avez besoin d'un contrôle plus fin, demandez-le directement dans le prompt.

Si vous exécutez Claude Opus 4.8 à l'effort max ou xhigh, définissez un budget maximal de tokens de sortie élevé afin que le modèle ait de la marge pour réfléchir et agir à travers ses sous-agents et appels d'outils. Commencez à 64k tokens et ajustez à partir de là.

Déclenchement de l'utilisation d'outils

Claude Opus 4.8 a tendance à privilégier le raisonnement par rapport aux appels d'outils. Cela produit de meilleurs résultats dans la plupart des cas. Cependant, augmenter le réglage d'effort est un levier utile pour accroître le niveau d'utilisation d'outils, en particulier dans le travail de connaissance. Les réglages d'effort high ou xhigh montrent une utilisation d'outils nettement plus importante dans la recherche agentique et le codage. Pour les scénarios où vous souhaitez plus d'utilisation d'outils, vous pouvez également ajuster votre prompt pour indiquer explicitement au modèle quand et comment utiliser correctement ses outils. Par exemple, si vous constatez que le modèle n'utilise pas vos outils de recherche web, décrivez clairement pourquoi et comment il devrait le faire.

Mises à jour de progression destinées à l'utilisateur

Claude Opus 4.8 fournit des mises à jour plus régulières et de meilleure qualité à l'utilisateur tout au long des longues traces agentiques. Si vous avez ajouté un échafaudage pour forcer des messages d'état intermédiaires (« Après chaque 3 appels d'outils, résume la progression »), essayez de le supprimer. Si vous constatez que la longueur ou le contenu des mises à jour destinées à l'utilisateur de Claude Opus 4.8 ne sont pas bien calibrés pour votre cas d'usage, décrivez explicitement à quoi ces mises à jour devraient ressembler dans le prompt et fournissez des exemples.

Suivi plus littéral des instructions

Claude Opus 4.8 interprète les prompts de manière littérale et explicite, en particulier aux niveaux d'effort inférieurs. Il ne généralise pas silencieusement une instruction d'un élément à un autre, et il n'infère pas des demandes que vous n'avez pas formulées. L'avantage de ce littéralisme est la précision et moins de tâtonnements, et il fonctionne généralement mieux pour les cas d'usage d'API avec des prompts soigneusement ajustés, l'extraction structurée et les pipelines où vous souhaitez un comportement prévisible. Si vous avez besoin que Claude applique une instruction de manière large, indiquez explicitement la portée (par exemple, « Applique ce formatage à chaque section, pas seulement à la première »).

Ton et style d'écriture

Comme avec tout nouveau modèle, le style de prose sur les écrits longs peut évoluer. Claude Opus 4.8 tend vers un style direct et affirmé avec un minimum de formulations de validation et une utilisation parcimonieuse des emojis. Si votre produit repose sur une voix spécifique, réévaluez les prompts de style par rapport à la nouvelle base de référence.

Par exemple, si la voix de votre produit est plus chaleureuse ou plus conversationnelle, ajoutez :

Use a warm, collaborative tone. Acknowledge the user's framing before answering.

Contrôle de la création de sous-agents

Claude Opus 4.8 a tendance à créer moins de sous-agents par défaut. Cependant, ce comportement est orientable par le prompting ; donnez à Claude Opus 4.8 des directives explicites sur les moments où les sous-agents sont souhaitables. Un exemple simple pour un cas d'usage de codage :

Do not spawn a subagent for work you can complete directly in a single response (e.g. refactoring a function you can already see).

Spawn multiple subagents in the same turn when fanning out across items or reading multiple files.

Design et paramètres par défaut du frontend

Claude Opus 4.8 a de solides instincts de design, avec un style maison par défaut cohérent : des arrière-plans crème chaud/blanc cassé (~#F4F1EA), une typographie d'affichage serif (Georgia, Fraunces, Playfair), des accents de mots en italique et un accent terracotta/ambre. Cela convient bien aux briefs éditoriaux, d'hôtellerie et de portfolio, mais semblera inadapté pour les tableaux de bord, les outils de développement, la fintech, la santé ou les applications d'entreprise. Ce style par défaut apparaît dans les présentations et les interfaces web.

Ce comportement par défaut est persistant. Les instructions génériques (« n'utilise pas de crème », « rends-le épuré et minimal ») ont tendance à faire basculer le modèle vers une autre palette fixe plutôt que de produire de la variété. Deux approches fonctionnent de manière fiable :

1. Spécifiez une alternative concrète. Le modèle suit précisément les spécifications explicites :

Design a desktop landing page for a supplement brand called AEFRM.

The visual direction should come from a cold monochrome atmosphere using pale silver-gray tones that gradually deepen into blue-gray and near-black, similar to a misted metallic surface.

The page should feel sharp and controlled, with a strong sense of structure and restraint.

Use this tonal system across the full page instead of introducing bright accent colors.

Use the uploaded image on the hero design in black and white.

The layout should be built with clear horizontal sections and a centered max-width container. Use 4px corner radius consistently across cards, buttons, inputs, and media frames. Margins should feel generous, with enough empty space around each section so the page breathes.

Typography should use a square, angular sans-serif with wider letter spacing than usual, especially in headings and navigation, so the text feels more engineered and less compressed. Headline text can be large and uppercase, while supporting copy remains short and sparse. The sub texts should be written with Alumni Sans SC in 4-6px like tiny little texts on corners bottom centre like that.

For the structure, start with a hero section containing a strong product statement, one short supporting paragraph, and a clean product placeholder or packshot frame. Below that, add a benefit grid with three or four blocks, then a formulation or ingredients section, and finally a cta.

Buttons should be flat and precise, with subtle hover changes using transition: all 160ms ease out where brightness and border contrast shift slightly rather than using dramatic motion.

Color palette should stay within this range:
#E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.

2. Demandez au modèle de proposer des options avant de construire. Cela rompt le comportement par défaut et donne le contrôle aux utilisateurs. Si vous vous appuyiez auparavant sur temperature pour la variété de design, utilisez cette approche ; elle produit des directions significativement différentes d'une exécution à l'autre. Exemple de prompt :

Before building, propose 4 distinct visual directions tailored to this brief (each as: bg hex / accent hex / typeface — one-line rationale). Ask the user to pick one, then implement only that direction.

De plus, Claude Opus 4.8 nécessite moins de prompting de design frontend que les modèles précédents pour éviter les motifs génériques que les utilisateurs appellent l'esthétique « AI slop ». Avec les modèles antérieurs, Anthropic recommandait un extrait de code de prompt plus long dans la compétence frontend-design. Cependant, Claude Opus 4.8 génère des frontends distinctifs et créatifs avec des directives de prompting plus minimales. Cet extrait de code de prompt fonctionne bien avec les conseils de prompting précédents pour la variété :

<frontend_aesthetics>
NEVER use generic AI-generated aesthetics like overused font families (Inter, Roboto, Arial, system fonts), cliched color schemes (particularly purple gradients on white or dark backgrounds), predictable layouts and component patterns, and cookie-cutter design that lacks context-specific character. Use unique fonts, cohesive colors and themes, and animations for effects and micro-interactions.
</frontend_aesthetics>

Produits de codage interactifs

L'utilisation de tokens et le comportement de Claude Opus 4.8 peuvent différer entre les agents de codage autonomes et asynchrones avec un seul tour utilisateur et les agents de codage interactifs et synchrones avec plusieurs tours utilisateur. Plus précisément, il a tendance à utiliser plus de tokens dans les contextes interactifs, principalement parce qu'il raisonne davantage après les tours utilisateur. Cela peut améliorer la cohérence à long terme, le suivi des instructions et les capacités de codage dans les longues sessions de codage interactives, mais s'accompagne également d'une utilisation accrue de tokens. Pour maximiser à la fois les performances et l'efficacité en tokens dans les produits de codage, utilisez l'effort xhigh ou high, ajoutez des fonctionnalités autonomes comme un mode automatique, et réduisez le nombre d'interactions humaines requises de la part de vos utilisateurs.

Bien sûr, lorsque vous limitez le nombre d'interactions utilisateur requises, il est important de spécifier la tâche, l'intention et les contraintes pertinentes dès le départ dans le premier tour humain. Fournir des descriptions de tâches bien spécifiées, claires et précises dès le départ peut aider à maximiser l'autonomie et l'intelligence tout en minimisant l'utilisation supplémentaire de tokens après les tours utilisateur. Comme Claude Opus 4.8 est plus autonome que les modèles précédents, ce modèle d'utilisation aide à maximiser les performances. En revanche, des prompts ambigus ou sous-spécifiés transmis progressivement sur plusieurs tours utilisateur ont tendance à réduire relativement l'efficacité en tokens et parfois les performances.

Harnais de revue de code

Claude Opus 4.8 est nettement meilleur pour trouver des bugs que les modèles précédents, et présente à la fois un meilleur rappel et une meilleure précision dans les évaluations internes. Cependant, si votre harnais de revue de code a été ajusté pour un modèle antérieur, vous pourriez initialement observer un rappel plus faible. Il s'agit probablement d'un effet du harnais, et non d'une régression de capacité. Lorsqu'un prompt de revue dit des choses comme « ne signale que les problèmes de haute sévérité », « sois conservateur » ou « ne pinaille pas », Claude Opus 4.8 peut suivre cette instruction plus fidèlement que les modèles antérieurs : il peut examiner le code tout aussi minutieusement, identifier les bugs, puis ne pas signaler les constats qu'il juge en dessous du seuil que vous avez indiqué. Cela peut se manifester par le fait que le modèle effectue la même profondeur d'investigation mais convertit moins d'investigations en constats signalés, en particulier sur les bugs de moindre sévérité. La précision augmente généralement, mais le rappel mesuré peut diminuer même si la capacité sous-jacente du modèle à trouver des bugs s'est améliorée.

Quelques formulations de prompt recommandées :

Report every issue you find, including ones you are uncertain about or consider low-severity. Do not filter for importance or confidence at this stage - a separate verification step will do that. Your goal here is coverage: it is better to surface a finding that later gets filtered out than to silently drop a real bug. For each finding, include your confidence level and an estimated severity so a downstream filter can rank them.

Ce prompt peut être utilisé sans avoir réellement de seconde étape, mais déplacer le filtrage par confiance hors de l'étape de détection aide souvent. Si votre harnais dispose d'une étape distincte de vérification, de déduplication ou de classement, indiquez explicitement au modèle que son travail à l'étape de détection est la couverture plutôt que le filtrage.

Si vous souhaitez que le modèle s'auto-filtre en une seule passe, soyez concret sur l'emplacement du seuil plutôt que d'utiliser des termes qualitatifs comme « important » : par exemple, « signale tout bug qui pourrait causer un comportement incorrect, un échec de test ou un résultat trompeur ; omets uniquement les détails mineurs comme les préférences de pur style ou de nommage ».

Itérez sur les prompts par rapport à un sous-ensemble de vos évaluations ou cas de test pour valider les gains de rappel ou de score F1.

Utilisation de l'ordinateur

La capacité d'utilisation de l'ordinateur fonctionne à toutes les résolutions, jusqu'à une résolution maximale de 2576px / 3,75MP. Les tests internes d'utilisation de l'ordinateur montrent que l'envoi d'images en 1080p offre un bon équilibre entre performance et coût.

Pour les charges de travail particulièrement sensibles aux coûts, 720p ou 1366×768 sont des options moins coûteuses avec de bonnes performances. Effectuez vos propres tests pour trouver les réglages idéaux pour votre cas d'usage ; expérimenter avec les réglages d'effort peut également aider à ajuster le comportement du modèle.

Was this page helpful?

Bonnes pratiquesIngénierie de prompts

Prompting pour Claude Opus 4.8

Longueur de réponse et verbosité

Si votre produit dépend d'un certain style ou d'une certaine verbosité de sortie, vous devrez peut-être ajuster vos prompts. Par exemple, pour diminuer la verbosité, vous pourriez ajouter :

Provide concise, focused responses. Skip non-essential context, and keep examples minimal.

Calibrage de l'effort et de la profondeur de réflexion

max : L'effort maximal peut apporter des gains de performance dans certains cas d'usage, mais peut montrer des rendements décroissants par rapport à l'augmentation de l'utilisation des tokens. Ce réglage peut aussi parfois être sujet à une réflexion excessive. Testez l'effort maximal pour les tâches exigeantes en intelligence.
xhigh : L'effort extra élevé est le meilleur réglage pour la plupart des cas d'usage de codage et agentiques.
high : Ce réglage équilibre l'utilisation des tokens et l'intelligence. Pour la plupart des cas d'usage sensibles à l'intelligence, utilisez un minimum d'effort high.
medium : Bon pour les cas d'usage sensibles aux coûts qui doivent réduire l'utilisation des tokens en échange d'une intelligence moindre.
low : À réserver aux tâches courtes et délimitées et aux charges de travail sensibles à la latence qui ne sont pas sensibles à l'intelligence.

This task involves multistep reasoning. Think carefully through the problem before responding.

L'effort est susceptible d'être plus important pour ce modèle que pour tout Opus précédent, alors expérimentez activement avec lui lors de votre mise à niveau.

Thinking adds latency and should only be used when it will meaningfully improve answer quality — typically for problems that require multistep reasoning. When in doubt, respond directly.

Déclenchement de l'utilisation d'outils

Mises à jour de progression destinées à l'utilisateur

Suivi plus littéral des instructions

Ton et style d'écriture

Par exemple, si la voix de votre produit est plus chaleureuse ou plus conversationnelle, ajoutez :

Use a warm, collaborative tone. Acknowledge the user's framing before answering.

Contrôle de la création de sous-agents

Do not spawn a subagent for work you can complete directly in a single response (e.g. refactoring a function you can already see).

Spawn multiple subagents in the same turn when fanning out across items or reading multiple files.

Design et paramètres par défaut du frontend

1. Spécifiez une alternative concrète. Le modèle suit précisément les spécifications explicites :

Design a desktop landing page for a supplement brand called AEFRM.

The visual direction should come from a cold monochrome atmosphere using pale silver-gray tones that gradually deepen into blue-gray and near-black, similar to a misted metallic surface.

The page should feel sharp and controlled, with a strong sense of structure and restraint.

Use this tonal system across the full page instead of introducing bright accent colors.

Use the uploaded image on the hero design in black and white.

The layout should be built with clear horizontal sections and a centered max-width container. Use 4px corner radius consistently across cards, buttons, inputs, and media frames. Margins should feel generous, with enough empty space around each section so the page breathes.

Typography should use a square, angular sans-serif with wider letter spacing than usual, especially in headings and navigation, so the text feels more engineered and less compressed. Headline text can be large and uppercase, while supporting copy remains short and sparse. The sub texts should be written with Alumni Sans SC in 4-6px like tiny little texts on corners bottom centre like that.

For the structure, start with a hero section containing a strong product statement, one short supporting paragraph, and a clean product placeholder or packshot frame. Below that, add a benefit grid with three or four blocks, then a formulation or ingredients section, and finally a cta.

Buttons should be flat and precise, with subtle hover changes using transition: all 160ms ease out where brightness and border contrast shift slightly rather than using dramatic motion.

Color palette should stay within this range:
#E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.

Before building, propose 4 distinct visual directions tailored to this brief (each as: bg hex / accent hex / typeface — one-line rationale). Ask the user to pick one, then implement only that direction.

<frontend_aesthetics>
NEVER use generic AI-generated aesthetics like overused font families (Inter, Roboto, Arial, system fonts), cliched color schemes (particularly purple gradients on white or dark backgrounds), predictable layouts and component patterns, and cookie-cutter design that lacks context-specific character. Use unique fonts, cohesive colors and themes, and animations for effects and micro-interactions.
</frontend_aesthetics>

Produits de codage interactifs

Harnais de revue de code

Quelques formulations de prompt recommandées :

Report every issue you find, including ones you are uncertain about or consider low-severity. Do not filter for importance or confidence at this stage - a separate verification step will do that. Your goal here is coverage: it is better to surface a finding that later gets filtered out than to silently drop a real bug. For each finding, include your confidence level and an estimated severity so a downstream filter can rank them.

Itérez sur les prompts par rapport à un sous-ensemble de vos évaluations ou cas de test pour valider les gains de rappel ou de score F1.

Utilisation de l'ordinateur

Was this page helpful?

Longueur de réponse et verbosité

Calibrage de l'effort et de la profondeur de réflexion

Déclenchement de l'utilisation d'outils

Mises à jour de progression destinées à l'utilisateur

Suivi plus littéral des instructions

Ton et style d'écriture

Contrôle de la création de sous-agents

Design et paramètres par défaut du frontend

Produits de codage interactifs

Harnais de revue de code

Utilisation de l'ordinateur

Longueur de réponse et verbosité

Calibrage de l'effort et de la profondeur de réflexion

Déclenchement de l'utilisation d'outils

Mises à jour de progression destinées à l'utilisateur

Suivi plus littéral des instructions

Ton et style d'écriture

Contrôle de la création de sous-agents

Design et paramètres par défaut du frontend

Produits de codage interactifs

Harnais de revue de code

Utilisation de l'ordinateur

Longueur de réponse et verbosité

Calibrage de l'effort et de la profondeur de réflexion

Déclenchement de l'utilisation d'outils

Mises à jour de progression destinées à l'utilisateur

Suivi plus littéral des instructions

Ton et style d'écriture

Contrôle de la création de sous-agents

Design et paramètres par défaut du frontend

Produits de codage interactifs

Harnais de revue de code

Utilisation de l'ordinateur

Longueur de réponse et verbosité

Calibrage de l'effort et de la profondeur de réflexion

Déclenchement de l'utilisation d'outils

Mises à jour de progression destinées à l'utilisateur

Suivi plus littéral des instructions

Ton et style d'écriture

Contrôle de la création de sous-agents

Design et paramètres par défaut du frontend

Produits de codage interactifs

Harnais de revue de code

Utilisation de l'ordinateur