Ce guide couvre les patterns de prompting spécifiques à Claude Opus 4.8. Pour les capacités du modèle et les changements d'API, consultez Nouveautés de Claude Opus 4.8. Pour les techniques qui s'appliquent à tous les modèles Claude actuels, consultez Bonnes pratiques de prompting.
Claude Opus 4.8 présente des points forts particuliers dans le travail agentique à long horizon, le travail intellectuel, la vision et les tâches de mémoire. Il fonctionne bien dès le départ avec les prompts existants de Claude Opus 4.7. Les patterns ci-dessous couvrent les comportements qui nécessitent le plus souvent un ajustement.
Pour les changements de paramètres d'API lors de la migration depuis Claude Opus 4.7 (paramètres d'échantillonnage, valeur par défaut de l'effort, fenêtre de contexte de 1M par défaut (200k sur Microsoft Foundry), messages système en milieu de conversation et détails d'arrêt pour refus), consultez le guide de migration.
Claude Opus 4.8 calibre la longueur de ses réponses en fonction de la complexité qu'il attribue à la tâche, plutôt que d'adopter une verbosité fixe par défaut. Cela signifie généralement des réponses plus courtes pour les recherches simples et beaucoup plus longues pour les analyses ouvertes.
Si votre produit dépend d'un certain style ou d'une certaine verbosité de sortie, vous devrez peut-être ajuster vos prompts. Par exemple, pour réduire la verbosité, vous pourriez ajouter :
Provide concise, focused responses. Skip non-essential context, and keep examples minimal.Si vous observez des exemples spécifiques de types de verbosité (comme des explications excessives), vous pouvez ajouter des instructions supplémentaires dans votre prompt pour les éviter. Les exemples positifs montrant comment Claude peut communiquer avec le niveau de concision approprié tendent à être plus efficaces que les exemples négatifs ou les instructions indiquant au modèle ce qu'il ne doit pas faire.
Le paramètre effort vous permet d'ajuster l'intelligence de Claude par rapport à la dépense de tokens, en échangeant de la capacité contre une vitesse plus rapide et des coûts réduits. Commencez avec le niveau d'effort xhigh pour les cas d'usage de codage et agentiques, et utilisez un minimum de high pour la plupart des cas d'usage sensibles à l'intelligence. Expérimentez avec d'autres niveaux d'effort pour affiner davantage l'utilisation de tokens et l'intelligence :
max : L'effort maximal peut apporter des gains de performance dans certains cas d'usage, mais peut présenter des rendements décroissants en raison de l'augmentation de l'utilisation de tokens. Ce réglage peut aussi parfois être sujet à la sur-réflexion. Testez l'effort maximal pour les tâches exigeantes en intelligence.xhigh : L'effort extra élevé est le meilleur réglage pour la plupart des cas d'usage de codage et agentiques.high : Ce réglage équilibre l'utilisation de tokens et l'intelligence. Pour la plupart des cas d'usage sensibles à l'intelligence, utilisez un minimum d'effort high.medium : Adapté aux cas d'usage sensibles aux coûts qui doivent réduire l'utilisation de tokens tout en sacrifiant une partie de l'intelligence.low : À réserver aux tâches courtes et bien délimitées ainsi qu'aux charges de travail sensibles à la latence qui ne sont pas sensibles à l'intelligence.Claude Opus 4.8 respecte strictement les niveaux d'effort, en particulier dans la partie basse. À low et medium, le modèle limite son travail à ce qui a été demandé plutôt que d'aller au-delà. C'est bénéfique pour la latence et le coût, mais sur des tâches modérément complexes exécutées à l'effort low, il existe un certain risque de sous-réflexion.
Si vous observez un raisonnement superficiel sur des problèmes complexes, augmentez l'effort à high ou xhigh plutôt que de contourner le problème par le prompting. Si vous devez maintenir l'effort à low pour des raisons de latence, ajoutez des indications ciblées :
This task involves multi-step reasoning. Think carefully through the problem before responding.L'effort sera probablement plus important pour ce modèle que pour tout Opus précédent, alors expérimentez activement avec ce paramètre lors de votre mise à niveau.
Sur Claude Opus 4.8, la réflexion est désactivée sauf si vous définissez explicitement thinking: {type: "adaptive"}. Le comportement de déclenchement de la réflexion adaptative est pilotable. Si vous constatez que le modèle réfléchit plus souvent que vous ne le souhaiteriez, ce qui peut arriver avec des invites système volumineuses ou complexes, ajoutez des indications pour l'orienter. Comme toujours, mesurez l'effet de tout changement de prompting sur les performances. Exemple :
Thinking adds latency and should only be used when it will meaningfully improve answer
quality — typically for problems that require multi-step reasoning. When in doubt,
respond directly.Inversement, si vous exécutez des charges de travail difficiles à medium et observez une sous-réflexion, le premier levier est d'augmenter l'effort. Si vous avez besoin d'un contrôle plus fin, demandez-le directement dans le prompt.
Si vous exécutez Claude Opus 4.8 à l'effort max ou xhigh, définissez un budget de tokens de sortie maximal élevé afin que le modèle ait la place de réfléchir et d'agir à travers ses sous-agents et appels d'outils. Commencez à 64k tokens et ajustez à partir de là.
Claude Opus 4.8 a tendance à privilégier le raisonnement par rapport aux appels d'outils. Cela produit de meilleurs résultats dans la plupart des cas. Cependant, augmenter le réglage d'effort est un levier utile pour accroître le niveau d'utilisation d'outils, en particulier dans le travail intellectuel. Les réglages d'effort high ou xhigh montrent une utilisation d'outils nettement plus importante dans la recherche agentique et le codage. Pour les scénarios où vous souhaitez davantage d'utilisation d'outils, vous pouvez également ajuster votre prompt pour indiquer explicitement au modèle quand et comment utiliser correctement ses outils. Par exemple, si vous constatez que le modèle n'utilise pas vos outils de recherche web, décrivez clairement pourquoi et comment il devrait le faire.
Claude Opus 4.8 fournit des mises à jour plus régulières et de meilleure qualité à l'utilisateur tout au long des longues traces agentiques. Si vous avez ajouté un échafaudage pour forcer des messages d'état intermédiaires (« Après chaque série de 3 appels d'outils, résume la progression »), essayez de le supprimer. Si vous constatez que la longueur ou le contenu des mises à jour destinées à l'utilisateur de Claude Opus 4.8 ne sont pas bien calibrés pour votre cas d'usage, décrivez explicitement à quoi ces mises à jour devraient ressembler dans le prompt et fournissez des exemples.
Claude Opus 4.8 interprète les prompts de manière littérale et explicite, en particulier aux niveaux d'effort inférieurs. Il ne généralise pas silencieusement une instruction d'un élément à un autre, et il n'infère pas de demandes que vous n'avez pas formulées. L'avantage de ce littéralisme est la précision et moins de va-et-vient, et il fonctionne généralement mieux pour les cas d'usage d'API avec des prompts soigneusement ajustés, l'extraction structurée et les pipelines où vous souhaitez un comportement prévisible. Si vous avez besoin que Claude applique une instruction de manière large, indiquez explicitement la portée (par exemple, « Applique ce formatage à chaque section, pas seulement à la première »).
Comme avec tout nouveau modèle, le style de prose sur les écrits longs peut évoluer. Claude Opus 4.8 tend vers un style direct et affirmé, avec un minimum de formulations axées sur la validation et un usage parcimonieux des emojis. Si votre produit repose sur une voix spécifique, réévaluez les prompts de style par rapport à la nouvelle référence.
Par exemple, si la voix de votre produit est plus chaleureuse ou plus conversationnelle, ajoutez :
Use a warm, collaborative tone. Acknowledge the user's framing before answering.Claude Opus 4.8 a tendance à créer moins de sous-agents par défaut. Cependant, ce comportement est pilotable via le prompting ; donnez à Claude Opus 4.8 des indications explicites sur les situations où les sous-agents sont souhaitables. Un exemple simplifié pour un cas d'usage de codage :
Do not spawn a subagent for work you can complete directly in a single response (e.g.
refactoring a function you can already see).
Spawn multiple subagents in the same turn when fanning out across items or reading multiple files.Claude Opus 4.8 possède de solides instincts de design, avec un style maison par défaut cohérent : arrière-plans crème chaud/blanc cassé (~#F4F1EA), typographie d'affichage à empattements (Georgia, Fraunces, Playfair), accents de mots en italique et une couleur d'accent terracotta/ambre. Cela convient bien aux briefs éditoriaux, d'hôtellerie et de portfolio, mais semblera déplacé pour les tableaux de bord, les outils de développement, la fintech, la santé ou les applications d'entreprise. Ce style par défaut apparaît aussi bien dans les présentations de diapositives que dans les interfaces web.
Ce style par défaut est persistant. Les instructions génériques (« n'utilise pas de crème », « rends-le épuré et minimaliste ») tendent à faire basculer le modèle vers une autre palette fixe plutôt que de produire de la variété. Deux approches fonctionnent de manière fiable :
1. Spécifiez une alternative concrète. Le modèle suit les spécifications explicites avec précision :
Design a desktop landing page for a supplement brand called AEFRM.
The visual direction should come from a cold monochrome atmosphere using pale
silver-gray tones that gradually deepen into blue-gray and near-black, similar to a
misted metallic surface.
The page should feel sharp and controlled, with a strong sense of structure and restraint.
Use this tonal system across the full page instead of introducing bright accent colors.
Use the uploaded image on the hero design in black and white.
The layout should be built with clear horizontal sections and a centered max-width
container. Use 4px corner radius consistently across cards, buttons, inputs, and media
frames. Margins should feel generous, with enough empty space around each section so the
page breathes.
Typography should use a square, angular sans-serif with wider letter spacing than usual,
especially in headings and navigation, so the text feels more engineered and less
compressed. Headline text can be large and uppercase, while supporting copy remains
short and sparse. The sub texts should be written with Alumni Sans SC in 4-6px like tiny
little texts on corners bottom centre like that.
For the structure, start with a hero section containing a strong product statement, one
short supporting paragraph, and a clean product placeholder or packshot frame. Below
that, add a benefit grid with three or four blocks, then a formulation or ingredients
section, and finally a cta.
Buttons should be flat and precise, with subtle hover changes using transition: all
160ms ease out where brightness and border contrast shift slightly rather than using
dramatic motion.
Color palette should stay within this range:
#E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.2. Demandez au modèle de proposer des options avant de construire. Cela rompt le style par défaut et donne le contrôle aux utilisateurs. Si vous vous appuyiez auparavant sur temperature pour obtenir de la variété dans le design, utilisez cette approche ; elle produit des directions significativement différentes d'une exécution à l'autre. Exemple de prompt :
Before building, propose 4 distinct visual directions tailored to this brief (each as:
bg hex / accent hex / typeface — one-line rationale). Ask the user to pick one, then
implement only that direction.De plus, Claude Opus 4.8 nécessite moins de prompting de design frontend que les modèles précédents pour éviter les patterns génériques que les utilisateurs qualifient d'esthétique « AI slop ». Avec les modèles antérieurs, Anthropic recommandait un extrait de code de prompt plus long dans le skill frontend-design. Cependant, Claude Opus 4.8 génère des frontends distinctifs et créatifs avec des indications de prompting plus minimales. Cet extrait de code de prompt fonctionne bien avec les conseils de prompting ci-dessus pour la variété :
<frontend_aesthetics>
NEVER use generic AI-generated aesthetics like overused font families (Inter, Roboto,
Arial, system fonts), cliched color schemes (particularly purple gradients on white or
dark backgrounds), predictable layouts and component patterns, and cookie-cutter design
that lacks context-specific character. Use unique fonts, cohesive colors and themes, and
animations for effects and micro-interactions.
</frontend_aesthetics>L'utilisation de tokens et le comportement de Claude Opus 4.8 peuvent différer entre les agents de codage autonomes et asynchrones avec un seul tour utilisateur et les agents de codage interactifs et synchrones avec plusieurs tours utilisateur. Plus précisément, il a tendance à utiliser plus de tokens dans les contextes interactifs, principalement parce qu'il raisonne davantage après les tours utilisateur. Cela peut améliorer la cohérence à long horizon, le suivi des instructions et les capacités de codage dans les longues sessions de codage interactives, mais s'accompagne également d'une utilisation accrue de tokens. Pour maximiser à la fois les performances et l'efficacité en tokens dans les produits de codage, utilisez l'effort xhigh ou high, ajoutez des fonctionnalités autonomes comme un mode automatique, et réduisez le nombre d'interactions humaines requises de vos utilisateurs.
Bien entendu, lorsque vous limitez le nombre d'interactions utilisateur requises, il est important de spécifier la tâche, l'intention et les contraintes pertinentes dès le départ dans le premier tour humain. Fournir des descriptions de tâches bien spécifiées, claires et précises dès le départ peut aider à maximiser l'autonomie et l'intelligence tout en minimisant l'utilisation supplémentaire de tokens après les tours utilisateur. Comme Claude Opus 4.8 est plus autonome que les modèles précédents, ce pattern d'utilisation aide à maximiser les performances. En revanche, les prompts ambigus ou sous-spécifiés transmis progressivement sur plusieurs tours utilisateur tendent à réduire relativement l'efficacité en tokens et parfois les performances.
Claude Opus 4.8 est significativement meilleur pour trouver des bugs que les modèles précédents, et présente à la fois un rappel et une précision plus élevés dans les évaluations internes. Cependant, si votre harnais de revue de code a été ajusté pour un modèle antérieur, vous pourriez initialement observer un rappel plus faible. Il s'agit probablement d'un effet de harnais, et non d'une régression de capacité. Lorsqu'un prompt de revue indique des choses comme « ne signale que les problèmes de haute gravité », « sois conservateur » ou « ne pinaille pas », Claude Opus 4.8 peut suivre cette instruction plus fidèlement que les modèles antérieurs : il peut examiner le code tout aussi minutieusement, identifier les bugs, puis ne pas signaler les constatations qu'il juge en dessous de votre seuil déclaré. Cela peut se manifester par le fait que le modèle effectue la même profondeur d'investigation mais convertit moins d'investigations en constatations signalées, en particulier sur les bugs de moindre gravité. La précision augmente généralement, mais le rappel mesuré peut diminuer même si la capacité sous-jacente du modèle à trouver des bugs s'est améliorée.
Quelques formulations de prompt recommandées :
Report every issue you find, including ones you are uncertain about or consider
low-severity. Do not filter for importance or confidence at this stage - a separate
verification step will do that. Your goal here is coverage: it is better to surface a
finding that later gets filtered out than to silently drop a real bug. For each finding,
include your confidence level and an estimated severity so a downstream filter can rank
them.Ce prompt peut être utilisé sans avoir de véritable deuxième étape, mais déplacer le filtrage par confiance hors de l'étape de détection aide souvent. Si votre harnais comporte une étape distincte de vérification, de déduplication ou de classement, indiquez explicitement au modèle que son rôle à l'étape de détection est la couverture plutôt que le filtrage.
Si vous souhaitez que le modèle s'auto-filtre en une seule passe, soyez concret sur l'emplacement du seuil plutôt que d'utiliser des termes qualitatifs comme « important » : par exemple, « signale tout bug qui pourrait causer un comportement incorrect, un échec de test ou un résultat trompeur ; omets uniquement les broutilles comme les préférences purement stylistiques ou de nommage ».
Itérez sur les prompts en les testant sur un sous-ensemble de vos évaluations ou cas de test pour valider les gains de rappel ou de score F1.
La capacité computer use (utilisation de l'ordinateur) fonctionne à toutes les résolutions, jusqu'à une résolution maximale de 2576px / 3,75 MP. Les tests internes d'utilisation de l'ordinateur montrent que l'envoi d'images en 1080p offre un bon équilibre entre performance et coût.
Pour les charges de travail particulièrement sensibles aux coûts, 720p ou 1366×768 sont des options moins coûteuses avec de solides performances. Effectuez vos propres tests pour trouver les réglages idéaux pour votre cas d'usage ; expérimenter avec les réglages d'effort peut également aider à ajuster le comportement du modèle.
Was this page helpful?