Ce guide couvre les schémas de prompting et de « scaffolding » (échafaudage) spécifiques à Claude Fable 5 et Claude Mythos 5. Pour les capacités du modèle, les modifications de l'API, la tarification et la disponibilité, consultez Présentation de Claude Fable 5 et Claude Mythos 5. Pour les techniques qui s'appliquent à tous les modèles Claude actuels, consultez Bonnes pratiques de prompting.
Claude Fable 5 s'attaque à des problèmes qui étaient auparavant trop complexes, trop longs ou trop ambigus pour les modèles précédents, et se montre particulièrement efficace pour le travail de bout en bout qui prendrait à une personne des heures, des jours ou des semaines. Les équipes qui obtiennent les meilleurs résultats appliquent Claude Fable 5 à leurs problèmes non résolus les plus difficiles ; le tester uniquement sur des charges de travail plus simples tend à sous-estimer l'étendue de ses capacités. Il fonctionne également de manière fiable sur des tâches plus simples.
Claude Fable 5 présente plusieurs différences comportementales par rapport à Claude Opus 4.8 qui peuvent nécessiter des mises à jour des prompts ou du scaffolding. Des améliorations de capacités à ce niveau sont également une bonne occasion de réévaluer quelles instructions, quels outils et quels garde-fous sont encore nécessaires. Les schémas ci-dessous couvrent les comportements qui nécessitent le plus souvent des ajustements.
Pour les modifications de paramètres d'API spécifiques à Claude Fable 5 et Claude Mythos 5 (réflexion adaptative uniquement, sortie de réflexion résumée uniquement, pas de budgets de réflexion étendue, la raison d'arrêt refusal et la gestion du repli), consultez Présentation de Claude Fable 5 et Claude Mythos 5.
Claude Fable 5 exécute des classificateurs de sécurité qui ciblent les techniques de cybersécurité offensives (telles que la création d'exploits, de logiciels malveillants ou d'outils d'attaque), le contenu relatif à la biologie et aux sciences de la vie (tel que les méthodes de laboratoire ou les mécanismes moléculaires), et l'extraction de la réflexion résumée du modèle. Le travail de cybersécurité bénin et les tâches bénéfiques en sciences de la vie peuvent également déclencher ces protections. Pour rediriger automatiquement les requêtes refusées, configurez le repli côté serveur ou côté client vers Claude Opus 4.8.
Par rapport à Claude Opus 4.8, Claude Fable 5 présente des améliorations dans les domaines suivants :
Au-delà de ces améliorations spécifiques, Claude Fable 5 est généralement plus performant que les modèles précédents sur presque toutes les tâches. Claude Fable 5 n'est pas destiné au travail de cybersécurité offensive ni à la biologie et aux sciences de la vie ; les requêtes dans ces domaines peuvent renvoyer stop_reason: "refusal".
Les requêtes individuelles sur des tâches difficiles peuvent s'exécuter pendant de nombreuses minutes aux niveaux d'effort plus élevés, en particulier lorsque la tâche nécessite de rassembler du contexte, de construire et de s'auto-vérifier, et les exécutions autonomes peuvent s'étendre sur des heures. C'est l'un des changements les plus importants que les équipes rencontrent lorsqu'elles s'adaptent à Claude Fable 5. Ajustez les délais d'expiration client, le streaming et les indicateurs de progression visibles par l'utilisateur avant de migrer, et envisagez de restructurer les harnais pour vérifier les exécutions de manière asynchrone, par exemple via des tâches planifiées, plutôt que de bloquer. Pour empêcher Claude Fable 5 de sur-planifier lorsqu'une tâche est ambiguë :
When you have enough information to act, act. Do not re-derive facts already established
in the conversation, re-litigate a decision the user has already made, or narrate
options you will not pursue in user-facing messages. If you are weighing a choice, give
a recommendation, not an exhaustive survey. This does not apply to thinking blocks.L'effort est le principal contrôle du compromis entre intelligence, latence et coût sur Claude Fable 5. Utilisez high par défaut pour la plupart des tâches, avec xhigh pour les charges de travail les plus sensibles aux capacités et medium ou low pour le travail de routine. Les niveaux d'effort inférieurs sur Claude Fable 5 fonctionnent toujours bien et dépassent souvent les performances de xhigh sur les modèles précédents. Réduisez l'effort si une tâche se termine mais prend plus de temps que nécessaire, ou si vous souhaitez un style de travail plus rapide et plus interactif.
Sur du travail de routine à un effort plus élevé, Claude Fable 5 peut rassembler du contexte et délibérer au-delà de ce que la tâche nécessite. En même temps, un effort plus élevé produit souvent un excellent comportement de vérification, un raisonnement sophistiqué et les résultats les plus rigoureux. Pour éviter le nettoyage ou le refactoring non demandés à un effort plus élevé :
Don't add features, refactor, or introduce abstractions beyond what the task requires. A
bug fix doesn't need surrounding cleanup and a one-shot operation usually doesn't need a
helper. Don't design for hypothetical future requirements: do the simplest thing that
works well. Avoid premature abstraction and half-finished implementations. Don't add
error handling, fallbacks, or validation for scenarios that cannot happen. Trust
internal code and framework guarantees. Only validate at system boundaries (user input,
external APIs). Don't use feature flags or backwards-compatibility shims when you can
just change the code.Le suivi des instructions est suffisamment amélioré pour que vous puissiez orienter la plupart des comportements avec une brève instruction plutôt qu'en énumérant chaque comportement par son nom. Par exemple, sans orientation, Claude Fable 5 peut développer au-delà de ce que la tâche nécessite, en particulier aux niveaux d'effort plus élevés : passer en revue des options qu'il ne poursuivra pas, expliquer longuement les causes profondes, produire des descriptions de PR fortement structurées, ou écrire des commentaires qui narrent ce que fait la ligne suivante. Une courte instruction de concision est aussi efficace que de lister chaque schéma :
Lead with the outcome. Your first sentence after finishing should answer "what happened"
or "what did you find": the thing the user would ask for if they said "just give me the
TLDR." Supporting detail and reasoning come after. Being readable and being concise are
different things, and readability matters more.
The way to keep output short is to be selective about what you include (drop details
that don't change what the reader would do next), not to compress the writing into
fragments, abbreviations, arrow chains like A → B → fails, or jargon.Il en va de même pour le comportement de point de contrôle dans les flux de travail de longue durée. Pour que Claude Fable 5 ne s'arrête que là où il a réellement besoin de vous, il n'est pas nécessaire d'énumérer chaque cas :
Pause for the user only when the work genuinely requires them: a destructive or
irreversible action, a real scope change, or input that only they can provide. If you
hit one of these, ask and end the turn, rather than ending on a promise.Lors de longues exécutions autonomes, demandez à Claude Fable 5 d'auditer sa progression par rapport aux résultats réels des outils. Dans les tests d'Anthropic, cela a presque éliminé les rapports d'état fabriqués, même sur des tâches conçues pour les provoquer :
Before reporting progress, audit each claim against a tool result from this session.
Only report work you can point to evidence for; if something is not yet verified, say so
explicitly. Report outcomes faithfully: if tests fail, say so with the output; if a step
was skipped, say that; when something is done and verified, state it plainly without
hedging.Claude Fable 5 peut occasionnellement effectuer des actions non demandées (rédiger un e-mail alors qu'aucun n'a été demandé, créer des sauvegardes défensives de branches git). Définissez des contraintes explicites sur ce que Claude Fable 5 doit et ne doit pas faire :
When the user is describing a problem, asking a question, or thinking out loud rather
than requesting a change, the deliverable is your assessment. Report your findings and
stop. Don't apply a fix until they ask for one. Before running a command that changes
system state (restarts, deletes, config edits), check that the evidence actually
supports that specific action. A signal that pattern-matches to a known failure may have
a different cause.Claude Fable 5 dispatche des sous-agents parallèles plus volontiers que les modèles précédents. Utilisez fréquemment des sous-agents, fournissez des indications explicites sur les cas où la délégation est appropriée, et privilégiez la communication asynchrone entre l'orchestrateur et les sous-agents plutôt que de bloquer jusqu'au retour de chaque sous-agent. Les sous-agents de longue durée qui conservent leur contexte entre les sous-tâches économisent du temps et des coûts grâce aux lectures de cache et évitent les goulots d'étranglement sur le sous-agent le plus lent.
Delegate independent subtasks to subagents and keep working while they run. Intervene
if a subagent goes off track or is missing relevant context.Claude Fable 5 fonctionne particulièrement bien lorsqu'il peut enregistrer les leçons tirées des exécutions précédentes et les consulter. Fournissez un endroit pour écrire des notes, aussi simple qu'un fichier Markdown :
Store one lesson per file with a one-line summary at the top. Record corrections and
confirmed approaches alike, including why they mattered. Don't save what the repo or
chat history already records; update an existing note rather than creating a duplicate;
delete notes that turn out to be wrong.Pour amorcer le système de mémoire à partir de l'historique existant, demandez à Claude Fable 5 de passer en revue les sessions passées :
Reflect on the previous sessions we've had together. Use subagents to identify core
themes and lessons, and store them in [X]. Make sure you know to reference [X] for
future use.Au cours d'une longue session, Claude Fable 5 peut occasionnellement terminer un tour par une déclaration d'intention textuelle uniquement (« Je vais maintenant exécuter X ») sans émettre l'appel d'outil correspondant, ou faire une pause pour demander la permission alors qu'il dispose déjà de suffisamment d'éléments pour continuer. Un « continue » ou « vas-y et fais-le de bout en bout » suffit. Pour définir quand une pause est appropriée, associez cela à l'instruction de point de contrôle dans Suivi rigoureux des instructions. Pour les pipelines autonomes, ajoutez un rappel système :
You are operating autonomously. The user is not watching in real time and cannot answer
questions mid-task, so asking "Want me to…?" or "Shall I…?" will block the work. For
reversible actions that follow from the original request, proceed without asking.
Offering follow-ups after the task is done is fine; asking permission after already
discussing with the user before doing the work is not. Before ending your turn, check
your last paragraph. If it is a plan, an analysis, a question, a list of next steps, or
a promise about work you have not done ("I'll…", "let me know when…"), do that work now
with tool calls. End your turn only when the task is complete or you are blocked on
input only the user can provide.Dans les sessions très longues, Claude Fable 5 peut occasionnellement suggérer une nouvelle session, proposer de résumer et de passer le relais, ou réduire son propre travail. Cela est le plus souvent déclenché lorsque le harnais affiche au modèle un décompte des tokens restants. Évitez d'afficher des décomptes explicites de budget de contexte lorsque c'est possible. Si le harnais doit les afficher, une réassurance aide :
You have ample context remaining. Do not stop, summarize, or suggest a new session on
account of context limits. Continue the work.Claude Fable 5 a tendance à mieux fonctionner lorsqu'il comprend l'intention derrière une demande : le contexte lui permet de relier la tâche aux informations pertinentes plutôt que d'inférer l'intention par lui-même. Fournissez du contexte sur la raison de votre demande, en particulier pour les agents de longue durée s'appuyant sur plusieurs flux de travail :
I'm working on [the larger task] for [who it's for]. They need [what the output
enables]. With that in mind: [request].Dans les conversations étendues ou agentiques (nombreux appels d'outils, contexte de travail volumineux), Claude Fable 5 peut produire du texte difficile à suivre : notation abrégée dense avec des chaînes de flèches, détails d'implémentation approfondis, références à une réflexion que l'utilisateur n'a jamais vue, ou formulation trop technique. Un addendum sur le style de communication atténue cela :
Terse shorthand is fine between tool calls (that's you thinking out loud, and brevity
there is good). Your final summary is different: it's for a reader who didn't see any of
that.
If you've been working for a while without the user watching (overnight, across many
tool calls, since they last spoke), your final message is their first look at any of it.
Write it as a re-grounding, not a continuation of your working thread: the outcome
first, then the one or two things you need from them, each explained as if new. The
vocabulary you built up while working is yours, not theirs; leave it behind unless you
re-introduce it.
When you write the summary at the end, drop the working shorthand. Write complete
sentences. Spell out terms. Don't use arrow chains, hyphen-stacked compounds, or labels
you made up earlier. When you mention files, commits, flags, or other identifiers, give
each one its own plain-language clause. Open with the outcome: one sentence on what
happened or what you found. Then the supporting detail. If you have to choose between
short and clear, choose clear.Lors de l'exécution d'agents longs et asynchrones, donnez à l'agent un moyen de faire remonter un message que l'utilisateur doit voir exactement tel qu'il est écrit, sans mettre fin à son tour : un livrable (un extrait de code généré ou un message rédigé), une mise à jour de progression avec des chiffres précis, ou une réponse directe à une question que l'utilisateur a posée en cours de boucle. L'entrée de l'outil est le message à afficher ; lorsque Claude l'appelle, affichez l'entrée directement dans votre interface utilisateur et renvoyez un simple accusé de réception comme résultat de l'outil. Les entrées d'outils ne sont jamais résumées, le contenu arrive donc intact.
{
"name": "send_to_user",
"description": "Display a message directly to the user. Use this for progress updates, partial results, or content the user must see exactly as written before the task finishes.",
"input_schema": {
"type": "object",
"properties": {
"message": {
"type": "string",
"description": "The content to display to the user."
}
},
"required": ["message"]
}
}Ajoutez cet outil chaque fois que votre expérience utilisateur dépend de la livraison de contenu ou d'interactions directes avec l'utilisateur mot pour mot en cours de tâche. Pour les agents qui ne font que narrer la progression de routine, les propres résumés du modèle sont généralement suffisants.
Establish a method for checking your own work at an interval of [X] as you build. Run this every [X interval], verifying your work with subagents against the specification.reasoning_extraction sur Claude Fable 5, provoquant des replis élevés vers Claude Opus 4.8. Auditez les compétences et invites système existantes à la recherche d'instructions de réflexion ou de type « montre ton raisonnement » lors de la migration. Si votre application a besoin de visibilité sur le raisonnement, lisez plutôt les blocs thinking structurés de la réflexion adaptative, et utilisez un outil d'envoi à l'utilisateur pour faire remonter la progression pendant les longues exécutions.Was this page helpful?