Esta guía cubre los patrones de prompting y "scaffolding" (andamiaje) específicos de Claude Fable 5 y Claude Mythos 5. Para conocer las capacidades del modelo, los cambios en la API, los precios y la disponibilidad, consulta Presentación de Claude Fable 5 y Claude Mythos 5. Para técnicas que aplican a todos los modelos actuales de Claude, consulta Mejores prácticas de prompting.
Claude Fable 5 aborda problemas que antes eran demasiado complejos, prolongados o ambiguos para modelos anteriores, y es particularmente eficaz en trabajo de principio a fin que a una persona le tomaría horas, días o semanas completar. Los equipos que obtienen los mejores resultados aplican Claude Fable 5 a sus problemas más difíciles sin resolver; probarlo únicamente en cargas de trabajo más simples tiende a subestimar su rango de capacidades. También se desempeña de manera confiable en tareas más sencillas.
Claude Fable 5 presenta varias diferencias de comportamiento respecto a Claude Opus 4.8 que pueden requerir actualizaciones en los prompts o en el scaffolding. Las mejoras de capacidad a este nivel también son una buena oportunidad para reevaluar qué instrucciones, herramientas y salvaguardas siguen siendo necesarias. Los patrones a continuación cubren los comportamientos que con mayor frecuencia requieren ajustes.
Para los cambios en los parámetros de la API específicos de Claude Fable 5 y Claude Mythos 5 (solo pensamiento adaptativo, salida de pensamiento únicamente resumida, sin presupuestos de pensamiento extendido, la razón de detención refusal y el manejo de fallback), consulta Presentación de Claude Fable 5 y Claude Mythos 5.
Claude Fable 5 ejecuta clasificadores de seguridad que apuntan a técnicas ofensivas de ciberseguridad (como la creación de exploits, malware o herramientas de ataque), contenido de biología y ciencias de la vida (como métodos de laboratorio o mecanismos moleculares) y la extracción del pensamiento resumido del modelo. El trabajo benigno de ciberseguridad y las tareas beneficiosas de ciencias de la vida también pueden activar estas salvaguardas. Para redirigir automáticamente las solicitudes rechazadas, configura el fallback del lado del servidor o del lado del cliente hacia Claude Opus 4.8.
En comparación con Claude Opus 4.8, Claude Fable 5 muestra mejoras en:
Más allá de estas mejoras específicas, Claude Fable 5 es generalmente más capaz que los modelos anteriores en casi todas las tareas. Claude Fable 5 no está diseñado para trabajo ofensivo de ciberseguridad ni de biología y ciencias de la vida; las solicitudes en esos dominios pueden devolver stop_reason: "refusal".
Las solicitudes individuales en tareas difíciles pueden ejecutarse durante muchos minutos en configuraciones de effort (esfuerzo) más altas, especialmente cuando la tarea requiere recopilar contexto, construir y autoverificar, y las ejecuciones autónomas pueden extenderse durante horas. Este es uno de los cambios más grandes que los equipos encuentran al adaptarse a Claude Fable 5. Ajusta los tiempos de espera del cliente, el streaming y los indicadores de progreso visibles para el usuario antes de migrar, y considera reestructurar los harnesses para revisar las ejecuciones de forma asíncrona, por ejemplo mediante trabajos programados, en lugar de bloquear. Para evitar que Claude Fable 5 planifique en exceso cuando una tarea es ambigua:
When you have enough information to act, act. Do not re-derive facts already established
in the conversation, re-litigate a decision the user has already made, or narrate
options you will not pursue in user-facing messages. If you are weighing a choice, give
a recommendation, not an exhaustive survey. This does not apply to thinking blocks.Effort es el control principal para el equilibrio entre inteligencia, latencia y costo en Claude Fable 5. Usa high como valor predeterminado para la mayoría de las tareas, con xhigh para las cargas de trabajo más sensibles a la capacidad y medium o low para trabajo rutinario. Las configuraciones de esfuerzo más bajas en Claude Fable 5 siguen funcionando bien y a menudo superan el rendimiento de xhigh en modelos anteriores. Reduce el esfuerzo si una tarea se completa pero tarda más de lo necesario, o si deseas un estilo de trabajo más rápido e interactivo.
En trabajo rutinario con esfuerzo más alto, Claude Fable 5 puede recopilar contexto y deliberar más allá de lo que la tarea necesita. Al mismo tiempo, un esfuerzo más alto a menudo produce un excelente comportamiento de verificación, razonamiento sofisticado y los resultados más rigurosos. Para evitar limpieza o refactorización no solicitada con esfuerzo más alto:
Don't add features, refactor, or introduce abstractions beyond what the task requires. A
bug fix doesn't need surrounding cleanup and a one-shot operation usually doesn't need a
helper. Don't design for hypothetical future requirements: do the simplest thing that
works well. Avoid premature abstraction and half-finished implementations. Don't add
error handling, fallbacks, or validation for scenarios that cannot happen. Trust
internal code and framework guarantees. Only validate at system boundaries (user input,
external APIs). Don't use feature flags or backwards-compatibility shims when you can
just change the code.El seguimiento de instrucciones ha mejorado lo suficiente como para que puedas dirigir la mayoría de los comportamientos con una instrucción breve en lugar de enumerar cada comportamiento por nombre. Por ejemplo, sin orientación, Claude Fable 5 puede elaborar más allá de lo que la tarea necesita, especialmente en configuraciones de esfuerzo más altas: explorar opciones que no seguirá, explicar causas raíz en detalle, producir descripciones de PR muy estructuradas o escribir comentarios que narran lo que hace la siguiente línea. Una instrucción corta de brevedad es tan efectiva como enumerar cada patrón:
Lead with the outcome. Your first sentence after finishing should answer "what happened"
or "what did you find": the thing the user would ask for if they said "just give me the
TLDR." Supporting detail and reasoning come after. Being readable and being concise are
different things, and readability matters more.
The way to keep output short is to be selective about what you include (drop details
that don't change what the reader would do next), not to compress the writing into
fragments, abbreviations, arrow chains like A → B → fails, or jargon.Lo mismo aplica al comportamiento de puntos de control en flujos de trabajo de larga duración. Para que Claude Fable 5 se detenga solo donde realmente te necesita, no es necesario enumerar cada caso:
Pause for the user only when the work genuinely requires them: a destructive or
irreversible action, a real scope change, or input that only they can provide. If you
hit one of these, ask and end the turn, rather than ending on a promise.En ejecuciones autónomas largas, instruye a Claude Fable 5 para que audite el progreso contra los resultados reales de las herramientas. En las pruebas de Anthropic, esto prácticamente eliminó los informes de estado fabricados incluso en tareas diseñadas para provocarlos:
Before reporting progress, audit each claim against a tool result from this session.
Only report work you can point to evidence for; if something is not yet verified, say so
explicitly. Report outcomes faithfully: if tests fail, say so with the output; if a step
was skipped, say that; when something is done and verified, state it plainly without
hedging.Claude Fable 5 puede ocasionalmente realizar acciones no solicitadas (redactar un correo electrónico cuando no se pidió ninguno, crear copias de seguridad defensivas de ramas de git). Define restricciones explícitas sobre lo que Claude Fable 5 debe y no debe hacer:
When the user is describing a problem, asking a question, or thinking out loud rather
than requesting a change, the deliverable is your assessment. Report your findings and
stop. Don't apply a fix until they ask for one. Before running a command that changes
system state (restarts, deletes, config edits), check that the evidence actually
supports that specific action. A signal that pattern-matches to a known failure may have
a different cause.Claude Fable 5 despacha subagentes en paralelo con más facilidad que los modelos anteriores. Usa subagentes con frecuencia, proporciona orientación explícita sobre cuándo es apropiada la delegación y prefiere la comunicación asíncrona entre el orquestador y los subagentes en lugar de bloquear hasta que cada subagente regrese. Los subagentes de larga duración que mantienen su contexto entre subtareas ahorran tiempo y costo mediante lecturas de caché y evitan cuellos de botella en el subagente más lento.
Delegate independent subtasks to subagents and keep working while they run. Intervene
if a subagent goes off track or is missing relevant context.Claude Fable 5 se desempeña particularmente bien cuando puede registrar lecciones de ejecuciones anteriores y consultarlas. Proporciona un lugar para escribir notas, tan simple como un archivo Markdown:
Store one lesson per file with a one-line summary at the top. Record corrections and
confirmed approaches alike, including why they mattered. Don't save what the repo or
chat history already records; update an existing note rather than creating a duplicate;
delete notes that turn out to be wrong.Para inicializar el sistema de memoria a partir del historial existente, haz que Claude Fable 5 revise sesiones pasadas:
Reflect on the previous sessions we've had together. Use subagents to identify core
themes and lessons, and store them in [X]. Make sure you know to reference [X] for
future use.Avanzada una sesión larga, Claude Fable 5 puede ocasionalmente terminar un turno con una declaración de intención solo en texto ("Ahora ejecutaré X") sin emitir la llamada de herramienta correspondiente, o pausar para pedir permiso cuando ya tiene suficiente para continuar. Un "continúa" o "adelante, hazlo de principio a fin" es suficiente. Para definir cuándo es apropiado pausar, combina esto con la instrucción de puntos de control en Seguimiento estricto de instrucciones. Para pipelines autónomos, agrega un recordatorio del sistema:
You are operating autonomously. The user is not watching in real time and cannot answer
questions mid-task, so asking "Want me to…?" or "Shall I…?" will block the work. For
reversible actions that follow from the original request, proceed without asking.
Offering follow-ups after the task is done is fine; asking permission after already
discussing with the user before doing the work is not. Before ending your turn, check
your last paragraph. If it is a plan, an analysis, a question, a list of next steps, or
a promise about work you have not done ("I'll…", "let me know when…"), do that work now
with tool calls. End your turn only when the task is complete or you are blocked on
input only the user can provide.En sesiones muy largas, Claude Fable 5 puede ocasionalmente sugerir una nueva sesión, ofrecer resumir y hacer un traspaso, o recortar su propio trabajo. Esto se activa con mayor frecuencia cuando el harness muestra al modelo una cuenta regresiva de tokens restantes. Evita mostrar conteos explícitos de presupuesto de contexto cuando sea posible. Si el harness debe mostrarlos, una aclaración tranquilizadora ayuda:
You have ample context remaining. Do not stop, summarize, or suggest a new session on
account of context limits. Continue the work.Claude Fable 5 tiende a desempeñarse mejor cuando entiende la intención detrás de una solicitud: el contexto le permite conectar la tarea con información relevante en lugar de inferir la intención por su cuenta. Proporciona contexto sobre por qué estás preguntando, especialmente para agentes de larga duración que trabajan con múltiples líneas de trabajo:
I'm working on [the larger task] for [who it's for]. They need [what the output
enables]. With that in mind: [request].En conversaciones extendidas o agénticas (muchas llamadas a herramientas, contexto de trabajo grande), Claude Fable 5 puede producir texto difícil de seguir: notación abreviada densa con cadenas de flechas, detalles profundos de implementación, referencias a pensamiento que el usuario nunca vio o redacción excesivamente técnica. Un apéndice de estilo de comunicación mitiga esto:
Terse shorthand is fine between tool calls (that's you thinking out loud, and brevity
there is good). Your final summary is different: it's for a reader who didn't see any of
that.
If you've been working for a while without the user watching (overnight, across many
tool calls, since they last spoke), your final message is their first look at any of it.
Write it as a re-grounding, not a continuation of your working thread: the outcome
first, then the one or two things you need from them, each explained as if new. The
vocabulary you built up while working is yours, not theirs; leave it behind unless you
re-introduce it.
When you write the summary at the end, drop the working shorthand. Write complete
sentences. Spell out terms. Don't use arrow chains, hyphen-stacked compounds, or labels
you made up earlier. When you mention files, commits, flags, or other identifiers, give
each one its own plain-language clause. Open with the outcome: one sentence on what
happened or what you found. Then the supporting detail. If you have to choose between
short and clear, choose clear.Al ejecutar agentes largos y asíncronos, dale al agente una forma de mostrar un mensaje que el usuario debe ver exactamente como está escrito, sin terminar su turno: un entregable (un fragmento de código generado o un mensaje redactado), una actualización de progreso con números específicos o una respuesta directa a una pregunta que el usuario hizo en medio del ciclo. La entrada de la herramienta es el mensaje a mostrar; cuando Claude la llama, renderiza la entrada directamente en tu interfaz de usuario y devuelve un simple acuse de recibo como resultado de la herramienta. Las entradas de herramientas nunca se resumen, por lo que el contenido llega intacto.
{
"name": "send_to_user",
"description": "Display a message directly to the user. Use this for progress updates, partial results, or content the user must see exactly as written before the task finishes.",
"input_schema": {
"type": "object",
"properties": {
"message": {
"type": "string",
"description": "The content to display to the user."
}
},
"required": ["message"]
}
}Agrega esta herramienta siempre que tu experiencia de usuario dependa de entregar contenido o interacciones directas con el usuario de forma literal en medio de la tarea. Para agentes que solo narran progreso rutinario, los resúmenes propios del modelo suelen ser adecuados.
Establish a method for checking your own work at an interval of [X] as you build. Run this every [X interval], verifying your work with subagents against the specification.reasoning_extraction en Claude Fable 5, causando fallbacks elevados a Claude Opus 4.8. Audita los skills e indicaciones del sistema existentes en busca de instrucciones de reflexión o de mostrar el pensamiento al migrar. Si tu aplicación necesita visibilidad del razonamiento, lee los bloques estructurados de thinking del pensamiento adaptativo en su lugar, y usa una herramienta de envío al usuario para mostrar el progreso durante ejecuciones largas.Was this page helpful?