Mejores prácticas de prompts

ConstruirIngeniería de prompts

Mejores prácticas de prompting

Guía completa de técnicas de ingeniería de prompts para los últimos modelos de Claude, cubriendo claridad, ejemplos, estructuración XML, pensamiento y sistemas agénticos.

Esta es la referencia única para la ingeniería de prompts con los últimos modelos de Claude, incluyendo Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 y Claude Haiku 4.5. Cubre técnicas fundamentales, control de salida, uso de herramientas, pensamiento y sistemas agénticos. Salta a la sección que coincida con tu situación.

Para una descripción general de las capacidades del modelo, consulta la descripción general de modelos. Para obtener detalles sobre las novedades en Claude Opus 4.7, consulta Novedades en Claude Opus 4.7. Para orientación sobre migración, consulta la Guía de migración.

Prompting Claude Opus 4.7

Claude Opus 4.7 es nuestro modelo más capaz disponible en general, con fortalezas particulares en trabajo agéntico de largo horizonte, trabajo de conocimiento, visión y tareas de memoria. Funciona bien de inmediato en prompts existentes de Claude Opus 4.6. Los patrones a continuación cubren los comportamientos que más a menudo requieren ajuste.

Para cambios de parámetros de API al migrar desde Claude Opus 4.6 (niveles de esfuerzo, presupuestos de tareas, configuración de pensamiento, eliminación de parámetros de muestreo y tokenización), consulta la guía de migración.

Longitud de respuesta y verbosidad

Claude Opus 4.7 calibra la longitud de la respuesta según la complejidad que juzga que tiene la tarea, en lugar de establecer una verbosidad fija por defecto. Esto generalmente significa respuestas más cortas en búsquedas simples y mucho más largas en análisis abiertos.

Si tu producto depende de un cierto estilo o verbosidad de salida, es posible que necesites ajustar tus prompts. Como ejemplo, para disminuir la verbosidad, podrías agregar:

Proporciona respuestas concisas y enfocadas. Omite contexto no esencial y mantén los ejemplos mínimos.

Si ves ejemplos específicos de tipos de verbosidad (es decir, sobre-explicación), puedes agregar instrucciones adicionales en tu prompt para prevenirlos. Los ejemplos positivos que muestran cómo Claude puede comunicarse con el nivel apropiado de concisión tienden a ser más efectivos que los ejemplos negativos o las instrucciones que le dicen al modelo qué no hacer.

Calibrando esfuerzo y profundidad de pensamiento

El parámetro de esfuerzo te permite ajustar la inteligencia de Claude versus el gasto de tokens, intercambiando capacidad por velocidad más rápida y costos más bajos. Comienza con el nuevo nivel de esfuerzo xhigh para casos de uso de codificación y agénticos, y usa un mínimo de esfuerzo high para la mayoría de casos de uso sensibles a la inteligencia. Experimenta con otros niveles de esfuerzo para ajustar aún más el uso de tokens e inteligencia:

max: El esfuerzo máximo puede entregar ganancias de rendimiento en algunos casos de uso, pero puede mostrar rendimientos decrecientes del aumento de uso de tokens. Esta configuración también puede ser a veces propensa al exceso de pensamiento. Recomendamos probar el esfuerzo máximo para tareas que demandan inteligencia.
xhigh (nuevo): El esfuerzo extra alto es la mejor configuración para la mayoría de casos de uso de codificación y agénticos.
high: Esta configuración equilibra el uso de tokens e inteligencia. Para la mayoría de casos de uso sensibles a la inteligencia, recomendamos un mínimo de esfuerzo high.
medium: Bueno para casos de uso sensibles a costos que necesitan reducir el uso de tokens mientras se intercambia inteligencia.
low: Reserva para tareas cortas y limitadas y cargas de trabajo sensibles a la latencia que no son sensibles a la inteligencia.

Cambiando significativamente desde Claude Opus 4.6, Claude Opus 4.7 respeta los niveles de esfuerzo estrictamente, especialmente en el extremo bajo. En low y medium, el modelo limita su trabajo a lo que se preguntó en lugar de ir más allá. Esto es bueno para latencia y costo, pero en tareas moderadamente complejas ejecutadas con esfuerzo low hay algún riesgo de razonamiento insuficiente.

Si observas razonamiento superficial en problemas complejos, aumenta el esfuerzo a high o xhigh en lugar de hacer prompting alrededor. Si necesitas mantener el esfuerzo en low por latencia, agrega orientación dirigida:

Esta tarea implica razonamiento de múltiples pasos. Piensa cuidadosamente a través del problema antes de responder.

Esperamos que el esfuerzo sea más importante para este modelo que para cualquier Opus anterior, y recomendamos experimentar con él activamente cuando actualices.

El comportamiento de activación del pensamiento adaptativo es orientable. Si encuentras que el modelo piensa más a menudo de lo que te gustaría — lo que puede suceder con prompts de sistema grandes o complejos — agrega orientación para dirigirlo. Como siempre, mide el efecto de cualquier cambio de prompting en el rendimiento. Ejemplo:

El pensamiento agrega latencia y solo debe usarse cuando mejorará significativamente la calidad de la respuesta — típicamente para problemas que requieren razonamiento de múltiples pasos. Cuando tengas dudas, responde directamente.

Conversamente, si estás ejecutando cargas de trabajo duras en medium y ves razonamiento insuficiente, el primer apalancamiento es aumentar el esfuerzo. Si necesitas un control más fino, solicítalo directamente.

Si estás ejecutando Claude Opus 4.7 con esfuerzo max o xhigh, establece un presupuesto de tokens de salida máximo grande para que el modelo tenga espacio para pensar y actuar en sus subagentos y llamadas de herramientas. Recomendamos comenzar con 64k tokens y ajustar desde allí.

Activación del uso de herramientas

Claude Opus 4.7 tiene una tendencia a usar herramientas menos a menudo que Claude Opus 4.6 y a usar razonamiento más. Esto produce mejores resultados en la mayoría de los casos. Sin embargo, aumentar la configuración de esfuerzo es un apalancamiento útil para aumentar el nivel de uso de herramientas, especialmente en trabajo de conocimiento. Las configuraciones de esfuerzo high o xhigh muestran sustancialmente más uso de herramientas en búsqueda agéntica y codificación. Para escenarios donde deseas más uso de herramientas, también puedes ajustar tu prompt para instruir explícitamente al modelo sobre cuándo y cómo usar adecuadamente sus herramientas. Por ejemplo, si encuentras que el modelo no está usando tus herramientas de búsqueda web, describe claramente por qué y cómo debería hacerlo.

Actualizaciones de progreso orientadas al usuario

Claude Opus 4.7 proporciona actualizaciones más regulares y de mayor calidad al usuario durante trazas agénticas largas. Si has agregado andamiaje para forzar mensajes de estado interino ("Después de cada 3 llamadas de herramientas, resume el progreso"), intenta eliminarlo. Si encuentras que la longitud o contenido de las actualizaciones orientadas al usuario de Claude Opus 4.7 no están bien calibradas para tu caso de uso, describe explícitamente cómo deberían verse estas actualizaciones en el prompt y proporciona ejemplos.

Seguimiento de instrucciones más literal

Claude Opus 4.7 interpreta prompts de manera más literal y explícita que Claude Opus 4.6, particularmente en niveles de esfuerzo más bajos. No generalizará silenciosamente una instrucción de un elemento a otro, y no inferirá solicitudes que no hiciste. El lado positivo de este literalismo es la precisión y menos confusión, y generalmente funciona mejor para casos de uso de API con prompts cuidadosamente ajustados, extracción estructurada y tuberías donde deseas comportamiento predecible. Si necesitas que Claude aplique una instrucción ampliamente, establece el alcance explícitamente (por ejemplo, "Aplica este formato a cada sección, no solo a la primera").

Tono y estilo de escritura

Como con cualquier modelo nuevo, el estilo de prosa en escritura de forma larga puede cambiar. Claude Opus 4.7 es más directo y opinado, con menos fraseología orientada a la validación y menos emojis que el estilo más cálido de Claude Opus 4.6. Si tu producto se basa en una voz específica, reevalúa los prompts de estilo contra la nueva línea de base.

Por ejemplo, si la voz de tu producto es más cálida o conversacional, agrega:

Usa un tono cálido y colaborativo. Reconoce el marco del usuario antes de responder.

Controlando el desove de subagentos

Claude Opus 4.7 tiende a desovar menos subagentos por defecto. Sin embargo, este comportamiento es orientable a través de prompting; proporciona a Claude Opus 4.7 orientación explícita sobre cuándo los subagentos son deseables. Un ejemplo de juguete para un caso de uso de codificación:

No desoves un subagentos para trabajo que puedas completar directamente en una sola respuesta (por ejemplo, refactorizar una función que ya puedes ver).

Desova múltiples subagentos en el mismo turno cuando abaniques entre elementos o leas múltiples archivos.

Valores predeterminados de diseño y frontend

Claude Opus 4.7 tiene instintos de diseño más fuertes que Claude Opus 4.6, con un estilo de casa predeterminado consistente: fondos cálidos de crema/blanco roto (~#F4F1EA), tipo de pantalla serif (Georgia, Fraunces, Playfair), acentos de palabras en cursiva y un acento terracota/ámbar. Esto se lee bien para editoriales, hospitalidad y briefs de portafolio, pero se sentirá fuera de lugar para paneles de control, herramientas de desarrollo, fintech, salud o aplicaciones empresariales — y aparece en presentaciones de diapositivas así como en interfaces web.

Este valor predeterminado es persistente. Las instrucciones genéricas ("no uses crema", "hazlo limpio y minimalista") tienden a cambiar el modelo a una paleta fija diferente en lugar de producir variedad. Dos enfoques funcionan de manera confiable:

1. Especifica una alternativa concreta. El modelo sigue especificaciones explícitas con precisión:

Diseña una página de destino de escritorio para una marca de suplementos llamada AEFRM.

La dirección visual debe provenir de una atmósfera monocromática fría usando tonos de gris plateado pálido que se profundizan gradualmente en gris azulado y casi negro, similar a una superficie metálica brumosa.

La página debe sentirse afilada y controlada, con un fuerte sentido de estructura y restricción.

Usa este sistema tonal en toda la página en lugar de introducir colores de acento brillantes.

Usa la imagen cargada en el diseño del héroe en blanco y negro.

El diseño debe construirse con secciones horizontales claras y un contenedor de ancho máximo centrado. Usa un radio de esquina de 4px consistentemente en tarjetas, botones, entradas y marcos de medios. Los márgenes deben sentirse generosos, con suficiente espacio vacío alrededor de cada sección para que la página respire.

La tipografía debe usar un sans-serif cuadrado y angular con espaciado de letras más amplio de lo usual, especialmente en encabezados y navegación, para que el texto se sienta más ingenieril y menos comprimido. El texto del titular puede ser grande y mayúscula, mientras que la copia de apoyo permanece corta y escasa. Los subtextos deben escribirse con Alumni Sans SC en 4-6px como textos pequeñitos en las esquinas abajo al centro así.

Para la estructura, comienza con una sección de héroe que contiene una declaración de producto fuerte, un párrafo de apoyo corto y un marco de marcador de posición de producto limpio o packshot. Debajo de eso, agrega una cuadrícula de beneficios con tres o cuatro bloques, luego una sección de formulación o ingredientes, y finalmente un cta.

Los botones deben ser planos y precisos, con cambios de desplazamiento sutiles usando transition: all 160ms ease out donde el brillo y el contraste del borde se desplazan ligeramente en lugar de usar movimiento dramático.

La paleta de colores debe mantenerse dentro de este rango:
#E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.

2. Haz que el modelo proponga opciones antes de construir. Esto rompe el valor predeterminado y da a los usuarios control. Si anteriormente confiabas en temperature para variedad de diseño, usa este enfoque — produce direcciones significativamente diferentes en ejecuciones. Ejemplo de prompt:

Antes de construir, propón 4 direcciones visuales distintas adaptadas a este brief (cada una como: bg hex / accent hex / typeface — rationale de una línea). Pregunta al usuario que elija una, luego implementa solo esa dirección.

Además, Claude Opus 4.7 requiere menos prompting de diseño frontend que modelos anteriores para evitar patrones genéricos que los usuarios llaman la estética "AI slop". Con modelos anteriores, recomendábamos un fragmento de prompt más largo en nuestra habilidad de diseño frontend. Sin embargo, Claude Opus 4.7 genera frontends distintivos y creativos con orientación de prompting más mínima. Este fragmento de prompt funciona bien con el consejo de prompting anterior para variedad:

<frontend_aesthetics>
NUNCA uses estéticas genéricas generadas por IA como familias de fuentes sobreutilizadas (Inter, Roboto, Arial, fuentes del sistema), esquemas de colores clichés (particularmente gradientes púrpuras en fondos blancos u oscuros), diseños predecibles y patrones de componentes, y diseño genérico que carece de carácter específico del contexto. Usa fuentes únicas, colores y temas cohesivos, y animaciones para efectos e interacciones micro.
</frontend_aesthetics>

Productos de codificación interactiva

El uso de tokens y comportamiento de Claude Opus 4.7 pueden diferir entre agentos de codificación autónomos y asincrónico con un turno de usuario único y agentos de codificación interactivos y sincrónico con múltiples turnos de usuario. Específicamente, tiende a usar más tokens en configuraciones interactivas, principalmente porque razona más después de turnos de usuario. Esto puede mejorar la coherencia de largo horizonte, el seguimiento de instrucciones y las capacidades de codificación en sesiones de codificación interactivas largas, pero también viene con más uso de tokens. Para maximizar tanto el rendimiento como la eficiencia de tokens en productos de codificación, recomendamos usar esfuerzo xhigh o high, agregar características autónomas como un modo automático, y reducir el número de interacciones humanas requeridas de tus usuarios.

Por supuesto, al limitar el número de interacciones de usuario requeridas, es importante especificar la tarea, intención y restricciones relevantes por adelantado en el primer turno humano. Proporcionar descripciones de tareas bien especificadas, claras y precisas por adelantado puede ayudar a maximizar la autonomía e inteligencia mientras se minimiza el uso de tokens extra después de turnos de usuario. Encontramos que porque Claude Opus 4.7 es más autónomo que modelos anteriores, este patrón de uso ayuda a maximizar el rendimiento. En contraste, prompts ambiguos o subespecificados transmitidos progresivamente en múltiples turnos de usuario tienden a reducir relativamente la eficiencia de tokens y a veces el rendimiento.

Arneses de revisión de código

Claude Opus 4.7 es significativamente mejor en encontrar bugs que modelos anteriores, y tiene tanto mayor recall como precisión en nuestras evaluaciones — 11pp mejor recall en una de nuestras evaluaciones de búsqueda de bugs más difíciles basada en PRs reales de Anthropic. Sin embargo, si tu arnés de revisión de código fue ajustado para un modelo anterior, es posible que inicialmente veas menor recall. Esto probablemente sea un efecto del arnés, no una regresión de capacidad. Cuando un prompt de revisión dice cosas como "solo reporta problemas de alta severidad", "sé conservador" o "no hagas nitpicking", Claude Opus 4.7 puede seguir esa instrucción más fielmente que modelos anteriores — puede investigar el código tan a fondo, identificar los bugs, y luego no reportar hallazgos que juzga estar por debajo de tu barra establecida. Esto puede mostrarse como el modelo haciendo la misma profundidad de investigación pero convirtiendo menos investigaciones en hallazgos reportados, especialmente en bugs de menor severidad. La precisión típicamente sube, pero el recall medido puede caer aunque la capacidad subyacente de búsqueda de bugs del modelo haya mejorado.

Lenguaje de prompt recomendado:

Reporta cada problema que encuentres, incluyendo aquellos de los que no estés seguro o consideres de baja severidad. No filtres por importancia o confianza en esta etapa - un paso de verificación separado hará eso. Tu objetivo aquí es cobertura: es mejor exponer un hallazgo que luego se filtre que silenciosamente dejar caer un bug real. Para cada hallazgo, incluye tu nivel de confianza y una severidad estimada para que un filtro descendente pueda clasificarlos.

Este prompt puede usarse sin tener un segundo paso real, pero mover el filtrado de confianza fuera del paso de hallazgo a menudo ayuda. Si tu arnés tiene una verificación separada, deduplicación o etapa de clasificación, dile explícitamente al modelo que su trabajo en la etapa de hallazgo es cobertura en lugar de filtrado.

Si realmente deseas que el modelo se auto-filtre en un solo paso, sé concreto sobre dónde está la barra en lugar de usar términos cualitativos como "importante" — por ejemplo, "reporta cualquier bug que pueda causar comportamiento incorrecto, una falla de prueba o un resultado engañoso; solo omite nits como preferencias puras de estilo o nomenclatura".

Recomendamos iterar en prompts contra un subconjunto de tus evaluaciones o casos de prueba para validar ganancias de recall o puntuación F1.

Uso de computadora

La capacidad de uso de computadora funciona en resoluciones, hasta una nueva resolución máxima de 2576px / 3.75MP. En nuestras pruebas de uso de computadora, encontramos que enviar imágenes a 1080p proporciona un buen equilibrio de rendimiento y costo.

Para cargas de trabajo particularmente sensibles a costos, recomendamos 720p o 1366×768 como opciones de menor costo con rendimiento fuerte. Recomendamos que realices tus propias pruebas para encontrar la configuración ideal para tu caso de uso; experimentar con configuraciones de esfuerzo también puede ayudar a ajustar el comportamiento del modelo.

Principios generales

Sé claro y directo

Claude responde bien a instrucciones claras y explícitas. Ser específico sobre tu salida deseada puede ayudar a mejorar los resultados. Si deseas comportamiento "más allá de lo esperado", solicítalo explícitamente en lugar de confiar en que el modelo lo infiera de prompts vagos.

Piensa en Claude como un empleado brillante pero nuevo que carece de contexto sobre tus normas y flujos de trabajo. Cuanto más precisamente expliques lo que deseas, mejor será el resultado.

Regla de oro: Muestra tu prompt a un colega con contexto mínimo sobre la tarea y pídele que lo siga. Si estarían confundidos, Claude también lo estará.

Sé específico sobre el formato de salida deseado y las restricciones.
Proporciona instrucciones como pasos secuenciales usando listas numeradas o puntos cuando el orden o la completitud de los pasos importa.

Agrega contexto para mejorar el rendimiento

Proporcionar contexto o motivación detrás de tus instrucciones, como explicar a Claude por qué tal comportamiento es importante, puede ayudar a Claude a entender mejor tus objetivos y entregar respuestas más dirigidas.

Claude es lo suficientemente inteligente para generalizar a partir de la explicación.

Usa ejemplos efectivamente

Los ejemplos son una de las formas más confiables de dirigir el formato de salida, tono y estructura de Claude. Algunos ejemplos bien elaborados (conocidos como prompting de pocos disparos o múltiples disparos) pueden mejorar dramáticamente la precisión y consistencia.

Al agregar ejemplos, hazlos:

Relevantes: Espeja tu caso de uso real de cerca.
Diversos: Cubre casos extremos y varía lo suficiente para que Claude no capte patrones no intencionados.
Estructurados: Envuelve ejemplos en etiquetas <example> (múltiples ejemplos en etiquetas <examples>) para que Claude pueda distinguirlos de las instrucciones.

Incluye 3–5 ejemplos para obtener los mejores resultados. También puedes pedirle a Claude que evalúe tus ejemplos para relevancia y diversidad, o que genere ejemplos adicionales basados en tu conjunto inicial.

Estructura prompts con etiquetas XML

Las etiquetas XML ayudan a Claude a analizar prompts complejos sin ambigüedad, especialmente cuando tu prompt mezcla instrucciones, contexto, ejemplos e entradas variables. Envolver cada tipo de contenido en su propia etiqueta (por ejemplo <instructions>, <context>, <input>) reduce la mala interpretación.

Mejores prácticas:

Usa nombres de etiqueta consistentes y descriptivos en tus prompts.
Anida etiquetas cuando el contenido tiene una jerarquía natural (documentos dentro de <documents>, cada uno dentro de <document index="n">).

Dale a Claude un rol

Establecer un rol en el prompt del sistema enfoca el comportamiento y tono de Claude para tu caso de uso. Incluso una sola oración marca la diferencia:

Python

import anthropic

client = anthropic.Anthropic()

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    system="You are a helpful coding assistant specializing in Python.",
    messages=[
        {"role": "user", "content": "How do I sort a list of dictionaries by key?"}
    ],
)
print(message.content)

Prompting de contexto largo

Cuando trabajes con documentos grandes o entradas ricas en datos (20k+ tokens), estructura tu prompt cuidadosamente para obtener los mejores resultados:

Pon datos de forma larga en la parte superior: Coloca tus documentos largos e entradas cerca de la parte superior de tu prompt, por encima de tu consulta, instrucciones y ejemplos. Esto puede mejorar significativamente el rendimiento en todos los modelos.

Las consultas al final pueden mejorar la calidad de la respuesta hasta un 30% en pruebas, especialmente con entradas complejas de múltiples documentos.
Estructura contenido de documento y metadatos con etiquetas XML: Cuando uses múltiples documentos, envuelve cada documento en etiquetas <document> con subtags <document_content> y <source> (y otros metadatos) para claridad.
Fundamenta respuestas en citas: Para tareas de documentos largos, pide a Claude que cite primero partes relevantes de los documentos antes de llevar a cabo su tarea. Esto ayuda a Claude a cortar a través del ruido del resto del contenido del documento.

Autoconocimiento del modelo

Si te gustaría que Claude se identifique correctamente en tu aplicación o use cadenas de API específicas:

Prompt de ejemplo para identidad de modelo

El asistente es Claude, creado por Anthropic. El modelo actual es Claude Opus 4.7.

Para aplicaciones impulsadas por LLM que necesitan especificar cadenas de modelo:

Prompt de ejemplo para cadena de modelo

Cuando se necesita un LLM, por favor establece por defecto Claude Opus 4.7 a menos que el usuario solicite lo contrario. La cadena de modelo exacta para Claude Opus 4.7 es claude-opus-4-7.

Salida y formato

Estilo de comunicación y verbosidad

Los últimos modelos de Claude tienen un estilo de comunicación más conciso y natural en comparación con modelos anteriores:

Más directo y fundamentado: Proporciona reportes de progreso basados en hechos en lugar de actualizaciones auto-celebratorias
Más conversacional: Ligeramente más fluido y coloquial, menos parecido a máquina
Menos verboso: Puede omitir resúmenes detallados por eficiencia a menos que se le solicite lo contrario

Esto significa que Claude puede omitir resúmenes verbales después de llamadas de herramientas, saltando directamente a la siguiente acción. Si prefieres más visibilidad en su razonamiento:

Prompt de ejemplo

Después de completar una tarea que implica uso de herramientas, proporciona un resumen rápido del trabajo que has hecho.

Controla el formato de respuestas

Hay algunas formas particularmente efectivas de dirigir el formato de salida:

Dile a Claude qué hacer en lugar de qué no hacer
- En lugar de: "No uses markdown en tu respuesta"
- Intenta: "Tu respuesta debe estar compuesta de párrafos de prosa que fluyan suavemente."
Usa indicadores de formato XML
- Intenta: "Escribe las secciones de prosa de tu respuesta en etiquetas <smoothly_flowing_prose_paragraphs>."
Haz coincidir el estilo de tu prompt con la salida deseada

El estilo de formato usado en tu prompt puede influir en el estilo de respuesta de Claude. Si aún experimentas problemas de dirigibilidad con formato de salida, intenta hacer coincidir el estilo de tu prompt con tu estilo de salida deseado lo más posible. Por ejemplo, eliminar markdown de tu prompt puede reducir el volumen de markdown en la salida.
Usa prompts detallados para preferencias de formato específicas

Para más control sobre el uso de markdown y formato, proporciona orientación explícita:

Prompt de ejemplo para minimizar markdown

<avoid_excessive_markdown_and_bullet_points>
Al escribir reportes, documentos, explicaciones técnicas, análisis o cualquier contenido de forma larga, escribe en prosa clara y fluida usando párrafos y oraciones completos. Usa saltos de párrafo estándar para organización y reserva markdown principalmente para `código en línea`, bloques de código (```...```), y encabezados simples (###, y ###). Evita usar **negrita** e *cursiva*.

NO uses listas ordenadas (1. ...) o listas desordenadas (*) a menos que: a) estés presentando elementos verdaderamente discretos donde un formato de lista es la mejor opción, o b) el usuario explícitamente solicite una lista o clasificación

En lugar de listar elementos con viñetas o números, incorpóralos naturalmente en oraciones. Esta orientación se aplica especialmente a la escritura técnica. Usar prosa en lugar de formato excesivo mejorará la satisfacción del usuario. NUNCA generes una serie de puntos excesivamente cortos.

Tu objetivo es texto legible y fluido que guíe al lector naturalmente a través de ideas en lugar de fragmentar información en puntos aislados.
</avoid_excessive_markdown_and_bullet_points>

Salida LaTeX

Claude Opus 4.6 establece por defecto LaTeX para expresiones matemáticas, ecuaciones y explicaciones técnicas. Si prefieres texto plano, agrega las siguientes instrucciones a tu prompt:

Prompt de ejemplo

Formatea tu respuesta en texto plano solamente. No uses LaTeX, MathJax o cualquier notación de marcado como \( \), $, o \frac{}{}. Escribe todas las expresiones matemáticas usando caracteres de texto estándar (por ejemplo, "/" para división, "*" para multiplicación, y "^" para exponentes).

Creación de documentos

Los últimos modelos de Claude sobresalen en crear presentaciones, animaciones y documentos visuales con creatividad impresionante y fuerte seguimiento de instrucciones. Los modelos producen salida pulida y utilizable en el primer intento en la mayoría de los casos.

Para obtener los mejores resultados con creación de documentos:

Prompt de ejemplo

Crea una presentación profesional sobre [tema]. Incluye elementos de diseño reflexivos, jerarquía visual y animaciones atractivas donde sea apropiado.

Migrando desde respuestas rellenadas previamente

Comenzando con modelos Claude 4.6 y Claude Mythos Preview, las respuestas rellenadas previamente en el último turno del asistente ya no son compatibles. En Mythos Preview, las solicitudes con mensajes de asistente rellenados previamente devuelven un error 400. La inteligencia del modelo y el seguimiento de instrucciones han avanzado de tal manera que la mayoría de casos de uso de prefill ya no lo requieren. Los modelos existentes continuarán soportando prefills, y agregar mensajes de asistente en otros lugares en la conversación no se ve afectado.

Aquí hay escenarios comunes de prefill y cómo migrar lejos de ellos:

Uso de herramientas

Los últimos modelos de Claude están entrenados para seguimiento de instrucciones preciso y se benefician de dirección explícita para usar herramientas específicas. Si dices "¿puedes sugerir algunos cambios?", Claude a veces proporcionará sugerencias en lugar de implementarlas, incluso si hacer cambios podría ser lo que pretendías.

Para que Claude tome acción, sé más explícito:

Para hacer que Claude sea más proactivo sobre tomar acción por defecto, puedes agregar esto a tu prompt del sistema:

Prompt de ejemplo para acción proactiva

<default_to_action>
Por defecto, implementa cambios en lugar de solo sugerirlos. Si la intención del usuario es poco clara, infiere la acción probable más útil y procede, usando herramientas para descubrir cualquier detalle faltante en lugar de adivinar. Intenta inferir la intención del usuario sobre si una llamada de herramienta (por ejemplo, edición o lectura de archivo) es intencionada o no, y actúa en consecuencia.
</default_to_action>

Por otro lado, si deseas que el modelo sea más reticente por defecto, menos propenso a saltar directamente a implementaciones, y solo tomar acción si se solicita, puedes dirigir este comportamiento con un prompt como el siguiente:

Prompt de ejemplo para acción conservadora

<do_not_act_before_instructions>
No saltes a implementación o cambies archivos a menos que se te instruya claramente a hacer cambios. Cuando la intención del usuario es ambigua, establece por defecto proporcionar información, hacer investigación y proporcionar recomendaciones en lugar de tomar acción. Solo procede con ediciones, modificaciones o implementaciones cuando el usuario explícitamente las solicita.
</do_not_act_before_instructions>

Claude Opus 4.5 y Claude Opus 4.6 también son más receptivos al prompt del sistema que modelos anteriores. Si tus prompts fueron diseñados para reducir el subtriggering en herramientas o habilidades, estos modelos pueden ahora overtrigger. La solución es reducir cualquier lenguaje agresivo. Donde podrías haber dicho "CRÍTICO: DEBES usar esta herramienta cuando...", puedes usar prompting más normal como "Usa esta herramienta cuando...".

Optimizar las llamadas de herramientas en paralelo

Los últimos modelos de Claude destacan en la ejecución paralela de herramientas. Estos modelos:

Ejecutarán múltiples búsquedas especulativas durante la investigación
Leerán varios archivos a la vez para construir contexto más rápidamente
Ejecutarán comandos bash en paralelo (que incluso pueden saturar el rendimiento del sistema)

Este comportamiento es fácilmente controlable. Aunque el modelo tiene una alta tasa de éxito en llamadas de herramientas paralelas sin indicaciones, puedes aumentar esto a ~100% o ajustar el nivel de agresividad:

Indicación de ejemplo para máxima eficiencia paralela

<use_parallel_tool_calls>
Si tienes la intención de llamar a múltiples herramientas y no hay dependencias entre las llamadas de herramientas, realiza todas las llamadas de herramientas independientes en paralelo. Prioriza llamar a herramientas simultáneamente siempre que las acciones puedan realizarse en paralelo en lugar de secuencialmente. Por ejemplo, al leer 3 archivos, ejecuta 3 llamadas de herramientas en paralelo para leer los 3 archivos en contexto al mismo tiempo. Maximiza el uso de llamadas de herramientas paralelas donde sea posible para aumentar la velocidad y eficiencia. Sin embargo, si algunas llamadas de herramientas dependen de llamadas anteriores para informar valores dependientes como los parámetros, NO llames a estas herramientas en paralelo y en su lugar llámalas secuencialmente. Nunca uses marcadores de posición o adivines parámetros faltantes en llamadas de herramientas.
</use_parallel_tool_calls>

Indicación de ejemplo para reducir la ejecución paralela

Ejecuta operaciones secuencialmente con breves pausas entre cada paso para garantizar estabilidad.

Pensamiento y razonamiento

Pensamiento excesivo y minuciosidad excesiva

Claude Opus 4.6 realiza significativamente más exploración inicial que los modelos anteriores, especialmente con configuraciones de effort más altas. Este trabajo inicial a menudo ayuda a optimizar los resultados finales, pero el modelo puede reunir contexto extenso o perseguir múltiples líneas de investigación sin ser indicado. Si tus indicaciones anteriormente alentaban al modelo a ser más minucioso, debes ajustar esa orientación para Claude Opus 4.6:

Reemplaza valores predeterminados generales con instrucciones más específicas. En lugar de "Por defecto, usa [herramienta]," añade orientación como "Usa [herramienta] cuando mejoraría tu comprensión del problema."
Elimina el exceso de indicaciones. Las herramientas que se disparaban insuficientemente en modelos anteriores probablemente se disparen apropiadamente ahora. Las instrucciones como "Si tienes dudas, usa [herramienta]" causarán un disparo excesivo.
Usa effort como alternativa. Si Claude continúa siendo demasiado agresivo, usa una configuración más baja para effort.

En algunos casos, Claude Opus 4.6 puede pensar extensamente, lo que puede inflar los tokens de pensamiento y ralentizar las respuestas. Si este comportamiento es indeseable, puedes añadir instrucciones explícitas para restringir su razonamiento, o puedes bajar la configuración de effort para reducir el pensamiento general y el uso de tokens.

Indicación de ejemplo

Cuando estés decidiendo cómo abordar un problema, elige un enfoque y comprométete con él. Evita revisar decisiones a menos que encuentres información nueva que contradiga directamente tu razonamiento. Si estás sopesando dos enfoques, elige uno y llévalo a cabo. Siempre puedes corregir el rumbo más tarde si el enfoque elegido falla.

Si necesitas un límite máximo duro en costos de pensamiento, el pensamiento extendido con un límite de budget_tokens sigue siendo funcional en Opus 4.6 y Sonnet 4.6 pero está deprecado. Prefiere bajar la configuración de effort o usar max_tokens como límite duro con pensamiento adaptativo.

Aprovechar las capacidades de pensamiento y pensamiento intercalado

Los últimos modelos de Claude ofrecen capacidades de pensamiento que pueden ser especialmente útiles para tareas que implican reflexión después del uso de herramientas o razonamiento complejo de múltiples pasos. Puedes guiar su pensamiento inicial o intercalado para obtener mejores resultados.

Claude Opus 4.6 y Claude Sonnet 4.6 usan pensamiento adaptativo (thinking: {type: "adaptive"}), donde Claude decide dinámicamente cuándo y cuánto pensar. Claude calibra su pensamiento basándose en dos factores: el parámetro effort y la complejidad de la consulta. Un esfuerzo más alto provoca más pensamiento, y las consultas más complejas hacen lo mismo. En consultas más fáciles que no requieren pensamiento, el modelo responde directamente. En evaluaciones internas, el pensamiento adaptativo impulsa de manera confiable un mejor rendimiento que el pensamiento extendido. Considera cambiar al pensamiento adaptativo para obtener las respuestas más inteligentes.

Usa pensamiento adaptativo para cargas de trabajo que requieren comportamiento agéntico como uso de herramientas de múltiples pasos, tareas de codificación complejas y bucles de agentes de largo horizonte. Los modelos más antiguos usan modo de pensamiento manual con budget_tokens.

Puedes guiar el comportamiento de pensamiento de Claude:

Indicación de ejemplo

Después de recibir resultados de herramientas, reflexiona cuidadosamente sobre su calidad y determina los pasos siguientes óptimos antes de proceder. Usa tu pensamiento para planificar e iterar basándote en esta nueva información, y luego toma la mejor acción siguiente.

El comportamiento de activación del pensamiento adaptativo es indicable. Si encuentras que el modelo piensa más a menudo de lo que te gustaría, lo que puede suceder con indicaciones de sistema grandes o complejas, añade orientación para dirigirlo:

Indicación de ejemplo

El pensamiento extendido añade latencia y solo debe usarse cuando mejorará significativamente la calidad de la respuesta - típicamente para problemas que requieren razonamiento de múltiples pasos. Cuando tengas dudas, responde directamente.

Si estás migrando desde pensamiento extendido con budget_tokens, reemplaza tu configuración de pensamiento y mueve el control de presupuesto a effort:

Antes (pensamiento extendido, modelos más antiguos):

Python

client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=64000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    messages=[{"role": "user", "content": "..."}],
)

Después (pensamiento adaptativo):

Python

client.messages.create(
    model="claude-opus-4-7",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},  # or "max", "xhigh", "medium", "low"
    messages=[{"role": "user", "content": "..."}],
)

Si no estás usando pensamiento extendido, no se requieren cambios. El pensamiento está desactivado por defecto cuando omites el parámetro thinking.

Prefiere instrucciones generales sobre pasos prescriptivos. Una indicación como "piensa minuciosamente" a menudo produce mejor razonamiento que un plan paso a paso escrito a mano. El razonamiento de Claude frecuentemente supera lo que un humano prescribiría.
Los ejemplos multishot funcionan con pensamiento. Usa etiquetas <thinking> dentro de tus ejemplos de pocos disparos para mostrar a Claude el patrón de razonamiento. Generalizará ese estilo a sus propios bloques de pensamiento extendido.
CoT manual como alternativa. Cuando el pensamiento está desactivado, aún puedes alentar razonamiento paso a paso pidiendo a Claude que piense a través del problema. Usa etiquetas estructuradas como <thinking> y <answer> para separar limpiamente el razonamiento de la salida final.
Pide a Claude que se autoverificar. Añade algo como "Antes de terminar, verifica tu respuesta contra [criterios de prueba]." Esto atrapa errores de manera confiable, especialmente para codificación y matemáticas.

Cuando el pensamiento extendido está desactivado, Claude Opus 4.5 es particularmente sensible a la palabra "think" y sus variantes. Considera usar alternativas como "consider," "evaluate," o "reason through" en esos casos.

Para más información sobre capacidades de pensamiento, ver Pensamiento extendido y Pensamiento adaptativo.

Sistemas agénticos

Razonamiento de largo horizonte y seguimiento de estado

Los últimos modelos de Claude destacan en tareas de razonamiento de largo horizonte con capacidades excepcionales de seguimiento de estado. Claude mantiene la orientación a través de sesiones extendidas enfocándose en el progreso incremental, haciendo avances constantes en pocas cosas a la vez en lugar de intentar todo a la vez. Esta capacidad emerge especialmente en múltiples ventanas de contexto o iteraciones de tareas, donde Claude puede trabajar en una tarea compleja, guardar el estado y continuar con una ventana de contexto nueva.

Conciencia de contexto y flujos de trabajo de múltiples ventanas

Los modelos Claude 4.6 y Claude 4.5 cuentan con conciencia de contexto, permitiendo al modelo rastrear su ventana de contexto restante (es decir, "presupuesto de tokens") a lo largo de una conversación. Esto permite a Claude ejecutar tareas y gestionar el contexto de manera más efectiva al entender cuánto espacio tiene para trabajar.

Gestión de límites de contexto:

Si estás usando Claude en un arnés de agente que compacta contexto o permite guardar contexto en archivos externos (como en Claude Code), considera añadir esta información a tu indicación para que Claude se comporte en consecuencia. De lo contrario, Claude puede a veces intentar naturalmente terminar el trabajo a medida que se acerca al límite de contexto. A continuación se muestra una indicación de ejemplo:

Indicación de ejemplo

Tu ventana de contexto será compactada automáticamente a medida que se acerque a su límite, permitiéndote continuar trabajando indefinidamente desde donde lo dejaste. Por lo tanto, no detengas tareas temprano debido a preocupaciones de presupuesto de tokens. A medida que te acerques a tu límite de presupuesto de tokens, guarda tu progreso actual y estado en memoria antes de que se actualice la ventana de contexto. Siempre sé lo más persistente y autónomo posible y completa tareas completamente, incluso si el final de tu presupuesto se está acercando. Nunca detengas artificialmente ninguna tarea temprano independientemente del contexto restante.

La herramienta de memoria se empareja naturalmente con la conciencia de contexto para transiciones de contexto sin problemas.

Flujos de trabajo de múltiples ventanas de contexto

Para tareas que abarcan múltiples ventanas de contexto:

Usa una indicación diferente para la primera ventana de contexto: Usa la primera ventana de contexto para configurar un marco (escribe pruebas, crea scripts de configuración), luego usa futuras ventanas de contexto para iterar en una lista de tareas.
Haz que el modelo escriba pruebas en un formato estructurado: Pide a Claude que cree pruebas antes de comenzar el trabajo y mantén un registro de ellas en un formato estructurado (por ejemplo, tests.json). Esto lleva a una mejor capacidad a largo plazo para iterar. Recuerda a Claude la importancia de las pruebas: "Es inaceptable eliminar o editar pruebas porque esto podría llevar a funcionalidad faltante o defectuosa."
Configura herramientas de calidad de vida: Anima a Claude a crear scripts de configuración (por ejemplo, init.sh) para iniciar servidores con elegancia, ejecutar suites de pruebas y linters. Esto previene trabajo repetido cuando se continúa desde una ventana de contexto nueva.
Comenzar de nuevo vs compactar: Cuando se borra una ventana de contexto, considera comenzar con una ventana de contexto completamente nueva en lugar de usar compactación. Los últimos modelos de Claude son extremadamente efectivos en descubrir estado desde el sistema de archivos local. En algunos casos, puedes querer aprovechar esto sobre la compactación. Sé prescriptivo sobre cómo debe comenzar:
- "Llama a pwd; solo puedes leer y escribir archivos en este directorio."
- "Revisa progress.txt, tests.json, y los registros de git."
- "Ejecuta manualmente una prueba de integración fundamental antes de pasar a implementar nuevas características."
Proporciona herramientas de verificación: A medida que crece la longitud de las tareas autónomas, Claude necesita verificar la corrección sin retroalimentación humana continua. Herramientas como el servidor Playwright MCP o capacidades de uso de computadora para probar interfaces de usuario son útiles.
Anima el uso completo del contexto: Indica a Claude que complete componentes eficientemente antes de pasar a lo siguiente:

Indicación de ejemplo

Esta es una tarea muy larga, por lo que puede ser beneficioso planificar tu trabajo claramente. Se anima a pasar todo tu contexto de salida trabajando en la tarea - solo asegúrate de no quedarte sin contexto con trabajo significativo sin confirmar. Continúa trabajando sistemáticamente hasta que hayas completado esta tarea.

Mejores prácticas de gestión de estado

Usa formatos estructurados para datos de estado: Cuando rastrées información estructurada (como resultados de pruebas o estado de tareas), usa JSON u otros formatos estructurados para ayudar a Claude a entender requisitos de esquema
Usa texto no estructurado para notas de progreso: Las notas de progreso de forma libre funcionan bien para rastrear progreso general y contexto
Usa git para rastreo de estado: Git proporciona un registro de lo que se ha hecho y puntos de control que pueden ser restaurados. Los últimos modelos de Claude funcionan especialmente bien usando git para rastrear estado a través de múltiples sesiones.
Enfatiza el progreso incremental: Pide explícitamente a Claude que mantenga un registro de su progreso y se enfoque en trabajo incremental

Equilibrio entre autonomía y seguridad

Sin orientación, Claude Opus 4.6 puede tomar acciones que son difíciles de revertir o afectar sistemas compartidos, como eliminar archivos, hacer push forzado o publicar en servicios externos. Si quieres que Claude Opus 4.6 confirme antes de tomar acciones potencialmente riesgosas, añade orientación a tu indicación:

Indicación de ejemplo

Considera la reversibilidad e impacto potencial de tus acciones. Se te anima a tomar acciones locales y reversibles como editar archivos o ejecutar pruebas, pero para acciones que son difíciles de revertir, afectan sistemas compartidos, o podrían ser destructivas, pide al usuario antes de proceder.

Ejemplos de acciones que justifican confirmación:
- Operaciones destructivas: eliminar archivos o ramas, soltar tablas de base de datos, rm -rf
- Operaciones difíciles de revertir: git push --force, git reset --hard, enmendar commits publicados
- Operaciones visibles para otros: hacer push de código, comentar en PRs/issues, enviar mensajes, modificar infraestructura compartida

Cuando encuentres obstáculos, no uses acciones destructivas como atajo. Por ejemplo, no eludas controles de seguridad (por ejemplo --no-verify) o descartes archivos desconocidos que podrían ser trabajo en progreso.

Investigación y recopilación de información

Los últimos modelos de Claude demuestran capacidades excepcionales de búsqueda agéntica y pueden encontrar y sintetizar información de múltiples fuentes de manera efectiva. Para resultados de investigación óptimos:

Proporciona criterios de éxito claros: Define qué constituye una respuesta exitosa a tu pregunta de investigación
Anima la verificación de fuentes: Pide a Claude que verifique información a través de múltiples fuentes
Para tareas de investigación complejas, usa un enfoque estructurado:

Indicación de ejemplo para investigación compleja

Busca esta información de manera estructurada. A medida que recopiles datos, desarrolla varias hipótesis competidoras. Rastrea tus niveles de confianza en tus notas de progreso para mejorar la calibración. Autocrítica regularmente tu enfoque y plan. Actualiza un árbol de hipótesis o archivo de notas de investigación para persistir información y proporcionar transparencia. Desglosa esta tarea de investigación compleja sistemáticamente.

Este enfoque estructurado permite a Claude encontrar y sintetizar prácticamente cualquier pieza de información e iterar críticamente sus hallazgos, sin importar el tamaño del corpus.

Orquestación de suagentes

Los últimos modelos de Claude demuestran capacidades significativamente mejoradas de orquestación nativa de suagentes. Estos modelos pueden reconocer cuándo las tareas se beneficiarían de delegar trabajo a suagentes especializados y hacerlo proactivamente sin requerir instrucción explícita.

Para aprovechar este comportamiento:

Asegura herramientas de suagente bien definidas: Ten herramientas de suagente disponibles y descritas en definiciones de herramientas
Deja que Claude orqueste naturalmente: Claude delegará apropiadamente sin instrucción explícita
Observa el uso excesivo: Claude Opus 4.6 tiene una fuerte predilección por suagentes y puede generarlos en situaciones donde un enfoque más simple y directo sería suficiente. Por ejemplo, el modelo puede generar suagentes para exploración de código cuando una llamada grep directa es más rápida y suficiente.

Si ves uso excesivo de suagentes, añade orientación explícita sobre cuándo los suagentes son y no son justificados:

Indicación de ejemplo para uso de suagentes

Usa suagentes cuando las tareas puedan ejecutarse en paralelo, requieran contexto aislado, o impliquen flujos de trabajo independientes que no necesiten compartir estado. Para tareas simples, operaciones secuenciales, ediciones de archivo único, o tareas donde necesites mantener contexto a través de pasos, trabaja directamente en lugar de delegar.

Encadenar indicaciones complejas

Con pensamiento adaptativo y orquestación de suagentes, Claude maneja la mayoría del razonamiento de múltiples pasos internamente. El encadenamiento explícito de indicaciones (dividir una tarea en llamadas API secuenciales) sigue siendo útil cuando necesitas inspeccionar salidas intermedias o aplicar una estructura de tubería específica.

El patrón de encadenamiento más común es autocorrección: generar un borrador → hacer que Claude lo revise contra criterios → hacer que Claude lo refine basándose en la revisión. Cada paso es una llamada API separada para que puedas registrar, evaluar o ramificar en cualquier punto.

Reducir la creación de archivos en codificación agéntica

Los últimos modelos de Claude pueden a veces crear nuevos archivos para propósitos de prueba e iteración, particularmente cuando se trabaja con código. Este enfoque permite a Claude usar archivos, especialmente scripts de python, como un 'bloc de notas temporal' antes de guardar su salida final. El uso de archivos temporales puede mejorar resultados particularmente para casos de uso de codificación agéntica.

Si prefieres minimizar la creación neta de nuevos archivos, puedes instruir a Claude que limpie después de sí mismo:

Indicación de ejemplo

Si creas cualquier archivo nuevo temporal, scripts, o archivos auxiliares para iteración, limpia estos archivos eliminándolos al final de la tarea.

Exceso de entusiasmo

Claude Opus 4.5 y Claude Opus 4.6 tienen una tendencia a sobreingeniería creando archivos extra, añadiendo abstracciones innecesarias, o construyendo flexibilidad que no fue solicitada. Si ves este comportamiento indeseable, añade orientación específica para mantener soluciones mínimas.

Por ejemplo:

Indicación de ejemplo para minimizar sobreingeniería

Evita la sobreingeniería. Solo realiza cambios que sean directamente solicitados o claramente necesarios. Mantén soluciones simples y enfocadas:

- Alcance: No añadas características, refactorices código, o hagas "mejoras" más allá de lo solicitado. Una corrección de bug no necesita código circundante limpiado. Una característica simple no necesita configurabilidad extra.

- Documentación: No añadas docstrings, comentarios, o anotaciones de tipo a código que no cambiaste. Solo añade comentarios donde la lógica no sea evidente por sí misma.

- Codificación defensiva: No añadas manejo de errores, alternativas, o validación para escenarios que no pueden suceder. Confía en garantías de código interno y marco. Solo valida en límites del sistema (entrada del usuario, APIs externas).

- Abstracciones: No crees ayudantes, utilidades, o abstracciones para operaciones de una sola vez. No diseñes para requisitos futuros hipotéticos. La cantidad correcta de complejidad es el mínimo necesario para la tarea actual.

Evitar enfocarse en pasar pruebas y codificación dura

Claude a veces puede enfocarse demasiado en hacer pasar pruebas a expensas de soluciones más generales, o puede usar soluciones alternativas como scripts auxiliares para refactorización compleja en lugar de usar herramientas estándar directamente. Para prevenir este comportamiento y asegurar soluciones robustas y generalizables:

Indicación de ejemplo

Por favor escribe una solución de alta calidad y propósito general usando las herramientas estándar disponibles. No crees scripts auxiliares o soluciones alternativas para realizar la tarea de manera más eficiente. Implementa una solución que funcione correctamente para todas las entradas válidas, no solo los casos de prueba. No codifiques valores duro o crees soluciones que solo funcionen para entradas de prueba específicas. En su lugar, implementa la lógica actual que resuelve el problema de manera general.

Enfócate en entender los requisitos del problema e implementar el algoritmo correcto. Las pruebas están ahí para verificar corrección, no para definir la solución. Proporciona una implementación principiada que siga mejores prácticas y principios de diseño de software.

Si la tarea es irrazonable o inviable, o si alguna de las pruebas es incorrecta, por favor infórmame en lugar de trabajar alrededor de ellas. La solución debe ser robusta, mantenible y extensible.

Minimizar alucinaciones en codificación agéntica

Los últimos modelos de Claude son menos propensos a alucinaciones y dan respuestas más precisas, fundamentadas e inteligentes basadas en el código. Para alentar este comportamiento aún más y minimizar alucinaciones:

Indicación de ejemplo

<investigate_before_answering>
Nunca especules sobre código que no has abierto. Si el usuario hace referencia a un archivo específico, DEBES leer el archivo antes de responder. Asegúrate de investigar y leer archivos relevantes ANTES de responder preguntas sobre la base de código. Nunca hagas ninguna afirmación sobre código antes de investigar a menos que estés seguro de la respuesta correcta - da respuestas fundamentadas y libres de alucinaciones.
</investigate_before_answering>

Consejos específicos de capacidad

Capacidades de visión mejoradas

Claude Opus 4.5 y Claude Opus 4.6 tienen capacidades de visión mejoradas en comparación con modelos anteriores de Claude. Funcionan mejor en tareas de procesamiento de imágenes y extracción de datos, particularmente cuando hay múltiples imágenes presentes en contexto. Estas mejoras se trasladan al uso de computadora, donde los modelos pueden interpretar más confiablemente capturas de pantalla y elementos de interfaz de usuario. También puedes usar estos modelos para analizar videos dividiéndolos en fotogramas.

Una técnica que ha demostrado ser efectiva para impulsar aún más el rendimiento es dar a Claude una herramienta de recorte o habilidad. Las pruebas han mostrado mejora consistente en evaluaciones de imágenes cuando Claude puede "acercarse" a regiones relevantes de una imagen. Anthropic ha creado un libro de cocina para la herramienta de recorte.

Diseño de interfaz

Claude Opus 4.5 y Claude Opus 4.6 destacan en la construcción de aplicaciones web complejas y del mundo real con un fuerte diseño de interfaz. Sin embargo, sin orientación, los modelos pueden inclinarse hacia patrones genéricos que crean lo que los usuarios llaman la estética "AI slop". Para crear interfaces distintivas y creativas que sorprendan y deleiten:

Para una guía detallada sobre mejora del diseño de interfaz, ver la publicación de blog sobre mejora del diseño de interfaz a través de habilidades.

Aquí hay un fragmento de indicación de sistema que puedes usar para alentar mejor diseño de interfaz:

Indicación de ejemplo para estética de interfaz

<frontend_aesthetics>
Tienes a converger hacia salidas genéricas, "en distribución". En diseño de interfaz, esto crea lo que los usuarios llaman la estética "AI slop". Evita esto: crea interfaces distintivas y creativas que sorprendan y deleiten.

Enfócate en:
- Tipografía: Elige fuentes que sean hermosas, únicas e interesantes. Evita fuentes genéricas como Arial e Inter; opta en su lugar por opciones distintivas que eleven la estética de la interfaz.
- Color y Tema: Comprométete con una estética coherente. Usa variables CSS para consistencia. Los colores dominantes con acentos agudos superan paletas tímidas y distribuidas uniformemente. Extrae inspiración de temas IDE y estéticas culturales.
- Movimiento: Usa animaciones para efectos e interacciones micro. Prioriza soluciones solo CSS para HTML. Usa la librería Motion para React cuando esté disponible. Enfócate en momentos de alto impacto: una carga de página bien orquestada con revelaciones escalonadas (animation-delay) crea más deleite que microinteracciones dispersas.
- Fondos: Crea atmósfera y profundidad en lugar de inclinarse hacia colores sólidos. Superpone gradientes CSS, usa patrones geométricos, o añade efectos contextuales que coincidan con la estética general.

Evita estéticas genéricas generadas por IA:
- Familias de fuentes sobreutilizadas (Inter, Roboto, Arial, fuentes del sistema)
- Esquemas de color cliché (particularmente gradientes púrpura sobre fondos blancos)
- Diseños y patrones de componentes predecibles
- Diseño genérico que carece de carácter específico del contexto

Interpreta creativamente y haz opciones inesperadas que se sientan genuinamente diseñadas para el contexto. Varía entre temas claros y oscuros, diferentes fuentes, diferentes estéticas. Aún tienes a converger en opciones comunes (Space Grotesk, por ejemplo) a través de generaciones. Evita esto: ¡es crítico que pienses fuera de la caja!
</frontend_aesthetics>

También puedes referirte a la definición de habilidad completa.

Consideraciones de migración

Cuando migres a modelos Claude 4.6 desde generaciones anteriores:

Sé específico sobre el comportamiento deseado: Considera describir exactamente qué te gustaría ver en la salida.
Enmarca tus instrucciones con modificadores: Añadir modificadores que alienten a Claude a aumentar la calidad y detalle de su salida puede ayudar a moldear mejor el rendimiento de Claude. Por ejemplo, en lugar de "Crea un panel de análisis", usa "Crea un panel de análisis. Incluye tantas características e interacciones relevantes como sea posible. Ve más allá de lo básico para crear una implementación completamente funcional."
Solicita características específicas explícitamente: Las animaciones y elementos interactivos deben ser solicitados explícitamente cuando se deseen.
Actualiza la configuración de pensamiento: Los modelos Claude 4.6 usan pensamiento adaptativo (thinking: {type: "adaptive"}) en lugar de pensamiento manual con budget_tokens. Usa el parámetro effort para controlar la profundidad del pensamiento.
Migra desde respuestas prefilladas: Las respuestas prefilladas en el último turno de asistente están deprecadas a partir de modelos Claude 4.6. Ver Migrando desde respuestas prefilladas para orientación detallada sobre alternativas.
Ajusta la indicación anti-pereza: Si tus indicaciones anteriormente alentaban al modelo a ser más minucioso o usar herramientas más agresivamente, reduce esa orientación. Los modelos Claude 4.6 son significativamente más proactivos y pueden dispararse excesivamente en instrucciones que eran necesarias para modelos anteriores.

Para pasos de migración detallados, ver la Guía de migración.

Migrando desde Claude Sonnet 4.5 a Claude Sonnet 4.6

Claude Sonnet 4.6 por defecto tiene un nivel de effort de high, en contraste con Claude Sonnet 4.5 que no tenía parámetro effort. Considera ajustar el parámetro effort a medida que migres desde Claude Sonnet 4.5 a Claude Sonnet 4.6. Si no se establece explícitamente, puedes experimentar latencia más alta con el nivel de effort predeterminado.

Configuraciones de effort recomendadas:

Medium para la mayoría de aplicaciones
Low para cargas de trabajo de alto volumen o sensibles a latencia
Establece un presupuesto de token de salida máximo grande (64k tokens recomendados) en effort medio o alto para dar al modelo espacio para pensar y actuar

Cuándo usar Opus 4.7 en su lugar: Para los problemas más difíciles y de largo horizonte (migraciones de código a gran escala, investigación profunda, trabajo autónomo extendido), Opus 4.7 sigue siendo la opción correcta. Sonnet 4.6 está optimizado para cargas de trabajo donde la rápida respuesta y la eficiencia de costos importan más.

Si no estás usando pensamiento extendido

Si no estás usando pensamiento extendido en Claude Sonnet 4.5, puedes continuar sin él en Claude Sonnet 4.6. Debes establecer explícitamente effort al nivel apropiado para tu caso de uso. Con effort low y pensamiento desactivado, puedes esperar rendimiento similar o mejor en relación con Claude Sonnet 4.5 sin pensamiento extendido.

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "disabled"},
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "..."}],
)

Si estás usando pensamiento extendido

Si estás usando pensamiento extendido con budget_tokens en Claude Sonnet 4.5, sigue siendo funcional en Claude Sonnet 4.6 pero está deprecado. Migra a pensamiento adaptativo con el parámetro effort.

Migrando a pensamiento adaptativo

El pensamiento adaptativo es particularmente bien adecuado para los siguientes patrones de carga de trabajo:

Agentes autónomos de múltiples pasos: agentes de codificación que convierten requisitos en software funcional, tuberías de análisis de datos, y búsqueda de bugs donde el modelo se ejecuta independientemente a través de muchos pasos. El pensamiento adaptativo permite al modelo calibrar su razonamiento por paso, manteniéndose en el camino sobre trayectorias más largas. Para estas cargas de trabajo, comienza con effort high. Si la latencia o el uso de tokens es una preocupación, reduce a medium.
Agentes de uso de computadora: Claude Sonnet 4.6 logró la mejor precisión en su clase en evaluaciones de uso de computadora usando modo adaptativo.
Cargas de trabajo bimodales: una mezcla de tareas fáciles y difíciles donde adaptativo omite pensamiento en consultas simples y razona profundamente en las complejas.

Cuando uses pensamiento adaptativo, evalúa effort medium y high en tus tareas. El nivel correcto depende del equilibrio de tu carga de trabajo entre calidad, latencia y uso de tokens.

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},
    messages=[{"role": "user", "content": "..."}],
)

Manteniendo budget_tokens durante la migración

Si necesitas mantener budget_tokens temporalmente mientras migras, un presupuesto alrededor de 16k tokens proporciona espacio para problemas más difíciles sin riesgo de uso de tokens descontrolado. Esta configuración está deprecada y será removida en una futura versión de modelo.

Para casos de uso de codificación (codificación agéntica, flujos de trabajo pesados en herramientas, generación de código), comienza con effort medium:

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "..."}],
)

Para casos de uso de chat y no codificación (chat, generación de contenido, búsqueda, clasificación), comienza con effort low:

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "..."}],
)

Was this page helpful?

ConstruirIngeniería de prompts

Mejores prácticas de prompting

Guía completa de técnicas de ingeniería de prompts para los últimos modelos de Claude, cubriendo claridad, ejemplos, estructuración XML, pensamiento y sistemas agénticos.

Prompting Claude Opus 4.7

Longitud de respuesta y verbosidad

Si tu producto depende de un cierto estilo o verbosidad de salida, es posible que necesites ajustar tus prompts. Como ejemplo, para disminuir la verbosidad, podrías agregar:

Proporciona respuestas concisas y enfocadas. Omite contexto no esencial y mantén los ejemplos mínimos.

Calibrando esfuerzo y profundidad de pensamiento

max: El esfuerzo máximo puede entregar ganancias de rendimiento en algunos casos de uso, pero puede mostrar rendimientos decrecientes del aumento de uso de tokens. Esta configuración también puede ser a veces propensa al exceso de pensamiento. Recomendamos probar el esfuerzo máximo para tareas que demandan inteligencia.
xhigh (nuevo): El esfuerzo extra alto es la mejor configuración para la mayoría de casos de uso de codificación y agénticos.
high: Esta configuración equilibra el uso de tokens e inteligencia. Para la mayoría de casos de uso sensibles a la inteligencia, recomendamos un mínimo de esfuerzo high.
medium: Bueno para casos de uso sensibles a costos que necesitan reducir el uso de tokens mientras se intercambia inteligencia.
low: Reserva para tareas cortas y limitadas y cargas de trabajo sensibles a la latencia que no son sensibles a la inteligencia.

Esta tarea implica razonamiento de múltiples pasos. Piensa cuidadosamente a través del problema antes de responder.

Esperamos que el esfuerzo sea más importante para este modelo que para cualquier Opus anterior, y recomendamos experimentar con él activamente cuando actualices.

El pensamiento agrega latencia y solo debe usarse cuando mejorará significativamente la calidad de la respuesta — típicamente para problemas que requieren razonamiento de múltiples pasos. Cuando tengas dudas, responde directamente.

Activación del uso de herramientas

Actualizaciones de progreso orientadas al usuario

Seguimiento de instrucciones más literal

Tono y estilo de escritura

Por ejemplo, si la voz de tu producto es más cálida o conversacional, agrega:

Usa un tono cálido y colaborativo. Reconoce el marco del usuario antes de responder.

Controlando el desove de subagentos

No desoves un subagentos para trabajo que puedas completar directamente en una sola respuesta (por ejemplo, refactorizar una función que ya puedes ver).

Desova múltiples subagentos en el mismo turno cuando abaniques entre elementos o leas múltiples archivos.

Valores predeterminados de diseño y frontend

1. Especifica una alternativa concreta. El modelo sigue especificaciones explícitas con precisión:

Diseña una página de destino de escritorio para una marca de suplementos llamada AEFRM.

La dirección visual debe provenir de una atmósfera monocromática fría usando tonos de gris plateado pálido que se profundizan gradualmente en gris azulado y casi negro, similar a una superficie metálica brumosa.

La página debe sentirse afilada y controlada, con un fuerte sentido de estructura y restricción.

Usa este sistema tonal en toda la página en lugar de introducir colores de acento brillantes.

Usa la imagen cargada en el diseño del héroe en blanco y negro.

El diseño debe construirse con secciones horizontales claras y un contenedor de ancho máximo centrado. Usa un radio de esquina de 4px consistentemente en tarjetas, botones, entradas y marcos de medios. Los márgenes deben sentirse generosos, con suficiente espacio vacío alrededor de cada sección para que la página respire.

La tipografía debe usar un sans-serif cuadrado y angular con espaciado de letras más amplio de lo usual, especialmente en encabezados y navegación, para que el texto se sienta más ingenieril y menos comprimido. El texto del titular puede ser grande y mayúscula, mientras que la copia de apoyo permanece corta y escasa. Los subtextos deben escribirse con Alumni Sans SC en 4-6px como textos pequeñitos en las esquinas abajo al centro así.

Para la estructura, comienza con una sección de héroe que contiene una declaración de producto fuerte, un párrafo de apoyo corto y un marco de marcador de posición de producto limpio o packshot. Debajo de eso, agrega una cuadrícula de beneficios con tres o cuatro bloques, luego una sección de formulación o ingredientes, y finalmente un cta.

Los botones deben ser planos y precisos, con cambios de desplazamiento sutiles usando transition: all 160ms ease out donde el brillo y el contraste del borde se desplazan ligeramente en lugar de usar movimiento dramático.

La paleta de colores debe mantenerse dentro de este rango:
#E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.

Antes de construir, propón 4 direcciones visuales distintas adaptadas a este brief (cada una como: bg hex / accent hex / typeface — rationale de una línea). Pregunta al usuario que elija una, luego implementa solo esa dirección.

<frontend_aesthetics>
NUNCA uses estéticas genéricas generadas por IA como familias de fuentes sobreutilizadas (Inter, Roboto, Arial, fuentes del sistema), esquemas de colores clichés (particularmente gradientes púrpuras en fondos blancos u oscuros), diseños predecibles y patrones de componentes, y diseño genérico que carece de carácter específico del contexto. Usa fuentes únicas, colores y temas cohesivos, y animaciones para efectos e interacciones micro.
</frontend_aesthetics>

Productos de codificación interactiva

Arneses de revisión de código

Lenguaje de prompt recomendado:

Reporta cada problema que encuentres, incluyendo aquellos de los que no estés seguro o consideres de baja severidad. No filtres por importancia o confianza en esta etapa - un paso de verificación separado hará eso. Tu objetivo aquí es cobertura: es mejor exponer un hallazgo que luego se filtre que silenciosamente dejar caer un bug real. Para cada hallazgo, incluye tu nivel de confianza y una severidad estimada para que un filtro descendente pueda clasificarlos.

Recomendamos iterar en prompts contra un subconjunto de tus evaluaciones o casos de prueba para validar ganancias de recall o puntuación F1.

Uso de computadora

Principios generales

Sé claro y directo

Piensa en Claude como un empleado brillante pero nuevo que carece de contexto sobre tus normas y flujos de trabajo. Cuanto más precisamente expliques lo que deseas, mejor será el resultado.

Regla de oro: Muestra tu prompt a un colega con contexto mínimo sobre la tarea y pídele que lo siga. Si estarían confundidos, Claude también lo estará.

Sé específico sobre el formato de salida deseado y las restricciones.
Proporciona instrucciones como pasos secuenciales usando listas numeradas o puntos cuando el orden o la completitud de los pasos importa.

Agrega contexto para mejorar el rendimiento

Claude es lo suficientemente inteligente para generalizar a partir de la explicación.

Usa ejemplos efectivamente

Al agregar ejemplos, hazlos:

Relevantes: Espeja tu caso de uso real de cerca.
Diversos: Cubre casos extremos y varía lo suficiente para que Claude no capte patrones no intencionados.
Estructurados: Envuelve ejemplos en etiquetas <example> (múltiples ejemplos en etiquetas <examples>) para que Claude pueda distinguirlos de las instrucciones.

Estructura prompts con etiquetas XML

Mejores prácticas:

Usa nombres de etiqueta consistentes y descriptivos en tus prompts.
Anida etiquetas cuando el contenido tiene una jerarquía natural (documentos dentro de <documents>, cada uno dentro de <document index="n">).

Dale a Claude un rol

Establecer un rol en el prompt del sistema enfoca el comportamiento y tono de Claude para tu caso de uso. Incluso una sola oración marca la diferencia:

Python

import anthropic

client = anthropic.Anthropic()

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    system="You are a helpful coding assistant specializing in Python.",
    messages=[
        {"role": "user", "content": "How do I sort a list of dictionaries by key?"}
    ],
)
print(message.content)

Prompting de contexto largo

Cuando trabajes con documentos grandes o entradas ricas en datos (20k+ tokens), estructura tu prompt cuidadosamente para obtener los mejores resultados:

Pon datos de forma larga en la parte superior: Coloca tus documentos largos e entradas cerca de la parte superior de tu prompt, por encima de tu consulta, instrucciones y ejemplos. Esto puede mejorar significativamente el rendimiento en todos los modelos.

Las consultas al final pueden mejorar la calidad de la respuesta hasta un 30% en pruebas, especialmente con entradas complejas de múltiples documentos.
Estructura contenido de documento y metadatos con etiquetas XML: Cuando uses múltiples documentos, envuelve cada documento en etiquetas <document> con subtags <document_content> y <source> (y otros metadatos) para claridad.
Fundamenta respuestas en citas: Para tareas de documentos largos, pide a Claude que cite primero partes relevantes de los documentos antes de llevar a cabo su tarea. Esto ayuda a Claude a cortar a través del ruido del resto del contenido del documento.

Autoconocimiento del modelo

Si te gustaría que Claude se identifique correctamente en tu aplicación o use cadenas de API específicas:

Prompt de ejemplo para identidad de modelo

El asistente es Claude, creado por Anthropic. El modelo actual es Claude Opus 4.7.

Para aplicaciones impulsadas por LLM que necesitan especificar cadenas de modelo:

Prompt de ejemplo para cadena de modelo

Cuando se necesita un LLM, por favor establece por defecto Claude Opus 4.7 a menos que el usuario solicite lo contrario. La cadena de modelo exacta para Claude Opus 4.7 es claude-opus-4-7.

Salida y formato

Estilo de comunicación y verbosidad

Los últimos modelos de Claude tienen un estilo de comunicación más conciso y natural en comparación con modelos anteriores:

Más directo y fundamentado: Proporciona reportes de progreso basados en hechos en lugar de actualizaciones auto-celebratorias
Más conversacional: Ligeramente más fluido y coloquial, menos parecido a máquina
Menos verboso: Puede omitir resúmenes detallados por eficiencia a menos que se le solicite lo contrario

Esto significa que Claude puede omitir resúmenes verbales después de llamadas de herramientas, saltando directamente a la siguiente acción. Si prefieres más visibilidad en su razonamiento:

Prompt de ejemplo

Después de completar una tarea que implica uso de herramientas, proporciona un resumen rápido del trabajo que has hecho.

Controla el formato de respuestas

Hay algunas formas particularmente efectivas de dirigir el formato de salida:

Dile a Claude qué hacer en lugar de qué no hacer
- En lugar de: "No uses markdown en tu respuesta"
- Intenta: "Tu respuesta debe estar compuesta de párrafos de prosa que fluyan suavemente."
Usa indicadores de formato XML
- Intenta: "Escribe las secciones de prosa de tu respuesta en etiquetas <smoothly_flowing_prose_paragraphs>."
Haz coincidir el estilo de tu prompt con la salida deseada

El estilo de formato usado en tu prompt puede influir en el estilo de respuesta de Claude. Si aún experimentas problemas de dirigibilidad con formato de salida, intenta hacer coincidir el estilo de tu prompt con tu estilo de salida deseado lo más posible. Por ejemplo, eliminar markdown de tu prompt puede reducir el volumen de markdown en la salida.
Usa prompts detallados para preferencias de formato específicas

Para más control sobre el uso de markdown y formato, proporciona orientación explícita:

Prompt de ejemplo para minimizar markdown

<avoid_excessive_markdown_and_bullet_points>
Al escribir reportes, documentos, explicaciones técnicas, análisis o cualquier contenido de forma larga, escribe en prosa clara y fluida usando párrafos y oraciones completos. Usa saltos de párrafo estándar para organización y reserva markdown principalmente para `código en línea`, bloques de código (```...```), y encabezados simples (###, y ###). Evita usar **negrita** e *cursiva*.

NO uses listas ordenadas (1. ...) o listas desordenadas (*) a menos que: a) estés presentando elementos verdaderamente discretos donde un formato de lista es la mejor opción, o b) el usuario explícitamente solicite una lista o clasificación

En lugar de listar elementos con viñetas o números, incorpóralos naturalmente en oraciones. Esta orientación se aplica especialmente a la escritura técnica. Usar prosa en lugar de formato excesivo mejorará la satisfacción del usuario. NUNCA generes una serie de puntos excesivamente cortos.

Tu objetivo es texto legible y fluido que guíe al lector naturalmente a través de ideas en lugar de fragmentar información en puntos aislados.
</avoid_excessive_markdown_and_bullet_points>

Salida LaTeX

Claude Opus 4.6 establece por defecto LaTeX para expresiones matemáticas, ecuaciones y explicaciones técnicas. Si prefieres texto plano, agrega las siguientes instrucciones a tu prompt:

Prompt de ejemplo

Formatea tu respuesta en texto plano solamente. No uses LaTeX, MathJax o cualquier notación de marcado como \( \), $, o \frac{}{}. Escribe todas las expresiones matemáticas usando caracteres de texto estándar (por ejemplo, "/" para división, "*" para multiplicación, y "^" para exponentes).

Creación de documentos

Para obtener los mejores resultados con creación de documentos:

Prompt de ejemplo

Crea una presentación profesional sobre [tema]. Incluye elementos de diseño reflexivos, jerarquía visual y animaciones atractivas donde sea apropiado.

Migrando desde respuestas rellenadas previamente

Aquí hay escenarios comunes de prefill y cómo migrar lejos de ellos:

Uso de herramientas

Para que Claude tome acción, sé más explícito:

Para hacer que Claude sea más proactivo sobre tomar acción por defecto, puedes agregar esto a tu prompt del sistema:

Prompt de ejemplo para acción proactiva

<default_to_action>
Por defecto, implementa cambios en lugar de solo sugerirlos. Si la intención del usuario es poco clara, infiere la acción probable más útil y procede, usando herramientas para descubrir cualquier detalle faltante en lugar de adivinar. Intenta inferir la intención del usuario sobre si una llamada de herramienta (por ejemplo, edición o lectura de archivo) es intencionada o no, y actúa en consecuencia.
</default_to_action>

Prompt de ejemplo para acción conservadora

<do_not_act_before_instructions>
No saltes a implementación o cambies archivos a menos que se te instruya claramente a hacer cambios. Cuando la intención del usuario es ambigua, establece por defecto proporcionar información, hacer investigación y proporcionar recomendaciones en lugar de tomar acción. Solo procede con ediciones, modificaciones o implementaciones cuando el usuario explícitamente las solicita.
</do_not_act_before_instructions>

Optimizar las llamadas de herramientas en paralelo

Los últimos modelos de Claude destacan en la ejecución paralela de herramientas. Estos modelos:

Ejecutarán múltiples búsquedas especulativas durante la investigación
Leerán varios archivos a la vez para construir contexto más rápidamente
Ejecutarán comandos bash en paralelo (que incluso pueden saturar el rendimiento del sistema)

Indicación de ejemplo para máxima eficiencia paralela

<use_parallel_tool_calls>
Si tienes la intención de llamar a múltiples herramientas y no hay dependencias entre las llamadas de herramientas, realiza todas las llamadas de herramientas independientes en paralelo. Prioriza llamar a herramientas simultáneamente siempre que las acciones puedan realizarse en paralelo en lugar de secuencialmente. Por ejemplo, al leer 3 archivos, ejecuta 3 llamadas de herramientas en paralelo para leer los 3 archivos en contexto al mismo tiempo. Maximiza el uso de llamadas de herramientas paralelas donde sea posible para aumentar la velocidad y eficiencia. Sin embargo, si algunas llamadas de herramientas dependen de llamadas anteriores para informar valores dependientes como los parámetros, NO llames a estas herramientas en paralelo y en su lugar llámalas secuencialmente. Nunca uses marcadores de posición o adivines parámetros faltantes en llamadas de herramientas.
</use_parallel_tool_calls>

Indicación de ejemplo para reducir la ejecución paralela

Ejecuta operaciones secuencialmente con breves pausas entre cada paso para garantizar estabilidad.

Pensamiento y razonamiento

Pensamiento excesivo y minuciosidad excesiva

Reemplaza valores predeterminados generales con instrucciones más específicas. En lugar de "Por defecto, usa [herramienta]," añade orientación como "Usa [herramienta] cuando mejoraría tu comprensión del problema."
Elimina el exceso de indicaciones. Las herramientas que se disparaban insuficientemente en modelos anteriores probablemente se disparen apropiadamente ahora. Las instrucciones como "Si tienes dudas, usa [herramienta]" causarán un disparo excesivo.
Usa effort como alternativa. Si Claude continúa siendo demasiado agresivo, usa una configuración más baja para effort.

Indicación de ejemplo

Cuando estés decidiendo cómo abordar un problema, elige un enfoque y comprométete con él. Evita revisar decisiones a menos que encuentres información nueva que contradiga directamente tu razonamiento. Si estás sopesando dos enfoques, elige uno y llévalo a cabo. Siempre puedes corregir el rumbo más tarde si el enfoque elegido falla.

Aprovechar las capacidades de pensamiento y pensamiento intercalado

Puedes guiar el comportamiento de pensamiento de Claude:

Indicación de ejemplo

Después de recibir resultados de herramientas, reflexiona cuidadosamente sobre su calidad y determina los pasos siguientes óptimos antes de proceder. Usa tu pensamiento para planificar e iterar basándote en esta nueva información, y luego toma la mejor acción siguiente.

Indicación de ejemplo

El pensamiento extendido añade latencia y solo debe usarse cuando mejorará significativamente la calidad de la respuesta - típicamente para problemas que requieren razonamiento de múltiples pasos. Cuando tengas dudas, responde directamente.

Si estás migrando desde pensamiento extendido con budget_tokens, reemplaza tu configuración de pensamiento y mueve el control de presupuesto a effort:

Antes (pensamiento extendido, modelos más antiguos):

Python

client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=64000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    messages=[{"role": "user", "content": "..."}],
)

Después (pensamiento adaptativo):

Python

client.messages.create(
    model="claude-opus-4-7",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},  # or "max", "xhigh", "medium", "low"
    messages=[{"role": "user", "content": "..."}],
)

Si no estás usando pensamiento extendido, no se requieren cambios. El pensamiento está desactivado por defecto cuando omites el parámetro thinking.

Prefiere instrucciones generales sobre pasos prescriptivos. Una indicación como "piensa minuciosamente" a menudo produce mejor razonamiento que un plan paso a paso escrito a mano. El razonamiento de Claude frecuentemente supera lo que un humano prescribiría.
Los ejemplos multishot funcionan con pensamiento. Usa etiquetas <thinking> dentro de tus ejemplos de pocos disparos para mostrar a Claude el patrón de razonamiento. Generalizará ese estilo a sus propios bloques de pensamiento extendido.
CoT manual como alternativa. Cuando el pensamiento está desactivado, aún puedes alentar razonamiento paso a paso pidiendo a Claude que piense a través del problema. Usa etiquetas estructuradas como <thinking> y <answer> para separar limpiamente el razonamiento de la salida final.
Pide a Claude que se autoverificar. Añade algo como "Antes de terminar, verifica tu respuesta contra [criterios de prueba]." Esto atrapa errores de manera confiable, especialmente para codificación y matemáticas.

Para más información sobre capacidades de pensamiento, ver Pensamiento extendido y Pensamiento adaptativo.

Sistemas agénticos

Razonamiento de largo horizonte y seguimiento de estado

Conciencia de contexto y flujos de trabajo de múltiples ventanas

Gestión de límites de contexto:

Indicación de ejemplo

Tu ventana de contexto será compactada automáticamente a medida que se acerque a su límite, permitiéndote continuar trabajando indefinidamente desde donde lo dejaste. Por lo tanto, no detengas tareas temprano debido a preocupaciones de presupuesto de tokens. A medida que te acerques a tu límite de presupuesto de tokens, guarda tu progreso actual y estado en memoria antes de que se actualice la ventana de contexto. Siempre sé lo más persistente y autónomo posible y completa tareas completamente, incluso si el final de tu presupuesto se está acercando. Nunca detengas artificialmente ninguna tarea temprano independientemente del contexto restante.

La herramienta de memoria se empareja naturalmente con la conciencia de contexto para transiciones de contexto sin problemas.

Flujos de trabajo de múltiples ventanas de contexto

Para tareas que abarcan múltiples ventanas de contexto:

Usa una indicación diferente para la primera ventana de contexto: Usa la primera ventana de contexto para configurar un marco (escribe pruebas, crea scripts de configuración), luego usa futuras ventanas de contexto para iterar en una lista de tareas.
Haz que el modelo escriba pruebas en un formato estructurado: Pide a Claude que cree pruebas antes de comenzar el trabajo y mantén un registro de ellas en un formato estructurado (por ejemplo, tests.json). Esto lleva a una mejor capacidad a largo plazo para iterar. Recuerda a Claude la importancia de las pruebas: "Es inaceptable eliminar o editar pruebas porque esto podría llevar a funcionalidad faltante o defectuosa."
Configura herramientas de calidad de vida: Anima a Claude a crear scripts de configuración (por ejemplo, init.sh) para iniciar servidores con elegancia, ejecutar suites de pruebas y linters. Esto previene trabajo repetido cuando se continúa desde una ventana de contexto nueva.
Comenzar de nuevo vs compactar: Cuando se borra una ventana de contexto, considera comenzar con una ventana de contexto completamente nueva en lugar de usar compactación. Los últimos modelos de Claude son extremadamente efectivos en descubrir estado desde el sistema de archivos local. En algunos casos, puedes querer aprovechar esto sobre la compactación. Sé prescriptivo sobre cómo debe comenzar:
- "Llama a pwd; solo puedes leer y escribir archivos en este directorio."
- "Revisa progress.txt, tests.json, y los registros de git."
- "Ejecuta manualmente una prueba de integración fundamental antes de pasar a implementar nuevas características."
Proporciona herramientas de verificación: A medida que crece la longitud de las tareas autónomas, Claude necesita verificar la corrección sin retroalimentación humana continua. Herramientas como el servidor Playwright MCP o capacidades de uso de computadora para probar interfaces de usuario son útiles.
Anima el uso completo del contexto: Indica a Claude que complete componentes eficientemente antes de pasar a lo siguiente:

Indicación de ejemplo

Esta es una tarea muy larga, por lo que puede ser beneficioso planificar tu trabajo claramente. Se anima a pasar todo tu contexto de salida trabajando en la tarea - solo asegúrate de no quedarte sin contexto con trabajo significativo sin confirmar. Continúa trabajando sistemáticamente hasta que hayas completado esta tarea.

Mejores prácticas de gestión de estado

Usa formatos estructurados para datos de estado: Cuando rastrées información estructurada (como resultados de pruebas o estado de tareas), usa JSON u otros formatos estructurados para ayudar a Claude a entender requisitos de esquema
Usa texto no estructurado para notas de progreso: Las notas de progreso de forma libre funcionan bien para rastrear progreso general y contexto
Usa git para rastreo de estado: Git proporciona un registro de lo que se ha hecho y puntos de control que pueden ser restaurados. Los últimos modelos de Claude funcionan especialmente bien usando git para rastrear estado a través de múltiples sesiones.
Enfatiza el progreso incremental: Pide explícitamente a Claude que mantenga un registro de su progreso y se enfoque en trabajo incremental

Equilibrio entre autonomía y seguridad

Indicación de ejemplo

Considera la reversibilidad e impacto potencial de tus acciones. Se te anima a tomar acciones locales y reversibles como editar archivos o ejecutar pruebas, pero para acciones que son difíciles de revertir, afectan sistemas compartidos, o podrían ser destructivas, pide al usuario antes de proceder.

Ejemplos de acciones que justifican confirmación:
- Operaciones destructivas: eliminar archivos o ramas, soltar tablas de base de datos, rm -rf
- Operaciones difíciles de revertir: git push --force, git reset --hard, enmendar commits publicados
- Operaciones visibles para otros: hacer push de código, comentar en PRs/issues, enviar mensajes, modificar infraestructura compartida

Cuando encuentres obstáculos, no uses acciones destructivas como atajo. Por ejemplo, no eludas controles de seguridad (por ejemplo --no-verify) o descartes archivos desconocidos que podrían ser trabajo en progreso.

Investigación y recopilación de información

Proporciona criterios de éxito claros: Define qué constituye una respuesta exitosa a tu pregunta de investigación
Anima la verificación de fuentes: Pide a Claude que verifique información a través de múltiples fuentes
Para tareas de investigación complejas, usa un enfoque estructurado:

Indicación de ejemplo para investigación compleja

Busca esta información de manera estructurada. A medida que recopiles datos, desarrolla varias hipótesis competidoras. Rastrea tus niveles de confianza en tus notas de progreso para mejorar la calibración. Autocrítica regularmente tu enfoque y plan. Actualiza un árbol de hipótesis o archivo de notas de investigación para persistir información y proporcionar transparencia. Desglosa esta tarea de investigación compleja sistemáticamente.

Este enfoque estructurado permite a Claude encontrar y sintetizar prácticamente cualquier pieza de información e iterar críticamente sus hallazgos, sin importar el tamaño del corpus.

Orquestación de suagentes

Para aprovechar este comportamiento:

Asegura herramientas de suagente bien definidas: Ten herramientas de suagente disponibles y descritas en definiciones de herramientas
Deja que Claude orqueste naturalmente: Claude delegará apropiadamente sin instrucción explícita
Observa el uso excesivo: Claude Opus 4.6 tiene una fuerte predilección por suagentes y puede generarlos en situaciones donde un enfoque más simple y directo sería suficiente. Por ejemplo, el modelo puede generar suagentes para exploración de código cuando una llamada grep directa es más rápida y suficiente.

Si ves uso excesivo de suagentes, añade orientación explícita sobre cuándo los suagentes son y no son justificados:

Indicación de ejemplo para uso de suagentes

Usa suagentes cuando las tareas puedan ejecutarse en paralelo, requieran contexto aislado, o impliquen flujos de trabajo independientes que no necesiten compartir estado. Para tareas simples, operaciones secuenciales, ediciones de archivo único, o tareas donde necesites mantener contexto a través de pasos, trabaja directamente en lugar de delegar.

Encadenar indicaciones complejas

Reducir la creación de archivos en codificación agéntica

Si prefieres minimizar la creación neta de nuevos archivos, puedes instruir a Claude que limpie después de sí mismo:

Indicación de ejemplo

Si creas cualquier archivo nuevo temporal, scripts, o archivos auxiliares para iteración, limpia estos archivos eliminándolos al final de la tarea.

Exceso de entusiasmo

Por ejemplo:

Indicación de ejemplo para minimizar sobreingeniería

Evita la sobreingeniería. Solo realiza cambios que sean directamente solicitados o claramente necesarios. Mantén soluciones simples y enfocadas:

- Alcance: No añadas características, refactorices código, o hagas "mejoras" más allá de lo solicitado. Una corrección de bug no necesita código circundante limpiado. Una característica simple no necesita configurabilidad extra.

- Documentación: No añadas docstrings, comentarios, o anotaciones de tipo a código que no cambiaste. Solo añade comentarios donde la lógica no sea evidente por sí misma.

- Codificación defensiva: No añadas manejo de errores, alternativas, o validación para escenarios que no pueden suceder. Confía en garantías de código interno y marco. Solo valida en límites del sistema (entrada del usuario, APIs externas).

- Abstracciones: No crees ayudantes, utilidades, o abstracciones para operaciones de una sola vez. No diseñes para requisitos futuros hipotéticos. La cantidad correcta de complejidad es el mínimo necesario para la tarea actual.

Evitar enfocarse en pasar pruebas y codificación dura

Indicación de ejemplo

Por favor escribe una solución de alta calidad y propósito general usando las herramientas estándar disponibles. No crees scripts auxiliares o soluciones alternativas para realizar la tarea de manera más eficiente. Implementa una solución que funcione correctamente para todas las entradas válidas, no solo los casos de prueba. No codifiques valores duro o crees soluciones que solo funcionen para entradas de prueba específicas. En su lugar, implementa la lógica actual que resuelve el problema de manera general.

Enfócate en entender los requisitos del problema e implementar el algoritmo correcto. Las pruebas están ahí para verificar corrección, no para definir la solución. Proporciona una implementación principiada que siga mejores prácticas y principios de diseño de software.

Si la tarea es irrazonable o inviable, o si alguna de las pruebas es incorrecta, por favor infórmame en lugar de trabajar alrededor de ellas. La solución debe ser robusta, mantenible y extensible.

Minimizar alucinaciones en codificación agéntica

Indicación de ejemplo

<investigate_before_answering>
Nunca especules sobre código que no has abierto. Si el usuario hace referencia a un archivo específico, DEBES leer el archivo antes de responder. Asegúrate de investigar y leer archivos relevantes ANTES de responder preguntas sobre la base de código. Nunca hagas ninguna afirmación sobre código antes de investigar a menos que estés seguro de la respuesta correcta - da respuestas fundamentadas y libres de alucinaciones.
</investigate_before_answering>

Consejos específicos de capacidad

Capacidades de visión mejoradas

Diseño de interfaz

Para una guía detallada sobre mejora del diseño de interfaz, ver la publicación de blog sobre mejora del diseño de interfaz a través de habilidades.

Aquí hay un fragmento de indicación de sistema que puedes usar para alentar mejor diseño de interfaz:

Indicación de ejemplo para estética de interfaz

<frontend_aesthetics>
Tienes a converger hacia salidas genéricas, "en distribución". En diseño de interfaz, esto crea lo que los usuarios llaman la estética "AI slop". Evita esto: crea interfaces distintivas y creativas que sorprendan y deleiten.

Enfócate en:
- Tipografía: Elige fuentes que sean hermosas, únicas e interesantes. Evita fuentes genéricas como Arial e Inter; opta en su lugar por opciones distintivas que eleven la estética de la interfaz.
- Color y Tema: Comprométete con una estética coherente. Usa variables CSS para consistencia. Los colores dominantes con acentos agudos superan paletas tímidas y distribuidas uniformemente. Extrae inspiración de temas IDE y estéticas culturales.
- Movimiento: Usa animaciones para efectos e interacciones micro. Prioriza soluciones solo CSS para HTML. Usa la librería Motion para React cuando esté disponible. Enfócate en momentos de alto impacto: una carga de página bien orquestada con revelaciones escalonadas (animation-delay) crea más deleite que microinteracciones dispersas.
- Fondos: Crea atmósfera y profundidad en lugar de inclinarse hacia colores sólidos. Superpone gradientes CSS, usa patrones geométricos, o añade efectos contextuales que coincidan con la estética general.

Evita estéticas genéricas generadas por IA:
- Familias de fuentes sobreutilizadas (Inter, Roboto, Arial, fuentes del sistema)
- Esquemas de color cliché (particularmente gradientes púrpura sobre fondos blancos)
- Diseños y patrones de componentes predecibles
- Diseño genérico que carece de carácter específico del contexto

Interpreta creativamente y haz opciones inesperadas que se sientan genuinamente diseñadas para el contexto. Varía entre temas claros y oscuros, diferentes fuentes, diferentes estéticas. Aún tienes a converger en opciones comunes (Space Grotesk, por ejemplo) a través de generaciones. Evita esto: ¡es crítico que pienses fuera de la caja!
</frontend_aesthetics>

También puedes referirte a la definición de habilidad completa.

Consideraciones de migración

Cuando migres a modelos Claude 4.6 desde generaciones anteriores:

Sé específico sobre el comportamiento deseado: Considera describir exactamente qué te gustaría ver en la salida.
Enmarca tus instrucciones con modificadores: Añadir modificadores que alienten a Claude a aumentar la calidad y detalle de su salida puede ayudar a moldear mejor el rendimiento de Claude. Por ejemplo, en lugar de "Crea un panel de análisis", usa "Crea un panel de análisis. Incluye tantas características e interacciones relevantes como sea posible. Ve más allá de lo básico para crear una implementación completamente funcional."
Solicita características específicas explícitamente: Las animaciones y elementos interactivos deben ser solicitados explícitamente cuando se deseen.
Actualiza la configuración de pensamiento: Los modelos Claude 4.6 usan pensamiento adaptativo (thinking: {type: "adaptive"}) en lugar de pensamiento manual con budget_tokens. Usa el parámetro effort para controlar la profundidad del pensamiento.
Migra desde respuestas prefilladas: Las respuestas prefilladas en el último turno de asistente están deprecadas a partir de modelos Claude 4.6. Ver Migrando desde respuestas prefilladas para orientación detallada sobre alternativas.
Ajusta la indicación anti-pereza: Si tus indicaciones anteriormente alentaban al modelo a ser más minucioso o usar herramientas más agresivamente, reduce esa orientación. Los modelos Claude 4.6 son significativamente más proactivos y pueden dispararse excesivamente en instrucciones que eran necesarias para modelos anteriores.

Para pasos de migración detallados, ver la Guía de migración.

Migrando desde Claude Sonnet 4.5 a Claude Sonnet 4.6

Configuraciones de effort recomendadas:

Medium para la mayoría de aplicaciones
Low para cargas de trabajo de alto volumen o sensibles a latencia
Establece un presupuesto de token de salida máximo grande (64k tokens recomendados) en effort medio o alto para dar al modelo espacio para pensar y actuar

Si no estás usando pensamiento extendido

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "disabled"},
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "..."}],
)

Si estás usando pensamiento extendido

Migrando a pensamiento adaptativo

El pensamiento adaptativo es particularmente bien adecuado para los siguientes patrones de carga de trabajo:

Agentes autónomos de múltiples pasos: agentes de codificación que convierten requisitos en software funcional, tuberías de análisis de datos, y búsqueda de bugs donde el modelo se ejecuta independientemente a través de muchos pasos. El pensamiento adaptativo permite al modelo calibrar su razonamiento por paso, manteniéndose en el camino sobre trayectorias más largas. Para estas cargas de trabajo, comienza con effort high. Si la latencia o el uso de tokens es una preocupación, reduce a medium.
Agentes de uso de computadora: Claude Sonnet 4.6 logró la mejor precisión en su clase en evaluaciones de uso de computadora usando modo adaptativo.
Cargas de trabajo bimodales: una mezcla de tareas fáciles y difíciles donde adaptativo omite pensamiento en consultas simples y razona profundamente en las complejas.

Cuando uses pensamiento adaptativo, evalúa effort medium y high en tus tareas. El nivel correcto depende del equilibrio de tu carga de trabajo entre calidad, latencia y uso de tokens.

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},
    messages=[{"role": "user", "content": "..."}],
)

Manteniendo budget_tokens durante la migración

Para casos de uso de codificación (codificación agéntica, flujos de trabajo pesados en herramientas, generación de código), comienza con effort medium:

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "..."}],
)

Para casos de uso de chat y no codificación (chat, generación de contenido, búsqueda, clasificación), comienza con effort low:

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "..."}],
)

Was this page helpful?

Prompting Claude Opus 4.7

Longitud de respuesta y verbosidad

Calibrando esfuerzo y profundidad de pensamiento

Activación del uso de herramientas

Actualizaciones de progreso orientadas al usuario

Seguimiento de instrucciones más literal

Tono y estilo de escritura

Controlando el desove de subagentos

Valores predeterminados de diseño y frontend

Productos de codificación interactiva

Arneses de revisión de código

Uso de computadora

Principios generales

Sé claro y directo

Ejemplo: Creando un panel de análisis

Agrega contexto para mejorar el rendimiento

Ejemplo: Preferencias de formato

Usa ejemplos efectivamente

Estructura prompts con etiquetas XML

Dale a Claude un rol

Prompting de contexto largo

Ejemplo de estructura multi-documento

Ejemplo de extracción de citas

Autoconocimiento del modelo

Salida y formato

Estilo de comunicación y verbosidad

Controla el formato de respuestas

Salida LaTeX

Creación de documentos

Migrando desde respuestas rellenadas previamente

Controlando el formato de salida

Eliminando preámbulos

Evitando rechazos malos

Continuaciones

Hidratación de contexto y consistencia de rol

Uso de herramientas

Uso de herramientas

Ejemplo: Instrucciones explícitas

Optimizar las llamadas de herramientas en paralelo

Pensamiento y razonamiento

Pensamiento excesivo y minuciosidad excesiva

Aprovechar las capacidades de pensamiento y pensamiento intercalado

Sistemas agénticos

Razonamiento de largo horizonte y seguimiento de estado

Conciencia de contexto y flujos de trabajo de múltiples ventanas

Flujos de trabajo de múltiples ventanas de contexto

Mejores prácticas de gestión de estado

Ejemplo: Rastreo de estado

Equilibrio entre autonomía y seguridad

Investigación y recopilación de información

Orquestación de suagentes

Encadenar indicaciones complejas

Reducir la creación de archivos en codificación agéntica

Exceso de entusiasmo

Evitar enfocarse en pasar pruebas y codificación dura

Minimizar alucinaciones en codificación agéntica

Consejos específicos de capacidad

Capacidades de visión mejoradas

Diseño de interfaz

Consideraciones de migración

Migrando desde Claude Sonnet 4.5 a Claude Sonnet 4.6

Si no estás usando pensamiento extendido

Si estás usando pensamiento extendido

Migrando a pensamiento adaptativo

Manteniendo budget_tokens durante la migración

Prompting Claude Opus 4.7

Longitud de respuesta y verbosidad

Calibrando esfuerzo y profundidad de pensamiento

Activación del uso de herramientas

Actualizaciones de progreso orientadas al usuario

Seguimiento de instrucciones más literal

Tono y estilo de escritura

Controlando el desove de subagentos

Valores predeterminados de diseño y frontend

Productos de codificación interactiva

Arneses de revisión de código

Uso de computadora

Principios generales

Sé claro y directo

Ejemplo: Creando un panel de análisis