Loading...
    • Construir
    • Admin
    • Modelos y precios
    • SDKs de cliente
    • Referencia de API
    Search...
    ⌘K
    Primeros pasos
    Introducción a ClaudeInicio rápido
    Construir con Claude
    Descripción general de característicasUso de Messages APIHabilidad Claude APIManejo de razones de parada
    Capacidades del modelo
    Extended thinkingAdaptive thinkingEsfuerzoPresupuestos de tareas (beta)Modo rápido (beta: vista previa de investigación)Salidas estructuradasCitasStreaming de mensajesProcesamiento por lotesResultados de búsquedaStreaming de rechazosSoporte multilingüeEmbeddings
    Herramientas
    Descripción generalCómo funciona el uso de herramientasHerramienta de búsqueda webHerramienta de obtención webHerramienta de ejecución de códigoHerramienta de asesorHerramienta de memoriaHerramienta BashHerramienta de uso de computadoraHerramienta de editor de texto
    Infraestructura de herramientas
    Referencia de herramientasBúsqueda de herramientasLlamada de herramientas programáticaStreaming de herramientas de grano fino
    Gestión de contexto
    Ventanas de contextoCompactaciónEdición de contextoAlmacenamiento en caché de promptsConteo de tokens
    Trabajar con archivos
    Files APISoporte de PDFImágenes y visión
    Habilidades
    Descripción generalInicio rápidoMejores prácticasHabilidades para empresasHabilidades en la API
    MCP
    Servidores MCP remotosConector MCP
    Ingeniería de prompts
    Descripción generalMejores prácticas de promptingHerramientas de prompting en Console
    Probar y evaluar
    Definir éxito y construir evaluacionesUsar la herramienta de evaluación en ConsoleReducir latencia
    Fortalecer barreras de seguridad
    Reducir alucinacionesAumentar consistencia de salidaMitigar jailbreaksReducir fuga de prompts
    Recursos
    Glosario
    Notas de la versión
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Ingeniería de prompts

    Mejores prácticas de prompting

    Guía completa de técnicas de ingeniería de prompts para los últimos modelos de Claude, cubriendo claridad, ejemplos, estructuración XML, pensamiento y sistemas agénticos.

    Esta es la referencia única para la ingeniería de prompts con los últimos modelos de Claude, incluyendo Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 y Claude Haiku 4.5. Cubre técnicas fundamentales, control de salida, uso de herramientas, pensamiento y sistemas agénticos. Salta a la sección que coincida con tu situación.

    Para una descripción general de las capacidades del modelo, consulta la descripción general de modelos. Para obtener detalles sobre las novedades en Claude Opus 4.7, consulta Novedades en Claude Opus 4.7. Para orientación sobre migración, consulta la Guía de migración.

    Prompting Claude Opus 4.7

    Claude Opus 4.7 es nuestro modelo más capaz disponible en general, con fortalezas particulares en trabajo agéntico de largo horizonte, trabajo de conocimiento, visión y tareas de memoria. Funciona bien de inmediato en prompts existentes de Claude Opus 4.6. Los patrones a continuación cubren los comportamientos que más a menudo requieren ajuste.

    Para cambios de parámetros de API al migrar desde Claude Opus 4.6 (niveles de esfuerzo, presupuestos de tareas, configuración de pensamiento, eliminación de parámetros de muestreo y tokenización), consulta la guía de migración.

    Longitud de respuesta y verbosidad

    Claude Opus 4.7 calibra la longitud de la respuesta según la complejidad que juzga que tiene la tarea, en lugar de establecer una verbosidad fija por defecto. Esto generalmente significa respuestas más cortas en búsquedas simples y mucho más largas en análisis abiertos.

    Si tu producto depende de un cierto estilo o verbosidad de salida, es posible que necesites ajustar tus prompts. Como ejemplo, para disminuir la verbosidad, podrías agregar:

    Proporciona respuestas concisas y enfocadas. Omite contexto no esencial y mantén los ejemplos mínimos.

    Si ves ejemplos específicos de tipos de verbosidad (es decir, sobre-explicación), puedes agregar instrucciones adicionales en tu prompt para prevenirlos. Los ejemplos positivos que muestran cómo Claude puede comunicarse con el nivel apropiado de concisión tienden a ser más efectivos que los ejemplos negativos o las instrucciones que le dicen al modelo qué no hacer.

    Calibrando esfuerzo y profundidad de pensamiento

    El parámetro de esfuerzo te permite ajustar la inteligencia de Claude versus el gasto de tokens, intercambiando capacidad por velocidad más rápida y costos más bajos. Comienza con el nuevo nivel de esfuerzo xhigh para casos de uso de codificación y agénticos, y usa un mínimo de esfuerzo high para la mayoría de casos de uso sensibles a la inteligencia. Experimenta con otros niveles de esfuerzo para ajustar aún más el uso de tokens e inteligencia:

    • max: El esfuerzo máximo puede entregar ganancias de rendimiento en algunos casos de uso, pero puede mostrar rendimientos decrecientes del aumento de uso de tokens. Esta configuración también puede ser a veces propensa al exceso de pensamiento. Recomendamos probar el esfuerzo máximo para tareas que demandan inteligencia.
    • xhigh (nuevo): El esfuerzo extra alto es la mejor configuración para la mayoría de casos de uso de codificación y agénticos.
    • high: Esta configuración equilibra el uso de tokens e inteligencia. Para la mayoría de casos de uso sensibles a la inteligencia, recomendamos un mínimo de esfuerzo high.
    • medium: Bueno para casos de uso sensibles a costos que necesitan reducir el uso de tokens mientras se intercambia inteligencia.
    • low: Reserva para tareas cortas y limitadas y cargas de trabajo sensibles a la latencia que no son sensibles a la inteligencia.

    Cambiando significativamente desde Claude Opus 4.6, Claude Opus 4.7 respeta los niveles de esfuerzo estrictamente, especialmente en el extremo bajo. En low y medium, el modelo limita su trabajo a lo que se preguntó en lugar de ir más allá. Esto es bueno para latencia y costo, pero en tareas moderadamente complejas ejecutadas con esfuerzo low hay algún riesgo de razonamiento insuficiente.

    Si observas razonamiento superficial en problemas complejos, aumenta el esfuerzo a high o xhigh en lugar de hacer prompting alrededor. Si necesitas mantener el esfuerzo en low por latencia, agrega orientación dirigida:

    Esta tarea implica razonamiento de múltiples pasos. Piensa cuidadosamente a través del problema antes de responder.

    Esperamos que el esfuerzo sea más importante para este modelo que para cualquier Opus anterior, y recomendamos experimentar con él activamente cuando actualices.

    El comportamiento de activación del pensamiento adaptativo es orientable. Si encuentras que el modelo piensa más a menudo de lo que te gustaría — lo que puede suceder con prompts de sistema grandes o complejos — agrega orientación para dirigirlo. Como siempre, mide el efecto de cualquier cambio de prompting en el rendimiento. Ejemplo:

    El pensamiento agrega latencia y solo debe usarse cuando mejorará significativamente la calidad de la respuesta — típicamente para problemas que requieren razonamiento de múltiples pasos. Cuando tengas dudas, responde directamente.

    Conversamente, si estás ejecutando cargas de trabajo duras en medium y ves razonamiento insuficiente, el primer apalancamiento es aumentar el esfuerzo. Si necesitas un control más fino, solicítalo directamente.

    Si estás ejecutando Claude Opus 4.7 con esfuerzo max o xhigh, establece un presupuesto de tokens de salida máximo grande para que el modelo tenga espacio para pensar y actuar en sus subagentos y llamadas de herramientas. Recomendamos comenzar con 64k tokens y ajustar desde allí.

    Activación del uso de herramientas

    Claude Opus 4.7 tiene una tendencia a usar herramientas menos a menudo que Claude Opus 4.6 y a usar razonamiento más. Esto produce mejores resultados en la mayoría de los casos. Sin embargo, aumentar la configuración de esfuerzo es un apalancamiento útil para aumentar el nivel de uso de herramientas, especialmente en trabajo de conocimiento. Las configuraciones de esfuerzo high o xhigh muestran sustancialmente más uso de herramientas en búsqueda agéntica y codificación. Para escenarios donde deseas más uso de herramientas, también puedes ajustar tu prompt para instruir explícitamente al modelo sobre cuándo y cómo usar adecuadamente sus herramientas. Por ejemplo, si encuentras que el modelo no está usando tus herramientas de búsqueda web, describe claramente por qué y cómo debería hacerlo.

    Actualizaciones de progreso orientadas al usuario

    Claude Opus 4.7 proporciona actualizaciones más regulares y de mayor calidad al usuario durante trazas agénticas largas. Si has agregado andamiaje para forzar mensajes de estado interino ("Después de cada 3 llamadas de herramientas, resume el progreso"), intenta eliminarlo. Si encuentras que la longitud o contenido de las actualizaciones orientadas al usuario de Claude Opus 4.7 no están bien calibradas para tu caso de uso, describe explícitamente cómo deberían verse estas actualizaciones en el prompt y proporciona ejemplos.

    Seguimiento de instrucciones más literal

    Claude Opus 4.7 interpreta prompts de manera más literal y explícita que Claude Opus 4.6, particularmente en niveles de esfuerzo más bajos. No generalizará silenciosamente una instrucción de un elemento a otro, y no inferirá solicitudes que no hiciste. El lado positivo de este literalismo es la precisión y menos confusión, y generalmente funciona mejor para casos de uso de API con prompts cuidadosamente ajustados, extracción estructurada y tuberías donde deseas comportamiento predecible. Si necesitas que Claude aplique una instrucción ampliamente, establece el alcance explícitamente (por ejemplo, "Aplica este formato a cada sección, no solo a la primera").

    Tono y estilo de escritura

    Como con cualquier modelo nuevo, el estilo de prosa en escritura de forma larga puede cambiar. Claude Opus 4.7 es más directo y opinado, con menos fraseología orientada a la validación y menos emojis que el estilo más cálido de Claude Opus 4.6. Si tu producto se basa en una voz específica, reevalúa los prompts de estilo contra la nueva línea de base.

    Por ejemplo, si la voz de tu producto es más cálida o conversacional, agrega:

    Usa un tono cálido y colaborativo. Reconoce el marco del usuario antes de responder.

    Controlando el desove de subagentos

    Claude Opus 4.7 tiende a desovar menos subagentos por defecto. Sin embargo, este comportamiento es orientable a través de prompting; proporciona a Claude Opus 4.7 orientación explícita sobre cuándo los subagentos son deseables. Un ejemplo de juguete para un caso de uso de codificación:

    No desoves un subagentos para trabajo que puedas completar directamente en una sola respuesta (por ejemplo, refactorizar una función que ya puedes ver).
    
    Desova múltiples subagentos en el mismo turno cuando abaniques entre elementos o leas múltiples archivos.

    Valores predeterminados de diseño y frontend

    Claude Opus 4.7 tiene instintos de diseño más fuertes que Claude Opus 4.6, con un estilo de casa predeterminado consistente: fondos cálidos de crema/blanco roto (~#F4F1EA), tipo de pantalla serif (Georgia, Fraunces, Playfair), acentos de palabras en cursiva y un acento terracota/ámbar. Esto se lee bien para editoriales, hospitalidad y briefs de portafolio, pero se sentirá fuera de lugar para paneles de control, herramientas de desarrollo, fintech, salud o aplicaciones empresariales — y aparece en presentaciones de diapositivas así como en interfaces web.

    Este valor predeterminado es persistente. Las instrucciones genéricas ("no uses crema", "hazlo limpio y minimalista") tienden a cambiar el modelo a una paleta fija diferente en lugar de producir variedad. Dos enfoques funcionan de manera confiable:

    1. Especifica una alternativa concreta. El modelo sigue especificaciones explícitas con precisión:

    Diseña una página de destino de escritorio para una marca de suplementos llamada AEFRM.
    
    La dirección visual debe provenir de una atmósfera monocromática fría usando tonos de gris plateado pálido que se profundizan gradualmente en gris azulado y casi negro, similar a una superficie metálica brumosa.
    
    La página debe sentirse afilada y controlada, con un fuerte sentido de estructura y restricción.
    
    Usa este sistema tonal en toda la página en lugar de introducir colores de acento brillantes.
    
    Usa la imagen cargada en el diseño del héroe en blanco y negro.
    
    El diseño debe construirse con secciones horizontales claras y un contenedor de ancho máximo centrado. Usa un radio de esquina de 4px consistentemente en tarjetas, botones, entradas y marcos de medios. Los márgenes deben sentirse generosos, con suficiente espacio vacío alrededor de cada sección para que la página respire.
    
    La tipografía debe usar un sans-serif cuadrado y angular con espaciado de letras más amplio de lo usual, especialmente en encabezados y navegación, para que el texto se sienta más ingenieril y menos comprimido. El texto del titular puede ser grande y mayúscula, mientras que la copia de apoyo permanece corta y escasa. Los subtextos deben escribirse con Alumni Sans SC en 4-6px como textos pequeñitos en las esquinas abajo al centro así.
    
    Para la estructura, comienza con una sección de héroe que contiene una declaración de producto fuerte, un párrafo de apoyo corto y un marco de marcador de posición de producto limpio o packshot. Debajo de eso, agrega una cuadrícula de beneficios con tres o cuatro bloques, luego una sección de formulación o ingredientes, y finalmente un cta.
    
    Los botones deben ser planos y precisos, con cambios de desplazamiento sutiles usando transition: all 160ms ease out donde el brillo y el contraste del borde se desplazan ligeramente en lugar de usar movimiento dramático.
    
    La paleta de colores debe mantenerse dentro de este rango:
    #E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.

    2. Haz que el modelo proponga opciones antes de construir. Esto rompe el valor predeterminado y da a los usuarios control. Si anteriormente confiabas en temperature para variedad de diseño, usa este enfoque — produce direcciones significativamente diferentes en ejecuciones. Ejemplo de prompt:

    Antes de construir, propón 4 direcciones visuales distintas adaptadas a este brief (cada una como: bg hex / accent hex / typeface — rationale de una línea). Pregunta al usuario que elija una, luego implementa solo esa dirección.

    Además, Claude Opus 4.7 requiere menos prompting de diseño frontend que modelos anteriores para evitar patrones genéricos que los usuarios llaman la estética "AI slop". Con modelos anteriores, recomendábamos un fragmento de prompt más largo en nuestra habilidad de diseño frontend. Sin embargo, Claude Opus 4.7 genera frontends distintivos y creativos con orientación de prompting más mínima. Este fragmento de prompt funciona bien con el consejo de prompting anterior para variedad:

    <frontend_aesthetics>
    NUNCA uses estéticas genéricas generadas por IA como familias de fuentes sobreutilizadas (Inter, Roboto, Arial, fuentes del sistema), esquemas de colores clichés (particularmente gradientes púrpuras en fondos blancos u oscuros), diseños predecibles y patrones de componentes, y diseño genérico que carece de carácter específico del contexto. Usa fuentes únicas, colores y temas cohesivos, y animaciones para efectos e interacciones micro.
    </frontend_aesthetics>

    Productos de codificación interactiva

    El uso de tokens y comportamiento de Claude Opus 4.7 pueden diferir entre agentos de codificación autónomos y asincrónico con un turno de usuario único y agentos de codificación interactivos y sincrónico con múltiples turnos de usuario. Específicamente, tiende a usar más tokens en configuraciones interactivas, principalmente porque razona más después de turnos de usuario. Esto puede mejorar la coherencia de largo horizonte, el seguimiento de instrucciones y las capacidades de codificación en sesiones de codificación interactivas largas, pero también viene con más uso de tokens. Para maximizar tanto el rendimiento como la eficiencia de tokens en productos de codificación, recomendamos usar esfuerzo xhigh o high, agregar características autónomas como un modo automático, y reducir el número de interacciones humanas requeridas de tus usuarios.

    Por supuesto, al limitar el número de interacciones de usuario requeridas, es importante especificar la tarea, intención y restricciones relevantes por adelantado en el primer turno humano. Proporcionar descripciones de tareas bien especificadas, claras y precisas por adelantado puede ayudar a maximizar la autonomía e inteligencia mientras se minimiza el uso de tokens extra después de turnos de usuario. Encontramos que porque Claude Opus 4.7 es más autónomo que modelos anteriores, este patrón de uso ayuda a maximizar el rendimiento. En contraste, prompts ambiguos o subespecificados transmitidos progresivamente en múltiples turnos de usuario tienden a reducir relativamente la eficiencia de tokens y a veces el rendimiento.

    Arneses de revisión de código

    Claude Opus 4.7 es significativamente mejor en encontrar bugs que modelos anteriores, y tiene tanto mayor recall como precisión en nuestras evaluaciones — 11pp mejor recall en una de nuestras evaluaciones de búsqueda de bugs más difíciles basada en PRs reales de Anthropic. Sin embargo, si tu arnés de revisión de código fue ajustado para un modelo anterior, es posible que inicialmente veas menor recall. Esto probablemente sea un efecto del arnés, no una regresión de capacidad. Cuando un prompt de revisión dice cosas como "solo reporta problemas de alta severidad", "sé conservador" o "no hagas nitpicking", Claude Opus 4.7 puede seguir esa instrucción más fielmente que modelos anteriores — puede investigar el código tan a fondo, identificar los bugs, y luego no reportar hallazgos que juzga estar por debajo de tu barra establecida. Esto puede mostrarse como el modelo haciendo la misma profundidad de investigación pero convirtiendo menos investigaciones en hallazgos reportados, especialmente en bugs de menor severidad. La precisión típicamente sube, pero el recall medido puede caer aunque la capacidad subyacente de búsqueda de bugs del modelo haya mejorado.

    Lenguaje de prompt recomendado:

    Reporta cada problema que encuentres, incluyendo aquellos de los que no estés seguro o consideres de baja severidad. No filtres por importancia o confianza en esta etapa - un paso de verificación separado hará eso. Tu objetivo aquí es cobertura: es mejor exponer un hallazgo que luego se filtre que silenciosamente dejar caer un bug real. Para cada hallazgo, incluye tu nivel de confianza y una severidad estimada para que un filtro descendente pueda clasificarlos.

    Este prompt puede usarse sin tener un segundo paso real, pero mover el filtrado de confianza fuera del paso de hallazgo a menudo ayuda. Si tu arnés tiene una verificación separada, deduplicación o etapa de clasificación, dile explícitamente al modelo que su trabajo en la etapa de hallazgo es cobertura en lugar de filtrado.

    Si realmente deseas que el modelo se auto-filtre en un solo paso, sé concreto sobre dónde está la barra en lugar de usar términos cualitativos como "importante" — por ejemplo, "reporta cualquier bug que pueda causar comportamiento incorrecto, una falla de prueba o un resultado engañoso; solo omite nits como preferencias puras de estilo o nomenclatura".

    Recomendamos iterar en prompts contra un subconjunto de tus evaluaciones o casos de prueba para validar ganancias de recall o puntuación F1.

    Uso de computadora

    La capacidad de uso de computadora funciona en resoluciones, hasta una nueva resolución máxima de 2576px / 3.75MP. En nuestras pruebas de uso de computadora, encontramos que enviar imágenes a 1080p proporciona un buen equilibrio de rendimiento y costo.

    Para cargas de trabajo particularmente sensibles a costos, recomendamos 720p o 1366×768 como opciones de menor costo con rendimiento fuerte. Recomendamos que realices tus propias pruebas para encontrar la configuración ideal para tu caso de uso; experimentar con configuraciones de esfuerzo también puede ayudar a ajustar el comportamiento del modelo.

    Principios generales

    Sé claro y directo

    Claude responde bien a instrucciones claras y explícitas. Ser específico sobre tu salida deseada puede ayudar a mejorar los resultados. Si deseas comportamiento "más allá de lo esperado", solicítalo explícitamente en lugar de confiar en que el modelo lo infiera de prompts vagos.

    Piensa en Claude como un empleado brillante pero nuevo que carece de contexto sobre tus normas y flujos de trabajo. Cuanto más precisamente expliques lo que deseas, mejor será el resultado.

    Regla de oro: Muestra tu prompt a un colega con contexto mínimo sobre la tarea y pídele que lo siga. Si estarían confundidos, Claude también lo estará.

    • Sé específico sobre el formato de salida deseado y las restricciones.
    • Proporciona instrucciones como pasos secuenciales usando listas numeradas o puntos cuando el orden o la completitud de los pasos importa.

    Agrega contexto para mejorar el rendimiento

    Proporcionar contexto o motivación detrás de tus instrucciones, como explicar a Claude por qué tal comportamiento es importante, puede ayudar a Claude a entender mejor tus objetivos y entregar respuestas más dirigidas.

    Claude es lo suficientemente inteligente para generalizar a partir de la explicación.

    Usa ejemplos efectivamente

    Los ejemplos son una de las formas más confiables de dirigir el formato de salida, tono y estructura de Claude. Algunos ejemplos bien elaborados (conocidos como prompting de pocos disparos o múltiples disparos) pueden mejorar dramáticamente la precisión y consistencia.

    Al agregar ejemplos, hazlos:

    • Relevantes: Espeja tu caso de uso real de cerca.
    • Diversos: Cubre casos extremos y varía lo suficiente para que Claude no capte patrones no intencionados.
    • Estructurados: Envuelve ejemplos en etiquetas <example> (múltiples ejemplos en etiquetas <examples>) para que Claude pueda distinguirlos de las instrucciones.
    Incluye 3–5 ejemplos para obtener los mejores resultados. También puedes pedirle a Claude que evalúe tus ejemplos para relevancia y diversidad, o que genere ejemplos adicionales basados en tu conjunto inicial.

    Estructura prompts con etiquetas XML

    Las etiquetas XML ayudan a Claude a analizar prompts complejos sin ambigüedad, especialmente cuando tu prompt mezcla instrucciones, contexto, ejemplos e entradas variables. Envolver cada tipo de contenido en su propia etiqueta (por ejemplo <instructions>, <context>, <input>) reduce la mala interpretación.

    Mejores prácticas:

    • Usa nombres de etiqueta consistentes y descriptivos en tus prompts.
    • Anida etiquetas cuando el contenido tiene una jerarquía natural (documentos dentro de <documents>, cada uno dentro de <document index="n">).

    Dale a Claude un rol

    Establecer un rol en el prompt del sistema enfoca el comportamiento y tono de Claude para tu caso de uso. Incluso una sola oración marca la diferencia:

    Python
    import anthropic
    
    client = anthropic.Anthropic()
    
    message = client.messages.create(
        model="claude-opus-4-7",
        max_tokens=1024,
        system="You are a helpful coding assistant specializing in Python.",
        messages=[
            {"role": "user", "content": "How do I sort a list of dictionaries by key?"}
        ],
    )
    print(message.content)

    Prompting de contexto largo

    Cuando trabajes con documentos grandes o entradas ricas en datos (20k+ tokens), estructura tu prompt cuidadosamente para obtener los mejores resultados:

    • Pon datos de forma larga en la parte superior: Coloca tus documentos largos e entradas cerca de la parte superior de tu prompt, por encima de tu consulta, instrucciones y ejemplos. Esto puede mejorar significativamente el rendimiento en todos los modelos.

      Las consultas al final pueden mejorar la calidad de la respuesta hasta un 30% en pruebas, especialmente con entradas complejas de múltiples documentos.
    • Estructura contenido de documento y metadatos con etiquetas XML: Cuando uses múltiples documentos, envuelve cada documento en etiquetas <document> con subtags <document_content> y <source> (y otros metadatos) para claridad.

    • Fundamenta respuestas en citas: Para tareas de documentos largos, pide a Claude que cite primero partes relevantes de los documentos antes de llevar a cabo su tarea. Esto ayuda a Claude a cortar a través del ruido del resto del contenido del documento.

    Autoconocimiento del modelo

    Si te gustaría que Claude se identifique correctamente en tu aplicación o use cadenas de API específicas:

    Prompt de ejemplo para identidad de modelo
    El asistente es Claude, creado por Anthropic. El modelo actual es Claude Opus 4.7.

    Para aplicaciones impulsadas por LLM que necesitan especificar cadenas de modelo:

    Prompt de ejemplo para cadena de modelo
    Cuando se necesita un LLM, por favor establece por defecto Claude Opus 4.7 a menos que el usuario solicite lo contrario. La cadena de modelo exacta para Claude Opus 4.7 es claude-opus-4-7.

    Salida y formato

    Estilo de comunicación y verbosidad

    Los últimos modelos de Claude tienen un estilo de comunicación más conciso y natural en comparación con modelos anteriores:

    • Más directo y fundamentado: Proporciona reportes de progreso basados en hechos en lugar de actualizaciones auto-celebratorias
    • Más conversacional: Ligeramente más fluido y coloquial, menos parecido a máquina
    • Menos verboso: Puede omitir resúmenes detallados por eficiencia a menos que se le solicite lo contrario

    Esto significa que Claude puede omitir resúmenes verbales después de llamadas de herramientas, saltando directamente a la siguiente acción. Si prefieres más visibilidad en su razonamiento:

    Prompt de ejemplo
    Después de completar una tarea que implica uso de herramientas, proporciona un resumen rápido del trabajo que has hecho.

    Controla el formato de respuestas

    Hay algunas formas particularmente efectivas de dirigir el formato de salida:

    1. Dile a Claude qué hacer en lugar de qué no hacer

      • En lugar de: "No uses markdown en tu respuesta"
      • Intenta: "Tu respuesta debe estar compuesta de párrafos de prosa que fluyan suavemente."
    2. Usa indicadores de formato XML

      • Intenta: "Escribe las secciones de prosa de tu respuesta en etiquetas <smoothly_flowing_prose_paragraphs>."
    3. Haz coincidir el estilo de tu prompt con la salida deseada

      El estilo de formato usado en tu prompt puede influir en el estilo de respuesta de Claude. Si aún experimentas problemas de dirigibilidad con formato de salida, intenta hacer coincidir el estilo de tu prompt con tu estilo de salida deseado lo más posible. Por ejemplo, eliminar markdown de tu prompt puede reducir el volumen de markdown en la salida.

    4. Usa prompts detallados para preferencias de formato específicas

      Para más control sobre el uso de markdown y formato, proporciona orientación explícita:

    Prompt de ejemplo para minimizar markdown
    <avoid_excessive_markdown_and_bullet_points>
    Al escribir reportes, documentos, explicaciones técnicas, análisis o cualquier contenido de forma larga, escribe en prosa clara y fluida usando párrafos y oraciones completos. Usa saltos de párrafo estándar para organización y reserva markdown principalmente para `código en línea`, bloques de código (```...```), y encabezados simples (###, y ###). Evita usar **negrita** e *cursiva*.
    
    NO uses listas ordenadas (1. ...) o listas desordenadas (*) a menos que: a) estés presentando elementos verdaderamente discretos donde un formato de lista es la mejor opción, o b) el usuario explícitamente solicite una lista o clasificación
    
    En lugar de listar elementos con viñetas o números, incorpóralos naturalmente en oraciones. Esta orientación se aplica especialmente a la escritura técnica. Usar prosa en lugar de formato excesivo mejorará la satisfacción del usuario. NUNCA generes una serie de puntos excesivamente cortos.
    
    Tu objetivo es texto legible y fluido que guíe al lector naturalmente a través de ideas en lugar de fragmentar información en puntos aislados.
    </avoid_excessive_markdown_and_bullet_points>

    Salida LaTeX

    Claude Opus 4.6 establece por defecto LaTeX para expresiones matemáticas, ecuaciones y explicaciones técnicas. Si prefieres texto plano, agrega las siguientes instrucciones a tu prompt:

    Prompt de ejemplo
    Formatea tu respuesta en texto plano solamente. No uses LaTeX, MathJax o cualquier notación de marcado como \( \), $, o \frac{}{}. Escribe todas las expresiones matemáticas usando caracteres de texto estándar (por ejemplo, "/" para división, "*" para multiplicación, y "^" para exponentes).

    Creación de documentos

    Los últimos modelos de Claude sobresalen en crear presentaciones, animaciones y documentos visuales con creatividad impresionante y fuerte seguimiento de instrucciones. Los modelos producen salida pulida y utilizable en el primer intento en la mayoría de los casos.

    Para obtener los mejores resultados con creación de documentos:

    Prompt de ejemplo
    Crea una presentación profesional sobre [tema]. Incluye elementos de diseño reflexivos, jerarquía visual y animaciones atractivas donde sea apropiado.

    Migrando desde respuestas rellenadas previamente

    Comenzando con modelos Claude 4.6 y Claude Mythos Preview, las respuestas rellenadas previamente en el último turno del asistente ya no son compatibles. En Mythos Preview, las solicitudes con mensajes de asistente rellenados previamente devuelven un error 400. La inteligencia del modelo y el seguimiento de instrucciones han avanzado de tal manera que la mayoría de casos de uso de prefill ya no lo requieren. Los modelos existentes continuarán soportando prefills, y agregar mensajes de asistente en otros lugares en la conversación no se ve afectado.

    Aquí hay escenarios comunes de prefill y cómo migrar lejos de ellos:

    Uso de herramientas

    Uso de herramientas

    Los últimos modelos de Claude están entrenados para seguimiento de instrucciones preciso y se benefician de dirección explícita para usar herramientas específicas. Si dices "¿puedes sugerir algunos cambios?", Claude a veces proporcionará sugerencias en lugar de implementarlas, incluso si hacer cambios podría ser lo que pretendías.

    Para que Claude tome acción, sé más explícito:

    Para hacer que Claude sea más proactivo sobre tomar acción por defecto, puedes agregar esto a tu prompt del sistema:

    Prompt de ejemplo para acción proactiva
    <default_to_action>
    Por defecto, implementa cambios en lugar de solo sugerirlos. Si la intención del usuario es poco clara, infiere la acción probable más útil y procede, usando herramientas para descubrir cualquier detalle faltante en lugar de adivinar. Intenta inferir la intención del usuario sobre si una llamada de herramienta (por ejemplo, edición o lectura de archivo) es intencionada o no, y actúa en consecuencia.
    </default_to_action>

    Por otro lado, si deseas que el modelo sea más reticente por defecto, menos propenso a saltar directamente a implementaciones, y solo tomar acción si se solicita, puedes dirigir este comportamiento con un prompt como el siguiente:

    Prompt de ejemplo para acción conservadora
    <do_not_act_before_instructions>
    No saltes a implementación o cambies archivos a menos que se te instruya claramente a hacer cambios. Cuando la intención del usuario es ambigua, establece por defecto proporcionar información, hacer investigación y proporcionar recomendaciones en lugar de tomar acción. Solo procede con ediciones, modificaciones o implementaciones cuando el usuario explícitamente las solicita.
    </do_not_act_before_instructions>

    Claude Opus 4.5 y Claude Opus 4.6 también son más receptivos al prompt del sistema que modelos anteriores. Si tus prompts fueron diseñados para reducir el subtriggering en herramientas o habilidades, estos modelos pueden ahora overtrigger. La solución es reducir cualquier lenguaje agresivo. Donde podrías haber dicho "CRÍTICO: DEBES usar esta herramienta cuando...", puedes usar prompting más normal como "Usa esta herramienta cuando...".

    Optimizar las llamadas de herramientas en paralelo

    Los últimos modelos de Claude destacan en la ejecución paralela de herramientas. Estos modelos:

    • Ejecutarán múltiples búsquedas especulativas durante la investigación
    • Leerán varios archivos a la vez para construir contexto más rápidamente
    • Ejecutarán comandos bash en paralelo (que incluso pueden saturar el rendimiento del sistema)

    Este comportamiento es fácilmente controlable. Aunque el modelo tiene una alta tasa de éxito en llamadas de herramientas paralelas sin indicaciones, puedes aumentar esto a ~100% o ajustar el nivel de agresividad:

    Indicación de ejemplo para máxima eficiencia paralela
    <use_parallel_tool_calls>
    Si tienes la intención de llamar a múltiples herramientas y no hay dependencias entre las llamadas de herramientas, realiza todas las llamadas de herramientas independientes en paralelo. Prioriza llamar a herramientas simultáneamente siempre que las acciones puedan realizarse en paralelo en lugar de secuencialmente. Por ejemplo, al leer 3 archivos, ejecuta 3 llamadas de herramientas en paralelo para leer los 3 archivos en contexto al mismo tiempo. Maximiza el uso de llamadas de herramientas paralelas donde sea posible para aumentar la velocidad y eficiencia. Sin embargo, si algunas llamadas de herramientas dependen de llamadas anteriores para informar valores dependientes como los parámetros, NO llames a estas herramientas en paralelo y en su lugar llámalas secuencialmente. Nunca uses marcadores de posición o adivines parámetros faltantes en llamadas de herramientas.
    </use_parallel_tool_calls>
    Indicación de ejemplo para reducir la ejecución paralela
    Ejecuta operaciones secuencialmente con breves pausas entre cada paso para garantizar estabilidad.

    Pensamiento y razonamiento

    Pensamiento excesivo y minuciosidad excesiva

    Claude Opus 4.6 realiza significativamente más exploración inicial que los modelos anteriores, especialmente con configuraciones de effort más altas. Este trabajo inicial a menudo ayuda a optimizar los resultados finales, pero el modelo puede reunir contexto extenso o perseguir múltiples líneas de investigación sin ser indicado. Si tus indicaciones anteriormente alentaban al modelo a ser más minucioso, debes ajustar esa orientación para Claude Opus 4.6:

    • Reemplaza valores predeterminados generales con instrucciones más específicas. En lugar de "Por defecto, usa [herramienta]," añade orientación como "Usa [herramienta] cuando mejoraría tu comprensión del problema."
    • Elimina el exceso de indicaciones. Las herramientas que se disparaban insuficientemente en modelos anteriores probablemente se disparen apropiadamente ahora. Las instrucciones como "Si tienes dudas, usa [herramienta]" causarán un disparo excesivo.
    • Usa effort como alternativa. Si Claude continúa siendo demasiado agresivo, usa una configuración más baja para effort.

    En algunos casos, Claude Opus 4.6 puede pensar extensamente, lo que puede inflar los tokens de pensamiento y ralentizar las respuestas. Si este comportamiento es indeseable, puedes añadir instrucciones explícitas para restringir su razonamiento, o puedes bajar la configuración de effort para reducir el pensamiento general y el uso de tokens.

    Indicación de ejemplo
    Cuando estés decidiendo cómo abordar un problema, elige un enfoque y comprométete con él. Evita revisar decisiones a menos que encuentres información nueva que contradiga directamente tu razonamiento. Si estás sopesando dos enfoques, elige uno y llévalo a cabo. Siempre puedes corregir el rumbo más tarde si el enfoque elegido falla.

    Si necesitas un límite máximo duro en costos de pensamiento, el pensamiento extendido con un límite de budget_tokens sigue siendo funcional en Opus 4.6 y Sonnet 4.6 pero está deprecado. Prefiere bajar la configuración de effort o usar max_tokens como límite duro con pensamiento adaptativo.

    Aprovechar las capacidades de pensamiento y pensamiento intercalado

    Los últimos modelos de Claude ofrecen capacidades de pensamiento que pueden ser especialmente útiles para tareas que implican reflexión después del uso de herramientas o razonamiento complejo de múltiples pasos. Puedes guiar su pensamiento inicial o intercalado para obtener mejores resultados.

    Claude Opus 4.6 y Claude Sonnet 4.6 usan pensamiento adaptativo (thinking: {type: "adaptive"}), donde Claude decide dinámicamente cuándo y cuánto pensar. Claude calibra su pensamiento basándose en dos factores: el parámetro effort y la complejidad de la consulta. Un esfuerzo más alto provoca más pensamiento, y las consultas más complejas hacen lo mismo. En consultas más fáciles que no requieren pensamiento, el modelo responde directamente. En evaluaciones internas, el pensamiento adaptativo impulsa de manera confiable un mejor rendimiento que el pensamiento extendido. Considera cambiar al pensamiento adaptativo para obtener las respuestas más inteligentes.

    Usa pensamiento adaptativo para cargas de trabajo que requieren comportamiento agéntico como uso de herramientas de múltiples pasos, tareas de codificación complejas y bucles de agentes de largo horizonte. Los modelos más antiguos usan modo de pensamiento manual con budget_tokens.

    Puedes guiar el comportamiento de pensamiento de Claude:

    Indicación de ejemplo
    Después de recibir resultados de herramientas, reflexiona cuidadosamente sobre su calidad y determina los pasos siguientes óptimos antes de proceder. Usa tu pensamiento para planificar e iterar basándote en esta nueva información, y luego toma la mejor acción siguiente.

    El comportamiento de activación del pensamiento adaptativo es indicable. Si encuentras que el modelo piensa más a menudo de lo que te gustaría, lo que puede suceder con indicaciones de sistema grandes o complejas, añade orientación para dirigirlo:

    Indicación de ejemplo
    El pensamiento extendido añade latencia y solo debe usarse cuando mejorará significativamente la calidad de la respuesta - típicamente para problemas que requieren razonamiento de múltiples pasos. Cuando tengas dudas, responde directamente.

    Si estás migrando desde pensamiento extendido con budget_tokens, reemplaza tu configuración de pensamiento y mueve el control de presupuesto a effort:

    Antes (pensamiento extendido, modelos más antiguos):

    Python
    client.messages.create(
        model="claude-sonnet-4-5-20250929",
        max_tokens=64000,
        thinking={"type": "enabled", "budget_tokens": 32000},
        messages=[{"role": "user", "content": "..."}],
    )

    Después (pensamiento adaptativo):

    Python
    client.messages.create(
        model="claude-opus-4-7",
        max_tokens=64000,
        thinking={"type": "adaptive"},
        output_config={"effort": "high"},  # or "max", "xhigh", "medium", "low"
        messages=[{"role": "user", "content": "..."}],
    )

    Si no estás usando pensamiento extendido, no se requieren cambios. El pensamiento está desactivado por defecto cuando omites el parámetro thinking.

    • Prefiere instrucciones generales sobre pasos prescriptivos. Una indicación como "piensa minuciosamente" a menudo produce mejor razonamiento que un plan paso a paso escrito a mano. El razonamiento de Claude frecuentemente supera lo que un humano prescribiría.
    • Los ejemplos multishot funcionan con pensamiento. Usa etiquetas <thinking> dentro de tus ejemplos de pocos disparos para mostrar a Claude el patrón de razonamiento. Generalizará ese estilo a sus propios bloques de pensamiento extendido.
    • CoT manual como alternativa. Cuando el pensamiento está desactivado, aún puedes alentar razonamiento paso a paso pidiendo a Claude que piense a través del problema. Usa etiquetas estructuradas como <thinking> y <answer> para separar limpiamente el razonamiento de la salida final.
    • Pide a Claude que se autoverificar. Añade algo como "Antes de terminar, verifica tu respuesta contra [criterios de prueba]." Esto atrapa errores de manera confiable, especialmente para codificación y matemáticas.
    Cuando el pensamiento extendido está desactivado, Claude Opus 4.5 es particularmente sensible a la palabra "think" y sus variantes. Considera usar alternativas como "consider," "evaluate," o "reason through" en esos casos.

    Para más información sobre capacidades de pensamiento, ver Pensamiento extendido y Pensamiento adaptativo.

    Sistemas agénticos

    Razonamiento de largo horizonte y seguimiento de estado

    Los últimos modelos de Claude destacan en tareas de razonamiento de largo horizonte con capacidades excepcionales de seguimiento de estado. Claude mantiene la orientación a través de sesiones extendidas enfocándose en el progreso incremental, haciendo avances constantes en pocas cosas a la vez en lugar de intentar todo a la vez. Esta capacidad emerge especialmente en múltiples ventanas de contexto o iteraciones de tareas, donde Claude puede trabajar en una tarea compleja, guardar el estado y continuar con una ventana de contexto nueva.

    Conciencia de contexto y flujos de trabajo de múltiples ventanas

    Los modelos Claude 4.6 y Claude 4.5 cuentan con conciencia de contexto, permitiendo al modelo rastrear su ventana de contexto restante (es decir, "presupuesto de tokens") a lo largo de una conversación. Esto permite a Claude ejecutar tareas y gestionar el contexto de manera más efectiva al entender cuánto espacio tiene para trabajar.

    Gestión de límites de contexto:

    Si estás usando Claude en un arnés de agente que compacta contexto o permite guardar contexto en archivos externos (como en Claude Code), considera añadir esta información a tu indicación para que Claude se comporte en consecuencia. De lo contrario, Claude puede a veces intentar naturalmente terminar el trabajo a medida que se acerca al límite de contexto. A continuación se muestra una indicación de ejemplo:

    Indicación de ejemplo
    Tu ventana de contexto será compactada automáticamente a medida que se acerque a su límite, permitiéndote continuar trabajando indefinidamente desde donde lo dejaste. Por lo tanto, no detengas tareas temprano debido a preocupaciones de presupuesto de tokens. A medida que te acerques a tu límite de presupuesto de tokens, guarda tu progreso actual y estado en memoria antes de que se actualice la ventana de contexto. Siempre sé lo más persistente y autónomo posible y completa tareas completamente, incluso si el final de tu presupuesto se está acercando. Nunca detengas artificialmente ninguna tarea temprano independientemente del contexto restante.

    La herramienta de memoria se empareja naturalmente con la conciencia de contexto para transiciones de contexto sin problemas.

    Flujos de trabajo de múltiples ventanas de contexto

    Para tareas que abarcan múltiples ventanas de contexto:

    1. Usa una indicación diferente para la primera ventana de contexto: Usa la primera ventana de contexto para configurar un marco (escribe pruebas, crea scripts de configuración), luego usa futuras ventanas de contexto para iterar en una lista de tareas.

    2. Haz que el modelo escriba pruebas en un formato estructurado: Pide a Claude que cree pruebas antes de comenzar el trabajo y mantén un registro de ellas en un formato estructurado (por ejemplo, tests.json). Esto lleva a una mejor capacidad a largo plazo para iterar. Recuerda a Claude la importancia de las pruebas: "Es inaceptable eliminar o editar pruebas porque esto podría llevar a funcionalidad faltante o defectuosa."

    3. Configura herramientas de calidad de vida: Anima a Claude a crear scripts de configuración (por ejemplo, init.sh) para iniciar servidores con elegancia, ejecutar suites de pruebas y linters. Esto previene trabajo repetido cuando se continúa desde una ventana de contexto nueva.

    4. Comenzar de nuevo vs compactar: Cuando se borra una ventana de contexto, considera comenzar con una ventana de contexto completamente nueva en lugar de usar compactación. Los últimos modelos de Claude son extremadamente efectivos en descubrir estado desde el sistema de archivos local. En algunos casos, puedes querer aprovechar esto sobre la compactación. Sé prescriptivo sobre cómo debe comenzar:

      • "Llama a pwd; solo puedes leer y escribir archivos en este directorio."
      • "Revisa progress.txt, tests.json, y los registros de git."
      • "Ejecuta manualmente una prueba de integración fundamental antes de pasar a implementar nuevas características."
    5. Proporciona herramientas de verificación: A medida que crece la longitud de las tareas autónomas, Claude necesita verificar la corrección sin retroalimentación humana continua. Herramientas como el servidor Playwright MCP o capacidades de uso de computadora para probar interfaces de usuario son útiles.

    6. Anima el uso completo del contexto: Indica a Claude que complete componentes eficientemente antes de pasar a lo siguiente:

    Indicación de ejemplo
    Esta es una tarea muy larga, por lo que puede ser beneficioso planificar tu trabajo claramente. Se anima a pasar todo tu contexto de salida trabajando en la tarea - solo asegúrate de no quedarte sin contexto con trabajo significativo sin confirmar. Continúa trabajando sistemáticamente hasta que hayas completado esta tarea.

    Mejores prácticas de gestión de estado

    • Usa formatos estructurados para datos de estado: Cuando rastrées información estructurada (como resultados de pruebas o estado de tareas), usa JSON u otros formatos estructurados para ayudar a Claude a entender requisitos de esquema
    • Usa texto no estructurado para notas de progreso: Las notas de progreso de forma libre funcionan bien para rastrear progreso general y contexto
    • Usa git para rastreo de estado: Git proporciona un registro de lo que se ha hecho y puntos de control que pueden ser restaurados. Los últimos modelos de Claude funcionan especialmente bien usando git para rastrear estado a través de múltiples sesiones.
    • Enfatiza el progreso incremental: Pide explícitamente a Claude que mantenga un registro de su progreso y se enfoque en trabajo incremental

    Equilibrio entre autonomía y seguridad

    Sin orientación, Claude Opus 4.6 puede tomar acciones que son difíciles de revertir o afectar sistemas compartidos, como eliminar archivos, hacer push forzado o publicar en servicios externos. Si quieres que Claude Opus 4.6 confirme antes de tomar acciones potencialmente riesgosas, añade orientación a tu indicación:

    Indicación de ejemplo
    Considera la reversibilidad e impacto potencial de tus acciones. Se te anima a tomar acciones locales y reversibles como editar archivos o ejecutar pruebas, pero para acciones que son difíciles de revertir, afectan sistemas compartidos, o podrían ser destructivas, pide al usuario antes de proceder.
    
    Ejemplos de acciones que justifican confirmación:
    - Operaciones destructivas: eliminar archivos o ramas, soltar tablas de base de datos, rm -rf
    - Operaciones difíciles de revertir: git push --force, git reset --hard, enmendar commits publicados
    - Operaciones visibles para otros: hacer push de código, comentar en PRs/issues, enviar mensajes, modificar infraestructura compartida
    
    Cuando encuentres obstáculos, no uses acciones destructivas como atajo. Por ejemplo, no eludas controles de seguridad (por ejemplo --no-verify) o descartes archivos desconocidos que podrían ser trabajo en progreso.

    Investigación y recopilación de información

    Los últimos modelos de Claude demuestran capacidades excepcionales de búsqueda agéntica y pueden encontrar y sintetizar información de múltiples fuentes de manera efectiva. Para resultados de investigación óptimos:

    1. Proporciona criterios de éxito claros: Define qué constituye una respuesta exitosa a tu pregunta de investigación

    2. Anima la verificación de fuentes: Pide a Claude que verifique información a través de múltiples fuentes

    3. Para tareas de investigación complejas, usa un enfoque estructurado:

    Indicación de ejemplo para investigación compleja
    Busca esta información de manera estructurada. A medida que recopiles datos, desarrolla varias hipótesis competidoras. Rastrea tus niveles de confianza en tus notas de progreso para mejorar la calibración. Autocrítica regularmente tu enfoque y plan. Actualiza un árbol de hipótesis o archivo de notas de investigación para persistir información y proporcionar transparencia. Desglosa esta tarea de investigación compleja sistemáticamente.

    Este enfoque estructurado permite a Claude encontrar y sintetizar prácticamente cualquier pieza de información e iterar críticamente sus hallazgos, sin importar el tamaño del corpus.

    Orquestación de suagentes

    Los últimos modelos de Claude demuestran capacidades significativamente mejoradas de orquestación nativa de suagentes. Estos modelos pueden reconocer cuándo las tareas se beneficiarían de delegar trabajo a suagentes especializados y hacerlo proactivamente sin requerir instrucción explícita.

    Para aprovechar este comportamiento:

    1. Asegura herramientas de suagente bien definidas: Ten herramientas de suagente disponibles y descritas en definiciones de herramientas
    2. Deja que Claude orqueste naturalmente: Claude delegará apropiadamente sin instrucción explícita
    3. Observa el uso excesivo: Claude Opus 4.6 tiene una fuerte predilección por suagentes y puede generarlos en situaciones donde un enfoque más simple y directo sería suficiente. Por ejemplo, el modelo puede generar suagentes para exploración de código cuando una llamada grep directa es más rápida y suficiente.

    Si ves uso excesivo de suagentes, añade orientación explícita sobre cuándo los suagentes son y no son justificados:

    Indicación de ejemplo para uso de suagentes
    Usa suagentes cuando las tareas puedan ejecutarse en paralelo, requieran contexto aislado, o impliquen flujos de trabajo independientes que no necesiten compartir estado. Para tareas simples, operaciones secuenciales, ediciones de archivo único, o tareas donde necesites mantener contexto a través de pasos, trabaja directamente en lugar de delegar.

    Encadenar indicaciones complejas

    Con pensamiento adaptativo y orquestación de suagentes, Claude maneja la mayoría del razonamiento de múltiples pasos internamente. El encadenamiento explícito de indicaciones (dividir una tarea en llamadas API secuenciales) sigue siendo útil cuando necesitas inspeccionar salidas intermedias o aplicar una estructura de tubería específica.

    El patrón de encadenamiento más común es autocorrección: generar un borrador → hacer que Claude lo revise contra criterios → hacer que Claude lo refine basándose en la revisión. Cada paso es una llamada API separada para que puedas registrar, evaluar o ramificar en cualquier punto.

    Reducir la creación de archivos en codificación agéntica

    Los últimos modelos de Claude pueden a veces crear nuevos archivos para propósitos de prueba e iteración, particularmente cuando se trabaja con código. Este enfoque permite a Claude usar archivos, especialmente scripts de python, como un 'bloc de notas temporal' antes de guardar su salida final. El uso de archivos temporales puede mejorar resultados particularmente para casos de uso de codificación agéntica.

    Si prefieres minimizar la creación neta de nuevos archivos, puedes instruir a Claude que limpie después de sí mismo:

    Indicación de ejemplo
    Si creas cualquier archivo nuevo temporal, scripts, o archivos auxiliares para iteración, limpia estos archivos eliminándolos al final de la tarea.

    Exceso de entusiasmo

    Claude Opus 4.5 y Claude Opus 4.6 tienen una tendencia a sobreingeniería creando archivos extra, añadiendo abstracciones innecesarias, o construyendo flexibilidad que no fue solicitada. Si ves este comportamiento indeseable, añade orientación específica para mantener soluciones mínimas.

    Por ejemplo:

    Indicación de ejemplo para minimizar sobreingeniería
    Evita la sobreingeniería. Solo realiza cambios que sean directamente solicitados o claramente necesarios. Mantén soluciones simples y enfocadas:
    
    - Alcance: No añadas características, refactorices código, o hagas "mejoras" más allá de lo solicitado. Una corrección de bug no necesita código circundante limpiado. Una característica simple no necesita configurabilidad extra.
    
    - Documentación: No añadas docstrings, comentarios, o anotaciones de tipo a código que no cambiaste. Solo añade comentarios donde la lógica no sea evidente por sí misma.
    
    - Codificación defensiva: No añadas manejo de errores, alternativas, o validación para escenarios que no pueden suceder. Confía en garantías de código interno y marco. Solo valida en límites del sistema (entrada del usuario, APIs externas).
    
    - Abstracciones: No crees ayudantes, utilidades, o abstracciones para operaciones de una sola vez. No diseñes para requisitos futuros hipotéticos. La cantidad correcta de complejidad es el mínimo necesario para la tarea actual.

    Evitar enfocarse en pasar pruebas y codificación dura

    Claude a veces puede enfocarse demasiado en hacer pasar pruebas a expensas de soluciones más generales, o puede usar soluciones alternativas como scripts auxiliares para refactorización compleja en lugar de usar herramientas estándar directamente. Para prevenir este comportamiento y asegurar soluciones robustas y generalizables:

    Indicación de ejemplo
    Por favor escribe una solución de alta calidad y propósito general usando las herramientas estándar disponibles. No crees scripts auxiliares o soluciones alternativas para realizar la tarea de manera más eficiente. Implementa una solución que funcione correctamente para todas las entradas válidas, no solo los casos de prueba. No codifiques valores duro o crees soluciones que solo funcionen para entradas de prueba específicas. En su lugar, implementa la lógica actual que resuelve el problema de manera general.
    
    Enfócate en entender los requisitos del problema e implementar el algoritmo correcto. Las pruebas están ahí para verificar corrección, no para definir la solución. Proporciona una implementación principiada que siga mejores prácticas y principios de diseño de software.
    
    Si la tarea es irrazonable o inviable, o si alguna de las pruebas es incorrecta, por favor infórmame en lugar de trabajar alrededor de ellas. La solución debe ser robusta, mantenible y extensible.

    Minimizar alucinaciones en codificación agéntica

    Los últimos modelos de Claude son menos propensos a alucinaciones y dan respuestas más precisas, fundamentadas e inteligentes basadas en el código. Para alentar este comportamiento aún más y minimizar alucinaciones:

    Indicación de ejemplo
    <investigate_before_answering>
    Nunca especules sobre código que no has abierto. Si el usuario hace referencia a un archivo específico, DEBES leer el archivo antes de responder. Asegúrate de investigar y leer archivos relevantes ANTES de responder preguntas sobre la base de código. Nunca hagas ninguna afirmación sobre código antes de investigar a menos que estés seguro de la respuesta correcta - da respuestas fundamentadas y libres de alucinaciones.
    </investigate_before_answering>

    Consejos específicos de capacidad

    Capacidades de visión mejoradas

    Claude Opus 4.5 y Claude Opus 4.6 tienen capacidades de visión mejoradas en comparación con modelos anteriores de Claude. Funcionan mejor en tareas de procesamiento de imágenes y extracción de datos, particularmente cuando hay múltiples imágenes presentes en contexto. Estas mejoras se trasladan al uso de computadora, donde los modelos pueden interpretar más confiablemente capturas de pantalla y elementos de interfaz de usuario. También puedes usar estos modelos para analizar videos dividiéndolos en fotogramas.

    Una técnica que ha demostrado ser efectiva para impulsar aún más el rendimiento es dar a Claude una herramienta de recorte o habilidad. Las pruebas han mostrado mejora consistente en evaluaciones de imágenes cuando Claude puede "acercarse" a regiones relevantes de una imagen. Anthropic ha creado un libro de cocina para la herramienta de recorte.

    Diseño de interfaz

    Claude Opus 4.5 y Claude Opus 4.6 destacan en la construcción de aplicaciones web complejas y del mundo real con un fuerte diseño de interfaz. Sin embargo, sin orientación, los modelos pueden inclinarse hacia patrones genéricos que crean lo que los usuarios llaman la estética "AI slop". Para crear interfaces distintivas y creativas que sorprendan y deleiten:

    Para una guía detallada sobre mejora del diseño de interfaz, ver la publicación de blog sobre mejora del diseño de interfaz a través de habilidades.

    Aquí hay un fragmento de indicación de sistema que puedes usar para alentar mejor diseño de interfaz:

    Indicación de ejemplo para estética de interfaz
    <frontend_aesthetics>
    Tienes a converger hacia salidas genéricas, "en distribución". En diseño de interfaz, esto crea lo que los usuarios llaman la estética "AI slop". Evita esto: crea interfaces distintivas y creativas que sorprendan y deleiten.
    
    Enfócate en:
    - Tipografía: Elige fuentes que sean hermosas, únicas e interesantes. Evita fuentes genéricas como Arial e Inter; opta en su lugar por opciones distintivas que eleven la estética de la interfaz.
    - Color y Tema: Comprométete con una estética coherente. Usa variables CSS para consistencia. Los colores dominantes con acentos agudos superan paletas tímidas y distribuidas uniformemente. Extrae inspiración de temas IDE y estéticas culturales.
    - Movimiento: Usa animaciones para efectos e interacciones micro. Prioriza soluciones solo CSS para HTML. Usa la librería Motion para React cuando esté disponible. Enfócate en momentos de alto impacto: una carga de página bien orquestada con revelaciones escalonadas (animation-delay) crea más deleite que microinteracciones dispersas.
    - Fondos: Crea atmósfera y profundidad en lugar de inclinarse hacia colores sólidos. Superpone gradientes CSS, usa patrones geométricos, o añade efectos contextuales que coincidan con la estética general.
    
    Evita estéticas genéricas generadas por IA:
    - Familias de fuentes sobreutilizadas (Inter, Roboto, Arial, fuentes del sistema)
    - Esquemas de color cliché (particularmente gradientes púrpura sobre fondos blancos)
    - Diseños y patrones de componentes predecibles
    - Diseño genérico que carece de carácter específico del contexto
    
    Interpreta creativamente y haz opciones inesperadas que se sientan genuinamente diseñadas para el contexto. Varía entre temas claros y oscuros, diferentes fuentes, diferentes estéticas. Aún tienes a converger en opciones comunes (Space Grotesk, por ejemplo) a través de generaciones. Evita esto: ¡es crítico que pienses fuera de la caja!
    </frontend_aesthetics>

    También puedes referirte a la definición de habilidad completa.

    Consideraciones de migración

    Cuando migres a modelos Claude 4.6 desde generaciones anteriores:

    1. Sé específico sobre el comportamiento deseado: Considera describir exactamente qué te gustaría ver en la salida.

    2. Enmarca tus instrucciones con modificadores: Añadir modificadores que alienten a Claude a aumentar la calidad y detalle de su salida puede ayudar a moldear mejor el rendimiento de Claude. Por ejemplo, en lugar de "Crea un panel de análisis", usa "Crea un panel de análisis. Incluye tantas características e interacciones relevantes como sea posible. Ve más allá de lo básico para crear una implementación completamente funcional."

    3. Solicita características específicas explícitamente: Las animaciones y elementos interactivos deben ser solicitados explícitamente cuando se deseen.

    4. Actualiza la configuración de pensamiento: Los modelos Claude 4.6 usan pensamiento adaptativo (thinking: {type: "adaptive"}) en lugar de pensamiento manual con budget_tokens. Usa el parámetro effort para controlar la profundidad del pensamiento.

    5. Migra desde respuestas prefilladas: Las respuestas prefilladas en el último turno de asistente están deprecadas a partir de modelos Claude 4.6. Ver Migrando desde respuestas prefilladas para orientación detallada sobre alternativas.

    6. Ajusta la indicación anti-pereza: Si tus indicaciones anteriormente alentaban al modelo a ser más minucioso o usar herramientas más agresivamente, reduce esa orientación. Los modelos Claude 4.6 son significativamente más proactivos y pueden dispararse excesivamente en instrucciones que eran necesarias para modelos anteriores.

    Para pasos de migración detallados, ver la Guía de migración.

    Migrando desde Claude Sonnet 4.5 a Claude Sonnet 4.6

    Claude Sonnet 4.6 por defecto tiene un nivel de effort de high, en contraste con Claude Sonnet 4.5 que no tenía parámetro effort. Considera ajustar el parámetro effort a medida que migres desde Claude Sonnet 4.5 a Claude Sonnet 4.6. Si no se establece explícitamente, puedes experimentar latencia más alta con el nivel de effort predeterminado.

    Configuraciones de effort recomendadas:

    • Medium para la mayoría de aplicaciones
    • Low para cargas de trabajo de alto volumen o sensibles a latencia
    • Establece un presupuesto de token de salida máximo grande (64k tokens recomendados) en effort medio o alto para dar al modelo espacio para pensar y actuar

    Cuándo usar Opus 4.7 en su lugar: Para los problemas más difíciles y de largo horizonte (migraciones de código a gran escala, investigación profunda, trabajo autónomo extendido), Opus 4.7 sigue siendo la opción correcta. Sonnet 4.6 está optimizado para cargas de trabajo donde la rápida respuesta y la eficiencia de costos importan más.

    Si no estás usando pensamiento extendido

    Si no estás usando pensamiento extendido en Claude Sonnet 4.5, puedes continuar sin él en Claude Sonnet 4.6. Debes establecer explícitamente effort al nivel apropiado para tu caso de uso. Con effort low y pensamiento desactivado, puedes esperar rendimiento similar o mejor en relación con Claude Sonnet 4.5 sin pensamiento extendido.

    Python
    client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        thinking={"type": "disabled"},
        output_config={"effort": "low"},
        messages=[{"role": "user", "content": "..."}],
    )

    Si estás usando pensamiento extendido

    Si estás usando pensamiento extendido con budget_tokens en Claude Sonnet 4.5, sigue siendo funcional en Claude Sonnet 4.6 pero está deprecado. Migra a pensamiento adaptativo con el parámetro effort.

    Migrando a pensamiento adaptativo

    El pensamiento adaptativo es particularmente bien adecuado para los siguientes patrones de carga de trabajo:

    • Agentes autónomos de múltiples pasos: agentes de codificación que convierten requisitos en software funcional, tuberías de análisis de datos, y búsqueda de bugs donde el modelo se ejecuta independientemente a través de muchos pasos. El pensamiento adaptativo permite al modelo calibrar su razonamiento por paso, manteniéndose en el camino sobre trayectorias más largas. Para estas cargas de trabajo, comienza con effort high. Si la latencia o el uso de tokens es una preocupación, reduce a medium.
    • Agentes de uso de computadora: Claude Sonnet 4.6 logró la mejor precisión en su clase en evaluaciones de uso de computadora usando modo adaptativo.
    • Cargas de trabajo bimodales: una mezcla de tareas fáciles y difíciles donde adaptativo omite pensamiento en consultas simples y razona profundamente en las complejas.

    Cuando uses pensamiento adaptativo, evalúa effort medium y high en tus tareas. El nivel correcto depende del equilibrio de tu carga de trabajo entre calidad, latencia y uso de tokens.

    Python
    client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=64000,
        thinking={"type": "adaptive"},
        output_config={"effort": "high"},
        messages=[{"role": "user", "content": "..."}],
    )
    Manteniendo budget_tokens durante la migración

    Si necesitas mantener budget_tokens temporalmente mientras migras, un presupuesto alrededor de 16k tokens proporciona espacio para problemas más difíciles sin riesgo de uso de tokens descontrolado. Esta configuración está deprecada y será removida en una futura versión de modelo.

    Para casos de uso de codificación (codificación agéntica, flujos de trabajo pesados en herramientas, generación de código), comienza con effort medium:

    Python
    client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=16384,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "medium"},
        messages=[{"role": "user", "content": "..."}],
    )

    Para casos de uso de chat y no codificación (chat, generación de contenido, búsqueda, clasificación), comienza con effort low:

    Python
    client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=8192,
        thinking={"type": "enabled", "budget_tokens": 16384},
        output_config={"effort": "low"},
        messages=[{"role": "user", "content": "..."}],
    )

    Was this page helpful?

    • Prompting Claude Opus 4.7
    • Longitud de respuesta y verbosidad
    • Calibrando esfuerzo y profundidad de pensamiento
    • Activación del uso de herramientas
    • Actualizaciones de progreso orientadas al usuario
    • Seguimiento de instrucciones más literal
    • Tono y estilo de escritura
    • Controlando el desove de subagentos
    • Valores predeterminados de diseño y frontend
    • Productos de codificación interactiva
    • Arneses de revisión de código
    • Uso de computadora
    • Principios generales
    • Sé claro y directo
    • Agrega contexto para mejorar el rendimiento
    • Usa ejemplos efectivamente
    • Estructura prompts con etiquetas XML
    • Dale a Claude un rol
    • Prompting de contexto largo
    • Autoconocimiento del modelo
    • Salida y formato
    • Estilo de comunicación y verbosidad
    • Controla el formato de respuestas
    • Salida LaTeX
    • Creación de documentos
    • Migrando desde respuestas rellenadas previamente
    • Uso de herramientas
    • Uso de herramientas
    • Optimizar las llamadas de herramientas en paralelo
    • Pensamiento y razonamiento
    • Pensamiento excesivo y minuciosidad excesiva
    • Aprovechar las capacidades de pensamiento y pensamiento intercalado
    • Sistemas agénticos
    • Razonamiento de largo horizonte y seguimiento de estado
    • Equilibrio entre autonomía y seguridad
    • Investigación y recopilación de información
    • Orquestación de suagentes
    • Encadenar indicaciones complejas
    • Reducir la creación de archivos en codificación agéntica
    • Exceso de entusiasmo
    • Evitar enfocarse en pasar pruebas y codificación dura
    • Minimizar alucinaciones en codificación agéntica
    • Consejos específicos de capacidad
    • Capacidades de visión mejoradas
    • Diseño de interfaz
    • Consideraciones de migración
    • Migrando desde Claude Sonnet 4.5 a Claude Sonnet 4.6