Claude Platform Docs
  • Mensajes
  • Agentes gestionados
  • Administración

Search...
⌘K
Casos de uso
Descripción generalEnrutamiento de ticketsAgente de atención al clienteModeración de contenidoResumen legal
Ingeniería de prompts
Descripción generalMejores prácticas de promptsPrompts para Claude Fable 5Prompts para Claude Opus 4.8Prompts para Claude Sonnet 5Herramientas de prompts de la Consola
Probar y evaluar
Definir el éxito y crear evaluacionesUso de la herramienta de evaluación en la ConsolaReducir la latencia
Reforzar las barreras de protección
Reducir alucinacionesAumentar la consistencia de salidaMitigar jailbreaksReducir la filtración de prompts
Referencia
Glosario

Log in
Reducir la filtración de prompts
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Mejores prácticas/Reforzar las barreras de protección

Reducir la filtración de prompts

Las filtraciones de prompts pueden exponer información sensible que esperas que permanezca "oculta" en tu prompt. Aunque ningún método es infalible, las estrategias a continuación pueden reducir significativamente el riesgo.

Antes de intentar reducir la filtración de prompts

Considera usar estrategias de ingeniería de prompts resistentes a filtraciones solo cuando sea absolutamente necesario. Los intentos de hacer tu prompt a prueba de filtraciones pueden añadir complejidad que podría degradar el rendimiento en otras partes de la tarea, debido al aumento de la complejidad de la tarea general del LLM.

Si decides implementar técnicas resistentes a filtraciones, asegúrate de probar tus prompts exhaustivamente para garantizar que la complejidad añadida no afecte negativamente el rendimiento del modelo ni la calidad de sus salidas.


Prueba primero técnicas de monitoreo, como el filtrado de salidas y el posprocesamiento, para intentar detectar instancias de filtración de prompts.

Estrategias para reducir la filtración de prompts

  • Separa el contexto de las consultas: Puedes intentar usar indicaciones del sistema para aislar la información clave y el contexto de las consultas del usuario. Puedes enfatizar las instrucciones clave en el turno User, y luego volver a enfatizar esas instrucciones prellenando el turno Assistant. (Nota: el prellenado no es compatible con Claude Fable 5, Claude Mythos 5, Claude Mythos Preview, Claude Opus 4.8, Claude Opus 4.7, Claude Opus 4.6 y Claude Sonnet 4.6).

  • Usa posprocesamiento: Filtra las salidas de Claude en busca de palabras clave que puedan indicar una filtración. Las técnicas incluyen el uso de expresiones regulares, filtrado de palabras clave u otros métodos de procesamiento de texto.
    
    También puedes usar un LLM con instrucciones específicas para filtrar salidas en busca de filtraciones más sutiles.
  • Evita detalles propietarios innecesarios: Si Claude no los necesita para realizar la tarea, no los incluyas. El contenido adicional distrae a Claude de enfocarse en las instrucciones de "no filtrar".
  • Auditorías regulares: Revisa periódicamente tus prompts y las salidas de Claude en busca de posibles filtraciones.

Recuerda, el objetivo no es solo prevenir filtraciones, sino mantener el rendimiento de Claude. Una prevención de filtraciones excesivamente compleja puede degradar los resultados. El equilibrio es clave.

Was this page helpful?

  • Antes de intentar reducir la filtración de prompts
  • Estrategias para reducir la filtración de prompts