Fortalecer protecciones

Reducir fuga de indicaciones

Estrategias para reducir el riesgo de fuga de indicaciones y proteger información sensible en tus prompts

Las fugas de indicaciones pueden exponer información sensible que esperas que esté "oculta" en tu indicación. Aunque ningún método es infalible, las estrategias a continuación pueden reducir significativamente el riesgo.

Antes de intentar reducir la fuga de indicaciones

Recomendamos usar estrategias de ingeniería de indicaciones resistentes a fugas solo cuando sea absolutamente necesario. Los intentos de hacer a prueba de fugas tu indicación pueden añadir complejidad que puede degradar el rendimiento en otras partes de la tarea debido al aumento de la complejidad de la tarea general del LLM.

Si decides implementar técnicas resistentes a fugas, asegúrate de probar tus indicaciones a fondo para garantizar que la complejidad añadida no impacte negativamente el rendimiento del modelo o la calidad de sus salidas.

Intenta primero técnicas de monitoreo, como filtrado de salida y post-procesamiento, para intentar detectar instancias de fuga de indicaciones.

Estrategias para reducir la fuga de indicaciones

Separar contexto de consultas: Puedes intentar usar indicaciones del sistema para aislar información clave y contexto de las consultas del usuario. Puedes enfatizar instrucciones clave en el turno del Usuario, luego reenfatizar esas instrucciones prefillando el turno del Asistente. (Nota: el prefillado está deprecado y no es compatible con Claude Opus 4.6 y Sonnet 4.5.)

Usar post-procesamiento: Filtra las salidas de Claude para palabras clave que podrían indicar una fuga. Las técnicas incluyen usar expresiones regulares, filtrado de palabras clave u otros métodos de procesamiento de texto.
También puedes usar un LLM indicado para filtrar salidas para fugas más matizadas.
Evitar detalles propietarios innecesarios: Si Claude no lo necesita para realizar la tarea, no lo incluyas. El contenido extra distrae a Claude de enfocarse en las instrucciones de "sin fuga".
Auditorías regulares: Revisa periódicamente tus indicaciones y las salidas de Claude para posibles fugas.

Recuerda, el objetivo no es solo prevenir fugas sino mantener el rendimiento de Claude. La prevención de fugas excesivamente compleja puede degradar los resultados. El equilibrio es clave.

Was this page helpful?

Fortalecer protecciones

Reducir fuga de indicaciones

Estrategias para reducir el riesgo de fuga de indicaciones y proteger información sensible en tus prompts

Antes de intentar reducir la fuga de indicaciones

Intenta primero técnicas de monitoreo, como filtrado de salida y post-procesamiento, para intentar detectar instancias de fuga de indicaciones.

Estrategias para reducir la fuga de indicaciones

Separar contexto de consultas: Puedes intentar usar indicaciones del sistema para aislar información clave y contexto de las consultas del usuario. Puedes enfatizar instrucciones clave en el turno del Usuario, luego reenfatizar esas instrucciones prefillando el turno del Asistente. (Nota: el prefillado está deprecado y no es compatible con Claude Opus 4.6 y Sonnet 4.5.)

Usar post-procesamiento: Filtra las salidas de Claude para palabras clave que podrían indicar una fuga. Las técnicas incluyen usar expresiones regulares, filtrado de palabras clave u otros métodos de procesamiento de texto.
También puedes usar un LLM indicado para filtrar salidas para fugas más matizadas.
Evitar detalles propietarios innecesarios: Si Claude no lo necesita para realizar la tarea, no lo incluyas. El contenido extra distrae a Claude de enfocarse en las instrucciones de "sin fuga".
Auditorías regulares: Revisa periódicamente tus indicaciones y las salidas de Claude para posibles fugas.

Recuerda, el objetivo no es solo prevenir fugas sino mantener el rendimiento de Claude. La prevención de fugas excesivamente compleja puede degradar los resultados. El equilibrio es clave.

Was this page helpful?

Antes de intentar reducir la fuga de indicaciones

Estrategias para reducir la fuga de indicaciones

Ejemplo: Salvaguardar análisis propietarios

Antes de intentar reducir la fuga de indicaciones

Estrategias para reducir la fuga de indicaciones

Ejemplo: Salvaguardar análisis propietarios