Strategie per ridurre il rischio di esposizione di informazioni sensibili nascoste nei tuoi prompt.
Le perdite di prompt possono esporre informazioni sensibili che ti aspetti siano "nascoste" nel tuo prompt. Sebbene nessun metodo sia infallibile, le strategie di seguito possono ridurre significativamente il rischio.
Prima di provare a ridurre la perdita di prompt
Considera l'utilizzo di strategie di prompt engineering resistenti alle perdite solo quando assolutamente necessario. I tentativi di rendere il tuo prompt a prova di perdita possono aggiungere complessità che potrebbe degradare le prestazioni in altre parti del compito a causa dell'aumento della complessità del compito complessivo dell'LLM.
Se decidi di implementare tecniche resistenti alle perdite, assicurati di testare accuratamente i tuoi prompt per garantire che la complessità aggiunta non impatti negativamente le prestazioni del modello o la qualità dei suoi output.
Prova prima le tecniche di monitoraggio, come lo screening dell'output e il post-processing, per cercare di rilevare istanze di perdita di prompt.
Strategie per ridurre la perdita di prompt
Separare il contesto dalle query:
Puoi provare a utilizzare i prompt di sistema per isolare le informazioni chiave e il contesto dalle query degli utenti. Puoi enfatizzare le istruzioni chiave nel turno User, quindi riemp enfatizzare quelle istruzioni prefillando il turno Assistant. (Nota: il prefill non è supportato su Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 e Sonnet 4.6.)
Usa il post-processing: Filtra gli output di Claude per parole chiave che potrebbero indicare una perdita. Le tecniche includono l'utilizzo di espressioni regolari, filtri di parole chiave o altri metodi di elaborazione del testo.
Puoi anche utilizzare un LLM con prompt per filtrare gli output per perdite più sfumate.
Evita dettagli proprietari non necessari: Se Claude non ne ha bisogno per eseguire il compito, non includerlo. Il contenuto extra distrae Claude dal concentrarsi sulle istruzioni "senza perdita".
Audit regolari: Rivedi periodicamente i tuoi prompt e gli output di Claude per potenziali perdite.
Ricorda, l'obiettivo non è solo prevenire le perdite ma mantenere le prestazioni di Claude. La prevenzione delle perdite eccessivamente complessa può degradare i risultati. L'equilibrio è fondamentale.