Estratégias para reduzir o risco de vazamento de prompt e proteger informações sensíveis
Vazamentos de prompt podem expor informações sensíveis que você espera manter "ocultas" em seu prompt. Embora nenhum método seja à prova de falhas, as estratégias abaixo podem reduzir significativamente o risco.
Antes de tentar reduzir vazamento de prompt
Considere usar estratégias de engenharia de prompt resistentes a vazamentos apenas quando absolutamente necessário. Tentativas de à prova de vazamento em seu prompt podem adicionar complexidade que pode degradar o desempenho em outras partes da tarefa devido ao aumento da complexidade da tarefa geral do LLM.
Se você decidir implementar técnicas resistentes a vazamentos, certifique-se de testar seus prompts completamente para garantir que a complexidade adicionada não impacte negativamente o desempenho do modelo ou a qualidade de suas saídas.
Tente técnicas de monitoramento primeiro, como triagem de saída e pós-processamento, para tentar detectar instâncias de vazamento de prompt.
Estratégias para reduzir vazamento de prompt
Separe contexto de consultas:
Você pode tentar usar prompts de sistema para isolar informações-chave e contexto de consultas de usuários. Você pode enfatizar instruções-chave na volta do User, depois reenfatizar essas instruções preenchendo previamente a volta do Assistant. (Nota: preenchimento prévio não é suportado em Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6 e Sonnet 4.6.)
Use pós-processamento: Filtre as saídas do Claude para palavras-chave que possam indicar um vazamento. As técnicas incluem usar expressões regulares, filtragem de palavras-chave ou outros métodos de processamento de texto.
Você também pode usar um LLM solicitado para filtrar saídas para vazamentos mais nuançados.
Evite detalhes proprietários desnecessários: Se Claude não precisar disso para executar a tarefa, não o inclua. Conteúdo extra distrai Claude de se concentrar em instruções de "sem vazamento".
Auditorias regulares: Revise periodicamente seus prompts e as saídas do Claude para possíveis vazamentos.
Lembre-se, o objetivo não é apenas prevenir vazamentos, mas manter o desempenho do Claude. Prevenção de vazamento excessivamente complexa pode degradar os resultados. O equilíbrio é fundamental.