ガードレールの強化

プロンプトの漏洩を減らす

プロンプトに「隠されている」と想定される機密情報の漏洩リスクを軽減するための戦略を学びます。

プロンプトの漏洩は、プロンプトに「隠されている」と想定される機密情報を露出させる可能性があります。完全に防ぐ方法はありませんが、以下の戦略によりリスクを大幅に軽減できます。

プロンプトの漏洩を減らす前に

漏洩に強いプロンプトエンジニアリング戦略の使用は、絶対に必要な場合にのみ推奨します。プロンプトの漏洩防止を試みると、LLMの全体的なタスクの複雑さが増すため、タスクの他の部分でパフォーマンスが低下する可能性のある複雑さが加わることがあります。

漏洩防止技術を実装する場合は、追加された複雑さがモデルのパフォーマンスや出力の品質に悪影響を与えないことを確認するために、プロンプトを徹底的にテストしてください。

まず、出力スクリーニングや後処理などの監視技術を試して、プロンプト漏洩のインスタンスを検出することをお勧めします。

プロンプトの漏洩を減らすための戦略

コンテキストとクエリを分離する： システムプロンプトを使用して、重要な情報やコンテキストをユーザーのクエリから分離することができます。Userターンで重要な指示を強調し、Assistantターンをプリフィルすることでそれらの指示を再度強調できます。（注：プリフィルは非推奨であり、Claude Opus 4.6およびSonnet 4.5ではサポートされていません。）

後処理を使用する：漏洩を示す可能性のあるキーワードについて、Claudeの出力をフィルタリングします。正規表現、キーワードフィルタリング、その他のテキスト処理方法などの技術があります。
より微妙な漏洩をフィルタリングするために、プロンプトされたLLMを使用することもできます。
不要な独自の詳細を避ける：Claudeがタスクを実行するために必要でない場合は、含めないでください。余分なコンテンツは、Claudeが「漏洩しない」という指示に集中することを妨げます。
定期的な監査：プロンプトとClaudeの出力を定期的にレビューして、潜在的な漏洩がないか確認してください。

目標は漏洩を防ぐことだけでなく、Claudeのパフォーマンスを維持することでもあることを忘れないでください。過度に複雑な漏洩防止は結果を低下させる可能性があります。バランスが重要です。

Was this page helpful?

プロンプトの漏洩を減らす前に

まず、出力スクリーニングや後処理などの監視技術を試して、プロンプト漏洩のインスタンスを検出することをお勧めします。

プロンプトの漏洩を減らすための戦略

コンテキストとクエリを分離する： システムプロンプトを使用して、重要な情報やコンテキストをユーザーのクエリから分離することができます。Userターンで重要な指示を強調し、Assistantターンをプリフィルすることでそれらの指示を再度強調できます。（注：プリフィルは非推奨であり、Claude Opus 4.6およびSonnet 4.5ではサポートされていません。）

後処理を使用する：漏洩を示す可能性のあるキーワードについて、Claudeの出力をフィルタリングします。正規表現、キーワードフィルタリング、その他のテキスト処理方法などの技術があります。

より微妙な漏洩をフィルタリングするために、プロンプトされたLLMを使用することもできます。

不要な独自の詳細を避ける：Claudeがタスクを実行するために必要でない場合は、含めないでください。余分なコンテンツは、Claudeが「漏洩しない」という指示に集中することを妨げます。

定期的な監査：プロンプトとClaudeの出力を定期的にレビューして、潜在的な漏洩がないか確認してください。

Was this page helpful?

プロンプトの漏洩を減らす前に

プロンプトの漏洩を減らすための戦略

例：独自の分析手法を保護する

プロンプトの漏洩を減らす前に

プロンプトの漏洩を減らすための戦略

例：独自の分析手法を保護する