Claude Platform Docs
  • メッセージ
  • マネージドエージェント
  • 管理

Search...
⌘K
ユースケース
概要チケットルーティングカスタマーサポートエージェントコンテンツモデレーション法務文書の要約
プロンプトエンジニアリング
概要プロンプトのベストプラクティスClaude Fable 5へのプロンプトClaude Opus 4.8へのプロンプトコンソールのプロンプトツール
テストと評価
成功の定義と評価の構築コンソールでの評価ツールの使用レイテンシの削減
ガードレールの強化
ハルシネーションの削減出力の一貫性向上ジェイルブレイクの軽減プロンプトリークの削減
リファレンス
用語集

Log in
プロンプトリークの削減
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
ベストプラクティス/ガードレールの強化

プロンプトリークの軽減

プロンプトリークは、プロンプト内で「隠されている」と想定している機密情報を露出させる可能性があります。完全に防ぐ方法はありませんが、以下の戦略によってリスクを大幅に軽減できます。

プロンプトリークの軽減を試みる前に

リーク耐性のあるプロンプトエンジニアリング戦略は、どうしても必要な場合にのみ使用することを検討してください。プロンプトのリーク対策を試みると複雑さが増し、LLMの全体的なタスクの複雑さが増すことで、タスクの他の部分のパフォーマンスが低下する可能性があります。

リーク耐性のある手法を実装することにした場合は、追加された複雑さがモデルのパフォーマンスや出力の品質に悪影響を与えないことを確認するために、プロンプトを十分にテストしてください。


まずは、出力スクリーニングや後処理などの監視手法を試して、プロンプトリークの発生を検出することをお勧めします。

プロンプトリークを軽減するための戦略

  • コンテキストとクエリを分離する: システムプロンプトを使用して、重要な情報やコンテキストをユーザークエリから分離することを試みることができます。Userターンで重要な指示を強調し、その後Assistantターンを事前入力することでそれらの指示を再度強調できます。(注:事前入力は、Claude Fable 5、Claude Mythos 5、Claude Mythos Preview、Claude Opus 4.8、Claude Opus 4.7、Claude Opus 4.6、Claude Sonnet 4.6ではサポートされていません。)

  • 後処理を使用する:Claudeの出力をフィルタリングして、リークを示す可能性のあるキーワードを検出します。手法には、正規表現、キーワードフィルタリング、その他のテキスト処理方法の使用が含まれます。
    
    より微妙なリークを検出するために、プロンプトを与えたLLMを使用して出力をフィルタリングすることもできます。
  • 不要な独自情報の詳細を避ける:Claudeがタスクを実行するために必要でない情報は含めないでください。余分な内容は、Claudeが「リークしない」という指示に集中することを妨げます。
  • 定期的な監査:プロンプトとClaudeの出力を定期的にレビューし、潜在的なリークがないか確認してください。

目標はリークを防ぐことだけでなく、Claudeのパフォーマンスを維持することでもあることを忘れないでください。過度に複雑なリーク防止策は結果を低下させる可能性があります。バランスが重要です。

Was this page helpful?

  • プロンプトリークの軽減を試みる前に
  • プロンプトリークを軽減するための戦略