Loading...
    • 開發者指南
    • API 參考
    • MCP
    • 資源
    • 發行說明
    Search...
    ⌘K
    開始使用
    Claude 簡介快速開始
    模型與定價
    模型概覽選擇模型Claude 4.5 新功能遷移至 Claude 4.5模型棄用定價
    使用 Claude 構建
    功能概覽使用 Messages API上下文窗口提示詞最佳實踐
    功能
    提示詞快取上下文編輯擴展思考努力串流消息批次處理引用多語言支援Token 計數嵌入視覺PDF 支援Files API搜尋結果結構化輸出
    工具
    概覽如何實現工具使用細粒度工具串流Bash 工具代碼執行工具程式化工具調用計算機使用工具文字編輯器工具網頁擷取工具網頁搜尋工具記憶體工具工具搜尋工具
    Agent Skills
    概覽快速開始最佳實踐使用 API 的 Skills
    Agent SDK
    概覽快速開始TypeScript SDKTypeScript V2 (預覽)Python SDK遷移指南
    API 中的 MCP
    MCP 連接器遠端 MCP 伺服器
    第三方平台上的 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    提示詞工程
    概覽提示詞生成器使用提示詞範本提示詞改進器清晰直接使用範例 (多次提示)讓 Claude 思考 (CoT)使用 XML 標籤給 Claude 一個角色 (系統提示詞)預填 Claude 的回應鏈接複雜提示詞長上下文提示擴展思考提示
    測試與評估
    定義成功標準開發測試案例使用評估工具降低延遲
    加強防護欄
    減少幻覺增加輸出一致性緩解越獄串流拒絕減少提示詞洩露保持 Claude 的角色
    管理和監控
    Admin API 概覽使用量和成本 APIClaude Code Analytics API
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    加強防護欄

    防範越獄和提示詞注入

    越獄和提示詞注入發生在使用者精心設計提示詞以利用模型漏洞,目的是生成不適當內容。雖然 Claude 本身對此類攻擊具有抵抗力,但以下是加強您的防護措施的額外步驟,特別是針對違反我們的服務條款或使用政策的使用。

    由於採用了憲法 AI 等先進訓練方法,Claude 比其他主要的 LLM 更能抵抗越獄攻擊。
    • 無害性篩選:使用輕量級模型(如 Claude Haiku 3)預先篩選使用者輸入。

    • 輸入驗證:過濾含有越獄模式的提示詞。您甚至可以使用 LLM 創建一個通用驗證篩選,方法是提供已知的越獄語言作為範例。

    • 提示詞工程:精心設計強調道德和法律界限的提示詞。

    調整回應並考慮限制或禁止反覆嘗試濫用行為以規避 Claude 防護措施的使用者。例如,如果特定使用者多次觸發同類型的拒絕回應(如「輸出被內容過濾政策阻止」),告知該使用者其行為違反相關使用政策,並採取相應行動。

    • 持續監控:定期分析輸出以發現越獄跡象。 利用此監控來迭代改進您的提示詞和驗證策略。

    進階:鏈式防護

    結合多種策略以提供強大保護。以下是一個使用工具的企業級範例:

    通過分層策略,您可以創建一個強大的防禦系統來抵禦越獄和提示詞注入,確保您的 Claude 驅動應用程式維持最高的安全性和合規性標準。

    • harmlessness_screen 工具中的提示詞