Loading...
    • 開發者指南
    • API 參考
    • MCP
    • 資源
    • 發行說明
    Search...
    ⌘K
    入門
    Claude 簡介快速開始
    模型與定價
    模型概覽選擇模型Claude 4.6 新功能遷移指南模型棄用定價
    使用 Claude 構建
    功能概覽使用 Messages API處理停止原因提示詞最佳實踐
    上下文管理
    上下文視窗壓縮上下文編輯
    功能
    提示詞快取延伸思考自適應思考思考力度串流訊息批次處理引用多語言支援Token 計數嵌入視覺PDF 支援Files API搜尋結果結構化輸出
    工具
    概覽如何實作工具使用細粒度工具串流Bash 工具程式碼執行工具程式化工具呼叫電腦使用工具文字編輯器工具網頁擷取工具網頁搜尋工具記憶工具工具搜尋工具
    Agent Skills
    概覽快速開始最佳實踐企業級 Skills透過 API 使用 Skills
    Agent SDK
    概覽快速開始TypeScript SDKTypeScript V2(預覽版)Python SDK遷移指南
    API 中的 MCP
    MCP 連接器遠端 MCP 伺服器
    第三方平台上的 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    提示詞工程
    概覽提示詞產生器使用提示詞範本提示詞改進器清晰直接使用範例(多範例提示)讓 Claude 思考(CoT)使用 XML 標籤賦予 Claude 角色(系統提示詞)串聯複雜提示詞長上下文技巧延伸思考技巧
    測試與評估
    定義成功標準開發測試案例使用評估工具降低延遲
    強化防護機制
    減少幻覺提高輸出一致性防範越獄攻擊串流拒絕減少提示詞洩漏讓 Claude 保持角色
    管理與監控
    Admin API 概覽資料駐留工作區用量與成本 APIClaude Code Analytics API零資料保留
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    強化防護機制

    緩解越獄攻擊和提示注入

    了解如何防範越獄攻擊和提示注入,以保護您的 Claude 應用程式。

    越獄攻擊和提示注入發生在使用者精心設計提示以利用模型漏洞,試圖生成不當內容時。雖然 Claude 本身對此類攻擊具有韌性,但以下是加強防護措施的額外步驟,特別是針對違反我們服務條款或使用政策的使用情況。

    得益於 Constitutional AI 等先進訓練方法,Claude 比其他主要 LLM 更能抵抗越獄攻擊。
    • 無害性篩選:使用輕量級模型如 Claude Haiku 3 來預先篩選使用者輸入。(注意:預填充已棄用,在 Claude Opus 4.6 和 Sonnet 4.5 上不受支援。)

    • 輸入驗證:過濾提示中的越獄攻擊模式。您甚至可以使用 LLM 透過提供已知的越獄攻擊語言作為範例來建立通用的驗證篩選。

    • 提示工程:設計強調道德和法律界限的提示。

    調整回應並考慮對反覆從事濫用行為、試圖繞過 Claude 防護措施的使用者進行限流或封禁。例如,如果某個特定使用者多次觸發同類型的拒絕(例如「輸出被內容過濾政策阻擋」),告知該使用者其行為違反了相關使用政策,並採取相應措施。

    • 持續監控:定期分析輸出以檢測越獄攻擊跡象。 利用此監控來反覆改進您的提示和驗證策略。

    進階:鏈式防護措施

    結合多種策略以實現穩健的保護。以下是一個使用工具的企業級範例:

    透過分層運用這些策略,您可以建立針對越獄攻擊和提示注入的穩健防禦,確保您的 Claude 驅動應用程式維持最高的安全和合規標準。

    Was this page helpful?

    • harmlessness_screen 工具中的提示