Loading...
    • 開發者指南
    • API 參考
    • MCP
    • 資源
    • 發行說明
    Search...
    ⌘K
    入門
    Claude 簡介快速開始
    模型與定價
    模型概覽選擇模型Claude 4.6 新功能遷移指南模型棄用定價
    使用 Claude 構建
    功能概覽使用 Messages API處理停止原因提示詞最佳實踐
    上下文管理
    上下文視窗壓縮上下文編輯
    功能
    提示詞快取延伸思考自適應思考思考力度串流訊息批次處理引用多語言支援Token 計數嵌入視覺PDF 支援Files API搜尋結果結構化輸出
    工具
    概覽如何實作工具使用細粒度工具串流Bash 工具程式碼執行工具程式化工具呼叫電腦使用工具文字編輯器工具網頁擷取工具網頁搜尋工具記憶工具工具搜尋工具
    Agent Skills
    概覽快速開始最佳實踐企業級 Skills透過 API 使用 Skills
    Agent SDK
    概覽快速開始TypeScript SDKTypeScript V2(預覽版)Python SDK遷移指南
    API 中的 MCP
    MCP 連接器遠端 MCP 伺服器
    第三方平台上的 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    提示詞工程
    概覽提示詞產生器使用提示詞範本提示詞改進器清晰直接使用範例(多範例提示)讓 Claude 思考(CoT)使用 XML 標籤賦予 Claude 角色(系統提示詞)串聯複雜提示詞長上下文技巧延伸思考技巧
    測試與評估
    定義成功標準開發測試案例使用評估工具降低延遲
    強化防護機制
    減少幻覺提高輸出一致性防範越獄攻擊串流拒絕減少提示詞洩漏讓 Claude 保持角色
    管理與監控
    Admin API 概覽資料駐留工作區用量與成本 APIClaude Code Analytics API零資料保留
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Agent Skills

    企業級技能

    在企業規模部署 Agent Skills 的治理、安全審查、評估和組織指南。

    本指南適用於需要在整個組織中治理 Agent Skills 的企業管理員和架構師。涵蓋如何在大規模環境中審查、評估、部署和管理 Skills。如需撰寫指南,請參閱最佳實踐。如需架構詳情,請參閱 Skills 概覽。

    安全審查與審核

    在企業中部署 Skills 需要回答兩個不同的問題:

    1. Skills 整體上是否安全? 請參閱概覽中的安全考量部分,了解平台層級的安全詳情。
    2. 如何審核特定的 Skill? 使用下方的風險評估和審查清單。

    風險層級評估

    在批准部署之前,根據以下風險指標評估每個 Skill:

    風險指標需要關注的內容關注程度
    程式碼執行Skill 目錄中的腳本(*.py、*.sh、*.js)高:腳本以完整環境存取權限執行
    指令操控忽略安全規則、對使用者隱藏操作或有條件地改變 Claude 行為的指令高:可繞過安全控制
    MCP 伺服器引用引用 MCP 工具的指令(ServerName:tool_name)高:將存取範圍擴展到 Skill 本身之外
    網路存取模式URL、API 端點、fetch、curl 或 requests 呼叫高:潛在的資料外洩向量
    硬編碼憑證Skill 檔案或腳本中的 API 金鑰、令牌或密碼高:機密資訊暴露在 Git 歷史記錄和上下文視窗中
    檔案系統存取範圍Skill 目錄外的路徑、寬泛的 glob 模式、路徑遍歷(../)中:可能存取非預期的資料
    工具呼叫指示 Claude 使用 bash、檔案操作或其他工具的指令中:審查執行了哪些操作

    審查清單

    在部署任何來自第三方或內部貢獻者的 Skill 之前,請完成以下步驟:

    1. 閱讀所有 Skill 目錄內容。 審查 SKILL.md、所有引用的 markdown 檔案,以及任何捆綁的腳本或資源。
    2. 驗證腳本行為是否與聲明的用途一致。 在沙箱環境中執行腳本,確認輸出與 Skill 的描述一致。
    3. 檢查是否有對抗性指令。 尋找告訴 Claude 忽略安全規則、對使用者隱藏操作、透過回應外洩資料,或根據特定輸入改變行為的指令。
    4. 檢查是否有外部 URL 擷取或網路呼叫。 在腳本和指令中搜尋網路存取模式(http、requests.get、urllib、curl、fetch)。
    5. 驗證沒有硬編碼憑證。 檢查 Skill 檔案中是否有 API 金鑰、令牌或密碼。憑證應使用環境變數或安全憑證儲存庫,絕不應出現在 Skill 內容中。
    6. 識別 Skill 指示 Claude 呼叫的工具和命令。 列出所有 bash 命令、檔案操作和工具引用。當 Skill 同時使用檔案讀取和網路工具時,考慮其組合風險。
    7. 確認重新導向目的地。 如果 Skill 引用外部 URL,驗證它們指向預期的網域。
    8. 驗證沒有資料外洩模式。 尋找讀取敏感資料然後寫入、傳送或編碼以進行外部傳輸的指令,包括透過 Claude 的對話回應。

    切勿在未經完整審計的情況下部署來自不受信任來源的 Skills。惡意 Skill 可以指示 Claude 執行任意程式碼、存取敏感檔案或向外部傳輸資料。對待 Skill 安裝應與在生產系統上安裝軟體一樣嚴謹。

    部署前評估 Skills

    如果 Skills 觸發不正確、與其他 Skills 衝突或提供不良指令,可能會降低代理效能。在任何生產部署之前都需要進行評估。

    評估內容

    在部署任何 Skill 之前,為以下維度建立審批關卡:

    維度衡量內容失敗範例
    觸發準確性Skill 是否在正確的查詢時啟動,並在不相關的查詢時保持不活動?Skill 在每次提到試算表時都會觸發,即使使用者只是想討論資料
    隔離行為Skill 是否能獨立正確運作?Skill 引用了其目錄中不存在的檔案
    共存性新增此 Skill 是否會降低其他 Skills 的效能?新 Skill 的描述過於寬泛,搶走了現有 Skills 的觸發
    指令遵循Claude 是否準確遵循 Skill 的指令?Claude 跳過驗證步驟或使用錯誤的函式庫
    輸出品質Skill 是否產生正確、有用的結果?生成的報告有格式錯誤或資料缺失

    評估要求

    要求 Skill 作者提交評估套件,每個 Skill 包含 3-5 個代表性查詢,涵蓋 Skill 應該觸發、不應該觸發以及模糊邊界情況。要求在您組織使用的模型(Haiku、Sonnet、Opus)上進行測試,因為 Skill 的效果因模型而異。

    如需建立評估的詳細指南,請參閱最佳實踐中的評估與迭代。如需一般評估方法論,請參閱開發測試案例。

    使用評估結果進行生命週期決策

    評估結果指示何時需要採取行動:

    • 觸發準確性下降: 更新 Skill 的描述或指令
    • 共存衝突: 合併重疊的 Skills 或縮小描述範圍
    • 持續低輸出品質: 重寫指令或新增驗證步驟
    • 更新後持續失敗: 棄用該 Skill

    Skill 生命週期管理

    1. 1

      規劃

      識別重複性高、容易出錯或需要專業知識的工作流程。將這些對應到組織角色,並確定哪些適合作為 Skills 的候選項。

    2. 2

      建立與審查

      確保 Skill 作者遵循最佳實踐。使用上方的審查清單要求進行安全審查。在批准前要求提供評估套件。建立職責分離:Skill 作者不應自行審查。

    3. 3

      測試

      要求在隔離環境(單獨的 Skill)和與現有 Skills 並存(共存測試)的情況下進行評估。在批准進入生產環境之前,驗證觸發準確性、輸出品質,以及在您的活動 Skill 集合中是否存在回歸問題。

    4. 4

      部署

      透過 Skills API 上傳以實現工作區範圍的存取。請參閱透過 API 使用 Skills 了解上傳和版本管理。在您的內部登錄冊中記錄 Skill 的用途、負責人和版本。

    5. 5

      監控

      追蹤使用模式並收集使用者回饋。定期重新執行評估,以偵測隨著工作流程和模型演進而產生的漂移或回歸。使用分析目前無法透過 Skills API 取得。實作應用程式層級的日誌記錄,以追蹤哪些 Skills 被包含在請求中。

    6. 6

      迭代或棄用

      在推廣新版本之前,要求完整的評估套件通過。當工作流程變更或評估分數下降時更新 Skills。當評估持續失敗或工作流程已退役時棄用 Skills。

    大規模組織 Skills

    召回限制

    作為一般準則,限制同時載入的 Skills 數量以維持可靠的召回準確性。每個 Skill 的中繼資料(名稱和描述)在系統提示中競爭注意力。當活動的 Skills 過多時,Claude 可能無法選擇正確的 Skill 或完全遺漏相關的 Skill。使用您的評估套件在新增 Skills 時衡量召回準確性,並在效能下降時停止新增。

    請注意,API 請求每次最多支援 8 個 Skills(請參閱透過 API 使用 Skills)。如果某個角色需要的 Skills 超過單次請求支援的數量,請考慮將狹窄的 Skills 合併為更廣泛的 Skills,或根據任務類型將請求路由到不同的 Skill 集合。

    從具體開始,之後再合併

    鼓勵團隊從狹窄的、針對特定工作流程的 Skills 開始,而非廣泛的多用途 Skills。隨著組織中出現模式,將相關的 Skills 合併為基於角色的套件。

    使用評估來決定何時合併。僅當合併後的 Skill 的評估確認其效能等同於它所取代的各個 Skills 時,才將狹窄的 Skills 合併為更廣泛的 Skill。

    範例演進:

    • 開始:formatting-sales-reports、querying-pipeline-data、updating-crm-records
    • 合併:sales-operations(當評估確認等效效能時)

    命名與編目

    在整個組織中使用一致的命名慣例。最佳實踐中的命名慣例部分提供了格式指南。

    為每個 Skill 維護一個內部登錄冊,包含:

    • 用途:Skill 支援的工作流程
    • 負責人:負責維護的團隊或個人
    • 版本:目前部署的版本
    • 依賴項:所需的 MCP 伺服器、套件或外部服務
    • 評估狀態:最近一次評估日期和結果

    基於角色的套件

    按組織角色分組 Skills,以保持每個使用者的活動 Skill 集合聚焦:

    • 銷售團隊:CRM 操作、銷售管線報告、提案生成
    • 工程團隊:程式碼審查、部署工作流程、事件回應
    • 財務團隊:報告生成、資料驗證、審計準備

    每個基於角色的套件應僅包含與該角色日常工作流程相關的 Skills。

    分發與版本控制

    原始碼控制

    將 Skill 目錄儲存在 Git 中,以實現歷史追蹤、透過 pull request 進行程式碼審查以及回滾能力。每個 Skill 目錄(包含 SKILL.md 和任何捆綁檔案)自然對應到一個 Git 追蹤的資料夾。

    基於 API 的分發

    Skills API 提供工作區範圍的分發。透過 API 上傳的 Skills 可供所有工作區成員使用。請參閱透過 API 使用 Skills 了解上傳、版本控制和管理端點。

    版本策略

    • 生產環境:將 Skills 固定到特定版本。在推廣新版本之前執行完整的評估套件。將每次更新視為需要完整安全審查的新部署。
    • 開發和測試環境:使用最新版本在推廣到生產環境之前驗證變更。
    • 回滾計劃:維護前一個版本作為備用方案。如果新版本在生產環境中未通過評估,立即回復到最後已知的良好版本。
    • 完整性驗證:計算已審查 Skills 的校驗和,並在部署時進行驗證。在您的 Skill 儲存庫中使用簽名提交以確保來源可追溯性。

    跨平台考量

    自訂 Skills 不會跨平台同步。透過 API 上傳的 Skills 在 claude.ai 或 Claude Code 中不可用,反之亦然。每個平台需要單獨上傳和管理。

    將 Skill 原始檔案維護在 Git 中作為唯一的事實來源。如果您的組織跨多個平台部署 Skills,請實作您自己的同步流程以保持一致性。如需完整詳情,請參閱跨平台可用性。

    後續步驟

    Agent Skills 概覽

    架構與平台詳情

    最佳實踐

    Skill 建立者的撰寫指南

    透過 API 使用 Skills

    以程式化方式上傳和管理 Skills

    安全部署 AI 代理

    代理部署的安全模式

    Was this page helpful?

    • 部署前評估 Skills
    • Skill 生命週期管理
    • 大規模組織 Skills
    • 基於 API 的分發