Was this page helpful?
本指南適用於需要在整個組織中管理 Agent Skills 的企業管理員和架構師。它涵蓋如何審查、評估、部署和大規模管理 Skills。有關編寫指導,請參閱最佳實踐。有關架構詳情,請參閱 Skills 概述。
在企業中部署 Skills 需要回答兩個不同的問題:
在批准部署前,根據這些風險指標評估每個 Skill:
| 風險指標 | 要查找的內容 | 關注程度 |
|---|---|---|
| 代碼執行 | Skill 目錄中的腳本(*.py、*.sh、*.js) | 高:腳本以完整環境訪問權限運行 |
| 指令操縱 | 指示忽略安全規則、隱藏用戶操作或有條件地改變 Claude 行為的指令 | 高:可以繞過安全控制 |
| MCP 伺服器引用 | 引用 MCP 工具的指令(ServerName:tool_name) | 高:擴展超出 Skill 本身的訪問權限 |
| 網絡訪問模式 | URL、API 端點、fetch、curl 或 requests 調用 | 高:潛在數據洩露向量 |
| 硬編碼憑證 | Skill 文件或腳本中的 API 密鑰、令牌或密碼 | 高:Git 歷史記錄和上下文窗口中暴露的機密 |
| 文件系統訪問範圍 | Skill 目錄外的路徑、寬泛的 glob 模式、路徑遍歷(../) | 中:可能訪問意外數據 |
| 工具調用 | 指示 Claude 使用 bash、文件操作或其他工具的指令 | 中:審查執行的操作 |
在部署來自第三方或內部貢獻者的任何 Skill 之前,完成以下步驟:
http、requests.get、urllib、curl、fetch)。不要在沒有完整審計的情況下部署來自不受信任來源的 Skills。惡意 Skill 可以指示 Claude 執行任意代碼、訪問敏感文件或外部傳輸數據。將 Skill 安裝視為與在生產系統上安裝軟件相同的嚴謹程度。
如果 Skills 觸發不正確、與其他 Skills 衝突或提供不良指令,可能會降低代理性能。在任何生產部署前需要評估。
在部署任何 Skill 前,為這些維度建立批准門檻:
| 維度 | 它測量什麼 | 失敗示例 |
|---|---|---|
| 觸發準確性 | Skill 是否為正確的查詢激活並對無關的查詢保持不活動? | Skill 在每次提及電子表格時觸發,即使用戶只是想討論數據 |
| 隔離行為 | Skill 是否單獨正確工作? | Skill 引用其目錄中不存在的文件 |
| 共存 | 添加此 Skill 是否會降低其他 Skills? | 新 Skill 的描述過於寬泛,從現有 Skills 竊取觸發 |
| 指令遵循 | Claude 是否準確遵循 Skill 的指令? | Claude 跳過驗證步驟或使用錯誤的庫 |
| 輸出質量 | Skill 是否產生正確、有用的結果? | 生成的報告有格式錯誤或缺少數據 |
要求 Skill 作者提交評估套件,每個 Skill 包含 3-5 個代表性查詢,涵蓋 Skill 應該觸發、不應該觸發和模糊邊界情況的情況。要求在您的組織使用的模型(Haiku、Sonnet、Opus)中進行測試,因為 Skill 效果因模型而異。
有關構建評估的詳細指導,請參閱最佳實踐中的評估和迭代。有關一般評估方法,請參閱開發測試用例。
評估結果表明何時採取行動:
計劃
識別重複、容易出錯或需要專業知識的工作流程。將這些映射到組織角色,並確定哪些是 Skills 的候選項。
創建和審查
測試
要求隔離評估(單獨的 Skill)和與現有 Skills 一起評估(共存測試)。在批准生產前,驗證觸發準確性、輸出質量以及跨活動 Skill 集的無回歸。
部署
通過 Skills API 上傳以進行工作區範圍的訪問。有關上傳和版本管理,請參閱使用 Skills 與 API。在內部註冊表中記錄 Skill,包括目的、所有者和版本。
監控
跟蹤使用模式並收集用戶反饋。定期重新運行評估以檢測工作流程和模型演變時的漂移或回歸。使用分析目前不可通過 Skills API 獲得。實施應用級日誌記錄以跟蹤請求中包含的 Skills。
迭代或棄用
要求完整評估套件在推廣新版本前通過。當工作流程更改或評估分數下降時更新 Skills。當評估持續失敗或工作流程被停用時棄用 Skills。
作為一般指導,限制同時加載的 Skills 數量以保持可靠的回憶準確性。每個 Skill 的元數據(名稱和描述)在系統提示中競爭注意力。當太多 Skills 活動時,Claude 可能無法選擇正確的 Skill 或完全錯過相關的。使用您的評估套件在添加 Skills 時測量回憶準確性,並在性能下降時停止添加。
請注意,API 請求支持每個請求最多 8 個 Skills(請參閱使用 Skills 與 API)。如果角色需要超過單個請求支持的 Skills,請考慮將狹隘的 Skills 合併為更寬泛的 Skills,或根據任務類型將請求路由到不同的 Skill 集。
鼓勵團隊從狹隘的、特定工作流程的 Skills 開始,而不是寬泛的、多用途的 Skills。隨著模式在您的組織中出現,將相關 Skills 合併為基於角色的捆綁。
使用評估來決定何時合併。只有當合併 Skill 的評估確認與其替換的單個 Skills 等效的性能時,才將狹隘的 Skills 合併為更寬泛的 Skills。
示例進展:
formatting-sales-reports、querying-pipeline-data、updating-crm-recordssales-operations(當評估確認等效性能時)在整個組織中使用一致的命名約定。最佳實踐中的命名約定部分提供格式指導。
為每個 Skill 維護內部註冊表,包含:
按組織角色對 Skills 進行分組,以保持每個用戶的活動 Skill 集專注:
每個基於角色的捆綁應僅包含與該角色日常工作流程相關的 Skills。
在 Git 中存儲 Skill 目錄以進行歷史跟蹤、通過拉取請求進行代碼審查和回滾能力。每個 Skill 目錄(包含 SKILL.md 和任何捆綁文件)自然映射到 Git 跟蹤的文件夾。
Skills API 提供工作區範圍的分發。通過 API 上傳的 Skills 可供所有工作區成員使用。有關上傳、版本控制和管理端點,請參閱使用 Skills 與 API。
自定義 Skills 不會跨表面同步。上傳到 API 的 Skills 在 claude.ai 或 Claude Code 中不可用,反之亦然。每個表面需要單獨的上傳和管理。
在 Git 中維護 Skill 源文件作為單一真實來源。如果您的組織在多個表面部署 Skills,實施您自己的同步過程以保持它們一致。有關完整詳情,請參閱跨表面可用性。
以編程方式上傳和管理 Skills