本指南適用於需要在整個組織中治理 Agent Skills 的企業管理員和架構師。涵蓋如何在大規模環境中審查、評估、部署和管理 Skills。如需撰寫指南,請參閱最佳實踐。如需架構詳情,請參閱 Skills 概覽。
在企業中部署 Skills 需要回答兩個不同的問題:
在批准部署之前,根據以下風險指標評估每個 Skill:
| 風險指標 | 需要關注的內容 | 關注程度 |
|---|---|---|
| 程式碼執行 | Skill 目錄中的腳本(*.py、*.sh、*.js) | 高:腳本以完整環境存取權限執行 |
| 指令操控 | 忽略安全規則、對使用者隱藏操作或有條件地改變 Claude 行為的指令 | 高:可繞過安全控制 |
| MCP 伺服器引用 | 引用 MCP 工具的指令(ServerName:tool_name) | 高:將存取範圍擴展到 Skill 本身之外 |
| 網路存取模式 | URL、API 端點、fetch、curl 或 requests 呼叫 | 高:潛在的資料外洩向量 |
| 硬編碼憑證 | Skill 檔案或腳本中的 API 金鑰、令牌或密碼 | 高:機密資訊暴露在 Git 歷史記錄和上下文視窗中 |
| 檔案系統存取範圍 | Skill 目錄外的路徑、寬泛的 glob 模式、路徑遍歷(../) | 中:可能存取非預期的資料 |
| 工具呼叫 | 指示 Claude 使用 bash、檔案操作或其他工具的指令 | 中:審查執行了哪些操作 |
在部署任何來自第三方或內部貢獻者的 Skill 之前,請完成以下步驟:
http、requests.get、urllib、curl、fetch)。切勿在未經完整審計的情況下部署來自不受信任來源的 Skills。惡意 Skill 可以指示 Claude 執行任意程式碼、存取敏感檔案或向外部傳輸資料。對待 Skill 安裝應與在生產系統上安裝軟體一樣嚴謹。
如果 Skills 觸發不正確、與其他 Skills 衝突或提供不良指令,可能會降低代理效能。在任何生產部署之前都需要進行評估。
在部署任何 Skill 之前,為以下維度建立審批關卡:
| 維度 | 衡量內容 | 失敗範例 |
|---|---|---|
| 觸發準確性 | Skill 是否在正確的查詢時啟動,並在不相關的查詢時保持不活動? | Skill 在每次提到試算表時都會觸發,即使使用者只是想討論資料 |
| 隔離行為 | Skill 是否能獨立正確運作? | Skill 引用了其目錄中不存在的檔案 |
| 共存性 | 新增此 Skill 是否會降低其他 Skills 的效能? | 新 Skill 的描述過於寬泛,搶走了現有 Skills 的觸發 |
| 指令遵循 | Claude 是否準確遵循 Skill 的指令? | Claude 跳過驗證步驟或使用錯誤的函式庫 |
| 輸出品質 | Skill 是否產生正確、有用的結果? | 生成的報告有格式錯誤或資料缺失 |
要求 Skill 作者提交評估套件,每個 Skill 包含 3-5 個代表性查詢,涵蓋 Skill 應該觸發、不應該觸發以及模糊邊界情況。要求在您組織使用的模型(Haiku、Sonnet、Opus)上進行測試,因為 Skill 的效果因模型而異。
如需建立評估的詳細指南,請參閱最佳實踐中的評估與迭代。如需一般評估方法論,請參閱開發測試案例。
評估結果指示何時需要採取行動:
規劃
識別重複性高、容易出錯或需要專業知識的工作流程。將這些對應到組織角色,並確定哪些適合作為 Skills 的候選項。
建立與審查
測試
要求在隔離環境(單獨的 Skill)和與現有 Skills 並存(共存測試)的情況下進行評估。在批准進入生產環境之前,驗證觸發準確性、輸出品質,以及在您的活動 Skill 集合中是否存在回歸問題。
部署
透過 Skills API 上傳以實現工作區範圍的存取。請參閱透過 API 使用 Skills 了解上傳和版本管理。在您的內部登錄冊中記錄 Skill 的用途、負責人和版本。
監控
追蹤使用模式並收集使用者回饋。定期重新執行評估,以偵測隨著工作流程和模型演進而產生的漂移或回歸。使用分析目前無法透過 Skills API 取得。實作應用程式層級的日誌記錄,以追蹤哪些 Skills 被包含在請求中。
迭代或棄用
在推廣新版本之前,要求完整的評估套件通過。當工作流程變更或評估分數下降時更新 Skills。當評估持續失敗或工作流程已退役時棄用 Skills。
作為一般準則,限制同時載入的 Skills 數量以維持可靠的召回準確性。每個 Skill 的中繼資料(名稱和描述)在系統提示中競爭注意力。當活動的 Skills 過多時,Claude 可能無法選擇正確的 Skill 或完全遺漏相關的 Skill。使用您的評估套件在新增 Skills 時衡量召回準確性,並在效能下降時停止新增。
請注意,API 請求每次最多支援 8 個 Skills(請參閱透過 API 使用 Skills)。如果某個角色需要的 Skills 超過單次請求支援的數量,請考慮將狹窄的 Skills 合併為更廣泛的 Skills,或根據任務類型將請求路由到不同的 Skill 集合。
鼓勵團隊從狹窄的、針對特定工作流程的 Skills 開始,而非廣泛的多用途 Skills。隨著組織中出現模式,將相關的 Skills 合併為基於角色的套件。
使用評估來決定何時合併。僅當合併後的 Skill 的評估確認其效能等同於它所取代的各個 Skills 時,才將狹窄的 Skills 合併為更廣泛的 Skill。
範例演進:
formatting-sales-reports、querying-pipeline-data、updating-crm-recordssales-operations(當評估確認等效效能時)在整個組織中使用一致的命名慣例。最佳實踐中的命名慣例部分提供了格式指南。
為每個 Skill 維護一個內部登錄冊,包含:
按組織角色分組 Skills,以保持每個使用者的活動 Skill 集合聚焦:
每個基於角色的套件應僅包含與該角色日常工作流程相關的 Skills。
將 Skill 目錄儲存在 Git 中,以實現歷史追蹤、透過 pull request 進行程式碼審查以及回滾能力。每個 Skill 目錄(包含 SKILL.md 和任何捆綁檔案)自然對應到一個 Git 追蹤的資料夾。
Skills API 提供工作區範圍的分發。透過 API 上傳的 Skills 可供所有工作區成員使用。請參閱透過 API 使用 Skills 了解上傳、版本控制和管理端點。
自訂 Skills 不會跨平台同步。透過 API 上傳的 Skills 在 claude.ai 或 Claude Code 中不可用,反之亦然。每個平台需要單獨上傳和管理。
將 Skill 原始檔案維護在 Git 中作為唯一的事實來源。如果您的組織跨多個平台部署 Skills,請實作您自己的同步流程以保持一致性。如需完整詳情,請參閱跨平台可用性。
Was this page helpful?