Was this page helpful?
本指南適用於需要在組織內治理 Agent Skills 的企業管理員與架構師。內容涵蓋如何大規模審核、評估、部署及管理 Skills。如需撰寫指引,請參閱最佳實務。如需架構詳細資訊,請參閱 Skills 概述。
在企業中部署 Skills 需要回答兩個不同的問題:
在核准部署之前,請根據以下風險指標評估每個 Skill:
| 風險指標 | 檢查項目 | 關注程度 |
|---|---|---|
| 程式碼執行 | Skill 目錄中的指令碼(*.py、*.sh、*.js) | 高:指令碼以完整環境存取權限執行 |
| 指令操縱 | 指示忽略安全規則、對使用者隱藏動作,或有條件地改變 Claude 行為的指令 | 高:可能繞過安全控制 |
| MCP 伺服器參照 | 參照 MCP 工具的指令(ServerName:tool_name) | 高:將存取範圍擴展至 Skill 本身之外 |
| 網路存取模式 | URL、API 端點、fetch、curl 或 requests 呼叫 | 高:潛在的資料外洩途徑 |
| 硬編碼憑證 | Skill 檔案或指令碼中的 API 金鑰、權杖或密碼 | 高:機密資訊會暴露於 Git 歷史記錄與上下文視窗中 |
| 檔案系統存取範圍 | Skill 目錄外的路徑、廣泛的 glob 模式、路徑遍歷(../) | 中:可能存取非預期的資料 |
| 工具調用 | 指示 Claude 使用 bash、檔案操作或其他工具的指令 | 中:審查執行了哪些操作 |
在部署任何來自第三方或內部貢獻者的 Skill 之前,請完成以下步驟:
http、requests.get、urllib、curl、fetch)。切勿在未經完整稽核的情況下部署來自不受信任來源的 Skills。惡意的 Skill 可能指示 Claude 執行任意程式碼、存取敏感檔案或將資料傳輸至外部。請以與在正式環境系統上安裝軟體相同的嚴謹程度來對待 Skill 的安裝。
如果 Skills 觸發不正確、與其他 Skills 衝突或提供不良指令,可能會降低代理程式的效能。在任何正式環境部署之前,都應要求進行評估。
在部署任何 Skill 之前,請針對以下面向建立核准關卡:
| 面向 | 衡量內容 | 失敗範例 |
|---|---|---|
| 觸發準確度 | Skill 是否針對正確的查詢啟動,並對不相關的查詢保持非啟動狀態? | Skill 在每次提及試算表時都觸發,即使使用者只是想討論資料 |
| 隔離行為 | Skill 單獨運作時是否正常? | Skill 參照其目錄中不存在的檔案 |
| 共存性 | 新增此 Skill 是否會降低其他 Skills 的效能? | 新 Skill 的描述過於廣泛,搶走了現有 Skills 的觸發機會 |
| 指令遵循 | Claude 是否準確遵循 Skill 的指令? | Claude 跳過驗證步驟或使用錯誤的程式庫 |
| 輸出品質 | Skill 是否產生正確、有用的結果? | 產生的報告有格式錯誤或資料遺漏 |
要求 Skill 作者提交評估套件,每個 Skill 包含 3 至 5 個代表性查詢,涵蓋 Skill 應觸發、不應觸發以及模糊邊緣案例的情況。要求在您組織使用的各個模型(Haiku、Sonnet、Opus)上進行測試,因為 Skill 的效果會因模型而異。
如需建立評估的詳細指引,請參閱最佳實務中的評估與迭代。如需一般評估方法論,請參閱開發測試案例。
評估結果可指示何時採取行動:
規劃
識別重複性高、容易出錯或需要專業知識的工作流程。將這些工作流程對應至組織角色,並判斷哪些適合作為 Skills 的候選項目。
建立與審查
測試
要求進行隔離評估(單獨測試 Skill)以及與現有 Skills 並存的評估(共存測試)。在核准進入正式環境之前,驗證觸發準確度、輸出品質,以及在您現行 Skill 集合中沒有回歸問題。
部署
透過 Skills API 上傳以供整個工作區存取。請參閱透過 API 使用 Skills 以了解上傳與版本管理。在您的內部登錄中記錄該 Skill 的用途、負責人與版本。
監控
追蹤使用模式並收集使用者回饋。定期重新執行評估,以偵測隨著工作流程與模型演進而產生的偏移或回歸。目前無法透過 Skills API 取得使用分析。請實作應用程式層級的記錄,以追蹤請求中包含了哪些 Skills。
迭代或棄用
在推廣新版本之前,要求完整的評估套件通過。當工作流程變更或評估分數下降時更新 Skills。當評估持續失敗或工作流程已停用時,棄用該 Skill。
作為一般準則,請限制同時載入的 Skills 數量,以維持可靠的召回準確度。每個 Skill 的中繼資料(名稱與描述)會在系統提示中競爭注意力。當啟用過多 Skills 時,Claude 可能無法選擇正確的 Skill,或完全遺漏相關的 Skills。請使用您的評估套件在新增 Skills 時衡量召回準確度,並在效能下降時停止新增。
請注意,API 請求每次最多支援 8 個 Skills(請參閱透過 API 使用 Skills)。如果某個角色需要的 Skills 數量超過單一請求所支援的上限,請考慮將範圍較窄的 Skills 合併為較廣泛的 Skills,或根據任務類型將請求路由至不同的 Skill 集合。
鼓勵團隊從範圍較窄、針對特定工作流程的 Skills 開始,而非廣泛、多用途的 Skills。當您的組織中出現共通模式時,再將相關的 Skills 整合為基於角色的套組。
使用評估來決定何時整合。只有當整合後的 Skill 評估結果確認其效能與所取代的個別 Skills 相當時,才將範圍較窄的 Skills 合併為較廣泛的 Skill。
範例進程:
formatting-sales-reports、querying-pipeline-data、updating-crm-recordssales-operations(當評估確認效能相當時)在您的組織中使用一致的命名慣例。最佳實務中的命名慣例一節提供了格式指引。
為每個 Skill 維護內部登錄,包含:
依組織角色將 Skills 分組,讓每位使用者的現行 Skill 集合保持聚焦:
每個基於角色的套組應僅包含與該角色日常工作流程相關的 Skills。
將 Skill 目錄儲存在 Git 中,以便追蹤歷史記錄、透過拉取請求進行程式碼審查,以及具備回溯能力。每個 Skill 目錄(包含 SKILL.md 與任何隨附檔案)自然對應至一個由 Git 追蹤的資料夾。
Skills API 提供工作區範圍的發佈。透過 API 上傳的 Skills 可供所有工作區成員使用。請參閱透過 API 使用 Skills 以了解上傳、版本管理與管理端點。
自訂 Skills 不會跨介面同步。上傳至 API 的 Skills 無法在 claude.ai 或 Claude Code 中使用,反之亦然。每個介面都需要分別上傳與管理。
將 Skill 原始檔案保存在 Git 中作為單一事實來源。如果您的組織在多個介面上部署 Skills,請實作您自己的同步流程以保持一致性。如需完整詳細資訊,請參閱跨介面可用性。