Loading...
  • 建構
  • 管理
  • 模型與定價
  • 客戶端 SDK
  • API 參考
Search...
⌘K
Log in
企業技能
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
建構/技能

企業級技能

在企業規模部署 Agent Skills 的治理、安全審查、評估和組織指導。

Was this page helpful?

  • 部署前評估 Skills
  • Skill 生命週期管理
  • 大規模組織 Skills
  • 基於 API 的分發

本指南適用於需要在整個組織中管理 Agent Skills 的企業管理員和架構師。它涵蓋如何審查、評估、部署和大規模管理 Skills。有關編寫指導,請參閱最佳實踐。有關架構詳情,請參閱 Skills 概述。

安全審查和審查

在企業中部署 Skills 需要回答兩個不同的問題:

  1. Skills 在一般情況下是否安全? 請參閱概述中的安全考慮部分,了解平台級安全詳情。
  2. 我如何審查特定的 Skill? 使用下面的風險評估和審查清單。

風險等級評估

在批准部署前,根據這些風險指標評估每個 Skill:

風險指標要查找的內容關注程度
代碼執行Skill 目錄中的腳本(*.py、*.sh、*.js)高:腳本以完整環境訪問權限運行
指令操縱指示忽略安全規則、隱藏用戶操作或有條件地改變 Claude 行為的指令高:可以繞過安全控制
MCP 伺服器引用引用 MCP 工具的指令(ServerName:tool_name)高:擴展超出 Skill 本身的訪問權限
網絡訪問模式URL、API 端點、fetch、curl 或 requests 調用高:潛在數據洩露向量
硬編碼憑證Skill 文件或腳本中的 API 密鑰、令牌或密碼高:Git 歷史記錄和上下文窗口中暴露的機密
文件系統訪問範圍Skill 目錄外的路徑、寬泛的 glob 模式、路徑遍歷(../)中:可能訪問意外數據
工具調用指示 Claude 使用 bash、文件操作或其他工具的指令中:審查執行的操作

審查清單

在部署來自第三方或內部貢獻者的任何 Skill 之前,完成以下步驟:

  1. 閱讀所有 Skill 目錄內容。 審查 SKILL.md、所有引用的 markdown 文件以及任何捆綁的腳本或資源。
  2. 驗證腳本行為與陳述的目的相符。 在沙箱環境中運行腳本,並確認輸出與 Skill 的描述一致。
  3. 檢查對抗性指令。 查找告訴 Claude 忽略安全規則、隱藏用戶操作、通過響應洩露數據或根據特定輸入改變行為的指令。
  4. 檢查外部 URL 獲取或網絡調用。 在腳本和指令中搜索網絡訪問模式(http、requests.get、urllib、curl、fetch)。
  5. 驗證沒有硬編碼憑證。 檢查 Skill 文件中的 API 密鑰、令牌或密碼。憑證應使用環境變量或安全憑證存儲,永遠不要出現在 Skill 內容中。
  6. 識別 Skill 指示 Claude 調用的工具和命令。 列出所有 bash 命令、文件操作和工具引用。當 Skill 同時使用文件讀取和網絡工具時,考慮組合風險。
  7. 確認重定向目標。 如果 Skill 引用外部 URL,驗證它們指向預期的域。
  8. 查找讀取敏感數據然後寫入、發送或編碼以進行外部傳輸的指令,包括通過 Claude 的對話響應。

不要在沒有完整審計的情況下部署來自不受信任來源的 Skills。惡意 Skill 可以指示 Claude 執行任意代碼、訪問敏感文件或外部傳輸數據。將 Skill 安裝視為與在生產系統上安裝軟件相同的嚴謹程度。

部署前評估 Skills

如果 Skills 觸發不正確、與其他 Skills 衝突或提供不良指令,可能會降低代理性能。在任何生產部署前需要評估。

要評估的內容

在部署任何 Skill 前,為這些維度建立批准門檻:

維度它測量什麼失敗示例
觸發準確性Skill 是否為正確的查詢激活並對無關的查詢保持不活動?Skill 在每次提及電子表格時觸發,即使用戶只是想討論數據
隔離行為Skill 是否單獨正確工作?Skill 引用其目錄中不存在的文件
共存添加此 Skill 是否會降低其他 Skills?新 Skill 的描述過於寬泛,從現有 Skills 竊取觸發
指令遵循Claude 是否準確遵循 Skill 的指令?Claude 跳過驗證步驟或使用錯誤的庫
輸出質量Skill 是否產生正確、有用的結果?生成的報告有格式錯誤或缺少數據

評估要求

要求 Skill 作者提交評估套件,每個 Skill 包含 3-5 個代表性查詢,涵蓋 Skill 應該觸發、不應該觸發和模糊邊界情況的情況。要求在您的組織使用的模型(Haiku、Sonnet、Opus)中進行測試,因為 Skill 效果因模型而異。

有關構建評估的詳細指導,請參閱最佳實踐中的評估和迭代。有關一般評估方法,請參閱開發測試用例。

使用評估進行生命週期決策

評估結果表明何時採取行動:

  • 觸發準確性下降: 更新 Skill 的描述或指令
  • 共存衝突: 合併重疊的 Skills 或縮小描述
  • 持續低輸出質量: 重寫指令或添加驗證步驟
  • 更新後持續失敗: 棄用 Skill

Skill 生命週期管理

  1. 1

    計劃

    識別重複、容易出錯或需要專業知識的工作流程。將這些映射到組織角色,並確定哪些是 Skills 的候選項。

  2. 2

    創建和審查

    確保 Skill 作者遵循最佳實踐。使用上面的審查清單要求進行安全審查。在批准前要求評估套件。建立職責分離:Skill 作者不應該是自己的審查者。

  3. 3

    測試

    要求隔離評估(單獨的 Skill)和與現有 Skills 一起評估(共存測試)。在批准生產前,驗證觸發準確性、輸出質量以及跨活動 Skill 集的無回歸。

  4. 4

    部署

    通過 Skills API 上傳以進行工作區範圍的訪問。有關上傳和版本管理,請參閱使用 Skills 與 API。在內部註冊表中記錄 Skill,包括目的、所有者和版本。

  5. 5

    監控

    跟蹤使用模式並收集用戶反饋。定期重新運行評估以檢測工作流程和模型演變時的漂移或回歸。使用分析目前不可通過 Skills API 獲得。實施應用級日誌記錄以跟蹤請求中包含的 Skills。

  6. 6

    迭代或棄用

    要求完整評估套件在推廣新版本前通過。當工作流程更改或評估分數下降時更新 Skills。當評估持續失敗或工作流程被停用時棄用 Skills。

大規模組織 Skills

回憶限制

作為一般指導,限制同時加載的 Skills 數量以保持可靠的回憶準確性。每個 Skill 的元數據(名稱和描述)在系統提示中競爭注意力。當太多 Skills 活動時,Claude 可能無法選擇正確的 Skill 或完全錯過相關的。使用您的評估套件在添加 Skills 時測量回憶準確性,並在性能下降時停止添加。

請注意,API 請求支持每個請求最多 8 個 Skills(請參閱使用 Skills 與 API)。如果角色需要超過單個請求支持的 Skills,請考慮將狹隘的 Skills 合併為更寬泛的 Skills,或根據任務類型將請求路由到不同的 Skill 集。

從具體開始,稍後合併

鼓勵團隊從狹隘的、特定工作流程的 Skills 開始,而不是寬泛的、多用途的 Skills。隨著模式在您的組織中出現,將相關 Skills 合併為基於角色的捆綁。

使用評估來決定何時合併。只有當合併 Skill 的評估確認與其替換的單個 Skills 等效的性能時,才將狹隘的 Skills 合併為更寬泛的 Skills。

示例進展:

  • 開始:formatting-sales-reports、querying-pipeline-data、updating-crm-records
  • 合併:sales-operations(當評估確認等效性能時)

命名和編目

在整個組織中使用一致的命名約定。最佳實踐中的命名約定部分提供格式指導。

為每個 Skill 維護內部註冊表,包含:

  • 目的:Skill 支持的工作流程
  • 所有者:負責維護的團隊或個人
  • 版本:當前部署的版本
  • 依賴項:所需的 MCP 伺服器、包或外部服務
  • 評估狀態:上次評估日期和結果

基於角色的捆綁

按組織角色對 Skills 進行分組,以保持每個用戶的活動 Skill 集專注:

  • 銷售團隊:CRM 操作、管道報告、提案生成
  • 工程:代碼審查、部署工作流程、事件響應
  • 財務:報告生成、數據驗證、審計準備

每個基於角色的捆綁應僅包含與該角色日常工作流程相關的 Skills。

分發和版本控制

源代碼控制

在 Git 中存儲 Skill 目錄以進行歷史跟蹤、通過拉取請求進行代碼審查和回滾能力。每個 Skill 目錄(包含 SKILL.md 和任何捆綁文件)自然映射到 Git 跟蹤的文件夾。

基於 API 的分發

Skills API 提供工作區範圍的分發。通過 API 上傳的 Skills 可供所有工作區成員使用。有關上傳、版本控制和管理端點,請參閱使用 Skills 與 API。

版本控制策略

  • 生產:將 Skills 固定到特定版本。在推廣新版本前運行完整評估套件。將每次更新視為需要完整安全審查的新部署。
  • 開發和測試:使用最新版本以在生產推廣前驗證更改。
  • 回滾計劃:維護上一個版本作為後備。如果新版本在生產中評估失敗,立即回滾到上一個已知良好版本。
  • 完整性驗證:計算已審查 Skills 的校驗和並在部署時驗證它們。在您的 Skill 存儲庫中使用簽名提交以確保來源。

跨表面考慮

自定義 Skills 不會跨表面同步。上傳到 API 的 Skills 在 claude.ai 或 Claude Code 中不可用,反之亦然。每個表面需要單獨的上傳和管理。

在 Git 中維護 Skill 源文件作為單一真實來源。如果您的組織在多個表面部署 Skills,實施您自己的同步過程以保持它們一致。有關完整詳情,請參閱跨表面可用性。

後續步驟

Agent Skills 概述

架構和平台詳情

最佳實踐

Skill 創建者的編寫指導

驗證沒有數據洩露模式。
使用 Skills 與 API

以編程方式上傳和管理 Skills