消息技能

企业级 Skills

在企业规模部署 Agent Skills 的治理、安全审查、评估和组织指南。

本指南面向需要在组织范围内治理 Agent Skills 的企业管理员和架构师。内容涵盖如何大规模审核、评估、部署和管理 Skills。有关编写指南，请参阅最佳实践。有关架构详情，请参阅 Skills 概述。

安全审查与审核

在企业中部署 Skills 需要回答两个不同的问题：

Skills 总体上是否安全？ 请参阅概述中的安全注意事项部分，了解平台级安全详情。
如何审核特定的 Skill？ 请使用下方的风险评估和审查清单。

风险等级评估

在批准部署之前，请根据以下风险指标评估每个 Skill：

风险指标	需要关注的内容	关注级别
代码执行	Skill 目录中的脚本（`.py`、`.sh`、`*.js`）	高：脚本以完整的环境访问权限运行
指令操纵	指示忽略安全规则、对用户隐藏操作或有条件地改变 Claude 行为的指令	高：可能绕过安全控制
MCP 服务器引用	引用 MCP 工具的指令（`ServerName:tool_name`）	高：将访问范围扩展到 Skill 本身之外
网络访问模式	URL、API 端点、`fetch`、`curl` 或 `requests` 调用	高：潜在的数据泄露途径
硬编码凭据	Skill 文件或脚本中的 API 密钥、令牌或密码	高：机密信息会暴露在 Git 历史记录和上下文窗口中
文件系统访问范围	Skill 目录之外的路径、宽泛的 glob 模式、路径遍历（`../`）	中：可能访问非预期的数据
工具调用	指示 Claude 使用 bash、文件操作或其他工具的指令	中：审查执行了哪些操作

审查清单

在部署来自第三方或内部贡献者的任何 Skill 之前，请完成以下步骤：

阅读所有 Skill 目录内容。 审查 SKILL.md、所有引用的 markdown 文件以及任何捆绑的脚本或资源。
验证脚本行为与声明的用途相符。 在沙盒环境中运行脚本，并确认输出与 Skill 的描述一致。
检查是否存在对抗性指令。 查找指示 Claude 忽略安全规则、对用户隐藏操作、通过响应泄露数据或根据特定输入改变行为的指令。
检查是否存在外部 URL 获取或网络调用。 在脚本和指令中搜索网络访问模式（http、requests.get、urllib、curl、fetch）。
验证没有硬编码凭据。 检查 Skill 文件中是否存在 API 密钥、令牌或密码。凭据应使用环境变量或安全凭据存储，绝不应出现在 Skill 内容中。
识别 Skill 指示 Claude 调用的工具和命令。 列出所有 bash 命令、文件操作和工具引用。当 Skill 同时使用文件读取和网络工具时，请考虑其组合风险。
确认重定向目标。 如果 Skill 引用了外部 URL，请验证它们指向预期的域名。
查找读取敏感数据然后将其写入、发送或编码以进行外部传输的指令，包括通过 Claude 的对话响应进行传输。

切勿在未经全面审计的情况下部署来自不受信任来源的 Skills。恶意 Skill 可能指示 Claude 执行任意代码、访问敏感文件或向外部传输数据。请以与在生产系统上安装软件相同的严格程度对待 Skill 的安装。

部署前评估 Skills

如果 Skills 触发不正确、与其他 Skills 冲突或提供了不良指令，可能会降低智能体的性能。在任何生产部署之前都应要求进行评估。

评估内容

在部署任何 Skill 之前，请针对以下维度建立审批关卡：

维度	衡量内容	失败示例
触发准确性	Skill 是否针对正确的查询激活，并对不相关的查询保持非激活状态？	每次提到电子表格时 Skill 都会触发，即使用户只是想讨论数据
隔离行为	Skill 能否独立正常工作？	Skill 引用了其目录中不存在的文件
共存性	添加此 Skill 是否会降低其他 Skills 的性能？	新 Skill 的描述过于宽泛，抢占了现有 Skills 的触发条件
指令遵循	Claude 是否准确遵循 Skill 的指令？	Claude 跳过验证步骤或使用了错误的库
输出质量	Skill 是否产生正确、有用的结果？	生成的报告存在格式错误或数据缺失

评估要求

要求 Skill 作者为每个 Skill 提交包含 3-5 个代表性查询的评估套件，涵盖 Skill 应触发的情况、不应触发的情况以及模糊的边缘情况。要求在您的组织使用的各个模型（Haiku、Sonnet、Opus）上进行测试，因为 Skill 的有效性因模型而异。

有关构建评估的详细指南，请参阅最佳实践中的评估与迭代。有关通用评估方法，请参阅开发测试用例。

使用评估进行生命周期决策

评估结果可以指示何时采取行动：

触发准确性下降： 更新 Skill 的描述或指令
共存冲突： 合并重叠的 Skills 或缩小描述范围
输出质量持续偏低： 重写指令或添加验证步骤
多次更新后仍持续失败： 弃用该 Skill

Skill 生命周期管理

规划
识别重复性、易出错或需要专业知识的工作流程。将这些工作流程映射到组织角色，并确定哪些适合作为 Skills 的候选对象。
创建与审查
确保 Skill 作者遵循最佳实践。要求使用上述审查清单进行安全审查。在批准前要求提供评估套件。建立职责分离机制：Skill 作者不应担任自己的审查者。
测试
要求进行隔离评估（单独测试 Skill）以及与现有 Skills 一起的评估（共存测试）。在批准投入生产之前，验证触发准确性、输出质量以及在您的活跃 Skill 集合中不存在回归问题。
部署
通过 Skills API 上传以实现工作区范围的访问。有关上传和版本管理，请参阅通过 API 使用 Skills。在您的内部注册表中记录该 Skill 的用途、负责人和版本。
监控
跟踪使用模式并收集用户反馈。定期重新运行评估，以检测随着工作流程和模型演变而出现的偏移或回归。目前无法通过 Skills API 获取使用情况分析数据。请实施应用程序级日志记录，以跟踪请求中包含了哪些 Skills。
迭代或弃用
在推广新版本之前，要求完整的评估套件通过。当工作流程发生变化或评估分数下降时更新 Skills。当评估持续失败或工作流程被淘汰时弃用 Skills。

大规模组织 Skills

召回限制

作为一般准则，请限制同时加载的 Skills 数量，以保持可靠的召回准确性。每个 Skill 的元数据（名称和描述）都会在系统提示中争夺注意力。如果激活的 Skills 过多，Claude 可能无法选择正确的 Skill 或完全遗漏相关的 Skills。在添加 Skills 时，使用您的评估套件来衡量召回准确性，并在性能下降时停止添加。

请注意，API 请求每次最多支持 8 个 Skills（请参阅通过 API 使用 Skills）。如果某个角色需要的 Skills 数量超过单个请求所支持的数量，请考虑将范围较窄的 Skills 合并为范围更广的 Skills，或根据任务类型将请求路由到不同的 Skill 集合。

从具体开始，后续再整合

鼓励团队从范围较窄、针对特定工作流程的 Skills 开始，而不是从宽泛的多用途 Skills 开始。随着组织内模式的显现，将相关的 Skills 整合为基于角色的组合包。

使用评估来决定何时进行整合。只有当整合后的 Skill 的评估结果确认其性能与所替代的各个独立 Skills 相当时，才将范围较窄的 Skills 合并为范围更广的 Skill。

演进示例：

起始：formatting-sales-reports、querying-pipeline-data、updating-crm-records
整合：sales-operations（当评估确认性能相当时）

命名与编目

在整个组织中使用一致的命名约定。最佳实践中的命名约定部分提供了格式指南。

为每个 Skill 维护一个内部注册表，包含以下信息：

用途：该 Skill 支持的工作流程
负责人：负责维护的团队或个人
版本：当前部署的版本
依赖项：所需的 MCP 服务器、软件包或外部服务
评估状态：最近的评估日期和结果

基于角色的组合包

按组织角色对 Skills 进行分组，使每个用户的活跃 Skill 集合保持聚焦：

销售团队：CRM 操作、销售管道报告、提案生成
工程团队：代码审查、部署工作流程、事件响应
财务团队：报告生成、数据验证、审计准备

每个基于角色的组合包应仅包含与该角色日常工作流程相关的 Skills。

分发与版本控制

源代码控制

将 Skill 目录存储在 Git 中，以实现历史记录跟踪、通过拉取请求进行代码审查以及回滚能力。每个 Skill 目录（包含 SKILL.md 和任何捆绑文件）都可以自然地映射到一个由 Git 跟踪的文件夹。

基于 API 的分发

Skills API 提供工作区范围的分发。通过 API 上传的 Skills 可供所有工作区成员使用。有关上传、版本控制和管理端点，请参阅通过 API 使用 Skills。

版本控制策略

生产环境：将 Skills 固定到特定版本。在推广新版本之前运行完整的评估套件。将每次更新视为需要完整安全审查的新部署。
开发和测试环境：使用最新版本，以便在推广到生产环境之前验证更改。
回滚计划：保留上一个版本作为后备。如果新版本在生产环境中未通过评估，请立即恢复到最后一个已知良好的版本。
完整性验证：计算已审查 Skills 的校验和，并在部署时进行验证。在您的 Skill 代码仓库中使用签名提交以确保来源可信。

跨平台注意事项

自定义 Skills 不会跨平台同步。上传到 API 的 Skills 在 claude.ai 或 Claude Code 中不可用，反之亦然。每个平台都需要单独上传和管理。

将 Skill 源文件保存在 Git 中作为唯一可信来源。如果您的组织跨多个平台部署 Skills，请实施您自己的同步流程以保持它们的一致性。有关完整详情，请参阅跨平台可用性。

后续步骤

Agent Skills 概述

架构和平台详情

最佳实践

面向 Skill 创建者的编写指南

通过 API 使用 Skills

以编程方式上传和管理 Skills

Was this page helpful?

消息技能

企业级 Skills

在企业规模部署 Agent Skills 的治理、安全审查、评估和组织指南。

安全审查与审核

在企业中部署 Skills 需要回答两个不同的问题：

Skills 总体上是否安全？ 请参阅概述中的安全注意事项部分，了解平台级安全详情。
如何审核特定的 Skill？ 请使用下方的风险评估和审查清单。

风险等级评估

在批准部署之前，请根据以下风险指标评估每个 Skill：

风险指标	需要关注的内容	关注级别
代码执行	Skill 目录中的脚本（`.py`、`.sh`、`*.js`）	高：脚本以完整的环境访问权限运行
指令操纵	指示忽略安全规则、对用户隐藏操作或有条件地改变 Claude 行为的指令	高：可能绕过安全控制
MCP 服务器引用	引用 MCP 工具的指令（`ServerName:tool_name`）	高：将访问范围扩展到 Skill 本身之外
网络访问模式	URL、API 端点、`fetch`、`curl` 或 `requests` 调用	高：潜在的数据泄露途径
硬编码凭据	Skill 文件或脚本中的 API 密钥、令牌或密码	高：机密信息会暴露在 Git 历史记录和上下文窗口中
文件系统访问范围	Skill 目录之外的路径、宽泛的 glob 模式、路径遍历（`../`）	中：可能访问非预期的数据
工具调用	指示 Claude 使用 bash、文件操作或其他工具的指令	中：审查执行了哪些操作

审查清单

在部署来自第三方或内部贡献者的任何 Skill 之前，请完成以下步骤：

阅读所有 Skill 目录内容。 审查 SKILL.md、所有引用的 markdown 文件以及任何捆绑的脚本或资源。
验证脚本行为与声明的用途相符。 在沙盒环境中运行脚本，并确认输出与 Skill 的描述一致。
检查是否存在对抗性指令。 查找指示 Claude 忽略安全规则、对用户隐藏操作、通过响应泄露数据或根据特定输入改变行为的指令。
检查是否存在外部 URL 获取或网络调用。 在脚本和指令中搜索网络访问模式（http、requests.get、urllib、curl、fetch）。
验证没有硬编码凭据。 检查 Skill 文件中是否存在 API 密钥、令牌或密码。凭据应使用环境变量或安全凭据存储，绝不应出现在 Skill 内容中。
识别 Skill 指示 Claude 调用的工具和命令。 列出所有 bash 命令、文件操作和工具引用。当 Skill 同时使用文件读取和网络工具时，请考虑其组合风险。
确认重定向目标。 如果 Skill 引用了外部 URL，请验证它们指向预期的域名。
查找读取敏感数据然后将其写入、发送或编码以进行外部传输的指令，包括通过 Claude 的对话响应进行传输。

部署前评估 Skills

如果 Skills 触发不正确、与其他 Skills 冲突或提供了不良指令，可能会降低智能体的性能。在任何生产部署之前都应要求进行评估。

评估内容

在部署任何 Skill 之前，请针对以下维度建立审批关卡：

维度	衡量内容	失败示例
触发准确性	Skill 是否针对正确的查询激活，并对不相关的查询保持非激活状态？	每次提到电子表格时 Skill 都会触发，即使用户只是想讨论数据
隔离行为	Skill 能否独立正常工作？	Skill 引用了其目录中不存在的文件
共存性	添加此 Skill 是否会降低其他 Skills 的性能？	新 Skill 的描述过于宽泛，抢占了现有 Skills 的触发条件
指令遵循	Claude 是否准确遵循 Skill 的指令？	Claude 跳过验证步骤或使用了错误的库
输出质量	Skill 是否产生正确、有用的结果？	生成的报告存在格式错误或数据缺失

评估要求

有关构建评估的详细指南，请参阅最佳实践中的评估与迭代。有关通用评估方法，请参阅开发测试用例。

使用评估进行生命周期决策

评估结果可以指示何时采取行动：

触发准确性下降： 更新 Skill 的描述或指令
共存冲突： 合并重叠的 Skills 或缩小描述范围
输出质量持续偏低： 重写指令或添加验证步骤
多次更新后仍持续失败： 弃用该 Skill

Skill 生命周期管理

规划
识别重复性、易出错或需要专业知识的工作流程。将这些工作流程映射到组织角色，并确定哪些适合作为 Skills 的候选对象。
创建与审查
确保 Skill 作者遵循最佳实践。要求使用上述审查清单进行安全审查。在批准前要求提供评估套件。建立职责分离机制：Skill 作者不应担任自己的审查者。
测试
要求进行隔离评估（单独测试 Skill）以及与现有 Skills 一起的评估（共存测试）。在批准投入生产之前，验证触发准确性、输出质量以及在您的活跃 Skill 集合中不存在回归问题。
部署
通过 Skills API 上传以实现工作区范围的访问。有关上传和版本管理，请参阅通过 API 使用 Skills。在您的内部注册表中记录该 Skill 的用途、负责人和版本。
监控
跟踪使用模式并收集用户反馈。定期重新运行评估，以检测随着工作流程和模型演变而出现的偏移或回归。目前无法通过 Skills API 获取使用情况分析数据。请实施应用程序级日志记录，以跟踪请求中包含了哪些 Skills。
迭代或弃用
在推广新版本之前，要求完整的评估套件通过。当工作流程发生变化或评估分数下降时更新 Skills。当评估持续失败或工作流程被淘汰时弃用 Skills。

大规模组织 Skills

召回限制

从具体开始，后续再整合

演进示例：

起始：formatting-sales-reports、querying-pipeline-data、updating-crm-records
整合：sales-operations（当评估确认性能相当时）

命名与编目

在整个组织中使用一致的命名约定。最佳实践中的命名约定部分提供了格式指南。

为每个 Skill 维护一个内部注册表，包含以下信息：

用途：该 Skill 支持的工作流程
负责人：负责维护的团队或个人
版本：当前部署的版本
依赖项：所需的 MCP 服务器、软件包或外部服务
评估状态：最近的评估日期和结果

基于角色的组合包

按组织角色对 Skills 进行分组，使每个用户的活跃 Skill 集合保持聚焦：

销售团队：CRM 操作、销售管道报告、提案生成
工程团队：代码审查、部署工作流程、事件响应
财务团队：报告生成、数据验证、审计准备

每个基于角色的组合包应仅包含与该角色日常工作流程相关的 Skills。

分发与版本控制

源代码控制

基于 API 的分发

Skills API 提供工作区范围的分发。通过 API 上传的 Skills 可供所有工作区成员使用。有关上传、版本控制和管理端点，请参阅通过 API 使用 Skills。

版本控制策略

生产环境：将 Skills 固定到特定版本。在推广新版本之前运行完整的评估套件。将每次更新视为需要完整安全审查的新部署。
开发和测试环境：使用最新版本，以便在推广到生产环境之前验证更改。
回滚计划：保留上一个版本作为后备。如果新版本在生产环境中未通过评估，请立即恢复到最后一个已知良好的版本。
完整性验证：计算已审查 Skills 的校验和，并在部署时进行验证。在您的 Skill 代码仓库中使用签名提交以确保来源可信。

跨平台注意事项

自定义 Skills 不会跨平台同步。上传到 API 的 Skills 在 claude.ai 或 Claude Code 中不可用，反之亦然。每个平台都需要单独上传和管理。

后续步骤

Agent Skills 概述

架构和平台详情

最佳实践

面向 Skill 创建者的编写指南

通过 API 使用 Skills

以编程方式上传和管理 Skills

Was this page helpful?

安全审查与审核

风险等级评估

审查清单

部署前评估 Skills

评估内容

评估要求

使用评估进行生命周期决策

Skill 生命周期管理

大规模组织 Skills

召回限制

从具体开始，后续再整合

命名与编目

基于角色的组合包

分发与版本控制

源代码控制

基于 API 的分发

版本控制策略

跨平台注意事项

后续步骤

安全审查与审核

风险等级评估

审查清单

部署前评估 Skills

评估内容

评估要求

使用评估进行生命周期决策

Skill 生命周期管理

大规模组织 Skills

召回限制

从具体开始，后续再整合

命名与编目

基于角色的组合包

分发与版本控制

源代码控制

基于 API 的分发

版本控制策略

跨平台注意事项

后续步骤

安全审查与审核

风险等级评估

审查清单

部署前评估 Skills

评估内容

评估要求

使用评估进行生命周期决策

Skill 生命周期管理

大规模组织 Skills

召回限制

从具体开始，后续再整合

命名与编目

基于角色的组合包

分发与版本控制

源代码控制

基于 API 的分发

版本控制策略

跨平台注意事项

后续步骤

安全审查与审核

风险等级评估

审查清单

部署前评估 Skills

评估内容

评估要求

使用评估进行生命周期决策

Skill 生命周期管理

大规模组织 Skills

召回限制

从具体开始，后续再整合

命名与编目

基于角色的组合包

分发与版本控制

源代码控制

基于 API 的分发

版本控制策略

跨平台注意事项

后续步骤