Loading...
  • 构建
  • 管理
  • 模型与定价
  • 客户端 SDK
  • API 参考
Search...
⌘K
Log in
企业级技能
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
构建/技能

企业级 Skills

在企业规模部署 Agent Skills 的治理、安全审查、评估和组织指导。

本指南面向需要在组织内管理 Agent Skills 的企业管理员和架构师。内容涵盖如何大规模审查、评估、部署和管理 Skills。有关编写指导,请参阅最佳实践。有关架构详情,请参阅 Skills 概述。

安全审查与审核

在企业中部署 Skills 需要回答两个不同的问题:

  1. Skills 总体上是否安全? 有关平台级安全详情,请参阅概述中的安全注意事项部分。
  2. 如何审核特定的 Skill? 使用下方的风险评估和审查清单。

风险等级评估

在批准部署之前,对照以下风险指标评估每个 Skill:

风险指标需要关注的内容关注级别
代码执行Skill 目录中的脚本(*.py、*.sh、*.js)高:脚本以完整环境访问权限运行
指令操纵指示忽略安全规则、向用户隐藏操作或有条件地改变 Claude 行为的指令高:可能绕过安全控制
MCP 服务器引用引用 MCP 工具的指令(ServerName:tool_name)高:将访问权限扩展到 Skill 本身之外
网络访问模式URL、API 端点、fetch、curl 或 requests 调用高:潜在的数据泄露向量
硬编码凭据Skill 文件或脚本中的 API 密钥、令牌或密码高:密钥暴露在 Git 历史记录和上下文窗口中
文件系统访问范围Skill 目录之外的路径、宽泛的 glob 模式、路径遍历(../)中:可能访问非预期数据
工具调用指示 Claude 使用 bash、文件操作或其他工具的指令中:审查执行了哪些操作

审查清单

在部署来自第三方或内部贡献者的任何 Skill 之前,请完成以下步骤:

  1. 阅读所有 Skill 目录内容。 审查 SKILL.md、所有引用的 markdown 文件以及任何捆绑的脚本或资源。
  2. 验证脚本行为与声明目的一致。 在沙盒环境中运行脚本,并确认输出与 Skill 的描述一致。
  3. 检查对抗性指令。 查找告知 Claude 忽略安全规则、向用户隐藏操作、通过响应泄露数据或根据特定输入改变行为的指令。
  4. 检查外部 URL 获取或网络调用。 在脚本和指令中搜索网络访问模式(http、requests.get、urllib、curl、fetch)。
  5. 验证无硬编码凭据。 检查 Skill 文件中是否存在 API 密钥、令牌或密码。凭据应使用环境变量或安全凭据存储,绝不应出现在 Skill 内容中。
  6. 识别 Skill 指示 Claude 调用的工具和命令。 列出所有 bash 命令、文件操作和工具引用。当 Skill 同时使用文件读取和网络工具时,考虑组合风险。
  7. 确认重定向目标。 如果 Skill 引用了外部 URL,验证它们指向预期的域名。
  8. 查找读取敏感数据后将其写入、发送或编码以进行外部传输的指令,包括通过 Claude 的对话响应进行传输。

切勿在未经完整审计的情况下部署来自不受信任来源的 Skills。恶意 Skill 可以指示 Claude 执行任意代码、访问敏感文件或向外部传输数据。对待 Skill 安装应与在生产系统上安装软件同等严格。

部署前评估 Skills

如果 Skills 触发不正确、与其他 Skills 冲突或提供了糟糕的指令,可能会降低 Agent 性能。在任何生产部署之前都需要进行评估。

评估内容

在部署任何 Skill 之前,为以下维度建立审批关卡:

维度衡量内容失败示例
触发准确性Skill 是否对正确的查询激活,并对不相关的查询保持非激活状态?Skill 在每次提到电子表格时都会触发,即使用户只是想讨论数据
隔离行为Skill 单独运行时是否正常工作?Skill 引用了其目录中不存在的文件
共存性添加此 Skill 是否会降低其他 Skills 的性能?新 Skill 的描述过于宽泛,抢占了现有 Skills 的触发条件
指令遵循Claude 是否准确遵循 Skill 的指令?Claude 跳过验证步骤或使用了错误的库
输出质量Skill 是否产生正确、有用的结果?生成的报告存在格式错误或数据缺失

评估要求

要求 Skill 作者提交评估套件,每个 Skill 包含 3-5 个代表性查询,涵盖 Skill 应触发、不应触发以及模糊边界情况。要求在您的组织使用的各个模型(Haiku、Sonnet、Opus)上进行测试,因为 Skill 的有效性因模型而异。

有关构建评估的详细指导,请参阅最佳实践中的评估与迭代。有关通用评估方法,请参阅开发测试用例。

使用评估进行生命周期决策

评估结果表明何时需要采取行动:

  • 触发准确性下降: 更新 Skill 的描述或指令
  • 共存冲突: 合并重叠的 Skills 或缩窄描述
  • 持续低输出质量: 重写指令或添加验证步骤
  • 跨更新持续失败: 弃用该 Skill

Skill 生命周期管理

  1. 1

    规划

    识别重复性、容易出错或需要专业知识的工作流程。将这些工作流程映射到组织角色,并确定哪些是 Skills 的候选对象。

  2. 2

    创建与审查

    确保 Skill 作者遵循最佳实践。使用上方的审查清单要求进行安全审查。在批准前要求提交评估套件。建立职责分离:Skill 作者不应自行审查自己的作品。

  3. 3

    测试

    要求在隔离环境(单独 Skill)和与现有 Skills 并存的情况下(共存测试)进行评估。在批准生产部署之前,验证触发准确性、输出质量以及整个活跃 Skill 集中是否存在回归。

  4. 4

    部署

    通过 Skills API 上传以实现工作区范围的访问。有关上传和版本管理,请参阅通过 API 使用 Skills。在内部注册表中记录 Skill 的目的、所有者和版本。

  5. 5

    监控

    跟踪使用模式并收集用户反馈。定期重新运行评估,以检测随着工作流程和模型演进而产生的漂移或回归。Skills API 目前不提供使用分析功能。实施应用程序级日志记录以跟踪请求中包含了哪些 Skills。

  6. 6

    迭代或弃用

    在推广新版本之前,要求通过完整的评估套件。当工作流程发生变化或评估分数下降时更新 Skills。当评估持续失败或工作流程退役时弃用 Skills。

大规模组织 Skills

召回限制

作为一般准则,限制同时加载的 Skills 数量以保持可靠的召回准确性。每个 Skill 的元数据(名称和描述)在系统提示中竞争注意力。当活跃的 Skills 过多时,Claude 可能无法选择正确的 Skill 或完全错过相关的 Skills。在添加 Skills 时使用评估套件衡量召回准确性,并在性能下降时停止添加。

请注意,API 请求每次请求最多支持 8 个 Skills(请参阅通过 API 使用 Skills)。如果某个角色需要的 Skills 超过单次请求支持的数量,请考虑将较窄的 Skills 合并为更广泛的 Skills,或根据任务类型将请求路由到不同的 Skill 集。

从具体开始,后续合并

鼓励团队从针对特定工作流程的 Skills 开始,而不是宽泛的多用途 Skills。随着组织内模式的出现,将相关 Skills 合并为基于角色的捆绑包。

使用评估来决定何时合并。只有当合并后的 Skill 的评估确认其性能与所替换的各个 Skills 相当时,才将较窄的 Skills 合并为更广泛的 Skills。

示例演进:

  • 开始:formatting-sales-reports、querying-pipeline-data、updating-crm-records
  • 合并:sales-operations(当评估确认性能相当时)

命名与编目

在整个组织中使用一致的命名约定。最佳实践中的命名约定部分提供了格式指导。

为每个 Skill 维护内部注册表,包含:

  • 目的:Skill 支持的工作流程
  • 所有者:负责维护的团队或个人
  • 版本:当前部署版本
  • 依赖项:所需的 MCP 服务器、包或外部服务
  • 评估状态:最近评估日期和结果

基于角色的捆绑包

按组织角色对 Skills 进行分组,以保持每个用户的活跃 Skill 集专注:

  • 销售团队:CRM 操作、管道报告、提案生成
  • 工程团队:代码审查、部署工作流程、事件响应
  • 财务团队:报告生成、数据验证、审计准备

每个基于角色的捆绑包应仅包含与该角色日常工作流程相关的 Skills。

分发与版本控制

源代码控制

将 Skill 目录存储在 Git 中,以实现历史跟踪、通过拉取请求进行代码审查以及回滚能力。每个 Skill 目录(包含 SKILL.md 和任何捆绑文件)自然映射到一个 Git 跟踪的文件夹。

基于 API 的分发

Skills API 提供工作区范围的分发。通过 API 上传的 Skills 对所有工作区成员可用。有关上传、版本控制和管理端点,请参阅通过 API 使用 Skills。

版本控制策略

  • 生产环境:将 Skills 固定到特定版本。在推广新版本之前运行完整的评估套件。将每次更新视为需要完整安全审查的新部署。
  • 开发和测试:使用最新版本在生产推广之前验证更改。
  • 回滚计划:将上一个版本作为备用方案保留。如果新版本在生产中未通过评估,立即回滚到最后已知的良好版本。
  • 完整性验证:计算已审查 Skills 的校验和,并在部署时验证它们。在 Skill 存储库中使用签名提交以确保来源可信。

跨平台注意事项

自定义 Skills 不会跨平台同步。通过 API 上传的 Skills 在 claude.ai 或 Claude Code 中不可用,反之亦然。每个平台都需要单独上传和管理。

将 Skill 源文件维护在 Git 中作为单一事实来源。如果您的组织在多个平台上部署 Skills,请实施自己的同步流程以保持一致性。有关完整详情,请参阅跨平台可用性。

后续步骤

Agent Skills 概述

架构和平台详情

最佳实践

Skill 创建者的编写指导

Was this page helpful?

  • 部署前评估 Skills
  • Skill 生命周期管理
  • 大规模组织 Skills
  • 基于 API 的分发
验证无数据泄露模式。
通过 API 使用 Skills

以编程方式上传和管理 Skills