Claude Platform Docs
  • 消息
  • 托管智能体
  • 管理

Search...
⌘K
第一步
Claude 简介快速入门
使用 Claude 构建
功能概览使用 Messages API停止原因与回退拒绝与回退回退额度
模型能力
扩展思考自适应思考努力程度任务预算(测试版)快速模式(研究预览)结构化输出引用流式传输消息批量处理搜索结果流式传输拒绝多语言支持嵌入
工具
概览工具使用的工作原理教程:构建使用工具的智能体定义工具处理工具调用并行工具使用工具运行器(SDK)严格工具使用工具使用与提示缓存服务器工具故障排除网页搜索工具网页抓取工具代码执行工具顾问工具记忆工具Bash 工具计算机使用工具文本编辑器工具
工具基础设施
工具参考管理工具上下文工具组合工具搜索编程式工具调用细粒度工具流式传输
上下文管理
上下文窗口压缩上下文编辑提示缓存对话中系统消息构建编排模式缓存诊断(测试版)令牌计数
处理文件
Files APIPDF 支持图像与视觉
技能
概览快速入门最佳实践企业技能API 中的技能
MCP
远程 MCP 服务器MCP 连接器
云平台上的 Claude
Amazon BedrockAmazon Bedrock(旧版)AWS 上的 Claude PlatformMicrosoft FoundryVertex AI

Log in
企业技能
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
消息/技能

企业级 Skills

在企业规模部署 Agent Skills 的治理、安全审查、评估和组织指南。

本指南面向需要在组织范围内治理 Agent Skills 的企业管理员和架构师。内容涵盖如何大规模审核、评估、部署和管理 Skills。有关编写指南,请参阅最佳实践。有关架构详情,请参阅 Skills 概述。

安全审查与审核

在企业中部署 Skills 需要回答两个不同的问题:

  1. Skills 总体上是否安全? 请参阅概述中的安全注意事项部分,了解平台级安全详情。
  2. 如何审核特定的 Skill? 请使用下方的风险评估和审查清单。

风险等级评估

在批准部署之前,请根据以下风险指标评估每个 Skill:

风险指标需要关注的内容关注级别
代码执行Skill 目录中的脚本(*.py、*.sh、*.js)高:脚本以完整的环境访问权限运行
指令操纵指示忽略安全规则、对用户隐藏操作或有条件地改变 Claude 行为的指令高:可能绕过安全控制
MCP 服务器引用引用 MCP 工具的指令(ServerName:tool_name)高:将访问范围扩展到 Skill 本身之外
网络访问模式URL、API 端点、fetch、curl 或 requests 调用高:潜在的数据泄露途径
硬编码凭据Skill 文件或脚本中的 API 密钥、令牌或密码高:机密信息会暴露在 Git 历史记录和上下文窗口中
文件系统访问范围Skill 目录之外的路径、宽泛的 glob 模式、路径遍历(../)中:可能访问非预期的数据
工具调用指示 Claude 使用 bash、文件操作或其他工具的指令中:审查执行了哪些操作

审查清单

在部署来自第三方或内部贡献者的任何 Skill 之前,请完成以下步骤:

  1. 阅读所有 Skill 目录内容。 审查 SKILL.md、所有引用的 markdown 文件以及任何捆绑的脚本或资源。
  2. 验证脚本行为与声明的用途相符。 在沙盒环境中运行脚本,并确认输出与 Skill 的描述一致。
  3. 检查是否存在对抗性指令。 查找指示 Claude 忽略安全规则、对用户隐藏操作、通过响应泄露数据或根据特定输入改变行为的指令。
  4. 检查是否存在外部 URL 获取或网络调用。 在脚本和指令中搜索网络访问模式(http、requests.get、urllib、curl、fetch)。
  5. 验证没有硬编码凭据。 检查 Skill 文件中是否存在 API 密钥、令牌或密码。凭据应使用环境变量或安全凭据存储,绝不应出现在 Skill 内容中。
  6. 识别 Skill 指示 Claude 调用的工具和命令。 列出所有 bash 命令、文件操作和工具引用。当 Skill 同时使用文件读取和网络工具时,请考虑其组合风险。
  7. 确认重定向目标。 如果 Skill 引用了外部 URL,请验证它们指向预期的域名。
  8. 验证不存在数据泄露模式。 查找读取敏感数据然后将其写入、发送或编码以进行外部传输的指令,包括通过 Claude 的对话响应进行传输。


切勿在未经全面审计的情况下部署来自不受信任来源的 Skills。恶意 Skill 可能指示 Claude 执行任意代码、访问敏感文件或向外部传输数据。请以与在生产系统上安装软件相同的严格程度对待 Skill 的安装。

部署前评估 Skills

如果 Skills 触发不正确、与其他 Skills 冲突或提供了不良指令,可能会降低智能体的性能。在任何生产部署之前都应要求进行评估。

评估内容

在部署任何 Skill 之前,请针对以下维度建立审批关卡:

维度衡量内容失败示例
触发准确性Skill 是否针对正确的查询激活,并对不相关的查询保持非激活状态?每次提到电子表格时 Skill 都会触发,即使用户只是想讨论数据
隔离行为Skill 能否独立正常工作?Skill 引用了其目录中不存在的文件
共存性添加此 Skill 是否会降低其他 Skills 的性能?新 Skill 的描述过于宽泛,抢占了现有 Skills 的触发条件
指令遵循Claude 是否准确遵循 Skill 的指令?Claude 跳过验证步骤或使用了错误的库
输出质量Skill 是否产生正确、有用的结果?生成的报告存在格式错误或数据缺失

评估要求

要求 Skill 作者为每个 Skill 提交包含 3-5 个代表性查询的评估套件,涵盖 Skill 应触发的情况、不应触发的情况以及模糊的边缘情况。要求在您的组织使用的各个模型(Haiku、Sonnet、Opus)上进行测试,因为 Skill 的有效性因模型而异。

有关构建评估的详细指南,请参阅最佳实践中的评估与迭代。有关通用评估方法,请参阅开发测试用例。

使用评估进行生命周期决策

评估结果可以指示何时采取行动:

  • 触发准确性下降: 更新 Skill 的描述或指令
  • 共存冲突: 合并重叠的 Skills 或缩小描述范围
  • 输出质量持续偏低: 重写指令或添加验证步骤
  • 多次更新后仍持续失败: 弃用该 Skill

Skill 生命周期管理

  1. 1

    规划

    识别重复性、易出错或需要专业知识的工作流程。将这些工作流程映射到组织角色,并确定哪些适合作为 Skills 的候选对象。

  2. 2

    创建与审查

    确保 Skill 作者遵循最佳实践。要求使用上述审查清单进行安全审查。在批准前要求提供评估套件。建立职责分离机制:Skill 作者不应担任自己的审查者。

  3. 3

    测试

    要求进行隔离评估(单独测试 Skill)以及与现有 Skills 一起的评估(共存测试)。在批准投入生产之前,验证触发准确性、输出质量以及在您的活跃 Skill 集合中不存在回归问题。

  4. 4

    部署

    通过 Skills API 上传以实现工作区范围的访问。有关上传和版本管理,请参阅通过 API 使用 Skills。在您的内部注册表中记录该 Skill 的用途、负责人和版本。

  5. 5

    监控

    跟踪使用模式并收集用户反馈。定期重新运行评估,以检测随着工作流程和模型演变而出现的偏移或回归。目前无法通过 Skills API 获取使用情况分析数据。请实施应用程序级日志记录,以跟踪请求中包含了哪些 Skills。

  6. 6

    迭代或弃用

    在推广新版本之前,要求完整的评估套件通过。当工作流程发生变化或评估分数下降时更新 Skills。当评估持续失败或工作流程被淘汰时弃用 Skills。

大规模组织 Skills

召回限制

作为一般准则,请限制同时加载的 Skills 数量,以保持可靠的召回准确性。每个 Skill 的元数据(名称和描述)都会在系统提示中争夺注意力。如果激活的 Skills 过多,Claude 可能无法选择正确的 Skill 或完全遗漏相关的 Skills。在添加 Skills 时,使用您的评估套件来衡量召回准确性,并在性能下降时停止添加。

请注意,API 请求每次最多支持 8 个 Skills(请参阅通过 API 使用 Skills)。如果某个角色需要的 Skills 数量超过单个请求所支持的数量,请考虑将范围较窄的 Skills 合并为范围更广的 Skills,或根据任务类型将请求路由到不同的 Skill 集合。

从具体开始,后续再整合

鼓励团队从范围较窄、针对特定工作流程的 Skills 开始,而不是从宽泛的多用途 Skills 开始。随着组织内模式的显现,将相关的 Skills 整合为基于角色的组合包。



使用评估来决定何时进行整合。只有当整合后的 Skill 的评估结果确认其性能与所替代的各个独立 Skills 相当时,才将范围较窄的 Skills 合并为范围更广的 Skill。

演进示例:

  • 起始:formatting-sales-reports、querying-pipeline-data、updating-crm-records
  • 整合:sales-operations(当评估确认性能相当时)

命名与编目

在整个组织中使用一致的命名约定。最佳实践中的命名约定部分提供了格式指南。

为每个 Skill 维护一个内部注册表,包含以下信息:

  • 用途:该 Skill 支持的工作流程
  • 负责人:负责维护的团队或个人
  • 版本:当前部署的版本
  • 依赖项:所需的 MCP 服务器、软件包或外部服务
  • 评估状态:最近的评估日期和结果

基于角色的组合包

按组织角色对 Skills 进行分组,使每个用户的活跃 Skill 集合保持聚焦:

  • 销售团队:CRM 操作、销售管道报告、提案生成
  • 工程团队:代码审查、部署工作流程、事件响应
  • 财务团队:报告生成、数据验证、审计准备

每个基于角色的组合包应仅包含与该角色日常工作流程相关的 Skills。

分发与版本控制

源代码控制

将 Skill 目录存储在 Git 中,以实现历史记录跟踪、通过拉取请求进行代码审查以及回滚能力。每个 Skill 目录(包含 SKILL.md 和任何捆绑文件)都可以自然地映射到一个由 Git 跟踪的文件夹。

基于 API 的分发

Skills API 提供工作区范围的分发。通过 API 上传的 Skills 可供所有工作区成员使用。有关上传、版本控制和管理端点,请参阅通过 API 使用 Skills。

版本控制策略

  • 生产环境:将 Skills 固定到特定版本。在推广新版本之前运行完整的评估套件。将每次更新视为需要完整安全审查的新部署。
  • 开发和测试环境:使用最新版本,以便在推广到生产环境之前验证更改。
  • 回滚计划:保留上一个版本作为后备。如果新版本在生产环境中未通过评估,请立即恢复到最后一个已知良好的版本。
  • 完整性验证:计算已审查 Skills 的校验和,并在部署时进行验证。在您的 Skill 代码仓库中使用签名提交以确保来源可信。

跨平台注意事项



自定义 Skills 不会跨平台同步。上传到 API 的 Skills 在 claude.ai 或 Claude Code 中不可用,反之亦然。每个平台都需要单独上传和管理。

将 Skill 源文件保存在 Git 中作为唯一可信来源。如果您的组织跨多个平台部署 Skills,请实施您自己的同步流程以保持它们的一致性。有关完整详情,请参阅跨平台可用性。

后续步骤

Agent Skills 概述

架构和平台详情

最佳实践

面向 Skill 创建者的编写指南


通过 API 使用 Skills

以编程方式上传和管理 Skills

Was this page helpful?

  • 安全审查与审核
  • 风险等级评估
  • 审查清单
  • 部署前评估 Skills
  • 评估内容
  • 评估要求
  • 使用评估进行生命周期决策
  • Skill 生命周期管理
  • 大规模组织 Skills
  • 召回限制
  • 从具体开始,后续再整合
  • 命名与编目
  • 基于角色的组合包
  • 分发与版本控制
  • 源代码控制
  • 基于 API 的分发
  • 版本控制策略
  • 跨平台注意事项
  • 后续步骤