Loading...
    • 开发者指南
    • API 参考
    • MCP
    • 资源
    • 更新日志
    Search...
    ⌘K
    入门
    Claude 简介快速开始
    模型与定价
    模型概览选择模型Claude 4.6 新特性迁移指南模型弃用定价
    使用 Claude 构建
    功能概览使用 Messages API处理停止原因提示词最佳实践
    上下文管理
    上下文窗口压缩上下文编辑
    能力
    提示缓存扩展思考自适应思考推理力度流式消息批量处理引用多语言支持Token 计数嵌入视觉PDF 支持Files API搜索结果结构化输出
    工具
    概览如何实现工具使用细粒度工具流式传输Bash 工具代码执行工具程序化工具调用计算机使用工具文本编辑器工具网页抓取工具网页搜索工具记忆工具工具搜索工具
    Agent Skills
    概览快速开始最佳实践企业级 Skills通过 API 使用 Skills
    Agent SDK
    概览快速开始TypeScript SDKTypeScript V2(预览版)Python SDK迁移指南
    API 中的 MCP
    MCP 连接器远程 MCP 服务器
    第三方平台上的 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    提示工程
    概览提示词生成器使用提示词模板提示词优化器清晰直接使用示例(多样本提示)让 Claude 思考(思维链)使用 XML 标签赋予 Claude 角色(系统提示词)链式复杂提示长上下文技巧扩展思考技巧
    测试与评估
    定义成功标准开发测试用例使用评估工具降低延迟
    加强安全护栏
    减少幻觉提高输出一致性防范越狱攻击流式拒绝减少提示词泄露保持 Claude 角色设定
    管理与监控
    Admin API 概览数据驻留工作空间用量与成本 APIClaude Code Analytics API零数据留存
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Agent Skills

    企业级技能

    在企业规模部署 Agent Skills 的治理、安全审查、评估和组织指南。

    本指南面向需要在组织范围内治理 Agent Skills 的企业管理员和架构师。它涵盖了如何大规模审查、评估、部署和管理 Skills。有关编写指南,请参阅最佳实践。有关架构详情,请参阅 Skills 概述。

    安全审查与审核

    在企业中部署 Skills 需要回答两个不同的问题:

    1. Skills 总体上是否安全? 请参阅概述中的安全注意事项部分,了解平台级安全详情。
    2. 如何审核特定的 Skill? 使用下面的风险评估和审查清单。

    风险等级评估

    在批准部署之前,根据以下风险指标评估每个 Skill:

    风险指标需要关注的内容关注级别
    代码执行Skill 目录中的脚本(*.py、*.sh、*.js)高:脚本以完整环境访问权限运行
    指令操纵忽略安全规则、对用户隐藏操作或有条件地改变 Claude 行为的指令高:可能绕过安全控制
    MCP 服务器引用引用 MCP 工具的指令(ServerName:tool_name)高:将访问范围扩展到 Skill 本身之外
    网络访问模式URL、API 端点、fetch、curl 或 requests 调用高:潜在的数据泄露途径
    硬编码凭据Skill 文件或脚本中的 API 密钥、令牌或密码高:密钥暴露在 Git 历史记录和上下文窗口中
    文件系统访问范围Skill 目录之外的路径、宽泛的 glob 模式、路径遍历(../)中:可能访问非预期数据
    工具调用指示 Claude 使用 bash、文件操作或其他工具的指令中:审查执行了哪些操作

    审查清单

    在部署来自第三方或内部贡献者的任何 Skill 之前,请完成以下步骤:

    1. 阅读所有 Skill 目录内容。 审查 SKILL.md、所有引用的 markdown 文件以及任何捆绑的脚本或资源。
    2. 验证脚本行为是否与声明的用途一致。 在沙箱环境中运行脚本,确认输出与 Skill 的描述一致。
    3. 检查对抗性指令。 查找告诉 Claude 忽略安全规则、对用户隐藏操作、通过响应泄露数据或根据特定输入改变行为的指令。
    4. 检查外部 URL 获取或网络调用。 在脚本和指令中搜索网络访问模式(http、requests.get、urllib、curl、fetch)。
    5. 验证没有硬编码凭据。 检查 Skill 文件中的 API 密钥、令牌或密码。凭据应使用环境变量或安全凭据存储,绝不应出现在 Skill 内容中。
    6. 识别 Skill 指示 Claude 调用的工具和命令。 列出所有 bash 命令、文件操作和工具引用。当 Skill 同时使用文件读取和网络工具时,请考虑组合风险。
    7. 确认重定向目标。 如果 Skill 引用外部 URL,请验证它们指向预期的域名。
    8. 验证没有数据泄露模式。 查找读取敏感数据然后写入、发送或编码以进行外部传输的指令,包括通过 Claude 的对话响应进行传输。

    切勿在未经完整审计的情况下部署来自不受信任来源的 Skills。恶意 Skill 可以指示 Claude 执行任意代码、访问敏感文件或向外部传输数据。对待 Skill 安装应与在生产系统上安装软件一样严格。

    部署前评估 Skills

    如果 Skills 触发不正确、与其他 Skills 冲突或提供了不良指令,可能会降低代理性能。在任何生产部署之前都需要进行评估。

    评估内容

    在部署任何 Skill 之前,为以下维度建立审批关卡:

    维度衡量内容失败示例
    触发准确性Skill 是否在正确的查询时激活,在无关查询时保持不活动?Skill 在每次提到电子表格时都会触发,即使用户只是想讨论数据
    隔离行为Skill 是否能独立正常工作?Skill 引用了其目录中不存在的文件
    共存性添加此 Skill 是否会降低其他 Skills 的性能?新 Skill 的描述过于宽泛,抢夺了现有 Skills 的触发机会
    指令遵循Claude 是否准确遵循 Skill 的指令?Claude 跳过验证步骤或使用了错误的库
    输出质量Skill 是否产生正确、有用的结果?生成的报告存在格式错误或数据缺失

    评估要求

    要求 Skill 作者提交评估套件,每个 Skill 包含 3-5 个代表性查询,涵盖 Skill 应该触发、不应该触发以及模糊边界情况。要求在您组织使用的模型(Haiku、Sonnet、Opus)上进行测试,因为 Skill 的效果因模型而异。

    有关构建评估的详细指南,请参阅最佳实践中的评估与迭代。有关通用评估方法论,请参阅开发测试用例。

    使用评估进行生命周期决策

    评估结果指示何时需要采取行动:

    • 触发准确性下降: 更新 Skill 的描述或指令
    • 共存冲突: 合并重叠的 Skills 或缩小描述范围
    • 持续低输出质量: 重写指令或添加验证步骤
    • 更新后持续失败: 弃用该 Skill

    Skill 生命周期管理

    1. 1

      规划

      识别重复性、易出错或需要专业知识的工作流程。将这些映射到组织角色,确定哪些适合作为 Skills 的候选。

    2. 2

      创建和审查

      确保 Skill 作者遵循最佳实践。使用上述审查清单要求进行安全审查。在批准前要求提供评估套件。建立职责分离:Skill 作者不应自行审查。

    3. 3

      测试

      要求在隔离环境(单独的 Skill)和与现有 Skills 并存的环境中进行评估(共存测试)。在批准投入生产之前,验证触发准确性、输出质量以及在活跃 Skill 集中不存在回归问题。

    4. 4

      部署

      通过 Skills API 上传以实现工作区范围的访问。有关上传和版本管理,请参阅通过 API 使用 Skills。在内部注册表中记录 Skill 的用途、负责人和版本。

    5. 5

      监控

      跟踪使用模式并收集用户反馈。定期重新运行评估,以检测随着工作流程和模型演变而产生的偏移或回归。使用分析目前无法通过 Skills API 获取。实施应用程序级日志记录来跟踪请求中包含了哪些 Skills。

    6. 6

      迭代或弃用

      要求完整的评估套件通过后才能推广新版本。当工作流程变化或评估分数下降时更新 Skills。当评估持续失败或工作流程已退役时弃用 Skills。

    大规模组织 Skills

    召回限制

    作为一般准则,限制同时加载的 Skills 数量以保持可靠的召回准确性。每个 Skill 的元数据(名称和描述)在系统提示中争夺注意力。当活跃的 Skills 过多时,Claude 可能无法选择正确的 Skill 或完全遗漏相关的 Skill。使用您的评估套件在添加 Skills 时衡量召回准确性,当性能下降时停止添加。

    请注意,API 请求每次最多支持 8 个 Skills(请参阅通过 API 使用 Skills)。如果某个角色需要的 Skills 超过单次请求支持的数量,请考虑将狭窄的 Skills 合并为更广泛的 Skills,或根据任务类型将请求路由到不同的 Skill 集。

    从具体开始,后续再合并

    鼓励团队从狭窄的、针对特定工作流程的 Skills 开始,而不是宽泛的多用途 Skills。随着组织中模式的出现,将相关的 Skills 合并为基于角色的捆绑包。

    使用评估来决定何时合并。仅当合并后的 Skill 的评估确认其性能等同于它所替代的各个单独 Skills 时,才将狭窄的 Skills 合并为更广泛的 Skill。

    示例演进:

    • 起始:formatting-sales-reports、querying-pipeline-data、updating-crm-records
    • 合并:sales-operations(当评估确认等效性能时)

    命名和编目

    在整个组织中使用一致的命名约定。最佳实践中的命名约定部分提供了格式指南。

    为每个 Skill 维护一个内部注册表,包含:

    • 用途:Skill 支持的工作流程
    • 负责人:负责维护的团队或个人
    • 版本:当前部署的版本
    • 依赖项:所需的 MCP 服务器、包或外部服务
    • 评估状态:最近一次评估日期和结果

    基于角色的捆绑包

    按组织角色分组 Skills,使每个用户的活跃 Skill 集保持聚焦:

    • 销售团队:CRM 操作、管道报告、提案生成
    • 工程团队:代码审查、部署工作流程、事件响应
    • 财务团队:报告生成、数据验证、审计准备

    每个基于角色的捆绑包应仅包含与该角色日常工作流程相关的 Skills。

    分发和版本控制

    源代码控制

    将 Skill 目录存储在 Git 中,以实现历史跟踪、通过拉取请求进行代码审查以及回滚能力。每个 Skill 目录(包含 SKILL.md 和任何捆绑文件)自然映射到一个 Git 跟踪的文件夹。

    基于 API 的分发

    Skills API 提供工作区范围的分发。通过 API 上传的 Skills 可供所有工作区成员使用。有关上传、版本管理和管理端点,请参阅通过 API 使用 Skills。

    版本策略

    • 生产环境:将 Skills 固定到特定版本。在推广新版本之前运行完整的评估套件。将每次更新视为需要完整安全审查的新部署。
    • 开发和测试环境:使用最新版本在推广到生产环境之前验证更改。
    • 回滚计划:保留上一版本作为备用。如果新版本在生产环境中评估失败,立即回退到最后一个已知良好的版本。
    • 完整性验证:计算已审查 Skills 的校验和,并在部署时进行验证。在 Skill 仓库中使用签名提交以确保来源可追溯。

    跨平台注意事项

    自定义 Skills 不会跨平台同步。上传到 API 的 Skills 在 claude.ai 或 Claude Code 中不可用,反之亦然。每个平台需要单独上传和管理。

    将 Skill 源文件维护在 Git 中作为唯一的事实来源。如果您的组织跨多个平台部署 Skills,请实施自己的同步流程以保持一致性。有关完整详情,请参阅跨平台可用性。

    后续步骤

    Agent Skills 概述

    架构和平台详情

    最佳实践

    面向 Skill 创建者的编写指南

    通过 API 使用 Skills

    以编程方式上传和管理 Skills

    安全部署 AI 代理

    代理部署的安全模式

    Was this page helpful?

    • 部署前评估 Skills
    • Skill 生命周期管理
    • 大规模组织 Skills
    • 基于 API 的分发