Loading...
    • 开发者指南
    • API 参考
    • MCP
    • 资源
    • 发布说明
    Search...
    ⌘K

    第一步

    Claude 简介快速开始

    模型与定价

    模型概览选择模型Claude 4.5 的新功能迁移到 Claude 4.5模型弃用定价

    使用 Claude 构建

    功能概览使用 Messages API上下文窗口提示词最佳实践

    功能

    提示词缓存上下文编辑扩展思考流式消息批处理引用多语言支持Token 计数嵌入向量视觉PDF 支持Files API搜索结果Google Sheets 插件

    工具

    概述如何实现工具使用令牌高效的工具使用细粒度工具流式传输Bash 工具代码执行工具计算机使用工具文本编辑器工具Web fetch 工具网络搜索工具记忆工具

    代理技能

    概述在 API 中开始使用 Agent Skills技能创作最佳实践通过 API 使用 Agent Skills

    Agent SDK

    概览TypeScript SDKPython SDK

    指南

    流式输入处理权限会话管理托管 Agent SDK修改系统提示词SDK 中的 MCP自定义工具SDK 中的子代理SDK 中的斜杠命令SDK 中的代理技能跟踪成本和使用情况待办事项列表SDK 中的插件

    API 中的 MCP

    MCP 连接器远程 MCP 服务器

    Claude 在第三方平台上

    Amazon BedrockVertex AI

    提示词工程

    概述提示词生成器使用提示模板提示词改进器保持清晰和直接使用示例(多示例提示)让 Claude 思考(思维链)使用XML标签给Claude分配角色(系统提示)预填充 Claude 的响应链式复杂提示长文本技巧扩展思考技巧

    测试与评估

    定义成功标准开发测试用例使用评估工具减少延迟

    加强防护措施

    减少幻觉提高输出一致性缓解越狱handle-streaming-refusals减少提示词泄露保持Claude的角色特征

    管理和监控

    Admin API 概述使用量和成本 APIClaude Code 分析 API
    Console
    测试与评估

    使用评估工具

    Claude Console 提供了一个评估工具,允许您在各种场景下测试您的提示词。

    访问评估功能

    要开始使用评估工具:

    1. 打开 Claude Console 并导航到提示词编辑器。
    2. 编写完提示词后,在屏幕顶部寻找"Evaluate"选项卡。

    访问评估功能

    确保您的提示词包含至少 1-2 个使用双大括号语法的动态变量:{{variable}}。这是创建评估测试集所必需的。

    生成提示词

    Console 提供了一个由 Claude Opus 4.1 驱动的内置提示词生成器:

    1. 1

      点击'Generate Prompt'

      点击"Generate Prompt"辅助工具将打开一个模态框,允许您输入任务信息。

    2. 2

      描述您的任务

      描述您想要的任务(例如,"分类入站客户支持请求"),可以提供尽可能多或少的详细信息。您包含的上下文越多,Claude 就越能为您的特定需求定制生成的提示词。

    3. 3

      生成您的提示词

      点击底部的橙色"Generate Prompt"按钮将让 Claude 为您生成高质量的提示词。然后您可以使用 Console 中的评估屏幕进一步改进这些提示词。

    此功能使创建具有适当变量语法的提示词以进行评估变得更加容易。

    提示词生成器

    创建测试用例

    当您访问评估屏幕时,您有几个选项来创建测试用例:

    1. 点击左下角的"+ Add Row"按钮手动添加用例。
    2. 使用"Generate Test Case"功能让 Claude 自动为您生成测试用例。
    3. 从 CSV 文件导入测试用例。

    要使用"Generate Test Case"功能:

    1. 1

      点击'Generate Test Case'

      Claude 将为您生成测试用例,每次点击按钮时生成一行。

    2. 2

      编辑生成逻辑(可选)

      您还可以通过点击"Generate Test Case"按钮右侧的箭头下拉菜单,然后点击弹出的变量窗口顶部的"Show generation logic"来编辑测试用例生成逻辑。您可能需要点击此窗口右上角的"Generate"来填充初始生成逻辑。

      编辑此项允许您自定义和微调 Claude 生成的测试用例,以获得更高的精度和特异性。

    这是一个填充了几个测试用例的评估屏幕示例:

    填充的评估屏幕

    如果您更新了原始提示词文本,您可以针对新提示词重新运行整个评估套件,以查看更改如何影响所有测试用例的性能。

    有效评估的技巧

    使用 Console 中的"Generate a prompt"辅助工具快速创建具有适当变量语法的提示词以进行评估。

    理解和比较结果

    评估工具提供了几个功能来帮助您完善提示词:

    1. 并排比较:比较两个或更多提示词的输出,快速查看更改的影响。
    2. 质量评分:在 5 分制上对响应质量进行评分,以跟踪每个提示词响应质量的改进。
    3. 提示词版本控制:创建提示词的新版本并重新运行测试套件,以快速迭代和改进结果。

    通过审查跨测试用例的结果并比较不同的提示词版本,您可以发现模式并更有效地对提示词进行明智的调整。

    今天就开始评估您的提示词,使用 Claude 构建更强大的 AI 应用程序!

      © 2025 ANTHROPIC PBC

      Products

      • Claude
      • Claude Code
      • Max plan
      • Team plan
      • Enterprise plan
      • Download app
      • Pricing
      • Log in

      Features

      • Claude and Slack
      • Claude in Excel

      Models

      • Opus
      • Sonnet
      • Haiku

      Solutions

      • AI agents
      • Code modernization
      • Coding
      • Customer support
      • Education
      • Financial services
      • Government
      • Life sciences

      Claude Developer Platform

      • Overview
      • Developer docs
      • Pricing
      • Amazon Bedrock
      • Google Cloud’s Vertex AI
      • Console login

      Learn

      • Blog
      • Catalog
      • Courses
      • Use cases
      • Connectors
      • Customer stories
      • Engineering at Anthropic
      • Events
      • Powered by Claude
      • Service partners
      • Startups program

      Company

      • Anthropic
      • Careers
      • Economic Futures
      • Research
      • News
      • Responsible Scaling Policy
      • Security and compliance
      • Transparency

      Help and security

      • Availability
      • Status
      • Support center

      Terms and policies

      • Privacy policy
      • Responsible disclosure policy
      • Terms of service: Commercial
      • Terms of service: Consumer
      • Usage policy

      Products

      • Claude
      • Claude Code
      • Max plan
      • Team plan
      • Enterprise plan
      • Download app
      • Pricing
      • Log in

      Features

      • Claude and Slack
      • Claude in Excel

      Models

      • Opus
      • Sonnet
      • Haiku

      Solutions

      • AI agents
      • Code modernization
      • Coding
      • Customer support
      • Education
      • Financial services
      • Government
      • Life sciences

      Claude Developer Platform

      • Overview
      • Developer docs
      • Pricing
      • Amazon Bedrock
      • Google Cloud’s Vertex AI
      • Console login

      Learn

      • Blog
      • Catalog
      • Courses
      • Use cases
      • Connectors
      • Customer stories
      • Engineering at Anthropic
      • Events
      • Powered by Claude
      • Service partners
      • Startups program

      Company

      • Anthropic
      • Careers
      • Economic Futures
      • Research
      • News
      • Responsible Scaling Policy
      • Security and compliance
      • Transparency

      Help and security

      • Availability
      • Status
      • Support center

      Terms and policies

      • Privacy policy
      • Responsible disclosure policy
      • Terms of service: Commercial
      • Terms of service: Consumer
      • Usage policy
      © 2025 ANTHROPIC PBC