要开始使用评估工具:

确保您的提示至少包含 1-2 个使用双大括号语法的动态变量:{{variable}}。这是创建评估测试集的必要条件。
Console 提供了一个由 Claude Sonnet 4.5 驱动的内置提示生成器:
点击'Generate Prompt'(生成提示)
点击"Generate Prompt"辅助工具将打开一个模态框,允许您输入任务信息。
描述您的任务
根据需要详细或简略地描述您期望的任务(例如,"对入站客户支持请求进行分类")。您提供的上下文越多,Claude 就越能根据您的具体需求定制生成的提示。
生成您的提示
点击底部的橙色"Generate Prompt"按钮,Claude 将为您生成高质量的提示。然后,您可以使用 Console 中的评估界面进一步改进这些提示。
此功能使您可以更轻松地创建具有适当变量语法的提示以进行评估。

当您访问评估界面时,有多种方式可以创建测试用例:
要使用"Generate Test Case"功能:
点击'Generate Test Case'(生成测试用例)
Claude 将为您生成测试用例,每次点击按钮生成一行。
编辑生成逻辑(可选)
您还可以通过点击"Generate Test Case"按钮右侧的下拉箭头,然后点击弹出的 Variables(变量)窗口顶部的"Show generation logic"(显示生成逻辑)来编辑测试用例生成逻辑。您可能需要点击此窗口右上角的"Generate"来填充初始生成逻辑。
编辑此内容可以让您自定义和微调 Claude 生成的测试用例,以获得更高的精确度和针对性。
以下是包含多个测试用例的已填充评估界面示例:

如果您更新了原始提示文本,可以针对新提示重新运行整个评估套件,以查看更改如何影响所有测试用例的性能。
使用 Console 中的"Generate a prompt"(生成提示)辅助工具,快速创建具有适当变量语法的提示以进行评估。
评估工具提供了多项功能来帮助您优化提示:
通过查看各个测试用例的结果并比较不同的提示版本,您可以发现规律并更高效地对提示进行明智的调整。
立即开始评估您的提示,使用 Claude 构建更强大的 AI 应用程序!
Was this page helpful?