Loading...
  • 建構
  • 管理
  • 模型與定價
  • 客戶端 SDK
  • API 參考
Search...
⌘K
Log in
在 Console 中使用評估工具
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
建構/測試與評估

使用評估工具

Claude Console 具有評估工具,允許您在各種場景下測試您的提示。

存取評估功能

要開始使用評估工具:

  1. 開啟 Claude Console 並導航至提示編輯器。
  2. 撰寫完提示後,在螢幕頂部尋找「Evaluate」標籤。

存取評估功能

確保您的提示至少包含 1-2 個使用雙大括號語法的動態變數:{{variable}}。這是建立評估測試集所必需的。

生成提示

Console 提供由 Claude Opus 4.1 驅動的內建提示生成器:

  1. 1

    點擊「Generate Prompt」

    點擊「Generate Prompt」輔助工具將開啟一個模態框,允許您輸入任務資訊。

  2. 2

    描述您的任務

    描述您所需的任務(例如,「對入站客戶支援請求進行分類」),可以提供盡可能多或盡可能少的詳細資訊。您包含的上下文越多,Claude 就能越好地根據您的特定需求調整其生成的提示。

  3. 3

    生成您的提示

    點擊底部的橙色「Generate Prompt」按鈕將使 Claude 為您生成高品質的提示。然後,您可以使用 Console 中的評估螢幕進一步改進這些提示。

此功能使建立具有適當變數語法的提示以進行評估變得更容易。

提示生成器

建立測試案例

當您存取評估螢幕時,您有多個選項來建立測試案例:

  1. 點擊左下角的「+ Add Row」按鈕以手動新增案例。
  2. 使用「Generate Test Case」功能讓 Claude 自動為您生成測試案例。
  3. 從 CSV 檔案匯入測試案例。

要使用「Generate Test Case」功能:

  1. 1

    點擊「Generate Test Case」

    Claude 將為您生成測試案例,每次點擊按鈕時一次生成一行。

  2. 2

    編輯生成邏輯(可選)

    您也可以透過點擊「Generate Test Case」按鈕右側的箭頭下拉菜單,然後點擊彈出的「Variables」視窗頂部的「Show generation logic」來編輯測試案例生成邏輯。您可能需要點擊此視窗右上角的「Generate」來填充初始生成邏輯。

    編輯這個允許您自訂和微調 Claude 生成的測試案例,以達到更高的精度和特異性。

以下是一個包含多個測試案例的已填充評估螢幕的範例:

已填充的評估螢幕

如果您更新原始提示文本,您可以針對新提示重新執行整個評估套件,以查看變更如何影響所有測試案例的效能。

有效評估的提示

使用 Console 中的「Generate a prompt」輔助工具快速建立具有適當變數語法的提示以進行評估。

理解和比較結果

評估工具提供多個功能來幫助您改進提示:

  1. 並排比較:比較兩個或多個提示的輸出,以快速查看變更的影響。
  2. 品質評分:在 5 點量表上對回應品質進行評分,以追蹤每個提示的回應品質改進。
  3. 提示版本控制:建立提示的新版本並重新執行測試套件,以快速迭代和改進結果。

透過檢查測試案例中的結果並比較不同的提示版本,您可以發現模式並更有效地對提示進行明智的調整。

立即開始評估您的提示,以使用 Claude 建立更強大的 AI 應用程式!

Was this page helpful?