Claude Platform Docs
  • メッセージ
  • マネージドエージェント
  • 管理

Search...
⌘K
ユースケース
概要チケットルーティングカスタマーサポートエージェントコンテンツモデレーション法務文書の要約
プロンプトエンジニアリング
概要プロンプトのベストプラクティスClaude Fable 5へのプロンプトClaude Opus 4.8へのプロンプトコンソールのプロンプトツール
テストと評価
成功の定義と評価の構築コンソールでの評価ツールの使用レイテンシの削減
ガードレールの強化
ハルシネーションの削減出力の一貫性向上ジェイルブレイクの軽減プロンプトリークの削減
リファレンス
用語集

Log in
コンソールでの評価ツールの使用
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
ベストプラクティス/テストと評価

評価ツールの使用

Claude Consoleには、さまざまなシナリオでプロンプトをテストできる評価ツールが搭載されています。

評価機能へのアクセス

評価ツールを使い始めるには:

  1. Claude Consoleを開き、プロンプトエディタに移動します。
  2. プロンプトを作成した後、画面上部にある「Evaluate」タブを探します。

評価機能へのアクセス



プロンプトには、二重中括弧構文({{variable}})を使用した動的変数を少なくとも1〜2個含めるようにしてください。これは評価テストセットを作成するために必要です。

プロンプトの生成

Consoleには、Claude Sonnet 4.5を搭載した組み込みのプロンプトジェネレーターが用意されています:

  1. 1

    「Generate Prompt」をクリック

    「Generate Prompt」ヘルパーツールをクリックすると、タスク情報を入力できるモーダルが開きます。

  2. 2

    タスクを説明する

    希望するタスク(例:「受信したカスタマーサポートリクエストのトリアージ」)を、詳細に、または簡潔に説明します。より多くのコンテキストを含めるほど、Claudeは生成するプロンプトを特定のニーズに合わせて調整できます。

  3. 3

    プロンプトを生成する

    下部にあるオレンジ色の「Generate Prompt」ボタンをクリックすると、Claudeが高品質なプロンプトを生成します。その後、Consoleの評価画面を使用して、それらのプロンプトをさらに改善できます。

この機能により、評価に適した変数構文を持つプロンプトを簡単に作成できます。

プロンプトジェネレーター

テストケースの作成

評価画面にアクセスすると、テストケースを作成するためのいくつかのオプションがあります:

  1. 左下にある「+ Add Row」ボタンをクリックして、手動でケースを追加します。
  2. 「Generate Test Case」機能を使用して、Claudeに自動的にテストケースを生成させます。
  3. CSVファイルからテストケースをインポートします。

「Generate Test Case」機能を使用するには:

  1. 1

    「Generate Test Case」をクリック

    ボタンをクリックするたびに、Claudeが1行ずつテストケースを生成します。

  2. 2

    生成ロジックを編集する(オプション)

    「Generate Test Case」ボタンの右側にある矢印ドロップダウンをクリックし、表示されるVariablesウィンドウの上部にある「Show generation logic」をクリックすることで、テストケース生成ロジックを編集することもできます。初期の生成ロジックを入力するには、このウィンドウの右上にある「Generate」をクリックする必要がある場合があります。

    これを編集することで、Claudeが生成するテストケースをより高い精度と具体性でカスタマイズおよび微調整できます。

以下は、複数のテストケースが入力された評価画面の例です:

入力済みの評価画面



元のプロンプトテキストを更新した場合、新しいプロンプトに対して評価スイート全体を再実行し、変更がすべてのテストケースでパフォーマンスにどのように影響するかを確認できます。

効果的な評価のためのヒント



Consoleの「Generate a prompt」ヘルパーツールを使用すると、評価に適した変数構文を持つプロンプトをすばやく作成できます。

結果の理解と比較

評価ツールには、プロンプトを改善するのに役立ついくつかの機能があります:

  1. 並列比較:2つ以上のプロンプトの出力を比較して、変更の影響をすばやく確認できます。
  2. 品質評価:5段階評価で応答品質を評価し、プロンプトごとの応答品質の改善を追跡できます。
  3. プロンプトのバージョン管理:プロンプトの新しいバージョンを作成し、テストスイートを再実行して、すばやく反復し結果を改善できます。

テストケース全体の結果を確認し、異なるプロンプトバージョンを比較することで、パターンを見つけ、より効率的にプロンプトに対して情報に基づいた調整を行うことができます。

今すぐプロンプトの評価を開始して、Claudeでより堅牢なAIアプリケーションを構築しましょう!

Was this page helpful?

  • 評価機能へのアクセス
  • プロンプトの生成
  • テストケースの作成
  • 効果的な評価のためのヒント
  • 結果の理解と比較