評価ツールを使い始めるには:

プロンプトには、二重中括弧構文({{variable}})を使用した動的変数を少なくとも1〜2個含めるようにしてください。これは評価テストセットを作成するために必要です。
Consoleには、Claude Sonnet 4.5を搭載した組み込みのプロンプトジェネレーターが用意されています:
「Generate Prompt」をクリック
「Generate Prompt」ヘルパーツールをクリックすると、タスク情報を入力できるモーダルが開きます。
タスクを説明する
希望するタスク(例:「受信したカスタマーサポートリクエストのトリアージ」)を、詳細に、または簡潔に説明します。より多くのコンテキストを含めるほど、Claudeは生成するプロンプトを特定のニーズに合わせて調整できます。
プロンプトを生成する
下部にあるオレンジ色の「Generate Prompt」ボタンをクリックすると、Claudeが高品質なプロンプトを生成します。その後、Consoleの評価画面を使用して、それらのプロンプトをさらに改善できます。
この機能により、評価に適した変数構文を持つプロンプトを簡単に作成できます。

評価画面にアクセスすると、テストケースを作成するためのいくつかのオプションがあります:
「Generate Test Case」機能を使用するには:
「Generate Test Case」をクリック
ボタンをクリックするたびに、Claudeが1行ずつテストケースを生成します。
生成ロジックを編集する(オプション)
「Generate Test Case」ボタンの右側にある矢印ドロップダウンをクリックし、表示されるVariablesウィンドウの上部にある「Show generation logic」をクリックすることで、テストケース生成ロジックを編集することもできます。初期の生成ロジックを入力するには、このウィンドウの右上にある「Generate」をクリックする必要がある場合があります。
これを編集することで、Claudeが生成するテストケースをより高い精度と具体性でカスタマイズおよび微調整できます。
以下は、複数のテストケースが入力された評価画面の例です:

元のプロンプトテキストを更新した場合、新しいプロンプトに対して評価スイート全体を再実行し、変更がすべてのテストケースでパフォーマンスにどのように影響するかを確認できます。
Consoleの「Generate a prompt」ヘルパーツールを使用すると、評価に適した変数構文を持つプロンプトをすばやく作成できます。
評価ツールには、プロンプトを改善するのに役立ついくつかの機能があります:
テストケース全体の結果を確認し、異なるプロンプトバージョンを比較することで、パターンを見つけ、より効率的にプロンプトに対して情報に基づいた調整を行うことができます。
今すぐプロンプトの評価を開始して、Claudeでより堅牢なAIアプリケーションを構築しましょう!
Was this page helpful?