Pour commencer à utiliser l'outil d'évaluation :

Assurez-vous que votre prompt inclut au moins 1 à 2 variables dynamiques en utilisant la syntaxe à double accolade : {{variable}}. Ceci est requis pour créer des ensembles de tests d'évaluation.
La Console propose un générateur de prompts intégré, propulsé par Claude Sonnet 4.5 :
Cliquez sur « Generate Prompt »
Cliquer sur l'outil d'aide « Generate Prompt » ouvrira une fenêtre modale qui vous permet de saisir les informations relatives à votre tâche.
Décrivez votre tâche
Décrivez la tâche souhaitée (par exemple, « Trier les demandes entrantes du support client ») avec autant ou aussi peu de détails que vous le souhaitez. Plus vous incluez de contexte, plus Claude peut adapter le prompt généré à vos besoins spécifiques.
Générez votre prompt
Cliquer sur le bouton orange « Generate Prompt » en bas de la fenêtre permettra à Claude de générer un prompt de haute qualité pour vous. Vous pouvez ensuite améliorer davantage ces prompts en utilisant l'écran d'évaluation dans la Console.
Cette fonctionnalité facilite la création de prompts avec la syntaxe de variable appropriée pour l'évaluation.

Lorsque vous accédez à l'écran d'évaluation, vous disposez de plusieurs options pour créer des cas de test :
Pour utiliser la fonctionnalité « Generate Test Case » :
Cliquez sur « Generate Test Case »
Claude générera des cas de test pour vous, une ligne à la fois à chaque clic sur le bouton.
Modifiez la logique de génération (facultatif)
Vous pouvez également modifier la logique de génération des cas de test en cliquant sur la flèche déroulante à droite du bouton « Generate Test Case », puis sur « Show generation logic » en haut de la fenêtre Variables qui s'affiche. Vous devrez peut-être cliquer sur « Generate » en haut à droite de cette fenêtre pour remplir la logique de génération initiale.
Modifier cette logique vous permet de personnaliser et d'affiner les cas de test générés par Claude avec une plus grande précision et spécificité.
Voici un exemple d'écran d'évaluation rempli avec plusieurs cas de test :

Si vous mettez à jour le texte de votre prompt d'origine, vous pouvez réexécuter l'ensemble de la suite d'évaluation avec le nouveau prompt pour voir comment les modifications affectent les performances sur tous les cas de test.
Utilisez l'outil d'aide « Generate a prompt » dans la Console pour créer rapidement des prompts avec la syntaxe de variable appropriée pour l'évaluation.
L'outil d'évaluation offre plusieurs fonctionnalités pour vous aider à affiner vos prompts :
En examinant les résultats sur l'ensemble des cas de test et en comparant différentes versions de prompts, vous pouvez repérer des tendances et apporter des ajustements éclairés à votre prompt de manière plus efficace.
Commencez à évaluer vos prompts dès aujourd'hui pour créer des applications d'IA plus robustes avec Claude !
Was this page helpful?