Claude Platform Docs
  • Messages
  • Agents gérés
  • Administration

Search...
⌘K
Cas d'usage
AperçuRoutage de ticketsAgent de support clientModération de contenuRésumé juridique
Ingénierie de prompts
AperçuBonnes pratiques de promptingPrompting de Claude Fable 5Prompting de Claude Opus 4.8Outils de prompting de la Console
Tester et évaluer
Définir le succès et créer des évaluationsUtiliser l'outil d'évaluation dans la ConsoleRéduire la latence
Renforcer les garde-fous
Réduire les hallucinationsAméliorer la cohérence des sortiesAtténuer les jailbreaksRéduire les fuites de prompt
Référence
Glossaire

Log in
Utiliser l'outil d'évaluation dans la Console
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Bonnes pratiques/Tester et évaluer

Utilisation de l'outil d'évaluation

La Claude Console propose un outil d'évaluation qui vous permet de tester vos prompts dans divers scénarios.

Accéder à la fonctionnalité d'évaluation

Pour commencer à utiliser l'outil d'évaluation :

  1. Ouvrez la Claude Console et accédez à l'éditeur de prompts.
  2. Après avoir rédigé votre prompt, recherchez l'onglet « Evaluate » en haut de l'écran.

Accéder à la fonctionnalité d'évaluation



Assurez-vous que votre prompt inclut au moins 1 à 2 variables dynamiques en utilisant la syntaxe à double accolade : {{variable}}. Ceci est requis pour créer des ensembles de tests d'évaluation.

Générer des prompts

La Console propose un générateur de prompts intégré, propulsé par Claude Sonnet 4.5 :

  1. 1

    Cliquez sur « Generate Prompt »

    Cliquer sur l'outil d'aide « Generate Prompt » ouvrira une fenêtre modale qui vous permet de saisir les informations relatives à votre tâche.

  2. 2

    Décrivez votre tâche

    Décrivez la tâche souhaitée (par exemple, « Trier les demandes entrantes du support client ») avec autant ou aussi peu de détails que vous le souhaitez. Plus vous incluez de contexte, plus Claude peut adapter le prompt généré à vos besoins spécifiques.

  3. 3

    Générez votre prompt

    Cliquer sur le bouton orange « Generate Prompt » en bas de la fenêtre permettra à Claude de générer un prompt de haute qualité pour vous. Vous pouvez ensuite améliorer davantage ces prompts en utilisant l'écran d'évaluation dans la Console.

Cette fonctionnalité facilite la création de prompts avec la syntaxe de variable appropriée pour l'évaluation.

Générateur de prompts

Créer des cas de test

Lorsque vous accédez à l'écran d'évaluation, vous disposez de plusieurs options pour créer des cas de test :

  1. Cliquez sur le bouton « + Add Row » en bas à gauche pour ajouter manuellement un cas.
  2. Utilisez la fonctionnalité « Generate Test Case » pour que Claude génère automatiquement des cas de test pour vous.
  3. Importez des cas de test à partir d'un fichier CSV.

Pour utiliser la fonctionnalité « Generate Test Case » :

  1. 1

    Cliquez sur « Generate Test Case »

    Claude générera des cas de test pour vous, une ligne à la fois à chaque clic sur le bouton.

  2. 2

    Modifiez la logique de génération (facultatif)

    Vous pouvez également modifier la logique de génération des cas de test en cliquant sur la flèche déroulante à droite du bouton « Generate Test Case », puis sur « Show generation logic » en haut de la fenêtre Variables qui s'affiche. Vous devrez peut-être cliquer sur « Generate » en haut à droite de cette fenêtre pour remplir la logique de génération initiale.

    Modifier cette logique vous permet de personnaliser et d'affiner les cas de test générés par Claude avec une plus grande précision et spécificité.

Voici un exemple d'écran d'évaluation rempli avec plusieurs cas de test :

Écran d'évaluation rempli



Si vous mettez à jour le texte de votre prompt d'origine, vous pouvez réexécuter l'ensemble de la suite d'évaluation avec le nouveau prompt pour voir comment les modifications affectent les performances sur tous les cas de test.

Conseils pour une évaluation efficace



Utilisez l'outil d'aide « Generate a prompt » dans la Console pour créer rapidement des prompts avec la syntaxe de variable appropriée pour l'évaluation.

Comprendre et comparer les résultats

L'outil d'évaluation offre plusieurs fonctionnalités pour vous aider à affiner vos prompts :

  1. Comparaison côte à côte : comparez les sorties de deux prompts ou plus pour voir rapidement l'impact de vos modifications.
  2. Notation de la qualité : notez la qualité des réponses sur une échelle de 5 points pour suivre les améliorations de la qualité des réponses par prompt.
  3. Gestion des versions de prompts : créez de nouvelles versions de votre prompt et réexécutez la suite de tests pour itérer rapidement et améliorer les résultats.

En examinant les résultats sur l'ensemble des cas de test et en comparant différentes versions de prompts, vous pouvez repérer des tendances et apporter des ajustements éclairés à votre prompt de manière plus efficace.

Commencez à évaluer vos prompts dès aujourd'hui pour créer des applications d'IA plus robustes avec Claude !

Was this page helpful?

  • Accéder à la fonctionnalité d'évaluation
  • Générer des prompts
  • Créer des cas de test
  • Conseils pour une évaluation efficace
  • Comprendre et comparer les résultats